Interview mit Martin Van Ryswyk vom Big-Data-Unternehmen DataStax

'Spark und Cassandra ergänzen sich perfekt'

Lucy Carey
© shutterstock.com/Pavel L Photo and Video

Erst neulich gab das Unternehmen DataStax die Integration von Apache Spark in die Datenbank Cassandra bekannt. Damit wurde innerhalb der Branche ein einzigartiger Präzedenzfall geschaffen. Wir sprachen mit Martin Van Ryswyk, stellvertretender Vorsitzender der Entwicklungsabteilung bei DataStax, über wesentliche Aspekte der Integration, entstehende Vorteile für den Nutzer sowie neue Big-Data-Strategien in Unternehmen.

JAXenter: Wie kam die Kooperation zustande?

Martin Van Ryswyk: Wir verfolgen die Entwicklung von Spark schon seit geraumer Zeit und sind sowohl vom Talent als auch von der vorhandenen Technologie bei Databricks beeindruckt. Die beiden Technologien ergänzen sich perfekt. Wir möchten unseren Nutzern außerdem eine starke Lösung mit starken Vertretern beider Technologien bieten. Eine Zusammenarbeit war also nur konsequent.

Martin Van RyswykMartin Van Ryswyk managt seit über 22 Jahren Software-Teams in kleineren und größeren Startups. In dieser Zeit hat er diverse Produkte bis zur Marktreife begleitet, u. a. in den Bereichen Cloud Computing, Application Lifecylce Management, Datenbank-Performanceanalyse, Speicher- und Systemmanagement. Bevor er zu DataStax kam, war er Senior Engineer bei Tidal Software, Liminate, EMC und Electric Cloud. An der University of California in Davis erwarb er einen Bachelor Science. (Bild: M. Van Ryswyk).

JAXenter: Welche Herausforderungen müssen für eine gelungene Eingliederung gemeistert werden?

Van Ryswyk: Um eine tiefe Integration zwischen Spark und Cassandra zu gewährleisten, ist eine genaue Zuordnung von Daten absolut erforderlich. Außerdem muss eine hohe Verfügbarkeit sowie ein gewisse Sicherheit bereitgestellt werden.

JAXenter: Welche Vorteile erhoffen Sie sich durch die Einbindung von Apache Spark und wer profitiert davon am meisten?

Van Ryswyk: Durch die Integration können wir modernen Unternehmen eine Alternative zu relationalen Datenbanken bieten, mit der sie eine zeitnahe Datenanalyse ihrer Online-Applikationen erhalten. Aber lesen Sie am besten selbst, wie sich unsere Kunden zur Einbindung von Apache Spark äußern. Chanan Braunstein, Chef der Next Gen Homework Applications bei Pearson Education, sagt zum Beispiel: „Die neue Spark/Shark Funktionsweise von Cassandra ermöglicht unseren Usern eine skalierbare und leistungsstarke Möglichkeit, schnelle Analysen unserer ständig ansteigenden Datenbestände zu erstellen. Diese Abkehr von relationalen Datenbanken ermöglicht es, zeitnahe Datenanalysen bereitstellen, so dass Nutzer nicht mehr auf zeitverzögerte Berichte angewiesen sind.“  

Und Brian O’Neil, CTO von Health Market Science, meint: „Wir brauchen eine standardisierte Möglichkeit, Arbeiten an Datenbeständen in Cassandra durchzuführen. Natürlich könnte man auf Hadoop zurückgreifen und darauf beschränkt sein, Analysen in Form von MapReduce-Konstrukten vorzunehmen, doch das macht nur mürbe. Stattdessen empfehle ich Spark.“ 

JAXenter: Konnten Sie schon ausmachen, ob andere Größen der Branche Ihnen nacheifern?

Van Ryswyk: Ich kann nur für uns selbst sprechen. Aber da es die erste Zusammenarbeit dieser Art ist, kann man davon ausgehen, dass andere Unternehmen uns folgen werden.

JAXenter: Haben Sie 2014 schon eine Veränderung im Umgang von Unternehmen mit Daten bemerkt?

Van Ryswyk: Es gibt immer mehr moderne Unternehmen, die die Nutzung von Daten als einen strategischen Vermögenswert ansehen, mit dem es sich konkurrieren lässt. Unternehmen wollen vermehrt zeitnahe Analysen, die einen Dateneinblick in Echtzeit garantieren, wodurch man schnell reagieren kann. Deswegen haben Online-Applikationen, die mit Usern interagieren und Daten sammeln, keinen Spielraum für Ausfälle und müssen jederzeit in der Lage sein, die Daten des Nutzers zu erhalten und zu verwerten, ganz gleich, wo er sich auch befinden mag.

JAXenter: Konnten Sie seit der Einbindung beobachten, dass die Konkurrenz ähnliche Allianzen schmiedet? 

Van Ryswyk: Ich kann nicht allzu sehr darüber spekulieren, was andere Unternehmen möglicherweise für Partnerschaften bilden, doch was wir ganz klar sehen können, ist eine enorme Wertschöpfung, die durch die Kooperation zustande gekommen ist.

JAX: Glauben Sie, dass es auf dem Markt eine vergleichbare Lösung gibt? 

Van Ryswyk: DataStax ist der erste NoSQL-Anbieter, der schnelle Analysen für Echtzeit-Daten anbieten kann. Auf dem NoSQL-Markt könnte man HBase zum Vergleich heranziehen, aber auch HBase ist bloß ein Bestandteil eines Hadoop-Warehouse, während Cassandra für transaktionale „Always-on“-Online-Anwendungen konzipiert wurde. 

Im Interview auf der JAX 2014 erklärt Tim Berglund, der vor Kurzem zu DataStax wechselte, seine Sicht auf die derzeitige Situation im Big-Data-Bereich. Im Januar fragten wir DataStax-CEO Billy Bosworth nach seinen Prognosen für das Jahr 2014 und Highlights des vergangenen Jahres: „2014 werden mehr Unternehmen NoSQL-Lösungen nutzen als je zuvor.“ Mehr über das im Februar erschienene DataStax Enterprise 4.0 gibt es übrigens auch hier auf JAXenter.

Das Interview wurde in englischer Sprache geführt. Deutsche Übersetzung: Mohammed Hübsch, Diana Kupfer.

Aufmacherbild: Big data server in rack with multiple hard drives von shutterstock.com / Urheberrecht: Pavel L Photo and Video

Geschrieben von
Lucy Carey
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: