JAXenter: Das glaube ich. Was meinst du: Sind wir in Sachen Datenspeicherung bzw. -verarbeitung bereits an den Grenzen angelangt? Oder haben wir gerade erst an der Oberfläche gekratzt?

Doug Cutting: Ich denke, wir stehen noch am Anfang der Einsatz- und Umsetzungsmöglichkeiten. Langfristig steigt die Erschwinglichkeit von Hardware zur Datenspeicherung und -verarbeitung exponentiell an; langfristig steigt auch der Bedarf an erschwinglicher Hardware von Seiten der Industrie – in vielen, in allen Industriezweigen -, da immer mehr Daten gespeichert und verarbeitet werden. Es scheint einen Zusammenhang zwischen diesen beiden Trends zu geben, deren Ende noch gar nicht abzusehen ist. Vielleicht werden sie sich etwas verlangsamen, aber das massive Wachstum wird sich fortsetzen.

Der Ansatz in Sachen Datenverarbeitung, den wir mit Hadoop verfolgen, geht sehr gut auf diese Trends ein. Wenn man versuchen möchte, massive Mengen an Daten zu speichern, braucht man die Voraussetzungen, um von Grund auf so linear wie möglich zu skalieren und auch die Hardware so ökonomisch wie möglich einsetzen. Die klassischen relationalen Tugenden sind dafür ungeeignet – sie sind ein wenig überholt, da sie aus einem anderen Bereich mit anderen Anforderungen kommen.

Die andere Sache, die sehr spannend ist, ist das, was Google zurzeit macht. Sie haben gerade ein Spanner-Paper über ihr F1-System herausgebracht. Die sind schon einen Schritt voraus, dem Rest der Welt voraus. Sie gewähren uns tiefe Einblick in das, was möglich ist, und indem sie diese Papers schreiben, geben sie uns im Prinzip einen Fahrplan vor, dem wir folgen können [lacht]. Momentan sieht es so aus, als könnten wir alles haben: Wir können transaktionsbasierte Datenbanksysteme haben, die sehr weit skalieren, sogar auf globaler Ebene. Diese können mehrere Datenzentren umspannen, Petabytes in ihren Tabellen erfassen und trotzdem interaktive Queries bedienen. Wir sind im Open-Source-Ökosystem noch nicht ganz an diesem Punkt angekommen, aber ich denke, es ist klar, dass das auch noch passieren wird.

Was die Features angeht, sind wir auf einem guten Weg, was bedeutet: noch mehr Anwender und mehr Anwendungsfälle. Es gibt also bereits wachsende Industriezweige, bessere technologische Möglichkeiten und eine zusehends besser werdende Hardware-Ökonomie. Die Industrie wird heranreifen und die Technologie vermehrt einsetzen. Auch auf der Seite der Technologie wird es Fortschritte geben, die der Industrie wiederum mehr Möglichkeiten an die Hand gibt. Ich glaube also überhaupt nicht, dass hier Schluss ist.

JAXenter: Einige Unternehmen zögern bisher, Hadoop einzusetzen. Muss da ein Umdenken stattfinden, damit die Technologie dort ankommt? Was muss alles berücksichtigt werden, bevor eine Hadoop-Distribution verwendet wird?

Doug Cutting: Jedes Unternehmen ist naturgemäß konservativ, und das aus gutem Grund: Wenn man anfängt, eine neue Technologie zu verwenden, muss man sie auch über mehrere Jahre unterstützen. Man möchte also nicht einfach nur „the next big thing“ an Bord holen und dann daran hängenbleiben. Deswegen wurde auch Cloudera gegründet – um in der Lage zu sein, Unternehmenskunden Unterstützung anzubieten, ihnen Sicherheit zu bieten. Und genau das passiert: Wir beobachten, wie immer mehr diese Technologie annehmen, und ich glaube, die Hälfte der Firmen auf der Fortune-50-Liste sind mittlerweile Kunden. Viele davon stehen erst am Anfang und haben Hadoop noch nicht im gesamten Unternehmen deployt. Aber die Verbreitung geht weiter.

Es passiert natürlich nicht über Nacht. Wenn der Kernbusiness irgendeine Art der Datentechnologie ist, sind Änderungen schwierig. Es gibt eine Menge Fälle, in denen der Hadoop-Stack einfach noch nicht weit genug ist. Aber es gibt auch viele Fälle, in denen er heute schon eingesetzt wird und den Leuten einen wahren Vorteil über ihre Marktbegleiter verschafft. Wir beobachten also ein stetiges Wachstum und eine stetig zunehmende Verbreitung.

Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.