Fleißige Sterngucker

Interesse an Apache Spark: Der neue Star am Big-Data-Himmel?

Michael Thomas

© Shutterstock.com/The Len

Einer Untersuchung des Analytik-Infrastruktur-Anbieters Treasure Data zufolge erfreut sich Apache Spark bei chinesischen Entwicklern – die bei der Beteiligung an Open-Source-Projekten historisch betrachtet eher zurückhaltend waren – deutlich größerer Beliebtheit als bei ihren US-amerikanischen Kollegen.

Die Zahlen der Analyse beruhen auf insgesamt 2.134 GitHub-„Stargazern“. Als „Stargazer“ werden diejenigen GitHub-User bezeichnet, die ein Repository mit einem Stern versehen und somit ein Lesezeichen gesetzt haben. Dies bedeutet allerdings nicht, dass der User über Neuigkeiten oder den Aktivitätsfeed (dies wäre „Repository Watching“) auf dem Laufenden gehalten wird (was wiederum als ein starkes Signal dafür gewertet werden könnte, dass der User das entsprechende Projekt auch nutzt), sondern erlaubt in erster Linie einen leichteren Zugriff und signalisiert dem Betreiber des Repository ein allgemeines Interesse.

Interessant sind die Zahlen allerdings dennoch: Demnach ist das Interesse an Apache Spark in China in absoluten Zahlen deutlich ausgeprägter als in den USA: Rund 750 chinesische Entwickler haben bislang Interesse an Apache Spark bekundet (Stand: Oktober 2015). Dem stehen knapp 450 US-amerikanische Entwickler gegenüber.

An Apache Spark interessierte GitHub-User (Quelle: http://blog.treasuredata.com/blog/2015/11/06/spark-by-the-numbers/)

An Apache Spark interessierte GitHub-User (Quelle: http://blog.treasuredata.com/blog/2015/11/06/spark-by-the-numbers/)

Eine weitere Aufschlüsselung der Zahlen zeigt, dass sich Kalifornien – und dabei insbesondere das Silicon Valley – wieder einmal als das amerikanische Testlabor für neue Technologien entpuppt. Die letzte Erkenntnis der Erhebung betrifft den Arbeitsplatz der Spark-Interessenten: Deren überwiegende Mehrzahl ist für Privatunternehmen oder Bildungseinrichtungen bwz. -organisationen tätig:

Branche der an Apache Spark Interessierten (Quelle: http://blog.treasuredata.com/blog/2015/11/06/spark-by-the-numbers/)

Branche der an Apache Spark Interessierten (Quelle: http://blog.treasuredata.com/blog/2015/11/06/spark-by-the-numbers/)

Spark befindet sich zwar immer noch in einer recht frühen Phase der Übernahme durch die Industrie. Zusammen mit einer Anfang des Jahres von Typesafe durchgeführten Umfrage weisen nun jedoch bereits zwei (zumindest teilweise) repräsentative Untersuchungen darauf hin, dass sich das Projekt in Entwicklerkreisen einer stetig steigenden Beliebtheit erfreut.

Über Apache Spark

Im Februar 2014,  nur wenige Wochen, nachdem Cloudera einen kommerziellen Support für das In-Memory-Framework angekündigt hatte, wurde Apache Spark aus dem Projekt-Inkubator der Apache Foundation entlassen und zum vollwertigen Projekt gemacht. Bereits wenige Monate später konnte Spark auf eine kleine Erfolgsstory zurückblicken: So integrierte das US-amerikanische Unternehmen MapR Technologies Spark in seine Distributionen. DataStax, Spezialist für die Datenbank Cassandra, startete eine Kooperation mit Databricks, um eine Integration von Spark in Cassandra zu realisieren (siehe dazu auch das JAXenter-Interview mit Martin Van Ryswyk von DataStax).

Aufmacherbild: Glowing Sparks in the dark von Shutterstock / Urheberrecht: The Len

Verwandte Themen:

Geschrieben von
Michael Thomas
Michael Thomas
Michael Thomas studierte Erziehungswissenschaft an der Johannes Gutenberg-Universität Mainz und arbeitet seit 2013 als Freelance-Autor bei JAXenter.de. Kontakt: mthomas[at]sandsmedia.com
Kommentare

Hinterlasse einen Kommentar

avatar
4000
  Subscribe  
Benachrichtige mich zu: