MongoDB Connector für Hadoop aktualisiert

Hartmut Schlosser

Für die Dokumenten-orientierte Datenbank MongoDB steht ein überarbeiteter Hadoop-Connector zur Verfügung. Der Connector verspricht die Kombination der analytischen Fähigkeiten von Hadoops MapReduce-Mechanismus mit den Anwendungsdaten aus MongoDB. MongoDB wird als Hadoop-kompatibles Dateisystem dargestellt, sodass MapReduce Jobs Echtzeitdaten von MongoDB lesen und verarbeiten können.

Neu ist die Unterstützung für Apache Hive mit SQL-ähnlichen Abfragen über MongoDB-Datensätze. Ad-Hoc-Analysen lassen sich mittels inkrementeller MapReduce-Jobs durchführen. Außerdem bietet der neue Connector Support für MongoDB BSON-Daten im Hadoop Distributed File System (HDFS), was für weniger Datenverkehr sorgen soll. Die Zugriffsmöglichkeit auf MongoDB Backupdateien soll darüber hinaus die Auslastung stark beanspruchter MongoDB-Cluster verringern.

Laut MongoDB CEO Max Schireson ist der Connector auf vielfachen Wunsch der Community entstanden:

MongoDB wird im Markt häufig für operative Big Data-Aufgaben in Echtzeit eingesetzt, während Hadoop eher für tiefgreifende Offline-Analysen zur Anwendung kommt. Es war der Wunsch der Community, dass wir diese Tools besser miteinander verzahnen.

Der MongoDB Connector for Hadoop wird auf GitHub entwickelt. Eine Einführung gibt es auf der Projektseite.

Geschrieben von
Hartmut Schlosser
Hartmut Schlosser
Content-Stratege, IT-Redakteur, Storyteller – als Online-Teamlead bei S&S Media ist Hartmut Schlosser immer auf der Suche nach der Geschichte hinter der News. #java #eclipse #devops #machinelearning #seo. Zum Lächeln bringen ihn kreative Aktionen, die den Leser bewegen. @hschlosser
Kommentare

Hinterlasse einen Kommentar

avatar
4000
  Subscribe  
Benachrichtige mich zu: