Suche

New Kid on the BigData-Block: Apache Drill im Incubator

Claudia Fröhling

Nachwuchs im Apache-Incubator: Das Framework Apache Drill ist der jüngste Zuwachs der Familie und soll die Open-Source-Implementierung für das Dremel-System bzw. die damit verbundene IaaS-Lösung BigQuery von Google darstellen. Drill soll bei der Analyse von datenintensiven, verteilten Anwendungen helfen und bis zu 10.000 Server skalieren können.

Im Gegensatz zu Apache Hadoop soll es bei Drill nicht um einen hohen Durchsatz bei der Verarbeitung von Datenmengen gehen, sondern um die interaktive Datenanalyse und Untersuchung  der so genannten Sub-Second-Latenz. Dabei soll Drill auch die Funktionen von Apache Zookeeper nutzen.

Apache Drill unterstützt ein verschachteltes Datenmodell und kodiert in Formaten wie JSON, Avro oder Protocol Buffers. Auch CSV-Dateien werden unterstützt. Abfragen sollen gegen diverse Datenquellen möglich sein, beispielsweise gegen HBase, Cassandra und MongoDB.

Zu den Mentoren des Incubator-Projekts gehören Ted Dunning (MapR), Grand Ingersoll (Lucid Works) und Isabel Drost (Nokia). Derzeit ist der erste Meilenstein als Developer Preview auf GitHub verfügbar.

Lesetipp: Im Java Magazin 10.13 startete übrigens unsere groß angelegte NoSQL-Serie, die die wichtigsten Lösungen in diesem Bereich Monat für Monat beleuchten soll. Los ging es mit Neo4j, nächste Woche folgt Apache Cassandra und darauf HBase.

Geschrieben von
Claudia Fröhling
Claudia Fröhling
Claudia Fröhling hat in verschiedenen Redaktionen als TV- und Onlineredakteurin gearbeitet, bevor sie 2008 zur Software & Support Media GmbH kam und sich bis 2014 um alle Projekte des Verlages im Ressort Java kümmerte. Claudia hat einen Abschluss in Politikwissenschaften und Multimedia Producing. Ihr Google+ Profil findest du hier.
Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.