Suche

Kein Dünnbrettbohrer: Apache Drill 1.0 verfügbar

Michael Thomas

© Shutterstock.com/David Orcea

Die schemafreie SQL Query Engine für Apache Hadoop, NoSQL und Cloud Storage Apache Drill hat ihre erste Hauptversion und damit die Produktionsreife erreicht.

Bereits im August 2012 wurde Apache Drill in den Apache Incubator aufgenommen, seit Ende 2014 genießt es den Status als Top-Level-Projekt der Apache Software Foundation (ASF). Mit Veröffentlichung der ersten Hauptversion 1.0 ist das Projekt ab sofort für den Produktionseinsatz freigegeben. Tomer Shiran, Mitglied des Apache Drill Project Management Committee, kommentierte das Release folgendermaßen:

The production-ready 1.0 release represents a significant milestone for the Drill project. It is the outcome of almost three years of development involving dozens of engineers from numerous companies. Apache Drill’s flexibility and ease-of-use have attracted thousands of users, and the enterprise-grade reliability, security and performance in the 1.0 release will further accelerate adoption.

Was ist Apache Drill?

Das Projekt stellt eine quelloffene Variante bzw. Weiterentwicklung des Big-Data-Projektes Dremel dar, das von Google für die Beschleunigung von mittels Hadoop durchgeführten Datenanalysen verwendet wird. Apache Drill bietet sich als schemafreie SQL Query Engine für Apache Hadoop, NoSQL und Cloud Storage den Entwicklern zufolge insbesondere bei der Hochleistungsanalyse von Daten in ihrem nativen Format, darunter auch selbstbeschreibende Daten wie Parquet, JSON-Dateien und HBase-Tabellen, an.

Ermöglicht wird zudem die Direktabfrage von Daten aus HBase-Tabellen, und zwar ohne dass parallele bzw. Overlay-Schemas im Hive Metastore definiert und aufrecht erhalten werden müssen. Des Weiteren bietet Apache Drill SQL-Erweiterungen für die Arbeit mit semistrukturierten bzw. verschachtelten Daten wie z.B. aus NoSQL Stores wie MongoDB oder Online-REST-APIs. Anfragen, die verschiedene Hadoop-Datenquellen wie HBase- und Hive-Tabellen simultan kombinieren, sind ebenfalls möglich.

Für den Einsatz von Apache Drill spricht ebenfalls, dass ein Leverage-Effekt mit bereits bestehenden SQL-Skillsets und Business-Intelligence-Tools erzielt werden kann: So werden Wechselkosten durch die vertraute ANSI-SQL-Syntax minimiert sowie die Lernkurve gesenkt. Außerdem können durch den Einsatz von ODBC- und JDBC-Treibern gängige Business-Intelligence- und Analyse-Tools wie Excel oder Tableau auch weiterhin verwendet werden.

Wie alle Projekte der ASF steht Apache Drill quelloffen unter der Apache License v2.0 zum Download bereit.

Aufmacherbild: Metal drilling closeup in metal workshop von Shutterstock.com / Urheberrecht: David Orcea

Verwandte Themen:

Geschrieben von
Michael Thomas
Michael Thomas
Michael Thomas studierte Erziehungswissenschaft an der Johannes Gutenberg-Universität Mainz und arbeitet seit 2013 als Freelance-Autor bei JAXenter.de. Kontakt: mthomas[at]sandsmedia.com
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: