Open Source Data Warehousing

Apache Hive 1.0.0 veröffentlicht

Michael Thomas

Apache Hive Logo (Quelle: hive.apache.org)

Die Data-Warehouse-Software für Hadoop Apache Hive hat ihre erste Hauptversion erreicht. Anders, als man bei einer Major-Version erwarten könnte, halten sich die Neuerungen in Hive 1.0.0 in Grenzen. Der Grund: Eigentlich sollte die Codebasis als Version 0.14.1 erscheinen, doch der Release-Mitteilung zufolge war die Community der Ansicht, dass es nach einem nun seit rund neun Jahren andauernden Entwicklungsprozess an der Zeit war, die folgenden Releases als 1.x-Versionen zu bezeichnen.

Neuerungen

Die wesentlichen Neuerungen von Hive 1.0.0 sind der Beginn der Definition des öffentlichen APIs sowie die Entfernung des HiveServer 1. Letzteres gilt als wichtiger Schritt auf dem Weg, Hive für den Einsatz in Unternehmen bereit zu machen. Der vor einiger Zeit von Cloudera spendierte HiveServer 2 ermöglicht die Unterstützung von JDBC und ODBC; die Authorisierung mit Apache Sentry befindet sich zur Zeit in Arbeit. CLI-User, die HiveServer 2 nutzen wollen, müssen zu Beeline migrieren.

Roadmap

Entsprechend der neuen Namenskonvention wird die ursprünglich als Hive 0.15.0 geplante – und damit die eigentliche Hauptversion darstellende – Version als Hive 1.1.0 erscheinen. Der Releaseprozess hat offenbar bereits begonnen; Hauptfeature soll die heiß ersehnte Einführung von Spark als drittes Ausführungs-Back-End (neben MapReduce und Tez) sein.

Verwandte Themen:

Geschrieben von
Michael Thomas
Michael Thomas
Michael Thomas studierte Erziehungswissenschaft an der Johannes Gutenberg-Universität Mainz und arbeitet seit 2013 als Freelance-Autor bei JAXenter.de. Kontakt: mthomas[at]sandsmedia.com
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
4000
  Subscribe  
Benachrichtige mich zu: