Big-Data-Projekt Apache Tajo erreicht Version 0.11.0

Michael Thomas

© Shutterstock.com/Baloncici

Apache Tajo ist in Version 0.11.0 erschienen. Das neueste Release des Data-Warehouse-Systems für Hadoop bringt insgesamt rund 350 Bugfixes sowie mehrere neue Funktionen mit sich.

Apache Tajo ist ein verteiltes, relationales Data-Warehouse-System für Hadoop, das sich vor allem für skalierbare Ad-hoc-Abfragen mit geringen Latenzzeiten sowie für Online-Aggregation und ETL-(Extract-Transfer-Load-)Prozesse eignet. Beeinflusst wird das Projekt von den Technologien Dryad, MapReduce, Dremel, Scope sowie von parallelen Datenbanken. Es verfügt über eine eigene Abfrage-Engine. Als primäre Speicherschicht verwendet Tajo das Dateisystem HDFS (Hadoop Distributed File System).

Die aktuelle Version 0.11.0 stellt Hyunsik Choi, Vice President von Apche Tajo, einen wichtigen Meilenstein dar, der insbesondere Unternehmensanwendern die Integration bestehender Datenbanken und NoSQL-Speicher erleichtern soll. Zu den neuen Features gehört u. a. die Unterstützung verschachtelter Record Types, sowie von ORC-Dateien, Tabellenräumen (ähnlich denen des relationalen Datenbankmanagementsystems), Multi-Abfragen und Python UDF/UDFA.

Eine Liste sämtlicher Änderungen und Neuerungen findet sich Auf der Projekt-Website.

Aufmacherbild: Big shelf with white storage boxes in warehouse von Shutterstock.com / Urheberrecht: Baloncici

Verwandte Themen:

Geschrieben von
Michael Thomas
Michael Thomas
Michael Thomas studierte Erziehungswissenschaft an der Johannes Gutenberg-Universität Mainz und arbeitet seit 2013 als Freelance-Autor bei JAXenter.de. Kontakt: mthomas[at]sandsmedia.com
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: