Big-Data-Projekt Apache Tajo in Version 0.10.0 erschienen

© shutterstock.com/Marques
Die Apache Software Foundation hat das 0.10.0-Release von Apache Tajo, einem Data-Warehouse-System für Hadoop, bekanntgegeben. Dutzende neuer Features soll die neue Version enthalten, darunter Oracle- und PostgreSQL-Catalog-Store-Unterstützung sowie eine direkte Unterstützung von JSON-Dateien.
Durch die HBase-Speicherintegration haben Tajo-Nutzer nun direkten Zugriff auf HBase-Tabellen. Der verbesserte Java-Database-Connectivity-(JDBC)-Treiber soll für eine einfachere Verwendung von JDBC-Anwendungen sorgen. Laut Hyunsik Choi, dem stellvertretenden Vorsitzenden des Tajo-Projekts, soll der Zugriff auf Tajo damit nicht komplizierter sein als der auf herkömmliche relationale Datenbankmanagementsysteme.
Last but not least wurde auch an der Amazon-S3-Unterstützung gefeilt – für Jihood Son, Mitglied des Tajo-Projektmanagementkomitees, das beeindruckendste Feature der neuen Version. Eine komplette Übersicht über die Neuerungen bietet der Changelog.
Was ist Apache Tajo?
Apache Tajo ist ein verteiltes, relationales Data-Warehouse-System für Hadoop, das sich vor allem für skalierbare Ad-hoc-Queries mit geringen Latenzzeiten sowie für Online-Aggregation und ETL-(Extract-Transfer-Load-)Prozesse eignet. Beeinflusst wird das Projekt von den Technologien Dryad, MapReduce, Dremel, Scope sowie von parallelen Datenbanken. Es verfügt über eine eigene Query Engine. Als primäre Speicherschicht verwendet Tajo das Dateisystem HDFS (Hadoop Distributed File System).
Im Frühjahr 2013 war Tajo in den Apache-Inkubator aufgenommen worden. Version 0.8.0 war das erste Tajo-Release als Top-Level-Projekt bei der Apache Software Foundation.

Aufmacherbild: City of Toledo near the bridge Puente de Alcantara over River Tajo, Spain von shutterstock.com / Urheberrecht: Marques
Hinterlasse einen Kommentar