Apache Tajo 0.8: erstes Release als Top-Level-Projekt

Redaktion JAXenter

Version 0.8 des Big-Data-Projekts Apache Tajo wurde freigegeben. Dies ist das erste Release als Top-Level-Projekt bei der Apache Foundation. Insgesamt 25 neue Features bietet die neue Version.

In puncto SQL-Support werden nun Datenbank-Namespaces unterstützt. Außerdem sind neue Join-Operationen möglich, u. a. Full, Left, Outer sowie komplexe Joins. Weitere Standard-SQL-Datentypen wie Date- und Time-Typen sowie entsprechende Operatoren werden nun ebenfalls unterstützt.

Tajo 0.8 ist kompatibel mit den Hadoop-Versionen 2.2.0, 2.3.0 und 2.4.0. Das neue Release bringt außerdem eine überarbeitete Hive-Integration.

Am Web-UI und der Tajo sql shell wurde ebenfalls gefeilt. Die Ausführung von Linux-Shell- und HDFS-Commands ist ab sofort möglich. Des Weiteren wird der JDBC-Treiber unterstützt.

Weitere neuere Features sowie Bugfixes können den Release Notes entnommen werden. Downloads stehen auf der Projektseite bereit.

Apache Tajo ist ein verteiltes, relationales Data-Warehouse-System für Hadoop, das sich vor allem für skalierbare Ad-hoc-Queries mit geringen Latenzzeiten sowie für Online-Aggregation und ETL-(Extract-Transfer-Load-)Prozesse eignet. Beeinflusst wird das Projekt von den Technologien Dryad, MapReduce, Dremel, Scope sowie von parallelen Datenbanken. Es verfügt über eine eigene Query Engine. Als primäre Speicherschicht verwendet Tajo das Dateisystem HDFS (Hadoop Distributed File System). Im Frühjahr 2013 war Tajo in den Apache-Inkubator aufgenommen worden.

Geschrieben von
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: