Elasticsearch for Hadoop 1.3 auf der Zielgeraden

Claudia Fröhling

Elasticsearch for Apache Hadoop (es-hadoop) ist in Version 1.3 M3 erschienen. Das Projekt bietet ein Jar für die Echtzeitsuche über verschiedene Hadoop-, Cascading-, Hive- und Pig-Versionen sowie verschiedene Hadoop-Distributionen hinweg.

Neben Bugfixes sind ab sofort unter anderem Multi-Index Writes für Tabellen möglich. Das ermöglicht die Indexierung von Daten in Hadoop in Echtzeit, egal ob man Map/Reduce, Cascading, Hive oder Pig nutzt. Neu sind außerdem über 15 Metriken zur Performance-Messung. Es-hadoop warnt jetzt außerdem vor, wenn sich Rechtschreibfehler in der Query befinden.

Mit Meilenstein 3 ist es möglich, sowohl HTTP- als auch SOCKS-Proxies zu nutzen. Elasticsearch for Hadoop unterstützt außerdem beide Hadoop-Umgebungen (1.x und 2.x). Mehr Informationen finden sich im Blogpost.

Eine Einführung in die Echtzeitanalyse mit Elasticsearch gibt Bernhard Pflugfelder auf der diesjährigen BigDataCon in Mainz. Wer sich vorher schon mit dem quelloffenenen, skalierbaren Document Store vertraut machen möchte, dem sei der Artikel von Pflugfelder und Christian Meder im Java Magazin 1.14 empfohlen.

Geschrieben von
Claudia Fröhling
Claudia Fröhling
Claudia Fröhling hat in verschiedenen Redaktionen als TV- und Onlineredakteurin gearbeitet, bevor sie 2008 zur Software & Support Media GmbH kam und sich bis 2014 um alle Projekte des Verlages im Ressort Java kümmerte. Claudia hat einen Abschluss in Politikwissenschaften und Multimedia Producing. Ihr Google+ Profil findest du hier.
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: