Apache Lucene und Solr erhalten Updates

Claudia Fröhling

Die Java-Such-Engine Apache Lucene und der Suchserver Solr sind in Version 4.5 erschienen. Beide werden vom Lucene-PMC, also dem Project Management Committee bei Apache, verwaltet.

Lucene

Lucene Core 4.5 erweitert vor allem das Kontingent von Values, beispielsweise für die DocValue-Felder und den neuen Lucene45Codec. Mit Lucene 4.0 war das Indexformat auf ein über „Codecs“ flexibel anpassbares Framework aktualisiert worden. Version 4.5 enthält außerdem neue Implementierungen für DocIdSet, Bugfixes sind ebenfalls enthalten. Eine vollständige Liste aller Änderungen findet sich im Changelog.

Nicht nur durch das Redesign des Fileformats markiert das vierte Major Release einen wichtigen Meilenstein für das Projekt. Lucene 4.0 macht auch Gebraucht von finiten Automaten, d.h. es betrachtet sowohl das Term Dictionary als auch das Query ans sich als finiten Zustandsautomaten. Außerdem wurden der FieldCache und das API an die zahlreichen Änderungen der vierten Version angepasst.

Solr

Solr 4.5 unterstützt ab sofort Custom Sharding, so ist es jetzt beispielsweise möglich, die Funktion „shard by field“ zu nutzen. Die neue Version enthält wie die von Lucene auch Änderungen für DocValue, außerdem lässt sich die solr.xml-Datei jetzt in Apache Zookeeper speichern. Alle Änderungen am Suchserver finden sich im Changelog.

Solr ist schon lange mehr als nur ein einfacher HTTP-Wrapper um Apache-Lucene-basierte Indizes. Es kann als eine NoSQL-Datenbank verstanden werden, die für die Suche in großen Datenmengen optimiert ist. Solr wird gerne als sekundärer Index für große, relationale Datenbanken eingesetzt, auf denen sich in der Regel schlecht über beliebige Attributkombinationen suchen lässt. Wie reif Apache Solr seit Version 4.3 für die Cloud ist, behandelt ein Artikel von Martin Breest und Jens Hadlich im Java Magazin 8.2013.

Geschrieben von
Claudia Fröhling
Claudia Fröhling
Claudia Fröhling hat in verschiedenen Redaktionen als TV- und Onlineredakteurin gearbeitet, bevor sie 2008 zur Software & Support Media GmbH kam und sich bis 2014 um alle Projekte des Verlages im Ressort Java kümmerte. Claudia hat einen Abschluss in Politikwissenschaften und Multimedia Producing. Ihr Google+ Profil findest du hier.
Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.