Apache Lucene und Solr erhalten Updates
Die Java-Such-Engine Apache Lucene und der Suchserver Solr sind in Version 4.5 erschienen. Beide werden vom Lucene-PMC, also dem Project Management Committee bei Apache, verwaltet.
Lucene
Lucene Core 4.5 erweitert vor allem das Kontingent von Values, beispielsweise für die DocValue-Felder und den neuen Lucene45Codec. Mit Lucene 4.0 war das Indexformat auf ein über „Codecs“ flexibel anpassbares Framework aktualisiert worden. Version 4.5 enthält außerdem neue Implementierungen für DocIdSet, Bugfixes sind ebenfalls enthalten. Eine vollständige Liste aller Änderungen findet sich im Changelog.
Nicht nur durch das Redesign des Fileformats markiert das vierte Major Release einen wichtigen Meilenstein für das Projekt. Lucene 4.0 macht auch Gebraucht von finiten Automaten, d.h. es betrachtet sowohl das Term Dictionary als auch das Query ans sich als finiten Zustandsautomaten. Außerdem wurden der FieldCache und das API an die zahlreichen Änderungen der vierten Version angepasst.
Solr
Solr 4.5 unterstützt ab sofort Custom Sharding, so ist es jetzt beispielsweise möglich, die Funktion „shard by field“ zu nutzen. Die neue Version enthält wie die von Lucene auch Änderungen für DocValue, außerdem lässt sich die solr.xml-Datei jetzt in Apache Zookeeper speichern. Alle Änderungen am Suchserver finden sich im Changelog.
Solr ist schon lange mehr als nur ein einfacher HTTP-Wrapper um Apache-Lucene-basierte Indizes. Es kann als eine NoSQL-Datenbank verstanden werden, die für die Suche in großen Datenmengen optimiert ist. Solr wird gerne als sekundärer Index für große, relationale Datenbanken eingesetzt, auf denen sich in der Regel schlecht über beliebige Attributkombinationen suchen lässt. Wie reif Apache Solr seit Version 4.3 für die Cloud ist, behandelt ein Artikel von Martin Breest und Jens Hadlich im Java Magazin 8.2013.
Hinterlasse einen Kommentar