Einführung in Apache Solr [Buchtipp]

Einführung in Apache Solr
Untertitel

Praxiseinstieg in die innovative Suchtechnologie

Autor

Markus Klose, Daniel Wrigley

Verlag

O’Reilly

Erschienen

2014

Seiten

336

Preis

39,90

ISBN

3955614212

Preis

39,90

Zu Apache Solr gibt es eine umfangreiche Dokumentation, tausende Tutorials, Blog-Posts und Bücher. Das letzte E-Book, das ich zu diesem Thema erstanden habe, füllte mehr als 1000 Seiten. Vermutlich gerade weil es so unglaublich viel zu diesem Thema gibt, ist der Einstieg in die Solr-Welt nicht unbedingt komfortabel.

Nachdem das Internet ja nichts vergisst, kämpft man sich als Neuling oft zwischen veralteten Konzepten und Beispielen durch, muss aber gleichzeitig auch irgendwie die zahlreichen neuen Begriffe aus der Such-Welt bewältigen.

Genau vor diesem Problem stand ich. Mühsam habe ich mir die ersten Basics zusammengereimt und einfach ausprobiert. Für mich kam das Buch von Klose und Wrigley ein bisschen zu spät, aber ich habe es trotzdem gelesen.

Solr-Einstieg

Das Buch ist sehr lesenswert. Es bietet einen fundierten und leicht zu lesenden Einstieg in die Solr-Welt, das mit ein paar Hintergründen und Hinweisen zur Installation anfängt. Schon nach 13 Seiten kann man die ersten Suchergebnisse bewundern. Die beeindrucken vielleicht noch niemanden außer dem Leser selbst, aber glücklicherweise ist das Buch ja noch nicht zu Ende.

Es geht weiter mit Grundbegriffen: was ist Indexierung, was für Suchkomponenten gibt es eigentlich. Das Wichtigste wird kurz und prägnant, aber immer verständlich und Anfängergerecht beschrieben. Sehr schön ist auch, dass bereits früh im Buch auf die verschiedenen Handler hingewiesen wird. Damit rundet sich der erste Eindruck ab und man hat das Gefühl, den Koloss Solr immerhin mal zu überblicken. Auch erste administrative Werkzeuge bekommt man in die Hand. Wenn man aus einer rein relationalen Welt kommt, ist NoSQL schon ausreichend verwirrend, und Solr setzt noch einen drauf. Daher ist dieses Kapitel sehr wichtig, um eine wichtige Orientierungshilfe bereits am Anfang zu erhalten.

Es wird weiter besprochen, wie das Indexieren von beispielsweise Wikipedia stattfindet, und auch die zahlreichen Suchoptionen kommen nicht zu kurz. Gerade dieses Kapitel sollte die meisten Entwickler anlocken, und es ist auch sehr gut gelungen. Vieles von den dort beschriebenen Möglichkeiten habe ich trotz intensiver Recherche nicht gefunden. Das Buch ist also nicht nur als Einsteigerwerk, sondern auch zum „immer wieder mal reinlesen“ geeignet. Es ist ganz klar keine Referenz, aber wer nur zeitweise mit Solr arbeitet, dürfte sich über die guten Beschreibungen und den strukturierten Aufbau des Buchs freuen.

Solrs Analyse-Prozess

Besonders interessant ist auch der Teil über Solrs Analyse-Prozess. Für diejenigen, die noch nicht mit Suchen zu tun hatten, dürfte dies der Teil mit der „Schwarzen Magie“ sein. Erfreulich ist, dass die beiden Autoren auch das einfach vermitteln können und man sich schnell sicher zwischen Filtern und Tokenizern bewegen kann. Hilfreich ist auch, dass an dieser Stelle sich das Werk auch in eine Art Kochbuch verwandelt, das zunächst das Problem und dann dessen Lösung beschreibt.

Nach etwa der Hälfte des Buchs dürften die meisten in der Lage sein, einen Solr-Knoten aufzusetzen und mittels z. B. Facetten eine Autosuggest Box zu bauen. Das Kapitel ist umfangreich, und die wichtigsten Solr-Features werden angesprochen.

Danach folgt das Kapitel über Scoring, das zunächst etwas anspruchsvoller ist, was sich mit der Komplexität des Themas begründen lässt. Hier zeigt sich auch die Fachkompetenz der Autoren, die alles präzise erklären und die richtige Werkzeuge zum Debuggen in die Hand geben. Im Verlauf wird es dann wieder einfacher, und das Kapitel wandelt sich wieder in ein Kochbuch.

Architektur und Cloud

Sozusagen als Überraschungsgast ist sogar noch ein Kapitel über die richtige Solr-Architektur beigelegt. Die Autoren beschränken sich dabei nicht auf das klassische Master/Slave Szenario, sondern geben auch einen Einblick in die modernere SolrCloud. Auch eine ZooKeeper-Einführung fehlt hier nicht. Dabei handelt es sich um eine Komponente mit denen sich die SolrCloud-Knoten verwalten lassen. Es ist der Standard für Solr und damit haben die Autoren genau an der richtigen Stelle über den Tellerrand gesehen. Bereits beim Lesen kann man dabei sein eigene Cloud mit aufbauen.

Einzig das letzte Kapitel wirkt etwas lahm. Hier geht es um Client-APIs, Deployment in Tomcat und auch, wie man Teil der Apache Community wird. Alles ganz nett, verblasst aber angesichts der großartigen anderen Kapitel. Das ist aber leicht zu verschmerzen. Immerhin kann man hier problemlos überblättern. Wer wirklich will, findet immerhin ein paar nette Anregungen was man sich noch so ansehen kann. Sogar ElasticSearch, ein Solr-Konkurrent, wird kurz angesprochen.

Fazit

Unterm Strich also ein sehr lesenswertes Buch, das man uneingeschränkt an jeden empfehlen kann, der gerade mit Solr anfängt oder nur hin und wieder damit arbeitet. Nachdem ich meine ersten Hürden gemeistert habe, verbleibt das Buch auf meinem Schreibtisch. Es ist hervorragend, um sich halb-vergessene Konzepte wieder ins Gedächtnis zu rufen, oder einen schnellen Einstieg in eine bestimmte Komponente zu bekommen. Obwohl Java-Grundkenntnisse das Lesen etwas vereinfachen dürften, würde ich das Buch auch meinen Kollegen aus anderen Programmier-Ländern in die Hand geben. Sprachlich ist es leicht zu lesen, verständlich und wirkt trotzdem frisch. Das Buch bietet tatsächlich, was drauf steht: eine Einführung. Die ist aber so effektiv und gut, dass man sich danach tatsächlich als recht kompetenten Anwender bezeichnen kann. Alles weitere kann man sich dann von den beiden Autoren Klose und Wrigley auf einen ihrer Trainings erzählen lassen. Hoffen wir, dass es noch ein Nachfolgewerk gibt.

Christian Grobmeier

Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: