Lucene-Subprojekt Tika mit neuer Version - JAXenter

Lucene-Subprojekt Tika mit neuer Version

Claudia Fröhling

Das Lucene-Subprojekt Tika ist in Version 0.7 erschienen und aktualisiert damit auf PDFBox 1.0. Außerdem soll das MP3-File-Parsing inklusive des ID3v2-Supports verbessert worden sein. Apache Tika bietet ein Toolkit zur Textextraktion. Mehr Informationen zu Tika, zu Lucene im Allgemeinen und weiteren Subprojekten gibt es in der großen Artikelserie von Bernd Fondermann.

Geschrieben von
Claudia Fröhling
Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.