Java HTML Parser für die Java-Suppe

Hartmut Schlosser

jsoup ist eine Java-Bibliothek für die Entwicklungsarbeit mit HTML. Parsen von HTML von einer URL, einer Datei oder einem String, Finden und Extrahieren von Daten mittels DOM oder CSS Selektoren, Manipulation von HTML-Elementen, -Attributen und HTML-Text gehören zum Funktionsumfang. Aktuell erschienen ist Version 1.4.1, die als neue Features u.a. das Parsen eines Input-Streams, DOM-Klonierung und einen not()-Pseudo-CSS-Selektor bietet. jsoup steht unter der Open-Source-MIT-Lizenz auf GitHub zum Download bereit.

Geschrieben von
Hartmut Schlosser
Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.