Suche
API erkennt Textbausteine und Emotionen

Natural Language API: Google liest auch zwischen den Zeilen

Kypriani Sinaris

Google baut seine Arbeit im Bereich Maschinelles Lernen weiter aus. Nun hat das Unternehmen sein neues Google Cloud Natural Language API vorgestellt. Damit soll es möglich sein, bestimmte Textbausteine auszulesen und zu analysieren. Außerdem ist es in der Lage, quasi zwischen den Zeilen zu lesen, denn: Es erkennt auch Emotionen.

Das API soll dazu eingesetzt werden, große Textmengen zu analysieren und darin Trends zu entdecken. Die analyzeEntities-Methode findet ausgesuchte Entitäten oder Typen von Entitäten innerhalb des Textes. Im Detail können acht verschiedene Typen bestimmt werden: PERSON und LOCATION sind wohl selbsterklärend, metadata liefert den passenden Wikipedia-URL zu einer Entität, salience bewertet die Wichtigkeit der Entität auf einer Skala von 0 bis 1 und mentions gibt an, an welcher Stelle des Textes die Entität gefunden wurde. Für die Analyse über einen ausgewählten Zeitraum kann das Tools BigQuery eingesetzt werden.

Am Beispiel des folgenden Satzes wird gezeigt, wie das Google Cloud Natural Language API funktioniert:

LONDON — J. K. Rowling always said that the seventh Harry Potter book, “Harry Potter and the Deathly Hallows,” would be the last in the series, and so far she has kept to her word.

Das API würde zunächst zwei Namen finden, sowohl J.K. Rowling, als auch Harry Potter. Den Namen der Autorin würde das API auch erkennen, wenn dieser als Rowling oder Joanne Kathleen Rowling auftauchen würde. In allen diesen Fällen würde es zusätzlich den passenden Wikipedia-Eintrag zu den genannten Personen liefern. In einem Blogpost stellt Google das neue Mitglied in der Machine-Learning-Familie vor.

Lesen Sie auch: TensorFlow 0.9: Ein erster Standard für Machine-Learning-Systeme

Ein mitfühlendes API

Die Entwickler des Natural Language API versprechen außerdem, dass das API in der Lage ist, die Stimmung eines Textes auszulesen. Auf einer Skala von -1 bis +1 wird die Polarität des Textes eingeschätzt. Zusätzlich verrät magnitude ‑ also quasi das Ausmaß der Emotion ‑ auf einer Skala ab 0, wie gewichtig die ausgedrückte Emotion ist. Polarität und Ausmaß werden unabhängig voneinander gewertet. Ein Beispiel:

I love everything about Harry Potter.

Dieser Satz bekommt durch das Wort love eine 100 Prozent positive Polarität, das Ausmaß ist dagegen eher niedrig. Bei folgendem Beispiel ist die Polarität durch Worte wie worry oder mistake negativ und das Ausmaß niedrig:

With a new set of movies on the horizon, some fans worry that Ms. Rowling will make the same mistake that George Lucas did after the three original “Star Wars” films, producing inferior work that detracts from the brilliance of the original.

Spannende Ergebnisse

Sara Robinson, Developer Advocate beim Google-Cloud-Platform-Projekt hat sich zur Demonstration die New York Times als Textkorpus ausgesucht. Bei der Analyse der vom 28. Juni bis 15. Juli lagen übrigens vor allem Begriffe rund um die Präsidentschaftswahl in den USA und den Brexit im Trend. Meistgenannte Personen waren Donald Trump, Hillary Clinton, Barack Obama und Bernie Sanders. Meistgenannte Orte die USA, Großbritannien, New York City, China und Europa. Bei der Analyse der Emotionen hat Sara Robinson zwischen Nachrichten zu den Themen Kunst, Nachrichten aus New York, Technik, Meinung, Business, internationalen Nachrichten und USA unterschieden. Dabei erhielt sie ein spannendes Ergebnis. In dieser Reihenfolge an Themen sinkt praktisch die Stimmung: Während Texte zu Kunstthemen noch die positivsten Emotionen transportieren, ist der Artikelkorpus zu U.S.-Themen am wenigsten positiv gewertet.

Die komplette Analyse sowie die spannenden Ergebnisse finden Sie auf der Projektseite der Google Cloud Platform. Momentan liegt das API als Open Beta vor.

Geschrieben von
Kypriani Sinaris
Kypriani Sinaris
Kypriani Sinaris studierte Kognitive Linguistik an der Goethe Universität Frankfurt am Main. Seit 2015 ist sie Redakteurin bei JAXenter und dem Java Magazin.
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
400
  Subscribe  
Benachrichtige mich zu: