Suche

KI: Google stellt neurales Netzwerk für maschinelle Übersetzung vor

Mascha Schnellbacher

Als Google seinen Übersetzungsdienst vor rund zehn Jahren startete, gab es im Web noch ziemlich wenige solcher digitalen Übersetzungstools. Im Lauf der Zeit wurde Google Translate immer besser darin, Texte von einer Sprache in eine andere zu übersetzen. Doch manchmal führte die Eingabe in das Übersetzungsfeld auch zu ziemlich seltsam anmutenden Ergebnissen. Jetzt stellt Google sein Google-Neural-Machine-Translation-System (GNMT) vor, das dank künstlicher Intelligenz wesentlich akkurater sein soll.

Das Übersetzen von einer Sprache in eine andere ist eine ziemlich komplexe Aufgabe – das wissen nicht nur geplagte Schüler, sondern auch geschulte Dolmetscher. Vor allem dann, wenn es nicht nur um das wörtliche Übersetzen geht, sondern auch noch Sprichwörter oder Slang hinzukommen, wird es kompliziert.

Gerade maschinelle Systeme müssen diese ganzen Regeln, Abweichungen und Sonderfälle mühsam lernen, wie viele Nutzer von Google Translate am eigenen Leib erfahren mussten. Google arbeitet seit Jahren an Machine-Learning-Technologien, die den Übersetzungsvorgang verbessern sollen – und hat jetzt mit dem Google-Neural-Machine-Translation-System (GNMT) einen Durchbruch erzielt.

Ein neurales Netzwerk für maschinelle Übersetzung

Das Google-Neural-Machine-Translation-System soll um bis zu 85 Prozent genauer sein als das bekannte Google Translate. Das neue Tool nutzt dafür ähnliche neurale Netzwerke wie in AlphaGo, die nicht nur Google Translate weit hinter sich lassen, sondern sogar fast die Trefferquote menschlicher Übersetzer erreichen.

Data from side-by-side evaluations, where human raters compare the quality of translations for a given source sentence. Scores range from 0 to 6, with 0 meaning “completely nonsense translation”, and 6 meaning “perfect translation."

Ergebnisse von verschiedenen Übersetzungen – 0 bedeutet „kompletter Unsinn“, 6 heißt „perfekte Übersetzung“.

GNMT wird derzeit darauf trainiert, Übersetzungen vom Chinesischen ins Englische anzufertigen. Dabei kommt es nicht nur darauf an, simple Wortentsprechungen zu lernen. Vielmehr müssen auch Sätze, Redensarten und Grammatikregeln gelernt werden, damit beispielsweise die Unterschiede zwischen „run a mile“, „run a test“ und „run a store“ klar werden. Dann kommen natürlich noch die Satzstellung und die dadurch unterschiedliche Bedeutung hinzu. An dieser Stelle werden neurale Netzwerke eingesetzt, die mit allen diesen Faktoren gefüttert werden und so Vorhersagemodelle erstellen können.

GNMT ist momentan mit Abstand das erfolgreichste Modell: Es schaut sich den Satz als Ganzes an und behält dabei die einzelnen Bestandteile wie Wörter und Phrasen im Blick. Dazu kodiert das Übersetzungssystem zuerst die (in diesem Fall) chinesischen Wörter in eine Liste von Vektoren, in der jeder Vektor die Bedeutung aller bis dahin gelesenen Wörter repräsentiert (Encoder). Nachdem der gesamte Satz gelesen ist, wird der englische Satz Wort für Wort generiert (Decoder). Um das übersetzte Wort zu erstellen, achtet der Decoder auf eine gewichtete Verteilung der kodierten chinesischen Vektoren, die am wichtigsten zur Generierung der englischen Entsprechung sind (Attention).

GNMT im Einsatz

GNMT im Einsatz

Dieses Prinzip ähnelt dem der Bilderkennung – was auch nicht weiter verwundert, da neurale Netzwerke vor allem zu diesem Zweck trainiert und eingesetzt werden. Sie betrachten ein Bild als Ganzes, sind sich dabei aber stets der einzelnen Komponenten bewusst – genauso wie bei einer Übersetzung.

GNMT macht Übersetzungen menschlicher

Das zugehörige Paper stellt weitere Vorteile des Google-Neural-Machine-Translation-Systems heraus: Dazu zählt vor allem eine erhebliche Reduktion des Berechnungsaufwands für die Verarbeitung solcher Übersetzungsaufgaben sowie eine Verkürzung der Rechenzeit. Möglich ist das durch den Einsatz des Machine-Learning-Toolkits TensorFlow und der Tensor Processing Units (TPUs). Die Übersetzung vom Chinesischen ins Englische wird ab sofort vollständig von GNMT durchgeführt; in den nächsten Monaten soll GNMT auf weitere Sprachpaare angewendet werden.

Allerdings ist das Feld der maschinellen Übersetzung noch immer weit und auch mit GNMT nicht abgeschlossen. Denn auch das System ist längst nicht fehlerfrei und produziert Fehler, die ein menschlicher Übersetzer nicht machen würde: Probleme treten beispielsweise bei ungewöhnlichen und seltenen Begriffen, bei der Übersetzung von feststehenden Begriffen oder durch mangelnde Berücksichtigung des gesamten Kontexts auf. Dennoch markiert GNMT einen wichtigen Meilenstein auf dem Weg in Richtung perfekte maschinelle Übersetzung.

Ausführliche Informationen zum Google-Neural-Machine-Translation-System (GNMT) gibt’s im Google-Research-Blog.

Verwandte Themen:

Geschrieben von
Mascha Schnellbacher
Mascha Schnellbacher
Mascha Schnellbacher studierte Buchwissenschaft und Deutsche Philologie an der Johannes Gutenberg-Universität Mainz. Seit Juni 2015 arbeitet sie als Redakteurin in der Redaktion des Entwickler Magazins bei Software & Support Media. Zuvor war sie als Lektorin in einem Verlag sowie als freie Editorin tätig.
Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.