Interview mit Björn Schuller zur MTC 2017

Deep Learning in mobilen Anwendungen: Labels, Spracherkennung und Co.

Kypriani Sinaris

Intelligente Anwendungen werden immer mehr ihren eigenen Charakter entwickeln. Davon geht Prof. Dr. Björn Schuller aus, Inhaber des Lehrstuhls für Complex & Intelligent Systems an der Universität Passau. Wir hatten die Gelegenheit, den Speaker bei der MTC 2017 zu interviewen und haben mit ihm über die Zukunft intelligenter mobiler Anwendungen gesprochen.

JAXenter: Deep Learning, Maschinelles Lernen oder die Künstliche Intelligenz: Das sind die Buzzwords der Stunde. Kannst du als Einstieg umreißen, was mobile Anwendungen in diesem Bereich bereits leisten können?

Björn Schuller: Mobile Anwendungen benutzen Deep Learning bereits im größeren Stil für Spracherkennung, Sprachverstehen, Übersetzung, Musikerkennung, Bilderkennung, z. B. wenn wir lachen, um im richtigen Moment auszulösen. Teilweise läuft die Verarbeitung aber noch verteilt, d.h., die Daten werden an einen Server geschickt, wo die eigentliche Intelligenz gelagert ist. Das wird sich zunehmend ändern, da Nutzer gerne die Daten bei sich behalten wollen und mobile Neuro-Processing-Units oder andere spezielle Chip-Entwicklungen für tiefes Lernen mit neuronalen Netzen oder andere Verfahren maschinellen Lernens rasante Fortschritte in der Entwicklung machen.

Mobile Anwendungen benutzen Deep Learning bereits im größeren Stil.

JAXenter: Welche technologischen Herausforderungen gibt es in diesem Bereich? Tiefem Lernen geht die Verarbeitung großer Datenmengen voraus …

Björn Schuller: Ja, dafür braucht es auch meistens sogenannte Labels, die sagen, was die Daten beinhalten, die aber meist nicht im großen Stil vorhanden sind. Mit ihnen kann man überwacht lernen, also dem intelligenten System vorführen „diese Daten sind dies und das“, damit es entsprechend lernt.

JAXenter: Wie kann man das mit dem menschlichen Lernen vergleichen?

Björn Schuller: Das ist nicht unbedingt, wie wir lernen. Wir lernen meist unüberwacht oder bestärkend, d.h., aus der Reaktion unserer Umwelt. Labels sind aber der (noch) weit verbreitete Standard beim tiefen und maschinellen Lernen. Die Herausforderung ist nun also, viele Daten mit Labels zu schaffen oder effizient wenige richtige Daten auszusuchen, oder die intelligenten Applikationen mehr selber, „leicht überwacht“, lernen zu lassen. Außerdem muss man natürlich effiziente Algorithmen entwickeln, die wenig Strom, Speicher und Rechenleistung brauchen, und dabei schnell nachlernen können. Dazu kommt, dass man gerne besser verstehen möchte, was ein Lernverfahren zu seinen Entscheidungen verleitet.

JAXenter: Du sprichst in deiner Session auch über künstliche Kreativität – was meinst du damit?

Björn Schuller: Man kennt ja schon Bilder, die künstliche Intelligenz erstellt hat. Wir lassen unsere Applikationen auch Musik komponieren, aber es geht noch weiter in den Bereich künstlich erstellter Gesprächsinhalte, Geschichten, Gedichte, oder Witze und vieles mehr. Das Interessante ist dann vor Allem, wo echte Kreativität beginnt und wie eine intelligente Applikation die geschaffenen Werke bewertet. Das bedeutet, dass sie eine Art Geschmack hat, um aus den vielen möglichen erstellbaren Varianten etwas auszuwählen. Es stellt sich die Frage, wie man die Kreativität an Rahmenbedingungen anpassen kann, z. B. ein Lied passend zur Situation komponieren lassen kann – z. B. für einen Augenblick in einem Videospiel.

Lesen Sie auch: TensorFlow 1.0 erschienen: Der neue Standard für Machine Learning

Das Interessante ist vor Allem, wo echte Kreativität beginnt und wie eine intelligente Applikation die geschaffenen Werke bewertet.

JAXenter: Wie sieht die Zukunft intelligenter Mobile-Anwendungen aus?

Björn Schuller: Intelligente mobile Anwendungen werden sicherlich intelligenter, effizienter und insgesamt robuster und leistungsstärker. Hoffentlich und wahrscheinlich werden auch zunehmend weniger Daten an externe Server gesendet, sondern mehr lokale Verarbeitung geleistet. Wahrscheinlich werden sie dennoch auch weiterhin kommunikativ sein, da potenziell der lokale Austausch mit anderen mobilen Geräten vor Ort steigt, wie diversen Wearables und künftig vielleicht Invisibles sowie Geräten anderer. Vor Allem werden sie aber vielleicht auch immer mehr ihren eigenen Charakter entwickeln, wie etwa bei der genannten künstlichen Kreativität.

PD Dr.-Ing. habil. Björn W. Schuller - Lehrstuhl für Mensch Maschine Kommunikation Foto: Andreas Heddergott / Verwendung frei fuer die Berichterstattung ueber die TU Muenchen unter Nennung des Copyrights

PD Dr.-Ing. habil. Björn W. Schuller – Lehrstuhl für Mensch Maschine Kommunikation
Foto: Andreas Heddergott

Prof. Dr. Björn Schuller ist Inhaber des Lehrstuhls für Complex & Intelligent Systems an der Universität Passau, Reader in Machine Learning am Imperial College London, permanenter Gastprofessor am HIT in der Volksrepublik China und Berater von Unternehmen wie HUAWEI. Er forscht und lehrt zur maschinellen Intelligenz. Bevorzugte Anwendungen liegen im Bereich der multisensoriellen Computerperzeption und der künstlichen emotionalen und sozialen Intelligenz. Industrielle Erfahrung zur Umsetzung in Produkte für mobile Alltagslösungen sammelte er unter Anderem als mitbegründender Geschäftsführer des TU München Start-ups audEERING GmbH im Starnberger Fünfseenland. Er ist Mitverfasser von fünf Büchern und über 600 technischen Publikationen im Fachbereich, die mehrfach zitiert wurden. Vom World Economic Forum wurde er 2015 und 2016 als einer der 40 herausragenden Wissenschaftler unter 40 Jahren geehrt.

Geschrieben von
Kypriani Sinaris
Kypriani Sinaris
Kypriani Sinaris studierte Kognitive Linguistik an der Goethe Universität Frankfurt am Main. Seit 2015 ist sie Redakteurin bei JAXenter und dem Java Magazin.
Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.