Dr. Christian Hidber auf der ML Conference 2019

Reinforcement Learning: Einführung und Anwendung im industriellen Umfeld

Redaktion JAXenter

Wie funktioniert Reinforcement Learning? Laut Dr. Christian Hidber lernen die Algorithmen intuitiv und durch Experimentieren, so wie ein Kind ein neues Spiel erlernt. Das demonstrierte er auf der ML Conference 2019 anhand eines industriellen Anwendungsbeispiels.

einforcement Learning lernt komplexe Prozesse selbstständig. Es werden keine großen Datensätze mit den „richtigen“ Antworten benötigt, sondern die Algorithmen lernen durch Experimentieren. Mithilfe von Reinforcement Learning lernen Roboter laufen, den Weltmeister in Go zu schlagen oder einen Hubschrauber zu fliegen.

Diese Session von der ML Conference zeigt das „Wie“ und „Warum“ des intuitiven Funktionierens von Reinforcement-Learning-Algorithmen und veranschaulicht deren Abläufe durch die Art und Weise, wie ein Kind ein neues Spiel erlernt. Dr. Christian Hidber gibt darin einen Einblick, wie man ein reales Problem als Reinforcement-Learning-Aufgabe umformulieren kann, und wirft einen Blick auf die Herausforderungen, das Projekt bei 7.000 Kunden in 42 Ländern auf der ganzen Welt in Produktion zu bringen.

Die gezeigte industrielle Anwendung basiert auf Dachentwässerungssystemen mit Siphonrohr. Sie soll gewährleisten, dass große Gebäude wie Stadien, Flughäfen oder Einkaufszentren bei starken Regenfällen nicht einstürzen. Die Wahl des „richtigen“ Durchmessers sei schwierig, erfordere Intuition und hydraulisches Fachwissen, so der Speaker. Bis heute sei kein realisierbarer, deterministischer Algorithmus bekannt. In der Session wird gezeigt, wie durch den Einsatz von Reinforcement Learning die Ausfallrate der bestehenden Lösung – basierend auf dem klassischen Supervised Learning – um mehr als 70 % reduziert werden konnte.

Christian is a consultant at bSquare with a focus on Machine Learning, .NET development, and Azure, and an international conference speaker. He has a PhD in computer algebra from ETH Zurich and did a postdoc at UC Berkeley where he researched online data mining algorithms. Currently, he applies machine learning to industrial hydraulics simulations.
Geschrieben von
Kommentare

Hinterlasse einen Kommentar

avatar
4000
  Subscribe  
Benachrichtige mich zu: