Schnelleres Training für Dopamine-Agenten

Reinforcement Learning: Dopamine 2.0 erschienen

Florian Roos

© Shutterstock / Fabrik Bilder

Dopamine 2.0 ist da. Die neue Version des Frameworks für Reinforcement Learning bietet schnelleres Training von Dopamine-Agenten. Support für mehr Kontrollumgebungen ist ebenfalls in der neuen Version enthalten.

Google hat Version 2.0 des Reinforcement Learning Frameworks Dopamine veröffentlicht. Die neue Version soll mit mehr Kontrollumgebungen kompatibel und daher flexibler einsetzbar sein. Dopamine konzentriert sich auf Reinforcement Learning mit dem Atari 2600 Framework, welches auf dem Arcade Learning Environment aufbaut.

In Dopamine 2.0 wird der Kern des Frameworks nicht verändert. Die vorgenommenen Änderungen sollen jedoch, laut Blogpost zum Release von Dopamine 2.0, für ein allgemeineres Interface zur Interaktion mit der jeweiligen Umgebung sorgen.

Schnelleres Agenten-Training in Dopamine 2.0

In Version 2.0 sind Standardkonfigurationen für die Umgebungen CartPole und Acrobot enthalten. Wie Pablo Samuel Castro und Marc G. Bellemare vom Dopamine-Team im bereits genannten Blogpost mitteilen, soll ein Dopamine-Agent mit diesen Umgebungen in Minuten trainierbar sein. Demnach können neue Ideen und Algorithmen schnell ausprobiert werden, bevor man sie im Atari 2600 Framework testet. Nach ihren Ausführungen benötigt eine Standard-GPU für vergleichbares Training eines Agenten etwa fünf Tage, bevor der Agent in einem Atari 2600 Spiel eingesetzt werden kann.

Um Rückwärtskompatibilität für Anwender des Frameworks sicherzustellen, bleibt Dopamine 1.0 weiterhin zum Download verfügbar. Im State of the Octoverse Report 2018 (wir berichteten) wurde Dopamine als „Cool new Open Source project of 2018“ ausgezeichnet. Weitere Informationen zu Dopamine 2.0 sind im Repository auf GitHub zu finden.

ML Conference 2019

Workshop: Machine Learning 101++ using Python

mit Dr. Pieter Buteneers (Chatlayer.ai)

Honey Bee Conservation using Deep Learning

mit Thiago da Silva Alves, Jean Metz (JArchitects)

ML Summit 2019

Grundlagen von Machine Learning

mit Oliver Zeigermann (embarc)

Lösungsansätze mit KI (ML) finden – better done than perfect!

mit Jan Hedtfeld und Lena Müller-Ontjes (MACH AG)

Geschrieben von
Florian Roos
Florian Roos
Florian Roos ist Redakteur für Software & Support Media. Er hat Politikwissenschaft an der Technischen Universität Darmstadt studiert und erste redaktionelle Erfahrungen in den Bereichen Games und Consumer-Hardware gesammelt.
Kommentare

Hinterlasse einen Kommentar

Hinterlasse den ersten Kommentar!

avatar
4000
  Subscribe  
Benachrichtige mich zu: