In den letzten Jahren hat das Feld des robotergestützten Verstärkungslernens (Reinforcement Learning, RL) bedeutende Fortschritte gemacht. Methoden, die komplexe Bildbeobachtungen verarbeiten, im realen Umfeld trainieren und zusätzliche Daten wie Demonstrationen und Vorerfahrungen einbeziehen können, sind nunmehr Realität. Nichtsdestotrotz bleibt die Anwendung von RL in der Robotik eine Herausforderung. Experten sind sich einig, dass die spezifischen Implementierungsdetails dieser Algorithmen oft genauso wichtig - wenn nicht sogar wichtiger - für die Leistung sind wie die Wahl des eigentlichen Algorithmus.
Ein bedeutendes Hindernis für die breite Anwendung von robotergestütztem RL sowie die Weiterentwicklung entsprechender Methoden ist die vergleichsweise schlechte Zugänglichkeit solcher Techniken. Um diese Herausforderung zu adressieren, wurde eine sorgfältig implementierte Softwarebibliothek entwickelt, die eine effiziente, off-policy basierte Deep-RL-Methode beinhaltet. Diese Bibliothek umfasst außerdem Methoden zur Berechnung von Belohnungen und zum Zurücksetzen der Umgebung, hochwertige Steuerungen für verbreitete Roboter und eine Reihe von anspruchsvollen Beispiel-Aufgaben.
Die Softwarebibliothek, bekannt als SERL (Software Suite for Sample-Efficient Robotic Reinforcement Learning), stellt eine Ressource für die Gemeinschaft dar. Ihre Designentscheidungen und experimentellen Ergebnisse wurden ausführlich beschrieben. Überraschenderweise zeigte sich, dass die Implementierung ein sehr effizientes Lernen ermöglicht. So wurden Strategien für den Zusammenbau von Leiterplatten, das Verlegen von Kabeln und das Umplatzieren von Objekten innerhalb von 25 bis 50 Minuten Training pro Strategie erlernt. Diese Ergebnisse verbessern die in der Literatur für ähnliche Aufgaben berichteten Ergebnisse und zeigen perfekte oder nahezu perfekte Erfolgsraten, extreme Robustheit auch unter Störungen und das Aufkommen von emergenten Erholungs- und Korrekturverhalten.
Die Autoren des SERL-Projekts - Jianlan Luo, Zheyuan Hu, Charles Xu, Siri Gadipudi, Archit Sharma, Rehaan Ahmad, Stefan Schaal, Chelsea Finn, Abhishek Gupta und Sergey Levine - präsentierten ihre Arbeit im Rahmen des CoRL 2023 Workshops. Die hochwertige, quelloffene Implementierung soll als Werkzeug für die Robotergemeinschaft dienen, um weitere Entwicklungen im Bereich des robotergestützten RL zu erleichtern. Der Quellcode und die zugehörigen Videos sind für die Öffentlichkeit zugänglich gemacht worden.
Diese Entwicklungen stehen im Kontext der wachsenden Bedeutung von dateneffizienten Lernverfahren in realen Umgebungen. Ein weiteres Beispiel für die Fortschritte auf diesem Gebiet ist die Studie von Thomas Bi und Raffaello D'Andrea, die ein robotergestütztes System zur Navigation und Lösung eines realen Labyrinthspiels entwickelten. Ihre Methode, basierend auf modellbasiertem RL, nutzt niedrig-dimensionale Beobachtungen aus Kamerabildern und verarbeitet diese Informationen, um das Labyrinth zu meistern. Das Lernen der Steuerungspolitik erfolgte ausschließlich auf dem physischen System, wobei der Fortschritt entlang des Labyrinthpfads als Belohnungssignal diente. Zusätzlich wurde das Training durch die Ausnutzung der systeminhärenten Symmetrien verbessert. Dieser Ansatz ermöglichte es, das beliebte reale Labyrinthspiel in Rekordzeit und mit lediglich fünf Stunden realer Trainingsdaten zu lösen.
Diese Fortschritte zeigen, dass durch die Kombination von fortschrittlichen RL-Methoden mit sorgfältiger Implementierung und Datennutzung die Effizienz des Lernprozesses in der Robotik erheblich gesteigert werden kann. Diese Entwicklungen haben das Potenzial, die Art und Weise, wie Roboter trainiert und eingesetzt werden, grundlegend zu verändern und neue Möglichkeiten für Anwendungen in der Industrie, Forschung und darüber hinaus zu eröffnen.
SERL und ähnliche Projekte sind ein Beleg dafür, dass die Forschung im Bereich des Verstärkungslernens zunehmend zugänglicher und anwendbarer wird. Sie ermöglichen es Forschern und Entwicklern, neue Techniken zu erforschen und zu implementieren, die die Interaktion zwischen Mensch und Maschine revolutionieren könnten. Obwohl noch Herausforderungen zu meistern sind, ist das Ziel klar: die Schaffung intelligenterer, anpassungsfähigerer und effizienterer Robotersysteme.