Forscher um Pulkit Agrawal und seinen Schüler Marcel Torne Villasevil vom Massachusetts Institute of Technology (MIT) haben mit „RialTo“ eine Übungs-Software für Roboter entwickelt. Der Vorteil: Die Maschine muss nicht mehr in der realen Umgebung üben, in der er später eingesetzt werden soll.
Vom späteren Einsatzort wird mithilfe von Bildern eines Smartphones ein digitaler Zwilling erstellt, der Basis für das Training wird.
Auf Störungen reagieren
„Unser Ziel war es, dass Roboter in einer einzigen Umgebung bei Störungen, Ablenkungen, wechselnden Lichtverhältnissen und veränderten Objektpositionen außergewöhnlich gute Leistungen erbringen“, sagt Villasevil, Forschungsassistent am MIT Computer Science and Artificial Intelligence Laboratory. „Jeder kann mit seinem Handy ein digitales Abbild der realen Welt aufnehmen, und die Roboter können dann in der simulierten Umgebung viel schneller trainieren als in der realen Welt.“
Ziel war es eine Strategie zu entwickeln, die auf realen Handlungen und Beobachtungen basiert, wie zum Beispiel das Greifen nach einer Tasse auf einer Theke. Diese Demonstrationen aus der realen Welt werden in der Simulation nachgebildet und liefern wertvolle Daten für das Training. „Das hilft bei der Entwicklung einer starken Strategie, die sowohl in der Simulation als auch in der realen Welt gut funktioniert“, so Torne Villasevil. „Ein verbesserter Algorithmus, der verstärkendes Lernen einsetzt, hilft dabei, diesen Prozess zu steuern, um sicherzustellen, dass die erlernten Prozesse auch außerhalb des Simulators wirksam sind.“ Verstärkendes Lernen ist eine Form des maschinellen Lernens.
Drei Schwierigkeitsgrade
Tests haben ergeben, dass RialTo die Erledigung einer Vielzahl von Aufgaben um 67 Prozent gegenüber dem Training in einer realen Umgebung verbessert hat. Die Aufgaben bestanden darin, eine Mikrowelle zu öffnen, ein Buch in ein Regal zu räumen, Teller und Tassen in ein Regal zu stellen sowie Schubladen und Schränke zu öffnen.
Bei jeder Aufgabe gab es drei ansteigende Schwierigkeitsgrade: zufällige Anordnung der Objekte, Hinzufügen von visuellen Ablenkungen und physische Störungen während der Ausführung. In Verbindung mit realen Daten übertraf das System herkömmliche Methoden des Nachahmungslernens, insbesondere in Situationen mit vielen visuellen Ablenkungen oder physischen Störungen.
(pd/pressetext)