LearningGripper

Greifen und Orientieren durch eigenständiges Lernen

Der LearningGripper entspricht in abstrahierter Weise der menschlichen Hand. Und auch seine Aktionen haben viel mit seinem natürlichen Vorbild gemeinsam: Der Robotergreifer mit vier Fingern lernt mittels Machine-Learning-Verfahren selbstständig, eine Kugel in angehobenem Zustand in jede beliebige vorgegebene Orientierung zu drehen.

Zur Ausführung dieser komplexen Handlung sind lediglich die elementaren Aktionen und möglichen Positionen der Finger sowie die Feedbackfunktion der Umgebung im Voraus definiert. Er bekommt nur die Vorgabe, was er können muss. Nicht aber, wie er die Aufgabe zu lösen hat. Die dazu nötige Bewegungsstrategie entwickeln die Lernalgorithmen des Greifers selbstständig – ganz ohne weitere Programmierung.

Greifen und Lernen – ein intelligentes Zusammenspiel

Theorien besagen, wir Menschen seien nur so intelligent, weil unsere Hand so viele komplexe Aufgaben lösen kann. Babys beginnen sehr früh, Objekte zu greifen – zum Beispiel den Finger der Mutter. Sobald wir gelernt haben, ein Objekt richtig zu fassen, können wir es umdrehen und von allen Seiten betrachten. Nur so lässt sich ein dreidimensionales Bild des Objektes im Kopf rekonstruieren. Die Hand dient uns Menschen also auch zum Lernen.

Trial and Error – Lernen durch Bestärken

Die Lernmethoden von Maschinen sind mit denen des Menschen vergleichbar: ob positiv oder negativ – sie benötigen eine Rückmeldung auf ihre Aktionen, um sie einordnen zu können und daraus zu lernen. Beim LearningGripper kommt die Methode des Reinforcement Learning zum Einsatz, das Lernen durch Verstärken. Der Greifer bekommt dabei keine konkrete Handlung vorgegeben, die er nachahmen muss. Er optimiert seine Fähigkeiten ausschließlich anhand des Feedbacks zu seinen vorangegangenen Aktionen. Dadurch erhöht sich die Wahrscheinlichkeit, dass er eine erfolgreiche Aktion ausgeführt und ein weniger erfolgreicher Zug nicht erneut wiederholt.

Angetrieben werden die vier Finger von insgesamt zwölf pneumatischen Balgaktoren mit Niederdruck zwischen 2,5 und 3,5 bar. Jeder von ihnen verfügt über drei Freiheitsgrade und die Grundfunktionen des Zeigefingers. Allein im Startzustand stehen der gesamten Hand damit 3¹² Gesamtaktionen zur Auswahl, um die Kugel neu zu orientieren. Durch die intelligente Koordination der Finger und die flexible Balgstruktur ist die Kinematik frei beweglich und nachgiebig. Sie kann selbst empfindlichste Objekte sicher greifen, anheben und drehen – ganz wie ihr natürliches Vorbild.

Reduzierter Programmieraufwand durch maschinelles Lernen

Beim Messeexponat zum LearningGripper demonstriert ein Greifer, wie er innerhalb einer Stunde eine Bewegungsstrategie maschinell erlernt – vom ersten Versuch bis zum zuverlässigen Lösen der gestellten Aufgabe. Ein zweiter Greifer zeigt das erlernte Verfahren bereits im gewünschten Zielszenario: Er hebt die Kugel an und dreht sie so, dass der eingeprägte Schriftzug am Ende mittig auf der Oberseite zu erkennen ist.

Integrierte Produkte von Festo