4 Smart: Die Lernalgorithmen ersetzen eine komplexe Programmierung … … und ermöglichen die schnelle Inbetriebnahme des Systems Screen wird eingebaut Einfach: der Wissenstransfer von einem Greifer auf den anderen Maschinelles Lernen Die Lernmethoden von Maschinen sind mit denen des Menschen vergleichbar. Die praktische Umsetzung geschieht in diesem Teilgebiet der künstlichen Intelligenz über Algorithmen, die aufgrund des erhaltenen Feedbacks ihre Verhaltens- bzw. Bewegungsstrategien entwickeln. Wie der Mensch benötigen auch Maschinen eine Rückmeldung – positiv wie negativ – auf ihre Aktionen, um sie einordnen zu können und daraus zu lernen. Trial and Error – Lernen durch Bestärken Beim LearningGripper kommt die Methode des Reinforcement Learning zum Einsatz, das Lernen durch Verstärken. Der Greifer optimiert seine Fähigkeiten ausschließlich anhand des Feedbacks zu seinen vorangegangenen Aktionen. Im Gegensatz zum Supervised Learning bekommt das System dabei keine konkrete Handlung vorgegeben, die es nachahmen muss. Das lernende System variiert seine Aktionen mit dem Ziel, das langfristige Feedback zu maximieren. Dadurch erhöht sich die Wahrscheinlichkeit, dass eine erfolgreiche Aktion ausgeführt und ein weniger erfolgreicher Zug nicht erneut wiederholt wird. Das Prinzip der Belohnung Zu Beginn probiert der LearningGripper zufällig aus, die Kugel zu drehen und den Schriftzug auf ihr nach oben zu bringen. Von einem Lagesensor innerhalb der Kugel bekommt er das Feedback, wie weit die Schrift von der Handfläche des Greifers entfernt ist – je größer der Abstand, desto stärker die positive Rückmeldung. Mit der Zeit entwickeln die Lernalgorithmen daraus eine Bewegungsstrategie. Der Greifer lernt, welche Aktion bei welchem Zustand auszuführen ist. Er versteht es, die Bewegungen so zu ändern, dass er möglichst viel positives Feedback bekommt und schließlich seine Aufgabe zuverlässig löst. Beim Messeexponat zum LearningGripper demonstriert ein Greifer, wie er innerhalb einer Stunde eine Bewegungsstrategie maschinell erlernt – vom ersten Versuch bis zum zuverlässigen Lösen der gestellten Aufgabe. Ein zweiter Greifer zeigt das erlernte Verfahren bereits im gewünschten Zielszenario: Er hebt die Kugel an und orientiert diese so, dass der eingeprägte Schriftzug am Ende mittig auf der Oberseite zu erkennen ist.
RkJQdWJsaXNoZXIy NzczNDE0