LearningGripper Maschinelles Lernen
2 Selbstlernend: Die vier pneumatischen Finger des LearningGripper … … orientieren die Kugel, bis die richtige Seite oben liegt Greifen und Orientieren durch eigenständiges Lernen Der LearningGripper von Festo entspricht in abstrahierter Weise der menschlichen Hand. Die vier Finger des Greifers werden von zwölf pneumatischen Balgaktoren mit Niederdruck angetrieben. Mittels Machine-Learning-Verfahren ist er in der Lage, eine komplexe Handlung wie das Greifen und Orientieren eines Gegenstands selbst zu erlernen. Smart und intuitiv – das Prinzip des LearningGripper Konkret stellt sich dem Greifer die Aufgabe, eine Kugel so zu drehen, dass eine bestimmte Seite nach oben zeigt. Das intelligente System eignet sich mit dem Trial-and-Error-Prinzip die entsprechenden Bewegungsabläufe an, die dazu notwendig sind. Je länger es lernt, desto zuverlässiger erfüllt es seine Aufgabe. Reduzierter Programmieraufwand Mit dem LearningGripper zeigt Festo, wie Systeme künftig komplexe Aufgaben ohne aufwendige Programmierung selbstständig lösen können. Bei der klassischen Vorgehensweise müsste der Entwickler dem Greifer für jeden Zustand von Fingern und Kugel eine eigene Aktion vorgeben. Beim LearningGripper sind lediglich die elementaren Aktionen und möglichen Positionen der Finger sowie die Feedbackfunktion der Umgebung im Voraus definiert. Er bekommt nur die Vorgabe, was er können muss. Nicht aber, wie er die Aufgabe zu lösen hat. Diese komplexe Bewegungsstrategie entwickeln die Lernalgorithmen des Greifers selbstständig – ganz ohne weitere Programmierung. Wissenstransfer auf weitere Greifer Überträgt man die Strategie eines Greifers auf einen zweiten, erlangt dieser ein Vorwissen, mit dem er seine eigene Strategie effizienter erlernen kann. Je identischer die Hardware der beiden Greifer ist, desto zielführender ist der Transfer. Je größer das Vorwissen, desto schneller lässt sich das System in voller Funktion einsetzen. Potenziale für die Fabrik von morgen Mit diesem Prinzip könnten in Zukunft selbstlernende Systeme wie der LearningGripper in eine Produktionslinie eingebaut werden und dann eigenständig ihr Verhalten optimieren. Daher befasst sich Festo schon heute intensiv mit der Lernfähigkeit von Maschinen.
3 Abgeschaut: Wie sein natürliches Vorbild … … lernt der Greifer mit dem Trial-and-Error-Prinzip Beweglich: Drei Freiheitsgrade verleihen jedem Finger die Grundfunktionen des menschlichen Zeigefingers Pneumatische Balgkinematik Beim LearningGripper ist die menschliche Hand auf vier abstrakte Finger reduziert, von denen jeder über drei Freiheitsgrade und die Grundfunktionen des Zeigefingers verfügt. Jeder der Freiheitsgrade hat einen Winkelbereich von +/− 25 Grad. Betrieben wird die Greiferkinematik mit Niederdruck zwischen 2,5 und 3,5 bar. Hochkomplexe Koordination Einziehen, ausfahren oder Position halten – durch die Verwendung der Proportionalventile MPYE und der Drucktransmitter SPTE von Festo lassen sich die zwölf pneumatischen Balgstrukturen in beliebige Zwischen- und Endpositionen ansteuern. Damit lässt sich jeder Finger in drei Richtungen bewegen. Allein im Startzustand stehen der gesamten Hand 3¹² Gesamtaktionen zur Auswahl, um die Kugel neu zu orientieren. Durch die intelligente Koordination der Finger und die flexible Balgstruktur aus Polyamid ist die Kinematik frei beweglich und nachgiebig. Sie kann selbst empfindlichste Objekte sicher greifen, anheben und drehen – ganz wie ihr natürliches Vorbild. Die menschliche Hand ist ein vielseitiges Werkzeug. Sie kann sowohl sehr stark als auch sehr filigran und feinfühlig sein. Viele Eigenschaften von Gegenständen lassen sich mit ihr am besten wahrnehmen – zum Beispiel die Form, Größe oder Textur der Objekte, ihre Temperatur oder ihr Gewicht. Greifen und Lernen – ein intelligentes Zusammenspiel Theorien besagen, der Mensch sei nur so intelligent, weil die Hand so viele komplexe Aufgaben lösen kann. Babys beginnen sehr früh, Objekte zu greifen – zum Beispiel den Finger der Mutter. Sobald man gelernt hat, ein Objekt richtig zu fassen, kann man es umdrehen und von allen Seiten betrachten. Nur so lässt sich ein dreidimensionales Bild des Objektes im Kopf rekonstruieren. Die Hand dient dem Menschen also auch zum Lernen. Dabei lernt der Mensch auf zwei verschiedene Arten: explizit oder implizit. Beim expliziten Lernen bekommt er eine genaue Vorgabe, was nachzumachen oder zu erlernen ist. Unter implizitem Lernen versteht man die unbewusste oder spielerische Aneignung von Fertigkeiten und Wissen beim Ausüben einer Tätigkeit.
4 Smart: Die Lernalgorithmen ersetzen eine komplexe Programmierung … … und ermöglichen die schnelle Inbetriebnahme des Systems Screen wird eingebaut Einfach: der Wissenstransfer von einem Greifer auf den anderen Maschinelles Lernen Die Lernmethoden von Maschinen sind mit denen des Menschen vergleichbar. Die praktische Umsetzung geschieht in diesem Teilgebiet der künstlichen Intelligenz über Algorithmen, die aufgrund des erhaltenen Feedbacks ihre Verhaltens- bzw. Bewegungsstrategien entwickeln. Wie der Mensch benötigen auch Maschinen eine Rückmeldung – positiv wie negativ – auf ihre Aktionen, um sie einordnen zu können und daraus zu lernen. Trial and Error – Lernen durch Bestärken Beim LearningGripper kommt die Methode des Reinforcement Learning zum Einsatz, das Lernen durch Verstärken. Der Greifer optimiert seine Fähigkeiten ausschließlich anhand des Feedbacks zu seinen vorangegangenen Aktionen. Im Gegensatz zum Supervised Learning bekommt das System dabei keine konkrete Handlung vorgegeben, die es nachahmen muss. Das lernende System variiert seine Aktionen mit dem Ziel, das langfristige Feedback zu maximieren. Dadurch erhöht sich die Wahrscheinlichkeit, dass eine erfolgreiche Aktion ausgeführt und ein weniger erfolgreicher Zug nicht erneut wiederholt wird. Das Prinzip der Belohnung Zu Beginn probiert der LearningGripper zufällig aus, die Kugel zu drehen und den Schriftzug auf ihr nach oben zu bringen. Von einem Lagesensor innerhalb der Kugel bekommt er das Feedback, wie weit die Schrift von der Handfläche des Greifers entfernt ist – je größer der Abstand, desto stärker die positive Rückmeldung. Mit der Zeit entwickeln die Lernalgorithmen daraus eine Bewegungsstrategie. Der Greifer lernt, welche Aktion bei welchem Zustand auszuführen ist. Er versteht es, die Bewegungen so zu ändern, dass er möglichst viel positives Feedback bekommt und schließlich seine Aufgabe zuverlässig löst. Beim Messeexponat zum LearningGripper demonstriert ein Greifer, wie er innerhalb einer Stunde eine Bewegungsstrategie maschinell erlernt – vom ersten Versuch bis zum zuverlässigen Lösen der gestellten Aufgabe. Ein zweiter Greifer zeigt das erlernte Verfahren bereits im gewünschten Zielszenario: Er hebt die Kugel an und orientiert diese so, dass der eingeprägte Schriftzug am Ende mittig auf der Oberseite zu erkennen ist.
5 LearningGripper: selbstlernendes Greifsystem zur Orientierung von runden Objekten Die Produktion im Wandel In der Vision von der Produktion der Zukunft ist Vernetzung allgegenwärtig. Die zentrale Fabriksteuerung wird sich evolutionär weiterentwickeln und zugleich werden die Möglichkeiten der dezentralen Selbstorganisation zunehmend eingesetzt. Anlagen und Systeme werden künftig ihre Umgebung verstehen und miteinander kommunizieren. In der Fabrik von morgen werden selbstkonfigurierende und selbstlernende Systeme die Produktionsprozesse nachhaltig gestalten. Ihre Entwicklung führt zu einer schnellen, einfachen und sicheren Inbetriebnahme. Mithilfe der maschinellen Lernfähigkeit lassen sich in Zukunft komplexe Aufgaben selbstständig lösen, ohne dass ein größerer Programmierungsaufwand nötig ist. Als weltweiter Anbieter von pneumatischer und elektrischer Automatisierungstechnik hat Festo die Kernkompetenz, die Fabrik der Zukunft mitzugestalten und seinen Kunden dafür maßgeschneiderte Lösungen zu liefern – ob als komplettes Produktionssystem oder als einzelne Komponente. Neue Perspektiven durch die Natur Oft liefert die Natur dabei verblüffende Impulse und neue Lösungsansätze. Deshalb hat Festo das Bionic Learning Network ins Leben gerufen. Im Verbund mit namhaften Hochschulen, Instituten und Entwicklerfirmen befasst sich Festo intensiv mit der Erprobung möglicher Greifertechnologien nach biologischem Vorbild. Bekanntestes Beispiel ist der FinGripper, den Festo mittlerweile als adaptiven Greifer DHDG in seinem Portfolio führt. Um formschlüssig zu greifen, nutzt er die natürliche Eigenschaft der Fischflosse. Sie knickt bei seitlicher Druckeinwirkung nicht weg, sondern schmiegt sich um den Druckpunkt herum. Beim NanoForceGripper sorgt derselbe Effekt dafür, die Gecko-Haftfolie sanft und energiearm vom Greifgut abzulösen. Im PowerGripper ist die Kinematik des Vogelschnabels umgesetzt. Mit dem Forschungsträger LearningGripper ist den Entwicklern nun der nächste Schritt gelungen: ein Greifer, der lernfähig ist und damit große Potenziale für die Zukunft birgt. FinGripper: adaptives Greifen mit dem Prinzip der Fischschwanzflosse PowerGripper: optimiertes Kraft-GewichtsVerhältnis durch Vogelschnabelkinematik NanoForceGripper: energieeffizientes Greifen nach Vorbild des Geckos
Technische Daten eines LearningGripper • Abmessungen: 263 mm × 263 mm × 255 mm • Gewicht: 1850 g • Herstellungsverfahren: Selektives Lasersintern • Werkstoff: Polyamid • Länge der Finger: je 195 mm • Freiheitsgrade: je 12 • Durchmesser des Greifobjekts: 100 mm • Handhabungsgewicht: 200 g • Ventile: 12 Proportional-Wegeventile MPYE-M5 • Betriebsdruck: 2,5 – 3,5 bar • Sensoren im LearningGripper: 4 Kraftmesssensoren (Fingerkuppen) 1 2 Drehwinkelgeber (Fingergelenke) 1 2 Drucksensoren SPTE (Balgaktoren) 1 Infrarot-Distanzsensor (Höhensensor) 1 Inertialsensor (Greifobjekt) • Steuerung: SPS-Steuerung CECX-C1 • Software: CodeSys 2.3, maschinelles Lernverfahren Projektbeteiligte Projektinitiator: Dr. Wilfried Stoll, geschäftsführender Gesellschafter, Festo Holding GmbH Projektteam: Dipl.-Des. Elias Knubben, Dipl.-Des. Ruwen Kaminski, Dipl.-Ing. Arne Rost, Dipl.-Ing. Johannes Stoll, B. Eng. Andreas Gause, Festo AG & Co. KG Prof. Dr. Wolfgang Ertel, M. Sc. Stephan Schädle, Institut für Künstliche Intelligenz der Hochschule Ravensburg-Weingarten 54818 de 4/2013 Film Festo AG & Co. KG Ruiter Straße 82 73734 Esslingen Deutschland Telefon 0711 347-0 Telefax 0711 347-21 55 cc@de.festo.com www.festo.com/bionik
RkJQdWJsaXNoZXIy NzczNDE0