LearningGripper

Afferrare e orientare attraverso l’apprendimento autonomo

Il LearningGripper corrisponde in modo astratto alla mano umana. Inoltre, le sue azioni hanno anche molto in comune con il suo modello biologico: la pinza con quattro dita impara in modo indipendente utilizzando un processo di apprendimento automatico a ruotare una sfera in un determinato orientamento quando viene sollevata.

Per svolgere questa complessa azione, vengono definite in anticipo solo le azioni elementari e le possibili posizioni delle dita nonché la funzione di feedback dell’ambiente. Gli viene indicato solo quel deve saper fare. Non però come risolvere il compito. Gli algoritmi di apprendimento della pinza sviluppano la strategia di movimento autonomamente, senza ulteriore programmazione.

Afferrare e apprendere: un’interazione intelligente

Secondo teorie, noi siamo così intelligenti solo perché la nostra mano è capace di risolvere tanti compiti complessi. I bambini iniziano ad afferrare molto presto, ad esempio il dito della madre. Non appena imparato ad afferrare correttamente un oggetto, possiamo girarlo e guardarlo da tutti i lati. Questo è l’unico modo per ricostruire un’immagine 3D dell’oggetto in testa. La mano serve a noi umani anche per apprendere.

Prova/errore: apprendimento con rinforzo

I metodi di apprendimento delle macchine sono paragonabili a quelli delle persone: devono ricevere un riscontro, positivo o negativo, alle azioni, in modo da poterle catalogare e apprendere. Nel LearningGripper si utilizza il metodo del Reinforcement Learning, apprendimento con rinforzo. Alla pinza non viene assegnata alcuna azione specifica che deve imitare. Ottimizza le sue abilità esclusivamente sulla base del feedback sulle sue azioni precedenti. Ciò aumenta la probabilità che intraprenda un’azione riuscita e non ripeta una mossa meno riuscita.

The four fingers are driven by a total of 12 pneumatic bellows actuators with low pressure between 2.5 and 3.5 bar. Each of them has three degrees of freedom and the basic functions of the index finger. In the initial state alone, the entire hand thus has a choice of 3¹² total actions to reposition the ball. Due to the intelligent coordination of the fingers and the flexible bellows structure, the kinematics are free-moving and pliable. It can safely grip, lift and rotate even the most sensitive objects – just like its natural role model.

Reduced programming effort thanks to machine learning

At the LearningGripper trade fair exhibit, a gripper demonstrates how it takes less than an hour for it to learn a mechanical motion strategy – from its first attempt to the reliable execution of the required task. A second gripper shows the learned procedure in the desired target scenario. It lifts the ball and turns it so that the embossed lettering on the end is visible in the centre on the top.