Il LearningGripper corrisponde in modo astratto alla mano umana. Inoltre, le sue azioni hanno anche molto in comune con il suo modello biologico: la pinza con quattro dita impara in modo indipendente utilizzando un processo di apprendimento automatico a ruotare una sfera in un determinato orientamento quando viene sollevata.
Per svolgere questa complessa azione, vengono definite in anticipo solo le azioni elementari e le possibili posizioni delle dita nonché la funzione di feedback dell’ambiente. Gli viene indicato solo quel deve saper fare. Non però come risolvere il compito. Gli algoritmi di apprendimento della pinza sviluppano la strategia di movimento autonomamente, senza ulteriore programmazione.
Secondo teorie, noi siamo così intelligenti solo perché la nostra mano è capace di risolvere tanti compiti complessi. I bambini iniziano ad afferrare molto presto, ad esempio il dito della madre. Non appena imparato ad afferrare correttamente un oggetto, possiamo girarlo e guardarlo da tutti i lati. Questo è l’unico modo per ricostruire un’immagine 3D dell’oggetto in testa. La mano serve a noi umani anche per apprendere.
I metodi di apprendimento delle macchine sono paragonabili a quelli delle persone: devono ricevere un riscontro, positivo o negativo, alle azioni, in modo da poterle catalogare e apprendere. Nel LearningGripper si utilizza il metodo del Reinforcement Learning, apprendimento con rinforzo. Alla pinza non viene assegnata alcuna azione specifica che deve imitare. Ottimizza le sue abilità esclusivamente sulla base del feedback sulle sue azioni precedenti. Ciò aumenta la probabilità che intraprenda un’azione riuscita e non ripeta una mossa meno riuscita.
Le quattro dita sono azionate da un totale di dodici attuatori pneumatici a soffietto con bassa pressione compresa tra 2,5 e 3,5 bar. Ognuno di loro ha tre gradi di libertà e le funzioni di base dell’indice. Solo nello stato iniziale, l’intera mano può scegliere tra 3¹² di azioni totali per riorientare la sfera. Grazie alla coordinazione delle dita e alla struttura a soffietto, la cinematica è liberamente mobile e flessibile. Afferra, solleva e ruota in sicurezza anche gli oggetti più sensibili, come il modello biologico.
In fiera, una pinza mostra come il LearningGripper possa apprendere una strategia di movimento entro un’ora, dal primo tentativo fino alla risoluzione affidabile del compito. Una seconda pinza mostra la procedura appresa nello scenario di destinazione desiderato: solleva la sfera e la ruota in modo che la scritta in rilievo alla fine possa essere vista al centro in alto.