O LearningGripper corresponde, de forma simbólica, à mão humana. E as suas ações também têm muito em comum com o seu modelo real: a garra do robô com quatro dedos aprende de forma autônoma, por meio de processos de aprendizagem por máquina, a suspender e rodar uma esfera em qualquer orientação predefinida.
Para executar essa ação complexa, são definidas previamente apenas as ações elementares e as possíveis posições dos dedos, além da função de feedback do ambiente ao redor. Só recebe a especificação do que pode ser feito. Mas não a forma como deve realizar a tarefa. Os algoritmos de aprendizagem da garra desenvolvem de forma autônoma a estratégia de movimento necessária para o movimento, sem nenhuma programação adicional.
As teorias dizem que nós, humanos, só somos muito inteligentes porque a nossa mão pode resolver muitas tarefas complexas. Os bebês começam a pegar objetos muito cedo, por exemplo, o dedo da mãe. Assim que aprendemos a pegar um objeto corretamente, podemos virá-lo e observá-lo de todos os lados. Só assim se consegue reconstruir uma imagem tridimensional do objeto em nosso cérebro. Ou seja, a mão também ajuda os seres humanos a aprender.
Os métodos de aprendizagem das máquinas são comparáveis aos dos seres humanos: sejam positivos ou negativos, precisam de feedback sobre as suas ações para poderem classificá-las e aprender com elas. O LearningGripper usa o método de aprendizagem por reforço, aprendendo por meio do reforço. A garra não recebe qualquer ação específica que deva imitar. Otimiza as suas habilidades apenas com base no feedback das suas ações anteriores. Isso aumenta a probabilidade de tomar uma ação bem sucedida e de não repetir uma ação mal sucedida.
Os quatro dedos são acionados por um total de doze atuadores pneumáticos de fole com baixa pressão entre 2,5 e 3,5 bar. Cada um deles possui três graus de liberdade e as funções básicas do dedo indicador. Só no estado inicial a mão inteira tem já à sua disposição 3¹² de ações totais para reorientar a esfera. Graças à coordenação inteligente dos dedos e à estrutura flexível dos foles, a cinemática é de movimento livre e flexível. Essa pode agarrar, levantar e rodar com segurança até os objetos mais sensíveis, tal como o modelo real.
Na exposição do LearningGripper, uma garra prova que é possível aprender a estratégia de um movimento mecânico em uma hora, desde a primeira tentativa até a resolução da tarefa de forma confiável. Uma segunda garra apresenta o método aprendido já no cenário de destino desejado: esta levanta a esfera e a gira para que as letras em relevo possam ser vistas no meio, na parte superior.