LearningGripper

Preensão e orientação através de aprendizagem autónoma

O LearningGripper corresponde, de forma abstrata, à mão humana. E as suas ações também têm muito em comum com o seu modelo natural: a garra do robô com quatro dedos aprende de forma autónoma, através de processos de aprendizagem por máquina, a rodar uma esfera em estado elevado em qualquer orientação predefinida.

Para executar esta ação complexa, são definidas previamente somente as ações elementares e as possíveis posições dos dedos, bem como a função de feedback do ambiente circundante. Só recebe a especificação do que pode fazer. Mas não a forma como deve resolver a tarefa. Os algoritmos de aprendizagem da garra desenvolvem de forma autónoma a estratégia de movimento necessária para o efeito, sem nenhuma programação adicional.

Preensão e aprendizagem – uma interação inteligente

As teorias dizem que nós, humanos, só somos muito inteligentes porque a nossa mão pode resolver muitas tarefas complexas. Os bebés começam a agarrar objetos muito cedo, por exemplo, o dedo da mãe. Assim que aprendemos a agarrar num objeto corretamente, podemos virá-lo e observá-lo de todos os lados. Só assim se consegue reconstruir uma imagem tridimensional do objeto na nossa cabeça. Ou seja, a mão também ajuda os seres humanos a aprender.

Tentativa e erro – aprendizagem através do reforço

Os métodos de aprendizagem das máquinas são comparáveis ​​aos dos seres humanos: sejam positivos ou negativos, precisam de feedback sobre as suas ações para as poderem classificar e aprender com elas. O LearningGripper usa o método de aprendizagem por reforço, aprendendo através do reforço. A garra não recebe qualquer ação específica que deva imitar. Otimiza as suas habilidades apenas com base no feedback das suas ações anteriores. Isso aumenta a probabilidade de tomar uma ação bem-sucedida e de não repetir uma ação menos bem sucedida.

Os quatro dedos são acionados por um total de doze atuadores pneumáticos de fole com baixa pressão entre 2,5 e 3,5 bar. Cada um deles possui três graus de liberdade e as funções básicas do dedo indicador. Só no estado inicial a mão inteira tem já à sua disposição 3¹² de ações totais para reorientar a esfera. Graças à coordenação inteligente dos dedos e à estrutura flexível dos foles, a cinemática é de movimento livre e flexível. Esta pode agarrar, levantar e rodar com segurança até os objetos mais sensíveis, tal como o seu modelo natural.

Esforço de programação reduzido através da aprendizagem por máquina

Na exposição do LearningGripper, uma garra demonstra como aprende uma estratégia de movimento mecanicamente numa hora, desde a primeira tentativa até resolver a tarefa de forma fiável. Uma segunda garra mostra o método aprendido já no cenário de destino desejado: esta levanta a esfera e roda-a para que as letras em relevo possam ser vistas no meio, na parte superior.