LearningGripper

Úchop a orientace prostřednictvím samostatného učení

LearningGripper napodobuje lidskou ruku. Jeho akce mají také mnoho společného s přírodním vzorem: robotické chapadlo se čtyřmi prsty se učí samostatně pomocí strojového učení, aby otočilo zvednutou kouli do jakékoliv dané orientace.

K provedení této složité akce jsou předem definovány pouze základní akce, možné polohy prstů a zpětná vazba prostředí. Chapadlo dostává jen zadání k tomu, co musí umět. Jak vyřešit úkol však nikoliv. Učící se algoritmy chapadla vyvíjejí nezbytnou pohybovou strategii samostatně – bez dalšího programování.

Úchop a učení – inteligentní interakce

Teorie říkají, že my lidé jsme inteligentní, protože naše ruka dokáže vyřešit tolik složitých úkolů. Děti začnou uchopovat předměty velmi brzy – například prst své matky. Jakmile jsme se naučili správně uchopit předmět, dokážeme ho otočit a podívat se na něj ze všech stran. To je jediný způsob, jak rekonstruovat trojrozměrný obraz objektu v hlavě. Ruka slouží nám lidem také k učení.

Zkouška a chyba – učení pomocí posilování

Metody strojového učení jsou srovnatelné s lidskými metodami: ať už v pozitivním nebo negativním smyslu – potřebujeme zpětnou vazbu o svých činnostech, abychom je mohli klasifikovat a poučit se z nich. LearningGripper používá metodu Reinforcement Learning, učení posilováním. Chapadlo nemá předepsanou žádnou konkrétní akci, kterou by muselo napodobovat. Optimalizuje své dovednosti pouze podle zpětné vazby k jeho předchozím akcím. Tím se zvyšuje pravděpodobnost, že podnikne úspěšnou akci a nebude opakovat méně úspěšný tah.