LearningGripper

Захоплення та орієнтування шляхом самостійного навчання

LearningGripper абстрактно відповідає людській руці. І його дії також мають багато спільного з природним зразком для наслідування: робот-захват із чотирма пальцями використовує методи машинного навчання, щоб самостійно навчитися перетворювати підняту сферу у будь-яку задану орієнтацію.

Для здійснення цієї складної операції заздалегідь визначаються лише елементарні дії та можливі положення пальців, а також функція зворотного зв’язку від середовища. Захват має інформацію лише про те, що він повинен зробити. А не про те, як він повинен вирішувати завдання. Алгоритми навчання захвату самостійно розробляють необхідну стратегію руху — без подальшого програмування.

Захоплення та навчання — розумна взаємодія

Теоретично відомо, що ми, люди, настільки розумні, що наші руки можуть вирішувати багато складних завдань. Немовлята з самого раннього віку починають хапатися за предмети — наприклад, за палець матері. Як тільки ми навчимося правильно схоплювати предмет, ми зможемо перевернути його і подивитися на нього з усіх боків. Тільки так можна отримати тривимірне зображення об’єкта в голові. Рука також служить нам, людям, для навчання.

Метод проб і помилок — навчання за допомогою підкріплення

Методи навчання машин можна порівняти з методами людей: позитивні чи негативні — їм потрібні зворотній зв’язки щодо своїх дій, щоб мати можливість класифікувати їх і вчитися на них. LearningGripper використовує метод навчання через підкріплення. Захвату не надається конкретна дія, яку він повинен імітувати. Він відточує свої навички виключно на основі зворотного звязку про свої попередні дії. Це підвищує ймовірність того, що він зробить вдалий хід і не повторить менш вдалий хід знову.

Чотири пальці приводять у дію загалом дванадцять пневматичних сильфонних приводів з низьким тиском від 2,5 до 3,5 бар. Кожен з них має три ступені свободи та основні функції вказівного пальця. В початковому стані вся рука має на вибір 3¹² дії, щоб переорієнтувати м’яч. Завдяки розумній координації пальців і гнучкому сильфону кінематика може вільно рухатися та є гнучкою. Пристрій може безпечно захоплювати, піднімати та обертати навіть найчутливіші об’єкти — так само, як і його природний аналог.

Зменшення зусиль програмування завдяки машинному навчанню

На виставці захват LearningGripper демонструє, як він автоматично вивчає стратегію руху протягом години — від першої спроби до надійного вирішення поставленого завдання. Другий захват показує метод, засвоєний у бажаному цільовому сценарії: він піднімає м’яч і повертає його так, щоб тиснений напис можна було побачити в середині верхньої частини.

Інтегровані продукти від Festo