LearningGripper, insan eline soyut bir şekilde karşılık gelir. Ve eylemlerinin doğal rol modeliyle de pek çok ortak noktası var: Dört parmaklı robot kavrayıcı, kaldırıldığında bir topu herhangi bir yönde döndürmek için bir makine öğrenimi sürecini kullanarak bağımsız olarak öğrenir.
Bu karmaşık eylemi gerçekleştirmek için, yalnızca parmakların temel eylemleri ve olası pozisyonları ile ortamın geri bildirim işlevi önceden tanımlanmıştır. Ona sadece yapması gereken verilir. Ama görevi nasıl çözmesi gerektiği değil. Kavrayıcının öğrenme algoritmaları, gerekli hareket stratejisini bağımsız olarak başka bir programlama yapmadan geliştirir.
Teoriler, biz insanların bu kadar zeki olmamızın tek sebebinin elimiz pek çok karmaşık görevi çözebildiğini söylüyor. Bebekler nesneleri çok erken kavramaya başlarlar örneğin annelerinin parmağı. Bir cismi doğru kavramayı öğrenir öğrenmez onu ters çevirebilir ve ona her yönden bakabiliriz. Bu, kafadaki nesnenin üç boyutlu görüntüsünü yeniden oluşturmanın tek yoludur. El aynı zamanda biz insanlara öğrenmek için de hizmet eder.
Makinelerin öğrenme yöntemleri insanlarla karşılaştırılabilir: Olumlu ya da olumsuz onları sınıflandırabilmek ve onlardan bir şeyler öğrenebilmek için eylemleri hakkında geri bildirime ihtiyaçları var. LearningGripper ile, pekiştirme yoluyla öğrenme, pekiştirmeli öğrenme yöntemi kullanılır. Kavrayıcıya, taklit etmesi gereken herhangi bir özel eylem verilmemiştir. Becerilerini yalnızca önceki eylemleriyle ilgili geri bildirim temelinde optimize eder. Bu, başarılı bir eylemde bulunma ve daha az başarılı bir hareketi tekrar denememe olasılığını artırır.