LearningGripper

透過自主學習進行抓握和定位

LearningGripper 看起來像是人手的抽像形式,並且它的動作也跟其自然界原型有很多共同之處:擁有四根手指的機器人抓手,利用機器學習過程自動學習將處於升起位置的球旋轉到任何指定的方向上。

只有提前設定好 LearningGripper 的手指的基本動作和可能位置,以及來自環境的回饋功能,才能進行這種複雜的抓取。只要告知抓手需要做什麼,而不是怎麼做。為此所需的移動策略由抓手的學習演算法獨立進行開發,無需任何進一步的編程。

抓握和學習——智能的互動

理論表明,我們人類之所以如此聰明,是因為我們的手可以解決很多複雜的任務。嬰兒很早就開始抓東西,例如母親的手指。一旦我們學會正確地抓住一個物體,我們就可以將這個物體轉過來,從四面八方觀察它。這是在頭腦裡重建物體 3D 影像的唯一方法。所以,手也有助於我們人類進行學習。

嘗試錯誤——邊鼓勵邊學習

機器的學習方法與人類相似:無論是積極的還是消極的——它們需要對自己的動作進行回饋,以便能夠對其進行分類並從中學習。LearningGripper 採用增強學習法。抓手未被告知必須模仿的任何具體動作。它完全基於對其先前動作的回饋來優化其技能。這樣它就更有可能執行成功的動作,而不會重複不太成功的動作。

抓手的四根手指由總共十二個氣動波紋管驅動器驅動,壓力低至 2.5 bar 至 3.5 bar 之間。四根手指中的每一根都有三個自由度和食指的基本功能。因此,僅在初始狀態下,整隻手就有總共 3¹² 個動作來重新定位球。歸功於手指和柔性波紋管結構的智能協調,抓手的運動裝置具有自由移動性和靈活性。它甚至可以安全地抓住、舉起和旋轉最敏感的物體,就像其自然界原型一樣。

透過機器學習減少編程工作量

在 LearningGripper 展示上,第一個抓手展示了如何在一小時內以機械方式學習運動策略,以及如何在不到一小時的時間內學習機械運動策略——從第一次嘗試到可靠地完成規定任務。第二個抓手展示了指定目標場景中的學習過程:它舉起並轉動球,以便末端的浮雕字母顯示在頂部的中間位置。