LearningGripper

独自の学習による把持と方向付け

LearningGripper は概念的な方法で人の手に対応します。またその動作にも、自然界のモデルと多くの共通点があります。4本の指を持つロボットグリッパはMachine-Learning プロセスを使用して自律的に学習しボールを持ち上げたときに、任意で規定した方向にボールを回転させます。

この複雑なアクションを実行するために、基本的なアクションと可能な指位置と環境のフィードバック機能のみが事前に定義されます。グリッパに与えられるのは何を行うことができなければいけないか、ということだけです。しかしどのように課題を解決しなければならないかは定められていません。グリッパの学習アルゴリズムはこれ以上プログラミングを行うことなしに、これに必要な移動戦略を独自に開発します。

把握と学習 - インテリジェントな連携プレイ

理論によると、私たち人がここまで知的であるのはひとえに私たちの手が多くの複雑なタスクを解決できるからだと言います。赤ちゃんは母親の指など、非常に早い段階で物を掴み始めます。私たちは物を正しく掴むことを学ぶと、すぐにそれを回転させ、あらゆる方向から観察することができるようになります。これは頭の中の対象物の3次元イメージを再構成する唯一の方法です。手は私たち人の学習にも役立ちます。

Trial and Error - 強化による学習

機械の学習方法は人の学習方法と類似しています。肯定的であれ否定的であれ、行動を類して学習するためには行動に対するフィードバックが必要です。LearningGripperではReinforcement Learning という手法を用いて、強化による学習を行います。この際グリッパには模倣する必要のある特定のアクションは与えられません。グリッパは以前のアクションに対するフィードバックのみに基づいて、自らのスキルを最適化します。これによりグリッパが成功したアクションを実行しあまり成功していない行動は再試行しない可能性が高まります。

4本のフィンガは2.5~3.5bar の低圧で合計12個の空気圧ベローアクチュエータによって駆動されます。これらはそれぞれに3つの自由度があり、人差し指の基本的な機能を備えています。開始状態だけでも、ボールの向きを変えるために、ハンド全体で合計3¹² のアクションから選択することができます。フィンガのインテリジェントな協調と柔軟なベロー構造によりキネマティクスには自由な可動性としなやかさが与えられます。自然界のモデルと同じように、非常にデリケートな物体も安全に把持し持ち上げ、回転させることができます。

機械学習によるプログラミングの労力の低減

見本市での LearningGripper に関する展示では最初の試行から目の前のタスクを確実に解決するに至るまでグリッパが1時間以内に移動戦略を機械学習する方法を示しています。2つめのグリッパはすでに希望する目標シナリオにて、学習済みのプロセスを示しています。2つめのグリッパはボールを持ち上げて回転させ、最後は上面の中央にエンボス加工の文字が見えるようにします。