
ロボットの訓練方法:犬のように扱う
アラン・ボイル著

ロボットの最適な動き方を見つけるために、デザイナーたちはヘビ、チーター、魚、さらには人魚からインスピレーションを得てきました。しかし、ロボットの学習に最適な方法を見つけるには、犬に着目しています。
ワシントン州立大学インテリジェントロボット学習研究所のコンピューター科学者が率いるチームは、犬が人間の飼い主からタスクを学習する際に見られるような、ちょっとした動きを組み込んだロボット訓練プログラムを開発しました。仮想ロボットは、何をすべきか迷っている時は速度を落とし、フィードバックを求めます。しかし、タスクを一度理解すると、あっという間に仕事をこなします。
先週シンガポールで開催された自律エージェントおよびマルチエージェントシステムに関する国際会議で発表された「戦略を考慮したベイズ学習」モデルは、プログラマーではなく一般の人々がロボットに何をすべきかを教えなければならない時代を見据えて開発された。
「誰もがプログラミングできるようになることを望んでいますが、おそらく実現は難しいでしょう」と、ワシントン州立大学のマシュー・テイラー教授は本日のニュースリリースで述べています。「そこで、プログラミングなしで誰もがロボットを訓練できる方法を提供する必要がありました。」
https://www.youtube.com/watch?v=AJQSGD_XPrk
テイラー氏、ワシントン州立大学の博士課程学生ベイ・ペン氏、そしてブラウン大学とノースカロライナ州立大学の同僚たちは、仮想ロボット犬を使ったソフトウェアシミュレーションを開発しました。このロボット犬は、異なる色の部屋間で物を運ぶように学習させる必要がありました。学習課題は、プログラマーではない被験者に委ねられ、赤い「罰」ボタンと緑の「ご褒美」ボタンが教材として使われました。
研究者たちは、仮想犬の動きの速度を、課題の各ステップごとに0.5秒から2秒まで変化させることができました。動きが遅いほど、トレーナーは犬がどう進めればよいか迷っていることを察知し、肯定的または否定的なフィードバックを与える機会が増えました。
「最初はバーチャル犬はゆっくりと動きます」とペン氏は言う。「しかし、フィードバックが増え、何をすべきか自信がついてくるにつれて、スピードが上がっていきます。」
ペン氏と同僚たちは、適応型低速から高速へのモデルが、訓練精度と訓練所要時間の点で全体的に最も優れた結果を生み出すことを発見した。現在、研究チームは実ロボットと仮想エージェントを用いた実験を行っている。
潜在的なメリットは、学習しやすいロボットの開発だけにとどまりません。研究者たちは、このソフトウェアは動物トレーナーの仕事の効率化にも役立つ可能性があると述べています。素晴らしい研究者ですね!
「スピードの必要性:非熟練人間からのタスク学習を改善するためのエージェントのアクション速度の適応」の著者には、ペン氏とテイラー氏に加え、ブラウン大学のジェームズ・マクグラシャン氏とマイケル・リットマン氏、NCSU のロバート・ロフティン氏とデビッド・ロバーツ氏も含まれています。