注目の論文

人工知能:人工世界でエキスパートを模倣できるエージェントの構築

Nature Communications

2023年11月29日

Artificial Intelligence: Building agents capable of imitating experts in an artificial world

3次元シミュレーションにおいて、今まで見たことのない課題を実行する際にリアルタイムでエキスパートを模倣する能力を持つ人工知能(AI)エージェントについて報告する論文が、Nature Communicationsに掲載される。このエージェントは、リアルタイムで共同プレイヤー(人間)から三人称視点で新しい知識を確実に得ることができる。著者らは、今回の知見が、身体性(embodied)AIに知識を迅速に伝達するという概念の実証であり、人間とAIの相互作用におけるオープンエンドな文化的進化に向けた第一歩になると述べている。

人間のデータを用いて身体性AIエージェントに新しい能力を教えることの有効性が、これまでの物理的シミュレーションや現実世界のロボット工学で証明されている。これまでのエージェントは通常、一人称視点による人間の実演データを多数用いて教師あり学習を行うが、そのためには多額の費用と膨大な時間を要する。それに対して人間は、赤ん坊であっても、実演者の真似をすることでほんの数秒で新しい技能をインタラクティブに学ぶことができる。そのため研究者は、人間のような高い効率とプライバシーを保持して、他者から社会的に学習できるAIエージェントを探索してきた。

今回、Edward Hughesらは、物理的にシミュレーションされたタスク空間(「GoalCycle3D」)において、数分間のうちに新しい専門家を識別し、その行動を模倣し、得られた知識を記憶できるAIエージェントを構築することを目的として、深層強化学習を用いてエージェントの訓練を行った。訓練の結果、このエージェントは、それまでに人間に遭遇したことがないにもかかわらず、専門家(人間とAIの両方)から、さまざまな難しいナビゲーション問題について効率的に学習できるようになった。例えば、このエージェントは、多数の障害物を含む複雑な地形をナビゲートできるようになった。今回用いられた方法にとって重要だったのが、実演者を周期的に離脱させることと課題の難易度を徐々に引き上げることを組み合わせた新しい形の自動カリキュラムであった。また、エージェントの個々のニューロンは解釈可能であり、物理的情報と社会的情報の両方がコードされていることも分かった。

今回の知見は、AI分野と文化進化心理学分野の相互作用の緊密化に向けた基礎固めとなった。Hughesらは、AIの実践者が人間の社会的学習から着想を得て、人間のパートナーにリアルタイムで適応する身体性エージェントをプライバシーが守られる方法で構築できるという考えを示している。また、社会的学習のできるAIエージェントは、人間の文化的能力の発達を研究する科学者にとっての新しいモデル化ツールとなる可能性がある。

doi: 10.1038/s41467-023-42875-2

「注目の論文」一覧へ戻る

プライバシーマーク制度