https://frosthead.com

AIはマルチプレイヤービデオゲームで優位に立つことでチームワークを学習している

チェスのような1対1のゲームでは、何十年もコンピューターが人間を支配してきましたが、人工知能(AI)をチームメイトと協力させるのは少し難しいです。 現在、GoogleのDeepMindプロジェクトの研究者は、AIプレイヤーに人間と他のコンピューターの両方を備えたチームで協力し、1999年のビデオゲームQuake III Arenaで競うことを教えています。

Scienceの Edd Gentは、AIが1人の対戦相手しかない場合、単一の心の可能な動きを予測するだけなので、通常はかなりうまくいくと報告しています。 しかし、チームワークは、チームメートのグループがどのように振る舞うかを予測するなど、コンピューターが伝統的に得意としないアクションを含むため、まったく別の問題です。 AIを本当に役立つものにするためには、他のインテリジェンスと協力する方法を学ぶ必要があります。

GoogleのDeepMindチームはブログ投稿で次のように説明しています。

「地球には何十億人もの人々が住んでおり、それぞれが独自の目標と行動を持っていますが、チーム、組織、社会を通じて、集団知能の印象的なディスプレイで一緒に集まることができます。 これは、マルチエージェント学習と呼ばれる設定です。多くの個々のエージェントは、独立して行動する必要がありますが、他のエージェントとの対話および協力を学習する必要があります。 これは非常に難しい問題です。共同適応エージェントによって世界は常に変化しているためです。」

プレイヤーのチームが仮想世界を走り、通常は銃やグレネードランチャーを互いに撃ち合うマルチプレイヤーの一人称ビデオゲームは、AIがチームワークの複雑さを学ぶのに最適な場所です。 各プレイヤーは個別に行動し、チーム全体に利益をもたらす選択をしなければなりません。

調査のために、チームは、 Quake III Arenaプラットフォームで旗を捕まえてプレイするようにAIを訓練しました。 ルールは非常に単純です。2つのチームが迷路のような戦場で対決します。 目標は、自分のチームを保護しながら、他のチームの仮想フラグをできるだけ多く獲得することであり、5分間で最も多くのフラグを獲得したチームが勝ちます。 ただし、実際には、物事はすぐに非常に複雑になる可能性があります。

DeepMindチームは30個のニューラルネットワークアルゴリズムを作成し、ランダムに生成された一連のゲームマップで互いに戦わせました。 ボットは、フラグをキャプチャし、他のプレイヤーをザッピングしてポイントを獲得し、キャラクターをリブートするリスポーンエリアに送り返します。 最初は、ボットの動作はランダムに見えました。 しかし、彼らがプレイすればするほど、彼らは良くなりました。 一貫して失われたニューラルネットワークはすべて除去され、AIの勝者の修正バージョンに置き換えられました。450, 000ゲームの終わりに、チームはチャンピオンとしてFor the Win(FTW)と呼ばれる1つのニューラルネットワークを獲得しました。

DeepMindグループは、AI学習スキルが不足しているミラーボットと呼ばれるものに対して、そして人間のチームに対してもFTWアルゴリズムをプレイしました。 FTWはすべての挑戦者を打ち負かしました。

その後、グループは40人のプレイヤーがチームメイトとボットの対戦相手としてランダムに対戦するトーナメントを開催しました。 ブログの投稿によると、人間のプレイヤーは、ボットが実際のチームメイトよりも協調的であることに気付きました。 FTWエージェントとペアになった人間のプレイヤーは、約5パーセントの試合でサイバー戦士を倒すことができました。

彼らが学んだように、ボットは旗が再出現したときにそれをつかむために旗の復活地点の近くでぶらぶらするなど、人間のプレイヤーが長く受け入れてきたいくつかの戦略を発見しました。 FTWチームは、悪用できるバグも発見しました。自分のチームメイトを後ろから撃った場合、スピードブーストが得られました。

「このプロジェクトの開発中に驚くべきことは、これらの高レベルの動作の一部を目にしたことです」と、DeepMindの研究者であり主著者であるMax JaderbergはGentに語ります。 「これらは人間のプレーヤーとして私たちが関係できるものです。」

ボットが人間のプレーヤーよりも優れていた主な理由の1つは、ボットが速くて正確な射手であり、人間の対戦相手よりも引き分けが速いことです。 しかし、それが彼らの成功の唯一の要因ではありませんでした。 ブログによると、研究者がロボシューティングゲームに反応時間を4分の1秒遅らせたとき、最高の人間はまだ約21パーセントの時間しか彼らを打ち負かすことができなかった。

この最初の研究以来、FTWとその子孫は、 Quake III Arenaの全戦場で解き放たれ、より多くのオプションとニュアンスを備えたさらに複雑な世界をマスターできることを示しています。 彼らはまた、超複雑な戦略宇宙ゲームStarcraft IIに優れたボットを作成しました

しかし、研究は単により良いビデオゲームアルゴリズムを作成することだけではありません。 チームワークについて学ぶことは、AIが自動運転車のフリートで働くのを最終的に助けるか、おそらくいつか外科医のニーズを予測するのに役立つロボットアシスタントになる可能性がある、と科学のGentは報告しています。

ただし、アーケードスターボットが真のチームワークを表しているとは誰もが考えているわけではありません。 AIの研究者であるジョージア工科大学のMark Riedl氏はThe New York Timesに、ボットはゲームに非常に優れていると語っています。 しかし、AIチームには人間のチームワークの1つの重要な要素であるコミュニケーションと意図的な協力が欠けているため、必ずしも協力ではありません。

そして、もちろん、彼らはまた、協力的なビデオゲーム体験のもう一つの特徴を欠いています:他のチームと話すことはゴミです。

AIはマルチプレイヤービデオゲームで優位に立つことでチームワークを学習している