https://frosthead.com

Googleの新しいAIはゲームの達人ですが、人間の心と比べてどうですか?

人間にとって、チェスはマスターするのに一生かかるかもしれません。 しかし、Google DeepMindの新しい人工知能プログラムであるAlphaZeroは、数時間でボードを征服することを自分自身に教えることができます。

Googleは、中国のボードゲームGoをプレイするために設計された一連のコンピュータープログラムであるAlphaGoスイートでの過去の成功に基づいて、新しいAlphaZeroが1つのボードゲームだけでなく3つのレベルで「超人的なパフォーマンス」のレベルを達成したことを誇りにしていますチェス、将gi(基本的には日本のチェス)。 Googleのデビッドシルバーが率いるコンピューターサイエンティストとエンジニアのチームは、最近の調査結果をScience誌に報告しました。

「これより前に、機械学習を使用すると、希望することを正確に行うことができますが、それだけです」と、ジョージア工科大学のインタラクティブコンピューティングと人工知能の専門家であるAyanna Howard氏は言います。研究。 「しかし、AlphaZeroは、そうではない(特定の)アルゴリズムを持つことができ、特定のパラメーター内で学習できることを示しています。」

AlphaZeroの巧妙なプログラミングは、確かに人間と機械の両方のゲームプレイへの期待を高めていますが、Googleは長い間、より大きな何かに照準を合わせてきました:エンジニアリングインテリジェンス。

研究者は、AlphaZeroが世界支配の危機にonしていると主張しないように注意しています(他の人は銃をジャンプするのが少し速くなっています)。 それでも、Silverとその他のDeepMindチームは、いつか似たようなシステムがドラッグデザインや材料科学に適用されることを期待しています。

それで、AlphaZeroがこれほど印象的なのは何ですか?

ゲームプレイは、人工知能の研究におけるゴールドスタンダードとして長い間尊敬されてきました。 構造化されたインタラクティブなゲームは、現実のシナリオを単純化したものです。難しい決定を下す必要があります。 勝ち負けが賭け金を押し上げる。 予測、批判的思考、戦略が重要です。

この種のスキルをエンコードするのは難しいです。 元のAlphaGoの最初のプロトタイプを含む、古いゲームプレイAIは、長年の自然な人間のゲームプレイ(基本的には、プログラマーに由来する受動的な知識ダンプ)で通常得られる経験を模倣するために、コードとデータでいっぱいです。 AlphaGo Zero(AlphaGoの最新バージョン)、および現在AlphaZeroを使用して、研究者はプログラムにただ1つの入力を与えました:問題のゲームのルール。 それから、システムは探し出し、取引自体のトリックを積極的に学びました。

行く AlphaZeroは、上の図の中国のボードゲームGoをプレイするために設計されたAlphaGoスイートの一部であるAlphaGo Zeroに基づいています。 元のプログラムの初期の反復には、人間対人間のゲームからのデータが供給されました。 後のバージョンでは、自己学習が行われ、ソフトウェアはそれ自体に対してゲームをプレイして独自の戦略を学びました。 (チャド・ミラー/ Flickr / CC BY-SA 2.0)

セルフプレイ強化学習と呼ばれるこの戦略は、まさにそのように聞こえます。大リーグに向けてトレーニングするために、AlphaZeroは試行錯誤を繰り返し、スキルを磨きました。 そして、ブルートフォースアプローチが成果を上げました。 AlphaGo Zeroとは異なり、AlphaZeroはGoをプレイするだけではありません。チェスや将giでも、ビジネスで最高のAIを打ち負かすことができます。 また、学習プロセスは非常に効率的であり、たった2、4、または30時間の自己指導で、それぞれ将sho、チェス、および囲masterに特化したプログラムを上回ることができます。 注目すべきことに、研究の著者は、AlphaZeroが実際の人間と真っ向から対決する事例を報告しなかった、とハワードは述べています。 (研究者たちは、これらのプログラムが一貫して人間の対応物を破壊していることを考えると、そのような対戦は無意味だろうと仮定したかもしれません。)

AlphaZeroは、ゲームプレイ中の各ターンでの次の動きの可能性をより少なく評価したにもかかわらず、Stockfish(現在は着席していないAIチェスマスター)とElmo(以前のAI将giのエキスパート)を打倒することもできました。 しかし、問題のアルゴリズムは本質的に異なり、電力消費量も異なるため、AlphaZeroを他の古いプログラムと直接比較することは困難です。イギリスのバース大学で人工知能を研究していたジョアンナブライソンは指摘しますAlphaZeroに貢献しません。

グーグルは、そのソフトウェアに関する多くの素晴らしい活字についておしゃべりしており、AlphaZeroも例外ではありません。 プログラムの消費電力に関するすべてを知っているわけではありませんが、明らかなのは、AlphaZeroが深刻な計算弾薬を詰め込まなければならないということです。 わずかな時間のトレーニングでは、プログラムは非常に忙しく、ボードゲーム戦略を人間のプレーヤーが必要とする(または、ほとんどの場合、習熟度を追求して)

この集中的なレジメンでは、Google独自の機械学習プロセッサユニット(TPU)を5, 000個使用しましたが、一部の推定ではチップあたり約200ワットを消費します。 どのようにスライスしても、AlphaZeroは約20ワットで動作する人間の脳よりもはるかに多くのエネルギーを必要とします。

AlphaZeroの絶対エネルギー消費を考慮する必要があります。BinYuは、カリフォルニア大学バークレー校の統計、機械学習、人工知能のインターフェースで働いています。 AlphaZeroは強力ですが、特にその作成と実行に費やされた人時間を追加する場合は、支出に見合ったものではないかもしれません。

精力的に高価であるかどうかにかかわらず、AlphaZeroは飛躍します。ほとんどのAIは1つのタスクで超特化されているため、この新しいプログラムは、ゲームプレイの3倍の脅威とともに非常に柔軟です。 「AlphaZeroが3つの異なるゲームに同じアーキテクチャを使用できたことは印象的です」とYu氏は言います。

あ、はい。 Googleの新しいAIは、いくつかの方法で新しいマークを設定しています。 これは速い。 強力です。 しかし、それはスマートになりますか?

ここで定義が曖昧になり始めます。 「AlphaZeroは、人間の知識なしにゼロから始めて、これらの各ゲームを超人レベルでプレイすることを学ぶことができました」と、DeepMindのSilverはプレスへの声明で述べました。

ボードゲームの専門知識が精神的な鋭敏さを必要とする場合でも、現実世界のすべてのプロキシには限界があります。 現在のイテレーションでは、AlphaZeroは人間が設計したゲームに勝つことで最大限に活用します。これは、「スーパーヒューマン」の潜在的な警告ラベルを正当化できない可能性があります。 一方、実際の人間の脳は、そのレパートリーに3つ以上のボードゲームを格納できます。

さらに、AlphaZeroのベースラインをタブララサ(白紙)と比較することは、研究者たちと同じように、一気に進んでいる、とBrysonは言います。 プログラマーは、人間の知識に関する重要な情報を提供しています。それは、ゲームのルールです。 「これまでのものよりもはるかに少ないのです」とブライソンは付け加えます。「しかし最も基本的なことは、まだルールが与えられているということです。 それらは明示的です。」

そして、これらの厄介なルールは、重要な松葉杖を構成する可能性があります。 「これらのプログラムは実行方法を学習しますが、道路のルールが必要です」とハワードは言います。 「世界には、これらのルールがないタスクがいっぱいです。」

プッシュが迫ると、AlphaZeroは既に強力なプログラムのアップグレード版です。AlphaGoZeroは、バージニア工科大学と州立大学で人工知能と計算の夢を研究しており、新しい研究には関与していなかったJoAnn Paulを説明します。 AlphaZeroは、AlphaGo Zeroと同じビルディングブロックとアルゴリズムの多くを使用しますが、それでも真のスマートのサブセットを構成しています。 「この新しい開発は革命的というよりも進化的だと思いました」と彼女は付け加えます。 「これらのアルゴリズムはどれも作成できません。 インテリジェンスはストーリーテリングについてもです。 まだそこにないものを想像しています。 私たちはコンピューターでそれらの用語を考えていません。」

問題の一部は、「インテリジェンス」の真の定義に関するコンセンサスがまだないことであり、技術分野だけではありません。 「私たちが批判的に考える存在をどのように訓練しているか、または無意識の脳をどのように使用しているかはまだ明らかではありません」と彼女は付け加えます。

この点まで、多くの研究者は、おそらく複数の種類の知性があると信じています。 そして、あるものを活用することで、別のものの材料が保証されます。 例えば、そこにいる最も賢い人々の何人かはチェスでひどいです。

これらの制限があるため、人工知能の未来に対するYuのビジョンは、一種の共進化において人間と機械を結びつけます。 機械は確かに特定のタスクで優れたものになると彼女は説明しますが、自動化されていないことを補うために、人間の入力と監視が常に必要になる場合があります。

もちろん、AIアリーナで物事がどのように揺れるのかはわかりません。 それまでの間、熟考することがたくさんあります。 「これらのコンピューターは強力であり、人間よりも優れた機能を実行できます」とPaul氏は言います。 「しかし、それでも知性の謎には及ばない。」


この記事はもともとNOVAで公開されました。
Googleの新しいAIはゲームの達人ですが、人間の心と比べてどうですか?