https://frosthead.com

AIは4年前よりも賢くなりますか?

誰もが人工知能、特に機械学習の新しい進歩について耳にしました。 また、それらの進歩が何を意味するかについてのユートピア的または黙示録的な予測を聞いたことがあります。 彼らは不滅か世界の終わりのいずれかを予言するために連れて行かれました、そして、多くのそれらの可能性について書かれました。 しかし、最も洗練されたAIは、人間の4歳児が簡単に達成できる問題を解決できるにはほど遠いです。 印象的な名前にもかかわらず、人工知能は、大規模なデータセットの統計パターンを検出するための技術で主に構成されています。 人間の学習にはさらに多くのことがあります。

どうすれば私たちの周りの世界についてそんなに多くを知ることができるでしょうか? 私たちは小さな子供であっても膨大な量を学びます。 4歳児はすでに植物や動物、機械について知っています。 欲望、信念、および感情。 恐竜や宇宙船ですら。

科学は世界についての私たちの知識を想像を絶するほど大きく、無限に小さく、宇宙の端と時間の始まりまで広げました。 そして、その知識を使用して、新しい分類と予測を行い、新しい可能性を想像し、世界で新しいことを実現します。 しかし、世界から私たちの誰にでも届くのは、網膜に当たる光子の流れと鼓膜の空気の乱れだけです。 私たちが持っている証拠が非常に限られているとき、私たちはどうやって世界についてそんなに多くを学ぶのでしょうか? そして、私たちの目の後ろに座っている数ポンドの灰色のグーでこれをどうやって行うのですか?

これまでの最良の答えは、私たちの脳が感覚に到達する具体的で特定の厄介なデータに対して計算を実行し、それらの計算が世界の正確な表現を生み出すということです。 表現は、構造化され、抽象的で、階層的です。 それらには、3次元オブジェクトの認識、言語の基礎となる文法、および他の人々が何を考えているかを理解させる「心の理論」のような精神的能力が含まれます。 これらの表現により、私たちは幅広い新しい予測を行い、多くの新しい可能性を明確に創造的な人間の方法で想像することができます。

この種の学習は唯一の知能ではありませんが、人間にとって特に重要なものです。 そして、それは幼い子どもたちの専門である一種の知性です。 子どもたちは計画と意思決定に非常に苦手ですが、彼らは宇宙で最高の学習者です。 データを理論に変換するプロセスの多くは、5歳になる前に発生します。

アリストテレスとプラトン以来、私たちが知っていることをどうやって知るかという問題に対処する2つの基本的な方法があり、それらは依然として機械学習の主なアプローチです。 アリストテレスはこの問題にボトムアップでアプローチしました。感覚から始めましょう-光子の流れと空気の振動(またはデジタル画像または記録のピクセルまたは音声サンプル)-パターンを抽出できるかどうかを確認します。 このアプローチは、哲学者のデイビッド・ヒュームやJSミルなどの古典的な連想主義者によって、さらにパブロフやBFスキナーなどの行動心理学者によってさらに進められました。 この見方では、表現の抽象性と階層構造は、幻想のようなもの、または少なくともエピフェノムです。 特に十分なデータがある場合は、関連付けとパターン検出によってすべての作業を実行できます。

Preview thumbnail for video 'Possible Minds: 25 Ways of Looking at AI

可能な心:AIを見る25の方法

科学界の著名なジョン・ブロックマンは、最も重要な科学的精神、つまりほとんどのキャリアでフィールド人工知能について考えている25人を集め、心、思考、知性、そしてそれが何を意味するかについての比類のない円卓会議を行います人間であること。

購入

時間が経つにつれて、学習のミステリーに対するこのボトムアップアプローチとプラトンの代替のトップダウンアプローチの間にシーソーがありました。 多分、具体的なデータから抽象的な知識を得るのは、すでに多くのことを知っているからです。特に、進化のおかげで、基本的な抽象的な概念の配列をすでに持っているからです。 科学者のように、これらの概念を使用して、世界についての仮説を立てることができます。 次に、生データからパターンを抽出しようとする代わりに、これらの仮説が正しい場合にデータがどのように見えるかについて予測を行うことができます。 プラトンとともに、デカルトやノアム・チョムスキーなどの「合理主義」哲学者や心理学者がこのアプローチを採用しました。

以下に、2つの方法の違いを示す日常的な例を示します。スパムペストの解決です。 データは、受信ボックス内のメッセージの並べ替えられていない長いリストで構成されます。 現実には、これらのメッセージの一部は本物であり、一部はスパムです。 それらを区別するためにデータをどのように使用できますか?

最初にボトムアップ手法を検討してください。 スパムメッセージには、アドレスの長いリスト、ナイジェリアの発信元、100万ドルの賞品への言及、バイアグラなどの特定の機能がある傾向があることに気付きます。 問題は、完全に有用なメッセージにもこれらの機能がある可能性があることです。 スパムメールと非スパムメールの十分な例を見てみると、スパムメールにはこれらの機能がある傾向があるだけでなく、機能が特定の方法で一緒になる傾向があることがわかります(ナイジェリアと100万ドルの問題)。 実際、スパムメッセージと有用なメッセージを区別する、わずかな高レベルの相関関係が存在する可能性があります。たとえば、スペルミスやIPアドレスの特定のパターンなどです。 これらのパターンを検出した場合、スパムを除外できます。

ボトムアップの機械学習技術はまさにこれを行います。 学習者は数百万のサンプルを取得します。各サンプルにはいくつかの機能セットがあり、それぞれスパム(またはその他のカテゴリ)としてラベル付けされています。 コンピューターは、たとえわずかであっても、2つを区別する特徴のパターンを抽出できます。

トップダウンのアプローチはどうですか? Journal of Clinical Biologyの編集者からメールが届きます。 それは私の論文の1つを指し、彼らは私による記事を出版したいと言っています。 ナイジェリア、バイアグラ、百万ドルはありません。 メールにはスパムの機能はありません。 しかし、私がすでに知っていることを使用し、スパムを生成するプロセスについて抽象的な方法で考えることで、このメールが疑わしいことがわかります。

1.私はスパマーが人間の欲に訴えることによって人々からお金を引き出すことを試みることを知っています。

2.また、合法的な「オープンアクセス」ジャーナルは、購読者ではなく著者に課金することで費用を賄い始めており、臨床生物学のようなものを実践していないことも知っています。

これらすべてをまとめると、そのメールがどこから来たのかについて、新しい仮説を立てることができます。 それは、偽のジャーナルに論文を「公開」するために学者を吸うように設計されています。 電子メールは、他のスパム電子メールと同じように見えなくても、他のスパム電子メールと同じ疑わしいプロセスの結果でした。 この結論は1つの例から導き出すことができます。さらに、「エディター」をグーグル検索することで、メール自体にあるものを超えて、仮説をさらに検証することができます。

コンピュータ用語では、欲と欺ceptionのような抽象的な概念を含み、電子メール詐欺を生み出すプロセスを記述する「生成モデル」から始めました。 これにより、ナイジェリアの古典的な電子メールスパムを認識することができますが、さまざまな種類のスパムの可能性を想像することもできます。 ジャーナルの電子メールを受け取ったら、逆方向に進むことができます。「これは、スパムを生成するプロセスから出てくる一種のメールのように思えます。」

AIの新しい興奮は、AI研究者がこれらの学習方法の両方の強力で効果的なバージョンを最近作成したためです。 しかし、メソッド自体について深く新しいものは何もありません。

ボトムアップの深層学習

1980年代、コンピューター科学者はコンピューターにデータのパターンを検出させるための独創的な方法を考案しました:コネクショニスト、またはニューラルネットワーク、アーキテクチャ(「神経」部分は比was的でした)。 このアプローチは1990年代に低迷しましたが、最近GoogleのDeepMindのような強力な「ディープラーニング」メソッドで復活しました。

たとえば、ディープラーニングプログラムに、「cat」というラベルの付いたインターネットイメージ、「house」というラベルの付いたインターネットイメージなどを提供できます。 プログラムは、2つの画像セットを区別するパターンを検出し、その情報を使用して新しい画像に正しくラベルを付けることができます。 教師なし学習と呼ばれるある種の機械学習は、ラベルのないデータのパターンを検出できます。 科学者が因子分析と呼んでいる機能のクラスターを探すだけです。 ディープラーニングマシンでは、これらのプロセスがさまざまなレベルで繰り返されます。 一部のプログラムでは、ピクセルまたはサウンドの生データから関連する機能を発見することさえできます。 コンピューターは、エッジとラインに対応する未加工画像のパターンを検出することから始めて、顔に対応するパターンなどのパターンを見つけることができます。

長い歴史を持つ別のボトムアップ手法は強化学習です。 1950年代、ジョン・ワトソンの仕事を基にしたBFスキナーは、特別な報酬と罰のスケジュールを与えることで、空中発射ミサイルをターゲット(最近のAIの邪魔なエコー)に導くことで、精巧な行動を行うように有名にハトをプログラムしました。 基本的な考え方は、目的の行動が達成されるまで、報われる行為は繰り返され、罰される行為は繰り返されないということでした。 スキナーの時代でさえ、何度も繰り返されるこの単純なプロセスは、複雑な行動につながる可能性がありました。 コンピューターは、人間の想像力を超える規模で何度も簡単な操作を実行するように設計されており、計算システムはこの方法で非常に複雑なスキルを習得できます。

たとえば、GoogleのDeepMindの研究者は、ディープラーニングと強化学習の組み合わせを使用して、コンピューターにAtariビデオゲームをプレイするよう指導しました。 コンピューターは、ゲームの仕組みについて何も知りませんでした。 ランダムに行動することから始まり、各瞬間のスクリーンの外観とスコアの程度に関する情報のみを取得しました。 ディープラーニングは画面上の機能を解釈するのに役立ち、強化学習はより高いスコアをシステムに与えました。 コンピューターはいくつかのゲームで非常に上手になりましたが、人間が習得するのが簡単だった他のゲームにも完全に爆撃されました。

ディープラーニングと強化学習の同様の組み合わせにより、DeepMindのAlphaZeroが成功しました。これは、チェスとゴーの両方で人間のプレーヤーを倒すことができ、ゲームのルールといくつかの計画能力の基本的な知識のみを備えたプログラムです。 AlphaZeroにはもう1つの興味深い機能があります。それは、数億ものゲームを自分自身に対してプレイすることによって機能します。 そうすることで、損失につながるミスを排除し、勝利につながる戦略を繰り返して詳しく説明します。 このようなシステム、および生成的敵対ネットワークと呼ばれる技術を含む他のシステムは、データを生成するだけでなく、データを観察します。

これらの手法を非常に大きなデータセットまたは数百万の電子メールメッセージ、Instagramの画像、音声録音に適用する計算能力がある場合、以前は非常に困難であったと思われる問題を解決できます。 それが、コンピューターサイエンスの興奮の多くの源です。 しかし、画像が猫であることや話し言葉がシリであることを認識するなど、これらの問題は人間の幼児にとって些細なものであることを覚えておく価値があります。 コンピュータサイエンスの最も興味深い発見の1つは、私たちにとって簡単な問題(猫の識別など)がコンピュータにとって難しいことです。チェスや囲playingを演奏するよりもはるかに難しいことです。 コンピューターでは、数個で分類できるオブジェクトを分類するために、数百万の例が必要です。 これらのボトムアップシステムは、新しい例に一般化できます。 新しい画像に猫としてのラベルをかなり正確に付けることができます。 しかし、彼らは人間が一般化する方法とはまったく異なる方法でそうします。 猫の画像とほぼ同じ画像の中には、猫としてまったく識別されないものもあります。 ランダムなぼかしのように見える他のものはそうなります。

トップダウンベイジアンモデル

トップダウンアプローチは初期のAIで大きな役割を果たし、2000年代には確率論的、またはベイジアン生成モデルの形での復活も経験しました。

このアプローチを使用する初期の試みは、2種類の問題に直面していました。 第一に、証拠のほとんどのパターンは、原則として多くの異なる仮説によって説明される可能性があります。私のジャーナルの電子メールメッセージは本物である可能性があります。 第二に、生成モデルが使用する概念はそもそもどこから来たのですか? プラトンとチョムスキーは、あなたは彼らと一緒に生まれたと言いました。 しかし、科学の最新の概念をどのように学ぶかをどのように説明できますか? または、幼い子供でさえ恐竜やロケット船についてどのように理解していますか?

ベイジアンモデルは、生成モデルと仮説検定を確率理論と組み合わせ、これらの2つの問題に対処します。 ベイジアンモデルを使用すると、データが与えられた場合に特定の仮説が真である可能性を計算できます。 そして、すでに持っているモデルに小規模で体系的な調整を加え、それらをデータに対してテストすることで、古いものから新しい概念やモデルを作成できる場合があります。 しかし、これらの利点は他の問題によって相殺されます。 ベイジアン手法を使用すると、2つの仮説のどちらがより可能性が高いかを選択できますが、ほとんどの場合、膨大な数の可能な仮説が存在し、それらをすべて効率的に考慮するシステムはありません。 そもそもテストする価値のある仮説をどのように決定しますか?

NYUのBrenden Lakeと同僚は、この種のトップダウン方式を使用して、人には簡単だがコンピューターには非常に難しい別の問題を解決しました。 日本の巻物のキャラクターを見てください。 一度も見たことがなくても、他の日本語の巻物のキャラクターと似ているのか違うのかはおそらくわかるでしょう。 あなたはおそらくそれを描くことができ、あなたが見ているものに基づいて偽の日本のキャラクターをデザインすることさえできます。それは韓国語やロシア語のキャラクターとはかなり違って見えるでしょう。

手書き文字を認識するボトムアップ方式は、コンピューターにそれぞれの数千の例を提供し、顕著な特徴を引き出すことです。 代わりに、レイク等。 プログラムにキャラクターの描き方の一般的なモデルを与えました。ストロークは右または左に移動します。 1つを終了した後、別のものを開始します。 等々。 プログラムが特定のキャラクターを見たとき、それが原因である可能性が最も高い一連のストロークを推測できました。スパムプロセスが私の疑わしい電子メールにつながったと推測したように。 次に、新しいキャラクターがそのシーケンスまたは別のシーケンスの結果である可能性が高いかどうかを判断でき、ストローク自体の同様のセットを生成できます。 このプログラムは、まったく同じデータに適用されるディープラーニングプログラムよりもはるかに優れて機能し、人間のパフォーマンスを密接に反映していました。

機械学習へのこれら2つのアプローチには、長所と短所があります。 ボトムアップアプローチでは、プログラムは最初から多くの知識を必要としませんが、大量のデータが必要であり、限られた方法でのみ一般化できます。 トップダウンアプローチでは、プログラムはほんの数例から学ぶことができ、より広くより多様な一般化を行うことができますが、最初からもっと多くを組み込む必要があります。 現在、多くの研究者が、ベイジアン推論を実装するためにディープラーニングを使用して、2つのアプローチを組み合わせようとしています。

AIの最近の成功の一部は、これらの古いアイデアの拡張の結果です。 しかし、それはインターネットのおかげでより多くのデータがあり、ムーアの法則のおかげでそのデータに適用する計算能力がはるかに大きいという事実と関係があります。 さらに、評価されていない事実は、私たちが持っているデータはすでに人間によってソートおよび処理されているということです。 Webに投稿される猫の写真は、標準的な猫の写真です。これは、人間が既に「良い」写真として選択した写真です。 Google翻訳が機能するのは、文章そのものを真に理解するのではなく、何百万もの人間の翻訳を活用し、それらを新しいテキストに一般化するためです。

しかし、人間の子供たちについて本当に注目すべきことは、彼らが何らかの方法でそれぞれのアプローチの最高の特徴を組み合わせて、それを超えていくということです。 過去15年間、発達学者は、子どもがデータから構造を学習する方法を探ってきました。 4歳児は、トップダウンシステムのように1つまたは2つのデータの例を取り上げ、非常に異なる概念に一般化することで学習できます。 しかし、ボトムアップシステムのように、データ自体から新しい概念とモデルを学ぶこともできます。

たとえば、私たちの研究室では、小さな子供たちに「ブリケット検出器」を提供しています。これは、今まで見たことのない新しい機械です。 これは、特定のオブジェクトを置いたときに点灯して音楽を再生するボックスで、他のオブジェクトを置かない場合です。 私たちは子供たちに機械がどのように機能するかの例を1つまたは2つだけ与え、たとえば2つの赤いブロックがうまくいくのに対し、緑と黄色の組み合わせではうまくいかないことを示します。 18ヶ月の子供でさえ、すぐに2つのオブジェクトが同じでなければならないという一般原則を理解し、その原則を新しい例に一般化します。たとえば、同じ形状の 2つのオブジェクトを選択して作成します。機械作業。 他の実験では、隠された目に見えないプロパティがマシンを動かしていること、またはマシンが抽象的な論理原理に基づいて動作していることを子供が理解できることを示しました。

これは、子供たちの日常の学習でも示すことができます。 幼い子どもは、比較的少ないデータでさえ、成人科学者が行うのと同じように、生物学、物理学、心理学の抽象的な直感的な理論を急速に学びます。

最近のAIシステムの注目すべき機械学習の成果は、ボトムアップとトップダウンの両方で、仮説と概念の狭い明確に定義されたスペースで行われます。ゲームピースと動きの正確なセット、画像の所定のセット。 対照的に、子供も科学者も概念を根本的に変え、単に既に持っている概念を微調整するのではなく、パラダイムシフトを行うことがあります。

4歳児は猫をすぐに認識して言葉を理解できますが、経験をはるかに超えた創造的で驚くべき新しい推論を行うこともできます。 私の孫は最近、例えば、大人が再び子供になりたい場合、健康な野菜は子供を大人に成長させるので、健康な野菜を食べないようにすべきだと説明しました。 この種の仮説は、大人は決して楽しまないというもっともらしい仮説であり、幼い子供の特徴です。 実際、同僚と私は、未就学児は年上の子どもや大人よりもありそうもない仮説を立てるのに優れていることを体系的に示しました。 この種の創造的な学習と革新がどのように可能であるか、私たちにはほとんどわかりません。

しかし、子どもたちが何をするかを見ると、プログラマーはコンピューター学習の方向性について有用なヒントを得ることができます。 子どもたちの学習の2つの特徴は特に印象的です。 子どもたちは積極的な学習者です。 AIのように受動的にデータを吸収するだけではありません。 科学者が実験するのと同じように、子どもたちは本質的に、無限の遊びと探検を通じて自分の周りの世界から情報を抽出しようとしています。 最近の研究は、この調査が見た目よりも体系的であり、仮説形成と理論選択をサポートする説得力のある証拠を見つけるのによく適応していることを示しています。 好奇心を機械に組み込み、世界と積極的に対話できるようにすることは、より現実的で幅広い学習への道です。

第二に、既存のAIとは異なり、子供は社会的および文化的学習者です。 人間は孤立して学習するのではなく、過去の世代の蓄積された知恵を利用します。 最近の研究では、未就学児でさえ模倣や他人の証言を聞くことで学ぶことが示されています。 しかし、彼らは単に受動的に教師に従うだけではありません。 代わりに、他の人からの情報を非常に繊細で繊細な方法で取り入れ、情報の出所や信頼性について複雑な推論を行い、自分の経験を聞いているものと体系的に統合します。

「人工知能」と「機械学習」は怖いですね。 そして、いくつかの点で彼らはそうです。 これらのシステムは、たとえば武器を制御するために使用されており、私たちは本当にそれを恐れる必要があります。 それでも、自然な愚かさは人工知能よりもはるかに大混乱を引き起こす可能性があります。 私たち人間は、新しいテクノロジーを適切に規制するために、これまでよりもずっと賢くする必要があります。 しかし、AIが人間に取って代わるという黙示録的またはユートピア的なビジョンのどちらにも、あまり根拠はありません。 学習の基本的なパラドックスを解決するまで、最高の人工知能は、平均的な4歳の人間と競争することはできません。

今後のコレクションPOSSIBLE MINDS:25 Ways of Looking AI、John Brockman編。 Penguin Random House LLCのメンバーであるPenguin Pressとの取り決めによって発行されています。 著作権©2019 John Brockman。

AIは4年前よりも賢くなりますか?