https://frosthead.com

チューリングテストが視覚的になりました

Facebookのアルゴリズムは、群衆からあなたの顔を選択することができます(または少なくとも試してみてください)が、家族の肖像画でポーズを取っているのか、仲間と飲んでいるのかを判断することはできません。 。 しかし、将来的には、コンピューターでそれができるようになるかもしれません。 現在、研究者たちは、スマートコンピューターが視覚的にどの程度識別されているかを把握する方法を提案しています。 彼らは、コンピューターが人間のような知性を表示できるかどうかのコンピューター科学者アラン・チューリングのテストに続いて、彼らのテストを視覚的チューリングテストと呼んでいます。

テストの一般的な認識は、人間とコンピューターを区別するために使用され、CAPTCHAを実行して新しい電子メールにサインアップするときに1つのバージョンがその効果に使用されるということです。 しかし、人工知能の研究者は、テストがこれまでの高度なコンピューターインテリジェンスの測定方法であると考えています。

「近年、コンピュータービジョンにいくつかの印象的な進歩がありました」と、ブラウン大学の数学教授であり、新しい評価を提案している研究者の1人であるスチュアートジェマンは記者会見で述べています。 「これらのシステムがどのように評価され、ベンチマークされるかという点で、基準を引き上げる時が来るかもしれないと感じました。」

このテストでは、画像に2人の人物が写っていることを単に認識するのではなく、2人の人物が会話や議論さえしていることをコンピューターが把握できるかどうかを確認します。 現在、研究者は公開されているデータセットを使用してプログラムをテストしています。MITにはLableMeがあり、クラウドソーシングを使用して、たとえば画像内の「車」、「木」、「建物」を識別します。 これを改善し、より大きな課題を提供するために、ブラウンに拠点を置く研究者は、標準化されたビジュアルチューリングテストのフレームワークを考案しました。

IEEE SpectrumレポートのLee Gomes:

提案された方法では、人間のテスト設計者が、ストリートシーンに人が含まれているか、人が何かを運んでいるか、話し合っているかなど、写真が持つ可能性がある特定の属性のリストを作成する必要があります。 写真は、まずこれらの基準に基づいて人間によって手書きで採点されます。 コンピュータビジョンシステムには、「答え」なしで同じ画像が表示され、人間が見つけたものを検出できるかどうかが判断されます。

最初は、質問は初歩的なもので、たとえば、写真の指定された領域に人がいるかどうかを尋ねます。 しかし、プログラムが高度になるにつれて、質問は複雑になります。 より複雑な質問には、写真の中の異なる人々の間の相互作用の性質が含まれる場合があります。

チームは、国立科学アカデミーの議事録でテストについて説明しました。 現在のところ、ドイツ語によると、新しいテストの単純なバージョンにも合格できないコンピューターシステムはありません。 しかし、彼らは将来的になります。 写真には多くの属性があるため、研究者はコンピューターが写真を評価することを学ぶための革新的な方法を考え出す必要があります。

「研究者として、私たちは「テストを教える」傾向があります」とGemanは声明で述べています。 「すべての人が参加するコンテストがあり、それらが成功の尺度である場合、それが私たちの焦点です。 そのため、現在のビジョンシステムの範囲外にテストを変更することは賢明かもしれません。」

チューリングテストが視覚的になりました