マシンが見るとき| イノベーション| スミソニアン - 記事、ブログ、イノベーション、イノベーション、科学、テクノロジー、スペース

蝶の羽のパターン認識。画像提供：Li Li

ここワシントンでは、あなたが「前進計画」と呼ぶこのことを聞いたことがありますが、まだそれを受け入れる準備ができていません。少し未来的すぎる。

それでも、私たちは、今から1か月以上後に何が起こるか予測しようとする人々を遠くから賞賛せざるを得ません。ですから、数週間前、IBMの大思想家が5年後に世界を想像し、私たちの日常生活に最大の影響を与える5つのイノベーション分野であると彼らが信じるものを特定したとき、私は感銘を受けました。

彼らは数年前からこれを行ってきましたが、今回は風変わりな気まぐれがテーマ、つまり人間の五感に続いていました。 2018年までに、私たち全員がより良く見、聞き、匂いを嗅ぐことができるようになると言っているのではなく、むしろマシンは、急速に進化する感覚および認知技術を使用することで、コンピューターがデータ取得からの変換を加速し、思考ツールへの処理エンジン。

パターンが見えますか？

今日は、ビジョンに取り組みましょう。 IBMがGoogleのProject Glassを指しているのではないかと考えるのは理にかなっています。メガネの役割を再定義したことは間違いありません。見た目を良くするオタクなアクセサリーから、いつか顔に装着するスマートフォン/データダイブデバイスを組み合わせたものになります。

しかし、それはIBM社員が話していることではありません。それらはマシンビジョン、特にパターン認識に焦点を当てており、それにより、コンピューターは繰り返し画像にさらされることで、物を識別することができます。

結局のところ、Googleはたまたま昨年の注目すべきパターン認識実験の1つに参加しました。このプロジェクトでは、YouTubeビデオから1, 000万枚の画像を調べた後、16, 000プロセッサを使用する1, 000台のコンピュータのネットワークが、猫のように見えた。

これが特に印象的だったのは、コンピューターが何を探すべきかについての人間の指導なしでそうすることができたということです。すべての学習は、猫のどの特徴が注目に値し、どのパターンが重要であるかを決定するために一緒に動作する機械を通して行われました。

そして、それが機械が視覚をどのように学習するかのモデルです。 IBMのIntelligent Information ManagementのシニアマネージャーであるJohn Smithが次のように説明しています。

「ビーチにどんなものがあるかをコンピューターに教えたいとしましょう。まず、ビーチシーンの多くの例をコンピューターに見せることから始めます。コンピュータは、これらの写真を、色分布、テクスチャパターン、エッジ情報、またはビデオの場合の動き情報などの個別の機能に変換します。次に、コンピューターは、これらのさまざまな機能に基づいて、ビーチシーンと他のシーンを区別する方法を学習し始めます。たとえば、ビーチのシーンでは、ダウンタウンの街並みと比較して、特定の色分布が通常見られることがわかります。」

どのくらいスマートですか？

彼らに良い。しかし、それに直面して、ビーチを識別することは、私たちのほとんどの人間にとって非常に基本的なものです。マシンがどれほどの思考力を発揮できるかについて夢中になれるでしょうか？

ニューヨーク大学の心理学教授であるゲイリー・マーカスはそう考えています。最近、ニューヨーカーのウェブサイトに書いて、彼は「ディープラーニング」として知られるようになったもので多くの進歩がなされたが、それらは本当にインテリジェントであると考えられる前にまだ長い道のりを持っていると結論付ける。

「現実的には、ディープラーニングは、インテリジェントマシンを構築するという大きな課題の一部にすぎません。このような手法には、因果関係（病気とその症状など）を表す方法がなく、「兄弟」や「同一」などの抽象的なアイデアを獲得する際に課題に直面する可能性があります。論理的な推論を実行する明確な方法はありません。オブジェクトが何であるか、何のためにあるのか、そして通常どのように使われるのかといった情報など、抽象的な知識を統合するにはまだまだ長い道のりです。」

IBMの人々は間違いなくそのことを認めるでしょう。機械学習は飛躍ではなく段階的に行われます。

しかし、彼らは5年以内に、ディープラーニングが十分な前進の一歩を踏み出し、たとえばコンピューターが医療診断ではるかに大きな役割を果たすようになり、腫瘍や血栓の発見に関しては実際に医師よりも良くなると信じているまたはMRI、X線またはCTスキャンでの病変組織。

そして、それは私たちの生活に大きな違いをもたらす可能性があります。

百聞は一見に如かず

マシンビジョンが私たちの生活に影響を与えている他の方法を次に示します。

最高の腕を前に出す：ピッツバーグ大学で開発されたテクノロジーは、パターン認識を使用して、対麻痺者が脳でロボットアームを制御できるようにします。
口は「はい」ですが、脳は「いいえ」と言います：スタンフォード大学の研究者は、脳のMRIスキャンでパターン認識アルゴリズムを使用すると、実際に腰痛があるのか、それとも偽物であるのかを判断するのに役立つことがわかりました。
あなたのほくろをクローズアップする準備ができたら：昨年、SkinVisionという名前のルーマニアのスタートアップが、人々が皮膚のほくろの写真を撮って、SkinVisionの認識ソフトウェアに異常を識別させ、リスクレベルを指摘できるiPhoneアプリを立ち上げました実際の診断を提供します。次のステップは、皮膚科医に皮膚の画像を直接送信できるようにすることです。
私はあなたのために契約を結んでいますか：現在開発中のFacedealsと呼ばれるマーケティングテクノロジーです。店舗の入り口にあるカメラがあなたを認識すると、スマートフォンでカスタマイズされた店内取引が送信されます。はい、最初にオプトインする必要があります。
どこでもそのシールを知っています：パターン認識を使用するコンピューター化された写真IDシステムは、英国の科学者が彼らのコートにユニークなマーキングを持っている灰色のシールを追跡するのを助けます。

ビデオボーナス：人工知能についてですが、ジョージア工科大学の科学者の賛辞であるベートーベンを演奏するロボットの群れです。今日はそれを見るとは思わなかったでしょう。

Smithsonian.comからの詳細

より人間の人工脳

テクノロジーがテロと戦う方法