https://frosthead.com

機械と話す

音声認識ソフトウェアは、おそらく私たちのほとんどが同意するでしょうが、かなりクールなものです。 しかし、スマートフォン、テレビ画面、ダッシュボードなど、機械との会話はそれほど重要ではありません。 デバイスのアドバイスをお求めですか? オタクのオタク。 理解できるように各単語を発音しますか? 本当にどれだけクールになれますか?

しかし、Appleは、その事実に忠実に、iPhone 4Sの声であるSiriの最新の広告キャンペーンで、クールなスターの3つのアイコンを採用することでこの目標を達成しました。 Zooey Deschanel(Adorable Cool)、John Malkovich(Cerebral Cool)、Samuel L. Jackson(Ultimate Cool)があり、すべて携帯電話で言葉遊びをすることは神のスポーツのようです。

それにもかかわらず、批評家は、実際の生活では、Siriはコマーシャルで描かれているほど反応がよくなく、すべてを知っているわけでもないことを指摘しています。 あなたも、これを聞いてショックを受けていると思います。 他の人は、すべてをパロディの熟していると見なします。Zooeyの兄弟Jooeyが、ZooeyとSiriの雨の日を一緒にファニーバージョンまたはダイバージョンで行うことを参照してください。

どんなに。 Siriは、新世代の「You Got Mail」の声であるロボットコーラスのリードシンガーになりました。

一部のサークルでは、SiriがSteve Jobsにふさわしくなく、彼がまだ生きていればJobsがそれを市場から引き離したか、少なくともこのような注目度の高い広告を決して承認しなかったと示唆することは流行です。製品に欠陥があるためのキャンペーン。

しかし、Jobsの後継者であるTim Cookが今週初めに言ったように、iPhone 4Sの所有者はSiriが好きだ。 3月にリリースされた調査によると、ほぼ90%が少なくとも1か月に1回は使用していると回答しています。 また、リリース時にベータ版と言われた数少ないアップル製品の1つであるSiriは、10月まで彼女の最初の誕生日を祝わないことに注意してください。 彼女はまだ言語を学んでおり、さらに重要なことに、人工知能の可能性を引き出し始めています。

Siriはおそらく12月にデビューする予定のApple TVの中心的存在になるでしょう。 しかし、チャンスは、機械と話すことが主流になる場所は私たちの車の中にあるということです。

ドライブ、彼女は言った

確かに、それは既に起こっていますが、理解したい場合はロボットスピーチに切り替える必要があります。 そして、それでも保証はありません。 今年の夏には、いくつかの新しいモデルにDragon Driveと呼ばれるものが搭載されるようになります。

マサチューセッツ州に本拠を置くNuance Communicationsの発明により、音声認識ビジネスの強力な存在となりました。 (Siriの背後にある脳であると広く信じられています。)先週、会社がDragon Drive!を発表したとき、車のニュアンスと音声認識は大きく前進しました。 クラウドを活用できるようになります。

これが意味することは、システムがその計算能力とメモリ能力を劇的に増加させるということです。 そして、それはあなたのダッシュボードの声がよりSiriのようになり、実際にそれと会話できるようになることを意味します。 単音節の叫びはもうありません。 何人かのオールマンブラザーズのように感じて、数秒後に「ホイッピングポスト」がスピーカーを駆け巡ってくると気軽に言及できる日が来ています。

重要なのは、機械のコンテキストと語用論をいかにうまく教えることができるか、つまり社会的状況でどのように言語を使用するかです。 そして、それはトリッキーなビジネスです。 まず第一に、最も洗練された音声認識デバイスでさえ、人間が話し終わるのを待つ必要があるので、文章全体を解析して解釈することができます。 次に、「心の理論」、つまり他の人が私たちとは異なる信念や意図を持つことができることを理解する能力があります。 私たちが知る限り、これを行うことができるのは人間だけです。

スタンフォードの2人の心理学者による最近の研究は、機械の直観を助けることに何が関係しているかの感覚を与えてくれます。 マイケル・フランクとノア・グッドマンの研究者は、参加者にオブジェクトのセットを見て、特定の単語と呼ばれるものを選択するように依頼するオンライン実験をセットアップしました。 たとえば、ある参加者グループは、青い正方形、青い円、赤い正方形を見ました。 そのグループの質問は、あなたが誰かと話していて、真ん中のオブジェクトを参照したいことを想像してください。 「青」と「丸」のどちらの言葉を使いますか?

他のグループは尋ねられました:誰かがあなたと話していると想像してください、そして、「青」という言葉をこれらのオブジェクトの1つを指すのに使用します。 彼らはどのオブジェクトについて話しているのですか?

この回答により、研究者は、聞き手が話者をどのように理解しているか、話者が何を言うかをどのように決定するかをより明確に把握することができました。 それから、彼らはコンピューターの思考プロセスを拡張および改良できるような数学的モデルを開発しました。

フランクは言った:「それは何年もかかるだろうが、夢はあなたが言ったことだけでなくあなたが望むものとあなたが何を意味するかを本当に考えているコンピューターのことだ。」

言論の仕方

音声認識の最近の開発は次のとおりです。

  • Siriは沈黙します 。IBMは企業秘密が抜け出すのを非常に緊張する傾向があるため、Dropboxなどの公開ファイル転送サイトを従業員が使用することを禁止しています。 しかし、セキュリティ管理者は、誰かが自分の電話と話している間に、最終的にはAppleのサーバー上にある機密情報を明らかにするのではないかと心配するため、オフィスでのSiriの使用を禁止しています。
  • Apple、それをお忘れなく!:サムスンは今週ロンドンで新しいGalaxy X IIIスマートフォンを発売し、大きなタッチスクリーンが注目を集めている一方で、新しい音声および顔認識ソフトウェアも備えています。
  • 私が言うことではなく、私が言うことをしてください:そして、サムスンはそこで止まりません。 最近、人間の発話を理解するロボットの特許出願を行いました。 ロボットは、「リスニング」機能を調整して、与えられたコマンドを中断または混乱させる可能性のある周囲のノイズを考慮することができます。 また、背景雑音が非常に大きい場合でも、誰が話しているのかを認識することができます。

インフォグラフィックボーナス:車は現在コンピューター化されていると思います。 インターネットに完全に接続されるまで待ちます。 コネクテッドカーでできることの概要を把握しましょう。

機械と話す