https://frosthead.com

GPSがあなたの言語を話すことを学ぶ方法

オーストラリアの歌手兼声優のカレン・ヤコブセンは、ニューヨークに到着してすぐに2000年にギグを取得しました。 プロデューサー(企業タイプ)は彼女を3週間レコーディングスタジオに送り、1日4時間かけて「次の交差点で左折」や「再計算」などのことを言った。結局、彼女の声ではなかった。緊張していました。 「「およそ」と約186回言った」とヤコブセンは回想する。 「そのようなことはあなたをループさせる可能性があります。」

関連性のあるコンテンツ

  • プトレマイオスからGPSまで、マップの簡単な歴史

2年後、彼女は友人から電話を受けました。 「カレン」、彼女の仲間はぼやけた。 「夫に新しいGPS機器を購入し、オーストラリアの声に乗せました。 それが、ジェイコブセンが彼女の声が世界中の4億人に指示を与えていることを知った理由です。

彼女の作品は、今どこにでも行くべき場所を告げる、今や遍在する声に染み込む血と技術のハイブリッドを強調しています。毎月10億人以上がGoogleマップに依存しており、80%が声のオプションを有効にしています。

1970年代後半のSpeak&Spellのロボットサウンドを考える音声合成の初期の頃、アルゴリズムはテキストをモノトーンストリームに変換しました。 次に、データベースが成長するにつれて、ヤコブセンのような声優が音節と単語のコーパスを発音し、それらのアルゴリズムが基本的なルールに従って結合および変更されることを記録できます。 最近では、自動車用のナビゲーションインターフェイスを設計するNuanceなどの企業のソフトウェアコーダーが、音声合成にディープラーニングを適用する3番目のアプローチを開発しました。 録音された単語と合成されたスニペットを混合し、人工知能に頼って発音をさらに人間的なものにします。 「それらは驚くほど自然に聞こえます」とNuanceの最高技術責任者Vlad Sejnohaは言います。

もちろん、言語システムは音声システムの課題のままです。 「「買い」と「買い」、または「読む」と「読む」を考えてください」とGoogleの広報担当者は言います。 「しかし、ユーザーが私たちの意図を常に推測できることを願っています。」AIがカーナビゲーションシステムに、よりインテリジェントに話すことを教えているので、次に、オンラインの世界を検索し、あなたが行く前にどこに行きたいかを見つけます。

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

わずか12ドルで今すぐスミソニアン誌を購読する

この記事は、スミソニアン誌の7月/ 8月号からの抜粋です

購入
GPSがあなたの言語を話すことを学ぶ方法