https://frosthead.com

人間の声を構築する方法

世界で最も認知されている声の1つはスティーブンホーキングのものです。もちろん、実際には有名な科学者の声ではなく、彼の顔の動きに応じてコンピューターで生成された声です。 彼は現在、シンセサイザーを使用してほぼ25年間話しています。彼の声と能力は、ずっと前に失われたALS、またはルーゲーリッグ病に移りました。 今日、英国の天体物理学者は、彼のロボットの単調な音を通して識別されます。そして、それは実際にアメリカのアクセントを持っています。

しかし、真実は、ホーキングがコンピューターで生成した音声を何千人もの人々、一部の若い女の子、一部の年配の女性、そして世界中のあらゆる年齢や民族の人々と共有していることです。 自然に話すことができない彼らは皆、それを自分自身と考えていますが、それについてユニークなことは何もありません。

そして、それはRupal Patelにとっては正しくないと思われます。

パテルはスピーチ科学者であり、ノースイースタン大学の新しいスピーチ科学技術センターのディレクターです。 彼女は長い間、声が個人を定義するのに役立つと感じていました。 人が世界でどのように知られているかを明確に形作ります。 たとえ人々が話すことができないとしても、彼らは彼らが誰であるかにより忠実な声を通してコミュニケーションをとる機会を与えられるべきではないと彼女は言います。

ここ数年、彼女と仲間のスピーチ科学者のティム・バネルは、人が作ることができるものなら何でもその本質として使用して、カスタムメイドの声を構築する方法を開発してきました。 それらは、それらの音のピッチと音量、そして「ss」や「ch」などの特定の文字の発音方法に焦点を当てています。目標は、可能な限り音声のアイデンティティに焦点を合わせることにあります。

次に、性別、年齢、サイズ、地理的背景が似ているドナーから音声を収集することにより、新しい音声を作成することが問題になります。 音声を寄付するために、人は言語の音のあらゆる組み合わせを累積的にカバーする短い文章の選択を読んで記録されます。 理想的には、彼または彼女は3, 000もの異なるフレーズを記録します。 これには数時間かかります。 また、録音は1回のセッションで行う必要はありませんが、ドナーが提供できるサウンドが多くなればなるほど、より良い音声を生成できます。

その音のコレクションから、特別に設計されたソフトウェアは、リバースエンジニアリングされた音声で言葉を作成します。これは、人が言語障害を持たない場合に聞こえるかもしれません。

これはスケーラブルですか?

膨大な数の文章を読んでいる寄付者の少なからぬ軍隊が、パーソナライズされた声に変えることができる音のデータベースを構築するのではないでしょうか?

はい、そうです、 Patelは最近のTEDトークで、それが彼女がHuman Voicebank Initiativeと呼んでいるものを推し進めている理由です。

プロジェクトのウェブサイトVocaliD.orgには、寄付者用のサインアップページと、個人的な声を聞きたい人のための別のページがあります。 後者は、名前と発話能力などの他の関連情報を提出する必要があります。この情報は、「完全に非発言的」から「音声を発することはできますが、言葉は使用できません」から「コミュニケーションに言葉を使用できる」までさまざまです。

プロジェクトの初期段階で実際に作成された音声はほんの一握りでしたが、すでに10, 000人以上が音声提供者として志願しています。 「数百」人が、新しい声を得るためにサインアップしたと彼女は言います。

それでも、声の銀行が直面しているいくつかのハードルがあります、とパテルは、その中で、声を構成するために必要なすべての資料をドナーに読ませるようにさせます。 現時点では、科学者が高品質のサンプルを入手できるように、ボランティアがプロのスタジオで録音する必要があることを考えると、この課題はさらに大きくなります。 パテルは、ドナーが自宅で文章を記録できるツールが開発されていると言います。

彼女のビジョンは、2020年までに100万の異なる音声サンプルを収集することです。しかし、すでに彼女の仕事は影響を与えています。 このサイトは、「重度の言語障害」を持つと言われる若い女性が提供する、わずか2文の音声ファイルを特徴としています。

「この声は私だけのものです。 友達と一緒に試すのが待ちきれません。」

TEDトークでヒューマンボイスバンクイニシアチブを説明するRupal Patelは次のとおりです。

聴覚の声

音声の効果に関する最近の研究は次のとおりです。

  • 母親の話を聞く: 小児科で発表された研究によると、母親の声の音だけで未熟児がよりよく食べることができます ナッシュビルにあるモンロー・カレル小児病院の研究者は、センサーを備えたおしゃぶりを使用して、お母さんが子守歌を歌っている録音で正しく吸った赤ちゃんに報酬を与えました。 特別なおしゃぶりを使用し、お母さんの声を聞いた研究の赤ちゃんは、使用しなかった人よりも1週間早く給餌チューブから抜けることができました。
  • エコーチャンバーへようこそ:以前の調査では、人々は小さな女性や大きな男性から来ているように聞こえる声を好むことが示唆されましたが、ブリティッシュコロンビア大学の新しい研究では、私たちが本当に好きなのは私たち自身のように聞こえる声であると主張しています、特に私たちがよく知っているアクセントがあるもの。 研究者はまた、人々は短い言葉を使った男性の声と、呼吸が聞こえた女性の声を好むようだと言った。
  • ゾウ は決して声を忘れません。アフリカゾウは明らかに聞き上手です。 ケニアでの2年間の調査によると、彼らは人間の声を性別、年齢、さらには民族グループで区別することができます。 研究者たちは、マサイ族の男性、女性、子供たちが叫んでいるのを記録し、象の群れから隠されたスピーカーでそれを演奏しました。 ゾウが対立する可能性がはるかに高いマサイ族の雄の声を動物が聞いたときのみ、彼らは反応し、ふくらはぎの周りに身を寄せ合った。 彼らは別の部族、カンバからの成人男性の声に反応しませんでした。カンバは、農民として群れとめったに衝突しません。
  • 彼らはあなたの痛みを聞きます:犬の一連の脳スキャンを完了した後、スコットランドの科学者は犬が声を認識して解釈するために彼らの脳の領域を持っているという点で人間に似ていると言います。 そして、それが、あなたの犬があなたの気持ちにとても同調しているように見えることができる理由です。
  • 私はあなたについて何かが違うことを知っていました。整形手術はあなたの見た目を変えるだけではありません。 それはまた、人の聞こえ方を変える可能性があります。 ジャーナルPlastic and Reconstructive Surgeryに掲載された論文によると、イランの研究者は鼻形成術または鼻の仕事をした患者が、処置後に声がより鼻に聞こえるとしばしば考えていることを発見しました。
人間の声を構築する方法