https://frosthead.com

手話翻訳デバイスはクールです。 しかし、それらは有用ですか?

過去数十年にわたって、研究者はアメリカ手話(ASL)を英語に翻訳するためのデバイスを定期的に開発してきました。 これらの技術の多くは、手袋を使用して署名の動きをキャプチャしますが、これは大きくて扱いにくい場合があります。

現在、ミシガン州立大学(MSU)の研究者グループは、ASL-英語の翻訳の改善を期待している、Chapstickのチューブのサイズのグローブレスデバイスを開発しました。

DeepASLと呼ばれるこのテクノロジーは、カメラデバイスを使用して手の動きをキャプチャし、ASLの兆候と一致するディープラーニングアルゴリズムを通じてデータを送ります。 従来の多くのデバイスとは異なり、DeepASLは単一の単語ではなく文全体を翻訳でき、ユーザーがサインの間で一時停止する必要はありません。

「これは本当に邪魔にならない技術です」と、研究を率いる電気およびコンピューターエンジニアリングの教授であるMi Zhang氏は言います。

Zhangと彼のチームは、DeepASLがリアルタイムの翻訳者として働くことで、耳が聞こえず難聴の人を助けることを望んでいます。 翻訳者を待つのに貴重な時間を費やす可能性がある場合、それは緊急の状況で特に役立つ可能性があるとZhangは言います。 Zhang氏によると、このデバイスは電話、タブレット、またはコンピューターと統合することもでき、ASLを教えるのに役立ちます。 耳の聞こえない子供の90パーセント以上が耳を傾けている親から生まれているため、ASLをすばやく学ぶ必要がある大人の大規模なコミュニティがあります。 DeepASLはデジタルチューターとして機能し、学習者が正しく署名しているかどうかに関するフィードバックを提供します。

Zhangは特許を申請しており、1年以内にデバイスを市場に投入したいと考えています。 手頃な価格のテクノロジー(Leap Motionモーションキャプチャシステムは小売価格78ドル)に基づいているため、これまでの取り組みよりも広く利用できる可能性があります。

deepasl-use.jpg 研究者のBiyi FangとMi ZhangがDeepASLのデモを行います。 (ミシガン州立大学)

しかし、聴覚障害者または聴覚障害者向けの大学であるギャロデット大学のコミュニケーション研究の教授であるクリスチャンフォグラーは、ASLを翻訳するように設計されたデバイスに懐疑的であり、彼の懐疑論はろうコミュニティの多くの人に共有されています。

デバイスは一般に、ASLを真に「翻訳」するのではなく、単に手話を認識し、それらを記号ごとに英語の単語に変換します、とVogler氏は言います。 これは、重要な文法情報、フレーズが質問であるかどうかに関する情報、否定、関係節などが失われることを意味します。 DeepASLは文章全体を翻訳しますが、ASL文法の一部の機能は手話を超えています。顔の表情はしばしば修飾語として使用されます。眉を上げるとフレーズが質問に変わり、ボディポジショニングがASLユーザーが他の人を引用していることを示します。

これまでのところ、「署名する人にとっては、どのシステムも遠隔操作に役立っていません」とVogler氏は付け加え、研究者はしばしば[[聴覚障害者]コミュニティとほとんど接触しておらず、彼らの本当のアイデアもほとんどないようです。ニーズ。"

Zhangのチームは、聴覚障害のある人ではなく、手話翻訳プログラムの学生でデバイスをテストしました。 Zhangは、DeepASLはこの時点で基本的な通信のみを可能にするように設計されており、これは出発点にすぎないことを強調しています。 彼は、チームが将来的にDeepASLの機能を拡張して、顔の表情もキャプチャすることを望んでいると言います。

「それは私たちが到達する次の重要なマイルストーンになるでしょう」と彼は言います。

Voglerは、MSUテクノロジーがディープラーニング手法を使用していることは肯定的であり、話し言葉で成功していると言います。 ただし、手袋を必要としないにもかかわらず、顔や体の動きをキャプチャしないため、このデバイスには以前のシステムと同じ落とし穴があります。

Voglerは、研究者は手話認識デバイスが実際に対面のコミュニケーションニーズを満たすことができるという考えから離れるべきだと考えています。

「対面でのコミュニケーションを促進するための多くのオプションがあります。署名された言語の言語的特性と署名者の実際のコミュニケーション行動を実際に尊重するものができるまで、これらの努力はそれらに取って代わるか、置き換えられることはほとんどありません」と彼は言います。 「その代わりに、人々は実際のコミュニティメンバーと、そして手話言語の複雑さを理解している人々と協力する必要があります。」

Voglerは、MSUのような手話認識技術がAlexaのような音声インターフェイスで動作することは有用だと言います。 これらのインターフェースの成長は、耳が不自由で難聴の人々にとってのアクセシビリティの課題である、と彼は言います。

「現在、音声を使用できない、または使用したくない場合、これらの音声インターフェイスと対話する効果的かつ効率的な方法はありません」と彼は言います。 「手話認識は、この状況に完全にマッチし、実際に有用で使い慣れることができるものです。」

手話翻訳デバイスはクールです。 しかし、それらは有用ですか?