ハリー・ポッターシリーズは、話をする絵や感動的な写真で、生きた肖像画のアイデアに慣れた世界を作りました。 しかし、先週、AIが生成したレオナルドダヴィンチのモナリザの 「生きている肖像」がウェブ上でラウンドを始めたとき、有名な肖像が彼女の唇を動かして見回したときに多くの人々が驚いた。
リサゲラルディーニのアニメーションポートレートは、モスクワのサムスンのAIセンターとスコルコボ科学技術研究所の研究者によって作成された、いくつかの新しい「トーキングヘッドモデル」の1つで、一般的に「ディープフェイク」として知られています。 わずか数フレームのリファレンスまたは単一の画像を使用して、研究者はまた、オプラのような有名人のディープフェイクを作成し、マリリン・モンローとアルバート・アインシュタインのシングルスナップショットに命を吹き込み、真珠のイヤリングを持つフェルメールの少女のような有名な画像の新しい表現を作成しました。
研究者たちは、彼らの手法を「少人数学習」と呼び、YouTubeとプレプリントレポジトリarXiv.orgでまだピアレビューされていない論文に投稿しました。 詳細はかなり技術的になりますが、 LiveScienceの Mindy Weisbergerは、生きているポートレートを生成するために、畳み込みニューラルネットワークと呼ばれる種類の人工知能が、参照画像を分析することによって自ら訓練することを報告しています。 その後、一連のフレームから顔の動きをモナリザのような静止画像に適用します。 アングルと参照画像が多いほど、生きているポートレートは良くなります。 論文によると、AIはわずか32枚の参照画像を使用して「3つの画像セットのうちどれがディープフェイクであるかを識別する人間の能力によって測定される」「完全なリアリズム」を生成できます。
もちろん、 モナリザはただの1つの画像なので、レオナルドの傑作の3つの「生きている肖像画」は少し不安です。 短いアニメーションの場合、ニューラルネットワークは3つの異なるトレーニングビデオを観察し、これらのフレームに基づいたモナリザの3つのバージョンはそれぞれ異なる性格を持っているように見えます。 レオナルドがさまざまな角度から有名なモデルを描いていた場合、システムはさらにリアルなリビングポートレートを生成できたでしょう。
アニメ化されたモナリザは楽しいものですが、ディープフェイクの登場により、コンピューターで生成された似顔絵が人々を中傷し、人種的または政治的緊張を引き起こし、オンラインメディアへの信頼をさらに損なう可能性があるという懸念が生じています。 「本物のビデオも含め、 すべてのビデオに対する信頼を損ないます」と、ブルッキングス研究所のジョン・ビラセナーは書いています。 「真実が何であるかがわからなくなるため、真実自体はとらえどころのないものになります。」
AIはディープフェイクの作成に使用されていますが、Villasenorによると、少なくとも現時点では、人間の目には見えない矛盾を探すことでディープフェイクを識別することもできます。
Harvard-MIT Ethics and Governance of AI InitiativeのディレクターであるTim Hwangは、 Wiredの Gregory Barberに、悪役が個人のラップトップで洗練されたディープフェイクを作成できる段階にまだ達していないと語っています。 「自宅でディープフェイクを生成するためにターンキーを使用するだけでいいということは何も示唆していません」と彼は言います。 「短期的、中期的、長期的ではありません。」
これは、サムスンの新しいシステムを使用すると費用がかかり、専門知識が必要だからです。 しかし、Barberの記事は、人々をだますためにニューラルネットワークによって作成された超洗練された写実的なビデオを必要としないことを指摘しています。 ちょうど先週、米国下院議長ナンシー・ペロシを酔わせるためにスローダウンされていた操作されたビデオがソーシャルネットワークで広まりました。
しかし、最終的には、この技術は十分に優れているため、悪意のある人物がディープフェイクを生成できるため、検出できません。 その日が来ると、HwangはWiredに 、人々は現実と偽物を整理するために、事実確認と文脈上の手がかりに頼る必要があると語る。 たとえば、 モナリザの口を閉ざしたハーフスマイルが歯を見せてにやにや笑いになり、彼女があなたにホワイトニング歯磨き粉を売ろうとするなら、それは間違いなく偽物です。