Microsoft の新しい AI ビデオツールは次のインターネット革命になるか、それとも悪夢になるか

エドガー・セルバンテス / Android 権威

TL;DR

Microsoft は、単一の画像とオーディオクリップからビデオを生成できる VASA-1 と呼ばれる新しい AI ツールを開発しました。
このテクノロジーは、前向きに利用できる信じられないほどの可能性を秘めていますが、有害な操作のリスクも伴います。
MicrosoftはVASA-1に慎重に取り組んでいると主張し、一般公開前に適切な規制が必要であると強調している。

生成 AI は、時折大きく前進するように見えて、私たちのデジタル環境を再構築し続けていますが、マイクロソフトの最新のイノベーションは、おそらくこれまでで最も画期的で、そして不安を抱かせるものです。

VASA-1、画像からビデオへのモデルでは、実際のビデオと捏造されたビデオの間の境界があいまいになります。 1 つの画像とオーディオクリップから、本物のような唇の動きや表情を備えた、驚くほどリアルな映像を生成できます。

マイクロソフトはこのテクノロジーの力を強く認識しており、VASA-1 は「貴重な口唇と音声の同期を生成するだけでなく、広範囲の感情や表情豊かな顔のニュアンス、自然な頭の動きをキャプチャすることができ、これが現実感や現実感の認識に貢献する」と述べています。活気。」

このシステムは、驚異的な 45 FPS で高解像度 (512×512) ビデオを生成します。さらに注目すべき点は、リアルな会話顔ビデオを 40 FPS でリアルタイムに生成できることです。

潜在的なアプリケーションは魅力的です。生き生きとした歴史上の人物が生き返った教育ツールや、サポートや治療効果を提供するバーチャルコンパニオンを想像してみてください。しかし、悪用の可能性も同様に計り知れず、誤った情報を広め、信頼を損なう可能性のある説得力の高いディープフェイクの懸念がすぐに浮上します。

Microsoft はこのことをよく知っており、少なくとも現時点では、これは主に研究活動であると主張しています。同社は固有のリスクを認め、次のように述べています。「他の関連コンテンツ生成技術と同様、人間になりすますために悪用される可能性があります。私たちは、実在の人物に関する誤解を招くコンテンツや有害なコンテンツを作成するいかなる行為にも反対します。」

ありがたいことに、Microsoft はこの強力なテクノロジーを時期尚早にリリースするつもりはないと主張しています。強力な規制が適用されるまで待つという同社の計画は心強いものであり、他のテクノロジー業界の標準となる必要がある。

イノベーションの猛烈なペースにより、将来を予測すること、そして VASA-1 のようなシステムがもたらす影響を予測することは困難な作業となっています。もしそのようなツールが公開された場合、創造性とアクセシビリティの新たな波を引き起こすことになるでしょうか、それとも不信感と操作の波が高まることになるのでしょうか? 以下のコメント欄でご意見をお聞かせください。

ヒントはありますか？私たちに話してください！ news@androidauthority.com までスタッフに電子メールを送信してください。匿名のままにするか、情報のクレジットを取得するかはあなたの選択です。