Microsoft の VASA-1 AI がモナリザをラップスターのように歌わせるワイルドなデモをご覧ください

マイクロソフトは、VASA-1 の新しいデモで AI の技術を披露し、モナリザにラップスターのように韻を踏ませています。 新しいフレームワークは、視覚感情スキル (VAS) を備えた仮想キャラクターの本物のような会話顔を生成するために使用されます。

AI が人間のディープフェイクを作成するために使用されるのではないかという恐怖が、さらに怖くなったのかもしれません。 Microsoft が最近発表した VASA-1 モデルは、音声と同期した唇の動きを実現できるだけでなく、広範な顔のニュアンスや自然な頭の動きをキャプチャすることもでき、これが信頼性と活気の認識に貢献すると同社は述べています。 。 Min Choi は、VASA-1 で作成された「パパラッチをラップするモナリザ」のビデオを X/Twitter で共有しました。

Advertisement

Microsoft は VASA-1 を削除しました。

この AI は、単一の画像を音声参照から表情豊かに歌わせたり、しゃべらせたりすることができます。 アリババのEMOに似ている

10 のワイルドな例:

1.パパラッチをラップするモナリザ pic.twitter.com/LSGF3mMVnD

— ミンチョイ (@minchoi) 2024 年 4 月 18 日

このソフトウェア大手は、VASA-1 の中核となるイノベーションには、顔の潜在空間で実行される全体的な顔のダイナミクスと頭部の動きの生成モデルが含まれていると説明しました。 VASA-1 は、さまざまな側面で総合的に以前の方法よりも優れており、リアルな顔と頭のダイナミクスを備えた高品質のビデオを実現すると同時に、「無視できる開始遅延」で最大 40FPS での 512×512 ビデオのオンライン生成をサポートしていると言われています。

大きな力には大きな責任が伴い、Microsoft は VASA-1 の機能に関してはこれを理解していると述べています。 同社は、それが悪用される可能性を認識しているが、同社の技術の「大きなプラスの可能性を認識することが不可欠である」と付け加えた。 Microsoftは、教育の公平性の向上、コミュニケーションに困難を抱える個人へのアクセシビリティの向上、困っている人への付き添いや治療的サポートの提供などの利点を挙げている。 Microsoft は、人間の幸福を増進するという最終目標を掲げ、責任を持って AI の開発に専念していると結論付けています。

そうは言っても、このソフトウェア巨人は、オンラインデモをリリースする計画はないと述べています。 VASA-1、API、製品、追加の実装の詳細、または関連するサービスについては、テクノロジーが適切な規制に従って責任を持って使用されることが確実になるまで、提供されません。 それで…おそらくないでしょうか?

Advertisement

Advertisement