Guarda l'intelligenza artificiale VASA-1 di Microsoft che fa cantare la Monna Lisa come una star del rap in una demo selvaggia

Microsoft sta mettendo in mostra le sue capacità di intelligenza artificiale con una nuova demo del suo VASA-1, facendo sputare rime a Monna Lisa come una star del rap. Il nuovo framework viene utilizzato per generare volti parlanti realistici di personaggi virtuali con abilità visuo-affettive (VAS).

La paura che l’intelligenza artificiale venga utilizzata per falsificare profondamente le persone potrebbe essere diventata un po’ più spaventosa. L'ultimo annuncio di Microsoft del suo modello VASA-1 non solo è in grado di eseguire movimenti delle labbra sincronizzati con l'audio, ma è anche in grado di catturare un ampio spettro di sfumature facciali e movimenti naturali della testa che, secondo l'azienda, contribuiscono alla percezione di autenticità e vivacità. . Min Choi ha condiviso un video creato con VASA-1 su X/Twitter di “Mona Lisa rappa Paparazzi”.

Microsoft ha appena abbandonato VASA-1.

Questa intelligenza artificiale può far cantare e parlare in modo espressivo una singola immagine dal riferimento audio. Simile a EMO di Alibaba

10 esempi selvaggi:

1. Monna Lisa rappa i paparazzi pic.twitter.com/LSGF3mMVnD

— Min Choi (@minchoi) 18 aprile 2024

Il colosso del software ha spiegato che le innovazioni principali di VASA-1 includono una dinamica facciale olistica e un modello di generazione del movimento della testa che si esibisce in uno spazio latente del viso. Si dice che VASA-1 superi i metodi precedenti in varie dimensioni in modo completo e che offra un'elevata qualità video con dinamiche facciali e della testa realistiche, supportando al contempo la generazione online di video 512×512 fino a 40 FPS con “latenza iniziale trascurabile”.

Da un grande potere derivano grandi responsabilità e Microsoft afferma di comprenderlo quando si tratta delle capacità di VASA-1. L'azienda riconosce la possibilità che venga utilizzata in modo improprio, ma aggiunge che “è imperativo riconoscere il sostanziale potenziale positivo” della tecnica dell'azienda. Microsoft elenca i vantaggi che includono, tra gli altri, il miglioramento dell’equità educativa, il miglioramento dell’accessibilità per le persone con difficoltà di comunicazione, l’offerta di compagnia o supporto terapeutico a chi ne ha bisogno. Microsoft conclude che si impegna a sviluppare l’intelligenza artificiale in modo responsabile, con l’obiettivo finale di promuovere il benessere umano.

Advertisement

Detto questo, il colosso del software afferma di non avere intenzione di rilasciare una demo online di VASA-1, API, prodotto, ulteriori dettagli di implementazione o qualsiasi offerta correlata, finché non sarà accertato che la tecnologia verrà utilizzata in modo responsabile e in conformità con le normative appropriate. Quindi… forse mai?

Advertisement

Advertisement