Regardez l'IA VASA-1 de Microsoft faire chanter la Joconde comme une star du rap dans une démo sauvage

Consultez notre autre site internet Juexparc.fr pour plus d’actualités et d’informations sur les jeux

Microsoft montre ses talents en matière d'IA avec une nouvelle démo de son VASA-1, faisant cracher des rimes à Mona Lisa comme une star du rap. Le nouveau cadre est utilisé pour générer des visages parlants réalistes de personnages virtuels dotés de compétences affectives visuelles (VAS).

La peur que l’IA soit utilisée pour simuler profondément des personnes est peut-être devenue un peu plus effrayante. La dernière annonce de Microsoft concernant son modèle VASA-1 est non seulement capable d'effectuer des mouvements de lèvres synchronisés avec l'audio, mais également de capturer un large spectre de nuances faciales et de mouvements naturels de la tête qui, selon la société, contribuent à la perception d'authenticité et de vivacité. . Min Choi a partagé une vidéo créée avec VASA-1 sur X/Twitter de « Mona Lisa rappant Paparazzi ».

Advertisement

Microsoft vient de supprimer VASA-1.

Cette IA peut faire chanter et parler une seule image à partir d’une référence audio de manière expressive. Semblable à EMO d’Alibaba

10 exemples sauvages :

1. Mona Lisa rappant Paparazzi pic.twitter.com/LSGF3mMVnD

– Min Choi (@minchoi) 18 avril 2024

Le géant du logiciel a expliqué que les principales innovations de VASA-1 incluent un modèle holistique de génération de dynamique faciale et de mouvements de la tête qui fonctionne dans un espace latent du visage. VASA-1 est censé surpasser les méthodes précédentes dans plusieurs dimensions et offrir une qualité vidéo élevée avec une dynamique réaliste du visage et de la tête, tout en prenant en charge la génération en ligne de vidéos 512 x 512 jusqu'à 40 images par seconde avec une « latence de démarrage négligeable ».

Une grande puissance implique de grandes responsabilités, et Microsoft affirme le comprendre en ce qui concerne les capacités du VASA-1. L'entreprise reconnaît la possibilité d'une utilisation abusive, mais ajoute qu'« il est impératif de reconnaître le potentiel positif substantiel » de sa technique. Microsoft énumère les avantages qui incluent, entre autres, l'amélioration de l'équité éducative, l'amélioration de l'accessibilité pour les personnes ayant des problèmes de communication, l'offre d'un accompagnement ou d'un soutien thérapeutique à ceux qui en ont besoin. Microsoft conclut qu'il se consacre au développement de l'IA de manière responsable, dans le but ultime de faire progresser le bien-être humain.

Cela dit, le géant du logiciel affirme qu'il n'a pas l'intention de publier une démo en ligne de VASA-1, API, produit, détails de mise en œuvre supplémentaires ou toute offre associée, jusqu'à ce qu'il soit certain que la technologie sera utilisée de manière responsable et conformément aux réglementations appropriées. Alors… peut-être jamais ?

Advertisement

Advertisement