Le nouvel outil AI Video de Microsoft pourrait être la prochaine révolution Internet – ou un cauchemar

Consultez notre autre site internet Juexparc.fr pour plus d’actualités et d’informations sur les jeux

Edgar Cervantes / Autorité Android

TL;DR

Advertisement

  • Microsoft a développé un nouvel outil d'IA appelé VASA-1 qui peut générer des vidéos à partir d'une seule image et d'un seul clip audio.
  • Cette technologie présente un potentiel incroyable d’utilisations positives, mais comporte également un risque de manipulation nuisible.
  • Microsoft insiste sur le fait qu'il aborde VASA-1 avec prudence, soulignant la nécessité d'une réglementation appropriée avant qu'il ne soit rendu public.

L'IA générative continue de remodeler notre paysage numérique avec des progrès apparemment énormes de temps en temps, et la dernière innovation de Microsoft est peut-être la plus révolutionnaire – et la plus déconcertante – à ce jour.

VASA-1, un modèle image-vidéo, brouille la frontière entre vidéo réelle et vidéo fabriquée. À partir d’une seule image et d’un clip audio, il peut générer des séquences incroyablement réalistes, complétées par des mouvements et des expressions de lèvres réalistes.

Microsoft est parfaitement conscient de la puissance de la technologie, notant que VASA-1 est « capable non seulement de produire une précieuse synchronisation audio labiale, mais également de capturer un large spectre d'émotions, de nuances faciales expressives et de mouvements naturels de la tête qui contribuent à la perception du réalisme et de l'émotion. vivacité. »

Le système génère une vidéo haute résolution (512 × 512) à une vitesse impressionnante de 45 FPS. Encore plus remarquable, il peut générer des vidéos de visages parlants réalistes à 40 FPS en temps réel.

Advertisement

Les applications potentielles sont alléchantes. Imaginez des outils pédagogiques avec des personnages historiques réalistes ou des compagnons virtuels offrant un soutien et des bienfaits thérapeutiques. Cependant, le potentiel d’utilisation abusive est tout aussi immense, signalant immédiatement les inquiétudes concernant des deepfakes très convaincants, capables de diffuser des informations erronées et de saper la confiance.

Microsoft le sait très bien et insiste sur le fait qu'il s'agit avant tout d'un projet de recherche, du moins pour le moment. L'entreprise a reconnu les risques inhérents, déclarant : « … comme d'autres techniques de génération de contenu connexes, elle pourrait encore potentiellement être utilisée à mauvais escient pour usurper l'identité d'êtres humains. Nous nous opposons à tout comportement visant à créer du contenu trompeur ou préjudiciable à des personnes réelles… »

Heureusement, Microsoft maintient qu'il ne publiera pas cette puissante technologie prématurément. Son intention d’attendre une réglementation robuste est rassurante et doit devenir une norme pour le reste de l’industrie technologique.

Le rythme effréné de l’innovation fait de la prévision de l’avenir – et des conséquences de systèmes comme VASA-1 – une tâche ardue. Si un tel outil devait être rendu public, marquerait-il le début d’une nouvelle vague de créativité et d’accessibilité, ou alimenterait-il une vague croissante de méfiance et de manipulation ? Faites-nous part de vos réflexions dans les commentaires ci-dessous.

Vous avez un conseil ? Parle-nous! Envoyez un e-mail à notre personnel à news@androidauthority.com. Vous pouvez rester anonyme ou obtenir un crédit pour l'information, c'est votre choix.

Advertisement