Nowe narzędzie AI Video firmy Microsoft może być kolejną rewolucją internetową

Edgar Cervantes / Autorytet Androida

TL;DR

Firma Microsoft opracowała nowe narzędzie AI o nazwie VASA-1, które może generować filmy z pojedynczego obrazu i klipu audio.
Technologia ta ma niesamowity potencjał pozytywnych zastosowań, ale niesie ze sobą ryzyko szkodliwej manipulacji.
Microsoft upiera się, że podchodzi do VASA-1 z ostrożnością, podkreślając potrzebę wprowadzenia odpowiednich regulacji przed jego upublicznieniem.

Generatywna sztuczna inteligencja w dalszym ciągu zmienia nasz cyfrowy krajobraz, od czasu do czasu dokonując pozornie ogromnych postępów, a najnowsza innowacja Microsoftu jest prawdopodobnie najbardziej przełomowa — i wytrącająca z równowagi — jak dotąd.

VASA-1, model obrazu na wideo, zaciera granicę między prawdziwym a sfabrykowanym wideo. Z pojedynczego obrazu i klipu audio może wygenerować szokująco realistyczny materiał filmowy z realistycznymi ruchami i mimiką ust.

Microsoft jest w pełni świadomy mocy tej technologii i zauważa, że VASA-1 „jest w stanie nie tylko zapewnić cenną synchronizację dźwięku ust i dźwięku, ale także uchwycić szerokie spektrum emocji i wyrazistych niuansów twarzy oraz naturalnych ruchów głowy, które przyczyniają się do postrzegania realizmu i żywość.”

System generuje wideo w wysokiej rozdzielczości (512×512) przy imponującej prędkości 45 FPS. Co jeszcze bardziej niezwykłe, może generować w czasie rzeczywistym realistyczne filmy z mówiącymi twarzami przy 40 klatkach na sekundę.

Potencjalne zastosowania są kuszące. Wyobraź sobie narzędzia edukacyjne z ożywionymi realistycznymi postaciami historycznymi lub wirtualnymi towarzyszami oferującymi wsparcie i korzyści terapeutyczne. Jednakże potencjał nadużyć jest równie ogromny, co natychmiast sygnalizuje obawy dotyczące wysoce przekonujących deepfake’ów, które mogą szerzyć dezinformację i podważać zaufanie.

Microsoft wie o tym bardzo dobrze i upiera się, że jest to przede wszystkim przedsięwzięcie badawcze, przynajmniej na razie. Firma przyznała się do nieodłącznego ryzyka, stwierdzając: „…podobnie jak inne powiązane techniki generowania treści, nadal może być potencjalnie niewłaściwie wykorzystana do podszywania się pod ludzi. Sprzeciwiamy się wszelkim zachowaniom tworzącym wprowadzające w błąd lub szkodliwe treści dotyczące prawdziwych osób…”

Na szczęście Microsoft utrzymuje, że nie wypuści tej potężnej technologii przedwcześnie. Plan zaczekania na solidne regulacje jest uspokajający i musi stać się normą dla reszty branży technologicznej.

Zawrotne tempo innowacji sprawia, że przewidywanie przyszłości – i konsekwencji systemów takich jak VASA-1 – jest trudnym zadaniem. Czy upublicznienie takiego narzędzia zapoczątkowałoby nową falę kreatywności i dostępności, czy też podsyciłoby rosnącą falę nieufności i manipulacji? Daj nam znać swoje przemyślenia w komentarzach poniżej.

Masz wskazówkę? Mów do nas! Wyślij e-mail do naszych pracowników na adres news@androidauthority.com. Możesz pozostać anonimowy lub uzyskać uznanie za informacje, to Twój wybór.