Edgar Cervantes / Autorytet Androida
TL;DR
Advertisement
- Firma Microsoft opracowała nowe narzędzie AI o nazwie VASA-1, które może generować filmy z pojedynczego obrazu i klipu audio.
- Technologia ta ma niesamowity potencjał pozytywnych zastosowań, ale niesie ze sobą ryzyko szkodliwej manipulacji.
- Microsoft upiera się, że podchodzi do VASA-1 z ostrożnością, podkreślając potrzebę wprowadzenia odpowiednich regulacji przed jego upublicznieniem.
Generatywna sztuczna inteligencja w dalszym ciągu zmienia nasz cyfrowy krajobraz, od czasu do czasu dokonując pozornie ogromnych postępów, a najnowsza innowacja Microsoftu jest prawdopodobnie najbardziej przełomowa — i wytrącająca z równowagi — jak dotąd.
VASA-1, model obrazu na wideo, zaciera granicę między prawdziwym a sfabrykowanym wideo. Z pojedynczego obrazu i klipu audio może wygenerować szokująco realistyczny materiał filmowy z realistycznymi ruchami i mimiką ust.
Microsoft jest w pełni świadomy mocy tej technologii i zauważa, że VASA-1 „jest w stanie nie tylko zapewnić cenną synchronizację dźwięku ust i dźwięku, ale także uchwycić szerokie spektrum emocji i wyrazistych niuansów twarzy oraz naturalnych ruchów głowy, które przyczyniają się do postrzegania realizmu i żywość.”
System generuje wideo w wysokiej rozdzielczości (512×512) przy imponującej prędkości 45 FPS. Co jeszcze bardziej niezwykłe, może generować w czasie rzeczywistym realistyczne filmy z mówiącymi twarzami przy 40 klatkach na sekundę.
Advertisement
Potencjalne zastosowania są kuszące. Wyobraź sobie narzędzia edukacyjne z ożywionymi realistycznymi postaciami historycznymi lub wirtualnymi towarzyszami oferującymi wsparcie i korzyści terapeutyczne. Jednakże potencjał nadużyć jest równie ogromny, co natychmiast sygnalizuje obawy dotyczące wysoce przekonujących deepfake’ów, które mogą szerzyć dezinformację i podważać zaufanie.
Microsoft wie o tym bardzo dobrze i upiera się, że jest to przede wszystkim przedsięwzięcie badawcze, przynajmniej na razie. Firma przyznała się do nieodłącznego ryzyka, stwierdzając: „…podobnie jak inne powiązane techniki generowania treści, nadal może być potencjalnie niewłaściwie wykorzystana do podszywania się pod ludzi. Sprzeciwiamy się wszelkim zachowaniom tworzącym wprowadzające w błąd lub szkodliwe treści dotyczące prawdziwych osób…”
Na szczęście Microsoft utrzymuje, że nie wypuści tej potężnej technologii przedwcześnie. Plan zaczekania na solidne regulacje jest uspokajający i musi stać się normą dla reszty branży technologicznej.
Advertisement
Zawrotne tempo innowacji sprawia, że przewidywanie przyszłości – i konsekwencji systemów takich jak VASA-1 – jest trudnym zadaniem. Czy upublicznienie takiego narzędzia zapoczątkowałoby nową falę kreatywności i dostępności, czy też podsyciłoby rosnącą falę nieufności i manipulacji? Daj nam znać swoje przemyślenia w komentarzach poniżej.