Model Veo AI firmy Google przekształca obrazy i tekst w wysokiej jakości filmy HD

Google udostępniło prywatną wersję demonstracyjną Veo, swojego najnowszego narzędzia wideo generującego sztuczną inteligencję. Wygenerowane filmy będą miały wysoką rozdzielczość i będą trwały około minuty i będą opatrzone cyfrowymi znakami wodnymi. W związku z tym generator tekstu na obraz Imagen 3 firmy Google przeszedł etapy testowe i stał się dostępny dla abonentów Google Cloud za pośrednictwem Vertex AI. To narzędzie umożliwi użytkownikom edycję zdjęć za pomocą podpowiedzi tekstowych oraz wstawianie własnego brandingu i stylu firmy do wygenerowanych obrazów.

Przykład sztucznej inteligencji Google Veo%20(2)

Firma Mountain View pobiła OpenAI i wypuściła gotową na rynek (choć z ograniczoną wersją zapoznawczą) wersję Veo, stanowiącą własne podejście do generowania sztucznej inteligencji przekształcającej tekst na wideo. Narzędzie jest już dostępne dla firm subskrybujących Google Cloud za pośrednictwem platformy Vertex AI. Na początku tego roku OpenAI mogło trafić na pierwsze strony gazet, kiedy zdjęło okładkę z generatywnej sztucznej inteligencji wideo Sora i zaprezentowało ultrarealistyczną zawartość, ale Google udało się przyspieszyć wprowadzenie Veo na rynek w niecałe sześć miesięcy od jego zaprezentowania w Google Konferencja programistów wejść/wyjść.

Inarticle Horizontal




Reklama utworzona przy użyciu statycznych obrazów wprowadzonych do Veo (Źródło: Agoda)

Obecnie Veo jest w stanie wygenerować filmy w rozdzielczości 1080p ze statycznych obrazów, dla których użytkownicy mogą ustawić różne elementy kinowe i wizualne za pomocą podpowiedzi tekstowych. W ogłoszeniu Google nie określono, jak długie mogą być filmy, ale podczas Google I/O firma podała, że ​​będzie to „ponad minuta”, cokolwiek to dokładnie oznacza.

Jeśli użytkownicy tak zdecydują, mogą zasilać Veo obrazami utworzonymi przez najnowszy generator Google Imagen 3 do przetwarzania tekstu na obraz. Google nazywa to narzędzie pierwszym hiperskalerem oferującym model obrazu do wideo, umożliwiającym firmom nie tylko edytowanie obrazów za pomocą podpowiedzi tekstowych, ale także nasycanie tych obrazów zasobami marki, stylem, logo itp. Narzędzie będzie dostępne dla wszystkich subskrybentów Google Cloud od przyszłego tygodnia.

Inarticle Horizontal

W obu przypadkach Google zapewnia użytkowników czy podjęto kroki, aby zapobiec tworzeniu przez narzędzia treści budzących wątpliwości lub naruszających prawa autorskie. Co więcej, Google osadzi całą treść z cyfrowymi znakami wodnymi za pomocą swojego narzędzia SynthID.

Z próbek dostarczonych przez Google wynika, że ​​jakość wideo i obrazu jest na tyle wysoka, że ​​może zwieść większość widzów. Największą zaletą jest to, że wszystkie utworzone filmy są nagrywane w zwolnionym tempie, ale pod względem wykonania Veo i Imagen tworzą treści porównywalne z niektórymi z najlepszych, jakie widzieliśmy do tej pory, takimi jak Sora. Gdyby tylko Coca-Cola miała w rękach te narzędzia, zanim stworzyła to monstrum.

Inarticle Horizontal
Inarticle Horizontal