Według Google nowe wersje modelu oferują ulepszone generowanie obrazu i dźwięku. Użytkownicy mogą oczekiwać czystszego i wyraźniejszego dźwięku dialogów oraz efektów, a także lepszej spójności postaci i scen. Veo 3.1 precyzyjniej rozpoznaje styl filmowy, umożliwiając tworzenie wideo z pojedynczych obrazów i dokładniej wykonuje polecenia użytkownika.
Nowe funkcjonalności Veo 3.1 i Veo 3.1 Fast
Google dodało też kilka funkcji, które pozwalają lepiej kontrolować proces tworzenia wideo:
- "Ingredients to video" – użytkownik może wskazać do trzech obrazów, które posłużą jako wzór dla filmu, np. postać lub scenerię
- „Scene extension” – użytkownicy mogą tworzyć dłuższe materiały wideo, generując nowe fragmenty bazujące na ostatniej sekundzie poprzedniego klipu.
- "First and last frame" – pozwala połączyć dwa obrazy w płynne przejście z dźwiękiem.
Modele Veo 3.1 i Veo 3.1 Fast są już dostępne w płatnej wersji testowej w ramach Gemini API.
OpenAI Sora 2
Jednym z głównych konkurentów Veo 3.1 firmy Google jest OpenAI Sora 2 – zaawansowany model generatywnej sztucznej inteligencji do tworzenia wideo i dźwięku.
Według informacji podanych przez OpenAI Sora 2 zapewnia wysoki poziom realizmu, dokładniejszą fizykę ruchu oraz precyzyjną synchronizację dialogów i efektów dźwiękowych z obrazem.
Od momentu premiery narzędzie zdobyło ogromną popularność – aplikacja Sora przekroczyła milion pobrań w mniej niż pięć dni, bijąc wcześniejsze rekordy ChatGPT.
System wykorzystuje technologię C2PA, umożliwiającą weryfikację źródła wygenerowanych materiałów i ograniczanie ryzyka tworzenia deepfake’ów.
Autorka/Autor: Jan Sowa
Źródło: Google, TVN24, OpenAI
Źródło zdjęcia głównego: Shutterstock