Notebookcheck Logo
Nasz autor w fikcyjnym biurze Notebookcheck (źródło zdjęcia: wygenerowane przez Vidu.com)

Filmy generowane przez sztuczną inteligencję ze spójnymi postaciami i scenami? Praktyczny test Vidu.com

Kwestie związane ze sztuczną inteligencją.

Vidu.com twierdzi, że jego sztuczna inteligencja może generować filmy ze spójnymi postaciami i środowiskami. Oznaczałoby to, że można łączyć wiele sekwencji z tymi samymi "aktorami" i potencjalnie tworzyć całe (krótkie) filmy. Ale czy to faktycznie działa? Sprawdziliśmy to w praktyce.
Christian Hintze (tłumaczenie DeepL / Ninh Duy) Opublikowany 🇺🇸 🇩🇪 ...
AI

Werdykt - Ogromny potencjał, ale jeszcze nie teraz

Potencjał (i ryzyko) są imponujące. Sztuczna inteligencja bez wątpienia przekształci nie tylko tworzenie treści, ale także branżę filmową i gamingową. Posiadanie spójnych postaci, ustawień i środowisk jest ważnym krokiem w kierunku uczynienia generatorów wideo AI praktycznymi, a nie tylko nowatorskimi.

źródło zdjęcia: Zrzut ekranu na Vidu.com
źródło zdjęcia: Zrzut ekranu na Vidu.com

W tej chwili jednak nie do końca. Jaki jest sens, jeśli osoba pozostaje taka sama (zakładając, że w ogóle to robi), ale potem przechodzi przez solidne obiekty, nagle się duplikuje lub wyrasta jej sześć palców u jednej ręki?

W tej chwili, Vidu.com bardziej przypomina zabawkę. To fajna zabawa, ale technologia nie jest jeszcze wystarczająco niezawodna do profesjonalnego użytku w filmie, reklamie lub podobnych obszarach. Jest po prostu zbyt wiele usterek.

Za

+ zabawna piaskownica wideo
+ może tworzyć imponujące efekty wizualne
+ darmowy do wczesnych eksperymentów

Przeciw

- mniejsza spójność niż oczekiwano
- obrazy referencyjne mogą być zniekształcone
- zbyt wiele błędów

Ceny i dostępność

Każdy może spróbować Vidu.com za darmo po utworzeniu konta. System działa na zasadzie kredytów. Nowi użytkownicy otrzymują kredyty startowe, a dzięki określonym działaniom można zarobić więcej.

Dostępne są również miesięczne i roczne subskrypcje.

Opcje subskrypcji i ceny (źródło obrazu: Zrzut ekranu na Vidu.com)
Opcje subskrypcji i ceny (źródło obrazu: Zrzut ekranu na Vidu.com)
5 kredytów za codzienne logowanie (źródło obrazu: Zrzut ekranu na Vidu.com)
5 kredytów za codzienne logowanie (źródło obrazu: Zrzut ekranu na Vidu.com)
Mogą Państwo zarobić więcej kredytów (źródło obrazu: Zrzut ekranu na Vidu.com)
Mogą Państwo zarobić więcej kredytów (źródło obrazu: Zrzut ekranu na Vidu.com)

Pomimo słusznej krytyki, uważamy, że sztuczna inteligencja w tej przestrzeni jest fascynująca. Z jednej strony można uzyskać niezwykle szczegółowe środowiska prosto z wyobraźni. Z drugiej strony, ludzie wygenerowani przez SI często wpatrują się pustym wzrokiem w przestrzeń lub poruszają się w dziwnym zwolnionym tempie.

Daliśmy więc nowy generator wideo AI Vidu.com na własnej skórze. Deweloperzy uprzejmie dodali 500 kredytów do naszego konta w celu przetestowania. Flagowy model platformy, Vidu Q1, może przetwarzać do siedmiu obrazów referencyjnych w jednej sekwencji wideo. Brakujące elementy mogą być generowane za pomocą podpowiedzi tekstowych.

Zdjęcia i filmy referencyjne już teraz wyglądają całkiem ekscytująco (źródło zdjęcia: Zrzut ekranu na Vidu.com)
Zdjęcia i filmy referencyjne już teraz wyglądają całkiem ekscytująco (źródło zdjęcia: Zrzut ekranu na Vidu.com)
Jeden z wielu przykładowych filmów (źródło obrazu: Zrzut ekranu na Vidu.com)
Jeden z wielu przykładowych filmów (źródło obrazu: Zrzut ekranu na Vidu.com)

Co można zrobić z Vidu?

Narzędzia na lewym pasku bocznym (źródło obrazu: Zrzut ekranu na Vidu.com)
Narzędzia na lewym pasku bocznym (źródło obrazu: Zrzut ekranu na Vidu.com)

Dzięki Vidu można generować filmy AI za pomocą tych narzędzi:

  1. Text to Video: Proszę wpisać podpowiedź opisującą, co powinno się wydarzyć w filmie
  2. Image to Video: Generowanie wideo z pojedynczego obrazu. Jeszcze fajniejsze: ustaw klatkę początkową i końcową, a Vidu wypełni przejście
  3. Odnośnik do wideo: Najbardziej ekscytująca funkcja. Proszę przesłać obrazy postaci, miejsc lub obiektów, a sztuczna inteligencja postara się zachować ich spójność w całym filmie.

wyjście to Full HD, 16:9, z opcjonalnym formatem smartfona. Filmy można nawet przeskalować, np. do 4K.

Praktyczne doświadczenie - krzywa uczenia się, precyzyjne podpowiedzi

Nasz ambitny plan:

  • Scena 1: Redaktor Notebookcheck stoi w biurze i testuje laptopa.
  • Scena 2: Wpisuje mierną ocenę.
  • Scena 3: Przejście do innego biura, gdzie panowie w garniturach oglądają nagranie z monitoringu, na którym redaktor wpisuje słabą ocenę.
  • Scena 4: Jeden z panów w garniturze wciska przycisk alarmowy.
  • Scena 5: Na miejsce zostaje wysłany zespół przypominający SWAT.

W sumie stworzyliśmy 10 wstępnych scen.

1. Scena: Redaktor testujący laptopa

Użyliśmy starszego, nie do końca aktualnego zdjęcia jednego z naszych redaktorów jako odniesienia do postaci, a także zdjęcia biura jako scenerii. Dodaliśmy logo Notebookcheck, laptopa i fikcyjne logo marki PC ("Lavani"). Następnie daliśmy następujący monit:

Nasze zdjęcia referencyjne (źródło zdjęcia: zrzut ekranu na Vidu.com)
Nasze zdjęcia referencyjne (źródło zdjęcia: zrzut ekranu na Vidu.com)
Nasz 1. monit (źródło obrazu: zrzut ekranu na Vidu.com)
Nasz 1. monit (źródło obrazu: zrzut ekranu na Vidu.com)
Wybór modelu i rozdzielczości (źródło obrazu: Zrzut ekranu na Vidu.com)
Wybór modelu i rozdzielczości (źródło obrazu: Zrzut ekranu na Vidu.com)

W skrócie: nasz redaktor (obrazek 1) powinien stać w biurze (obrazek 2) i testować laptopa. Na ceglanej ścianie w tle powinno pojawić się logo Notebookcheck (obrazek 3).

Renderowanie 5-sekundowego klipu za pomocą modelu Vidu Q1 zajmuje tylko około 1-2 minut i kosztuje 15-20 kredytów. Rezultat?

Nie byliśmy zbyt zadowoleni z następujących kwestii:

  1. Dlaczego fryzura naszej postaci nie pasuje do zdjęcia referencyjnego? Czy pozostanie ona spójna w późniejszych scenach?
  2. Dlaczego nasze logo referencyjne zostało zamienione na "notobochech"?
  3. Dlaczego nie uwzględniono żądanego kąta kamery "przez ramię"?
  4. Dlaczego montażysta cały czas mówi do mikrofonu?

Dla filmowców utrudnia to uzyskanie dokładnych kątów kamery i ustawień, które opisują.

Złe logo, zła fryzura (źródło zdjęcia: Zrzut ekranu na Vidu.com)
Złe logo, zła fryzura (źródło zdjęcia: Zrzut ekranu na Vidu.com)

Poprawialiśmy naszą podpowiedź, ale im więcej szczegółów dodawaliśmy, tym więcej problemów się pojawiało. Teraz fryzura była poprawna, ale nagle na ekranie pojawiło się dwóch bliźniaczych redaktorów. Następnie nasz redaktor przeszedł prosto przez biurko.

Sztuczna inteligencja miała również problemy z umieszczeniem pierwszego planu. I pomimo wielokrotnych monitów, nigdy nie stworzyła żądanego ujęcia zza ramienia. Krótko mówiąc, nasze dane tekstowe nie były dokładnie śledzone.

Obraz na wideo

Odłożyliśmy na bok nasz ambitny pomysł na film krótkometrażowy i wypróbowaliśmy funkcję Image-to-Video oraz przejścia między dwoma obrazami referencyjnymi.

pierwszy z nich zadziałał całkiem dobrze. Na przykład, nasz obraz Illidana (z gry *Warcraft 3*) został przekształcony w krótki klip. Kamera robiła zbliżenie na twarz łowcy demonów, gdy ten się krzywił. Ze względu na prawa autorskie nie pokażemy tutaj tego obrazu ani wideo.

Na koniec przetestowaliśmy przejście między dwiema klatkami:

  1. Illidan stoi na skale.
  2. Illidan ląduje na ziemi.

Idea: Illidan powinien zeskoczyć ze skały (obraz 1) i wylądować na ziemi (obraz 2). Ale w wygenerowanym wideo Illidan zmienił się w czarny, podobny do ptaka cień. Całkowicie bezużyteczne.

Nie wygląda już jak Illidan, niezależnie od skoku (źródło obrazu: Zrzut ekranu na Vidu.com)
Nie wygląda już jak Illidan, niezależnie od skoku (źródło obrazu: Zrzut ekranu na Vidu.com)

Podsumowanie

Generator wideo Vidu.com (źródło obrazu: Zrzut ekranu na Vidu.com)
Generator wideo Vidu.com (źródło obrazu: Zrzut ekranu na Vidu.com)

Generowanie filmów za pomocą Vidu.com jest banalnie proste. Ale uzyskanie dokładnych scen, kątów kamery i działań, których Państwo oczekują, nie jest takie proste. Podpowiedzi nie są ściśle przestrzegane, obrazy referencyjne ulegają zniekształceniu (logo, fryzura), obiekty tracą fizyczną spójność (przechodzenie przez biurko) lub pojawiają się inne usterki (zduplikowany edytor).

Ogólnie rzecz biorąc, jest to nieco frustrujące i obecnie prawie uniemożliwia tworzenie naprawdę spójnych filmów dostosowanych do Państwa wizji.

Please share our article, every link counts!
Mail Logo
> laptopy testy i recenzje notebooki > Laptopy > Filmy generowane przez sztuczną inteligencję ze spójnymi postaciami i scenami? Praktyczny test Vidu.com
Christian Hintze, 2025-09-28 (Update: 2025-09-28)