Notebookcheck Logo

Sora 2 to konsekwentnie niekonsekwentny twórca wideo AI OpenAI

We wszystkich tych testach wyróżniała się jedna prawda: Sora 2 jest konsekwentnie niespójna. Na zdjęciu mężczyzna tańczący wokół logo Sora 2. (Źródło obrazu: Notebookcheck - Darryl Linington, wygenerowane za pomocą Sora 2)
We wszystkich tych testach wyróżniała się jedna prawda: Sora 2 jest konsekwentnie niespójna. Na zdjęciu mężczyzna tańczący wokół logo Sora 2. (Źródło obrazu: Notebookcheck - Darryl Linington, wygenerowane za pomocą Sora 2)
Sora 2 opiera się na fundamencie tekst-wideo OpenAI, ale dodaje ostrzejsze śledzenie ruchu, bardziej spójne oświetlenie i silniejszą "symulację świata" Mówiąc prościej: znacznie lepiej sprawia, że obiekty zachowują się tak, jakby należały do tej samej przestrzeni fizycznej.
AI DIY Software Opinion / Kommentar

Tam, gdzie większość modeli wideo AI ma trudności z ciągłością, Sora 2 rozumie przyczyny i skutki środowiskowe. Cienie zmieniają się realistycznie. Woda faluje, gdy coś się w niej poruszy. Odbicia pojawiają się w szkle i kałużach, a nie pod przypadkowymi kątami.

OpenAI opisuje Sorę 2 jako zdolną do generowania "złożonych scen z wieloma postaciami, specyficznym ruchem i szczegółowym tłem, które pozostają spójne w czasie" To prawda - choć "spójne" to w tym świecie wciąż pojęcie względne.

Prompt 1: Pojedynek w Central Parku, który się rozpadł

Pierwszy test był celowo ambitny:

"Spokojne popołudnie w nowojorskim Central Parku. Turyści spacerują w delikatnym słońcu. Nagle postać w szacie aktywuje świecącą laskę energetyczną i wzywa ludzi do bezpiecznego przejścia. Inna, w ciemnych szatach, wyłania się z drzew trzymając czerwoną broń. Tłum rozprasza się, gdy obaj pojedynkują się eleganckimi, tanecznymi ruchami, świecącymi łukami światła odbijającymi się od pobliskiej wody. Kamera okrąża ich nieustannie, gdy jesienne liście wirują w powietrzu"

To, co wróciło, było wizualnie uderzające - delikatne złote odcienie, płynne obroty kamery i przekonujące odbicia. Ale potem przyszedł chaos. Świecące laski (miecze świetlne) migotały, wyginały się i zmieniały w dziwne kształty. Ciała wojowników straciły równowagę, a kończyny przecinały się nawzajem niczym upiorne wielokąty z gier wideo z lat 90-tych. Choreografia bardziej przypominała surrealistyczny taniec interpretacyjny niż filmową walkę.

I ta wada nie jest unikalna dla mojego testu. OpenAI przyznało, że Sora 2 "zmaga się z trwałą, fizycznie wiarygodną walką humanoidalną lub choreografią broni", co szybko staje się oczywiste, gdy broń zaczyna się poruszać.

Mimo to otaczający świat wyglądał na tyle realistycznie, że można było mu to prawie wybaczyć. Scena sprawiała wrażenie filmowej, nawet jeśli akcja taka nie była.

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

Prompt 2: Odkupienie pojedynku w Central Parku

Sora 2 dość dobrze odpowiedziała na następującą podpowiedź.

"Spokojne popołudnie w nowojorskim Central Parku. Turyści spacerują i robią zdjęcia w delikatnym, złotym słońcu. Nagle postać w jasnych szatach aktywuje świecącą laskę energetyczną i pilnie wzywa ludzi, by przenieśli się w bezpieczne miejsce. Inna postać w ciemnych szatach pojawia się z drzew, trzymając czerwoną broń energetyczną. Tłum rozpierzcha się, gdy obaj rozpoczynają precyzyjny, filmowy pojedynek - eleganckie, taneczne ruchy, świecące łuki światła odbijające się od pobliskiej wody. Kamera okrąża ich w jednym ciągłym ujęciu, podczas gdy jesienne liście wirują w powietrzu. Nie widać kontaktu ani obrażeń - tylko zręczną choreografię i dynamiczny ruch."

Tym razem to naprawdę zadziałało. Ruchy wyglądały na ugruntowane, płynne i zaskakująco ludzkie, a końcowe uderzenie płynęło tak naturalnie, że łatwo zapomnieć, że ogląda się coś wygenerowanego przez sztuczną inteligencję.

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

Propozycja 3: Ptaki i lwy przy wodopoju

Dla spokojniejszego testu zwróciłem się do dzikiej przyrody. Podpowiedź:

"Proszę stworzyć scenę dzikiej przyrody, w której ptaki i lwy piją naturalnie z wodopoju. Każde zwierzę powinno poruszać się realistycznie, a scena musi być hiperrealistyczna"

Tutaj Sora 2 była w swoim żywiole. Ptaki trzepotały i zanurzały się z wiarygodnym ruchem skrzydeł. Światło słoneczne mieniło się na powierzchni wody, a odbicia reagowały naturalnie, gdy zwierzęta zmieniały pozycję. Tekstury - futro, pióra, falujące błoto - wyglądały na bliskie dokumentalnej jakości natury.

Wciąż jednak wkradały się dziwactwa modela. Jeden lew skończył niezgrabnie umieszczony na błotnistej krawędzi, zdając się pić bezpośrednio z brudu, a nie z wody. To drobny, ale wymowny szczegół: Sora 2 doskonale odwzorowuje ogólną scenę, ale czasami gubi się w interakcji między obiektami a powierzchnią.

Mimo to, był to najbardziej przekonujący wynik - i wskazówka, gdzie leży prawdziwa siła Sora 2: realizm środowiskowy.

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

Prompt 4: Futurystyczny pościg na dachu

W ostatnim teście wykorzystałem ruch, oświetlenie i atmosferę do granic możliwości:

"Rozległy futurystyczny krajobraz miejski o świcie. Cyberpunkowy kurier w ciemnej kurtce biegnie sprintem przez dachy, niosąc świecącą walizkę z danymi. Ścigający go dron przemyka między antenami i otworami wentylacyjnymi, a jego silniki wystrzeliwują niebieskie płomienie.

Kamera śledzi z tyłu i z prawej strony biegacza, w stylu ręcznym, gdy przeskakują lukę. Dron wyprzedza go w powietrzu; flara obiektywu i rozmycie ruchu dopełniają scenę"

Efekt był oszałamiający i zaskakująco filmowy.

Oświetlenie sprzedało to: wschód słońca odbijający się od szklanych wież, odbicia na metalowych powierzchniach i subtelny rozbłysk obiektywu podczas skoku. Ruch był płynny i ciężki. Pościg dronem wprowadził prawdziwe napięcie, a płytka głębia ostrości naśladowała kamerę filmową 35 mm.

To była Sora 2 działająca na wszystkich cylindrach - złożona, spójna i wiarygodna. Gdyby był to zwiastun gry lub filmu, większość widzów na pierwszy rzut oka nie podejrzewałaby udziału sztucznej inteligencji.

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

Piękna nieprzewidywalność Sora 2

We wszystkich tych testach wyróżniała się jedna prawda: Sora 2 jest konsekwentnie niespójna. Czasami wszystko się udaje. Innym razem rodzi coś tak dziwacznego, że nie można przestać się śmiać. Ta nieprzewidywalność stała się częścią jej uroku.

Na Reddicie jeden z użytkowników doskonale to podsumował:

"Sora 2 albo daje ci energię Pixara, albo gorączkowego snu, nie ma nic pomiędzy."
- r/AIGuild

Model od czasu do czasu zniekształca obiekty, zmienia kolory w trakcie sceny lub błędnie interpretuje podpowiedzi w zachwycająco absurdalny sposób. Prośba o "dwa pluszowe zwierzęta idące obok siebie" stworzyła kiedyś stworzenia, które wyglądały jak pół pluszowy miś, pół nadmuchiwany balon. Nie jest to dokładne, ale zapada w pamięć.

Ten chaos może być obciążeniem dla profesjonalistów potrzebujących niezawodności, ale dla kreatywnych eksperymentów jest złotem. Sora 2 czasami zachowuje się bardziej jak współpracownik z nadaktywną wyobraźnią niż przewidywalna maszyna.

Realizm kontra rzeczywistość: Zrozumienie mocnych stron Sora 2

Kiedy Sora 2 działa, czuje się jak magia. Ale to nie jest magia - to maszyna interpretująca twoje słowa poprzez prawdopodobieństwo i uczenie się wzorców wizualnych. Rozwija się dzięki kontekstowi, a nie precyzji. Proszę dać jej silne wyczucie miejsca - kierunek oświetlenia, ruch kamery, ton - a ona przekonująco wypełni resztę. Proszę poprosić ją o precyzyjną choreografię lub interakcję motoryczną, a się zawiedzie.

Wzorzec ten pasuje do tego, co inni zaobserwowali w grupach testowych Reddit i Discord. Twórcy zauważają, że prostsze ludzkie działania (chodzenie, patrzenie, gestykulacja) są wiarygodne, ale złożone sekwencje (walka, przytulanie, gra na instrumentach) szybko się psują. Sugeruje to, że modelowanie fizyki OpenAI nadal traktuje ludzkie ciało jako zestaw niezależnych klastrów ruchu, a nie jako pojedynczą jednostkę. Jest to wystarczająco realistyczne przez kilka sekund - potem entropia bierze górę.

Szerszy kontekst: Kreatywność w erze algorytmów

To, co sprawia, że Sora 2 jest fascynująca, to nie tylko jej postęp techniczny... To zmiana kulturowa, którą reprezentuje.

Przez dziesięciolecia tworzenie wideo było drogie, czasochłonne i ograniczone dostępem do sprzętu lub talentu. Teraz każdy, kto ma dobry pomysł i akapit tekstu, może stworzyć coś atrakcyjnego wizualnie.

Ta demokratyzacja jest potężna, ale także rozmywa kreatywne autorstwo. Kiedy model "wyobraża" sobie część sceny w nieprawidłowy sposób, czy jest to porażka, czy interpretacja?

W moim pojedynku w Central Parku wypaczona broń zrujnowała realizm, ale wprowadziła senną jakość. Nie tego chciałem, ale sugerowało to surrealistyczną, malarską estetykę - coś bliższego filmowi eksperymentalnemu niż hollywoodzkiej akcji.

Może to jest głębsza lekcja: W tworzeniu filmów ze sztuczną inteligencją nie chodzi o kontrolę. Chodzi o negocjacje.

Granice techniczne i etyczne

OpenAI zdaje sobie sprawę zarówno z podekscytowania, jak i niepokoju związanego z tym narzędziem. Firma nadal ogranicza dostęp, powołując się na potencjalne nadużycia i potrzebę zabezpieczenia treści.

Japoński rząd niedawno wezwał OpenAI do upewnienia się, że Sora 2 nie narusza praw autorskich do anime i mangi - co przypomina, że kreatywny zasięg sztucznej inteligencji wiąże się z rzeczywistymi konsekwencjami prawnymi. Pozostaje jeszcze kwestia oryginalności. Wyniki Sora 2 mogą wyglądać na nowe, ale są szkolone na ogromnych ilościach istniejących mediów. Im bardziej staje się to realistyczne, tym trudniej jest oddzielić hołd od replikacji. Dlatego też, pomimo swojej cudowności, Sora 2 znajduje się na rozdrożu między artyzmem a automatyzacją.

Ceny Sora 2. (Źródło obrazu: OpenAI)
Ceny Sora 2. (Źródło obrazu: OpenAI)

Problemy z dźwiękiem są bardzo zauważalne

Większość klipów Sora 2 wciąż boryka się z dźwiękiem. Podczas gdy oprawa wizualna jest często oszałamiająca, dźwięk ma tendencję do brzmienia słabego, płaskiego, przytłumionego lub nienaturalnego. Sora 2 stara się generować odgłosy otoczenia, efekty i dialogi jednocześnie, ale nie jest w stanie oddzielić ich tak, jak zrobiłby to prawdziwy projektant dźwięku. Rezultatem jest nadmiernie skompresowany, metaliczny lub dziwnie zbalansowany dźwięk, który rzadko pasuje do kinowej jakości obrazu. Póki co, najlepszym sposobem na udźwiękowienie filmów z gry Sora 2 jest dodanie dźwięku w postprodukcji, łącząc rzeczywistą atmosferę, efekty i muzykę, aby ożywić scenę.

Spojrzenie w przyszłość, niedoskonale wyrenderowane

Po wielu dniach testów, Sora 2 wywarła na mnie wrażenie, rozbawiła mnie i nieco zaniepokoiła. Jest to zarówno cud inżynierii, jak i przypomnienie, że ludzki ruch, emocje i opowiadanie historii pozostają wyjątkowo złożone.

Mocne strony: Otoczenie, oświetlenie, atmosfera, dynamiczny ruch i realizm w krótkich sekwencjach.

Słabe strony: Kontakt z ludźmi, fizyka broni, okazjonalne surrealistyczne zniekształcenia.

Czy Sora 2 naprawdę spełnia oczekiwania?

Sora 2 to całkiem przyzwoity krok w kierunku filmowania wspomaganego sztuczną inteligencją... Proszę jednak nie oczekiwać nieskazitelnego realizmu. Co więcej, prawdziwi filmowcy wciąż są prawdziwymi artystami, których potrzebujemy... Ponieważ Sora 2 wciąż zmaga się z poruszaniem antymonami człowieka, a także zwierząt, w naturalny sposób.

Jak ujął to jeden z Redditorów:

"Sora 2 czuje się jak oglądanie przyszłości uczącej się śnić".
- r/OpenAI

To trafne podsumowanie. Sora 2 nie tylko symuluje rzeczywistość... Eksperymentuje z nią. A dla tych z nas, którzy to obserwują, jest to zarówno ekscytujące, jak i głęboko ludzkie... Tylko z wyjątkowo złą jakością dźwięku.

Please share our article, every link counts!
Mail Logo
> laptopy testy i recenzje notebooki > Nowinki > Archiwum v2 > Archiwum 2025 11 > Sora 2 to konsekwentnie niekonsekwentny twórca wideo AI OpenAI
Darryl Linington, 2025-11-12 (Update: 2025-11-13)