Nano Banana Pro to doskonałe narzędzie do generowania wysokiej jakości obrazów przy minimalnym wysiłku. Na pierwszy rzut oka obrazy ze sztucznej inteligencji Google zwykle wydają się bezbłędne. Dłonie z czterema palcami i kciukiem, prawidłowa anatomia i proporcje. Perspektywy są spójne, a proporcje są również ogólnie dokładne. Generator obrazu jest tak dobry, że przynajmniej po niewielkiej obróbce końcowej, wiele narzędzi do automatycznego wykrywania obrazów AI zawodzi, jak w przypadku nasz pierwszy eksperyment jak pokazał nasz pierwszy eksperyment.
Niemniej jednak, nawet Nano Banana Pro czasami zawodzi w szczegółach. Wystarczy niewielkie powiększenie, aby ujawnić kilka błędów w obrazie. Przyjrzyjmy się im krok po kroku.
Zamki błyskawiczne i guziki: Drobne szczegóły są często niespójne
Kobieta na naszym zdjęciu ma na sobie oliwkowozieloną kurtkę. Styl odzieży mieści się gdzieś pomiędzy kurtką polową a parką. Nano Banana Pro wyjątkowo dobrze odwzorowuje fałdy i materiał, ale nie inne części kurtki. Po bliższym przyjrzeniu się, niespójności szybko stają się widoczne.
Zacznijmy od zamka błyskawicznego. Po prawej stronie obrazu ząbki zamka znikają w połowie. Po lewej stronie zmienia się długość i rozstaw poszczególnych ząbków zamka. Zatrzaski wskazują również, że obraz został wygenerowany przez sztuczną inteligencję. Zamiast okrągłych otworów widzimy kształt litery D. Ostatni, ale nie mniej ważny, jest kołnierz kurtki. Po prawej stronie widzimy białe futrzane wykończenie, którego całkowicie brakuje po lewej stronie. Zamiast tego materiał kołnierza płynnie łączy się z elementami na ramionach po lewej stronie. Co więcej, wycięcie pokazanej części kołnierza jest nielogiczne.
Jest również jasne, że coś jest nie tak z zamkiem błyskawicznym na czarnej kurtce polarowej. Nie ma ząbków, suwak jest mniej więcej całkowicie wygięty, a pod spodem zamek zamienia się w materiał
Znikający punkt perspektywy
Diabeł tkwi też w szczegółach. Gemini, a raczej Nano Banana Pro, dobrze radzi sobie z renderowaniem perspektywy. Na pierwszy rzut oka widoczny jest tylko jeden znikający punkt. Jednak bliższe spojrzenie ujawnia, że pomimo rozmycia, niektóre linie znikających punktów przecinają kondygnacje lub, w przypadku dwóch autobusów po lewej stronie, po prostu znikają w powietrzu. Linie, które uznaliśmy za niespójne, pokolorowaliśmy na fioletowo po określeniu znikającego punktu perspektywy
Linia włosów i dłonie
Jeśli chodzi o dłonie, nawet najbardziej zaawansowana sztuczna inteligencja Google wciąż nie jest odporna na drobne nieścisłości. Patrząc na szczegóły, palce i dłoń kobiety trzymającej banana nie są całkowicie anatomicznie poprawne. Kilka niespójności jest szczególnie zauważalnych na środkowym palcu. Palec i paznokieć są zbyt szerokie, przedni staw palca nie ma artykulacji, a połączenie z dłonią jest również niejednoznaczne. Do tego dochodzą fałdy skóry między palcami, które rozciągają się aż do kostek.
Na linii włosów szczególnie zauważalne jest to, że prawie wszystkie włosy - nawet siwe - zaczynają się od brązowej warstwy. Jest to szczególnie widoczne z przodu głowy
Wnioski: Podglądanie pikseli i zdrowy rozsądek pomogą
W pierwszej części naszej serii, przepuściliśmy obraz kobiety z bananem przez różne narzędzia do rozpoznawania obrazów AI. Po kilku edycjach obrazu sześć platform internetowych niestety zrezygnowało z tego obrazu i stwierdziło, że nie jest to obraz wygenerowany przez sztuczną inteligencję. Ludzkie oko i odrobina zdrowego rozsądku są w tym przypadku znacznie bardziej pomocne. Obraz ujawnia całą serię punktów wskazujących na sztuczną inteligencję. Każdy, kto pozostaje sceptyczny, powinien zdawać sobie sprawę z problemów związanych z generowaniem obrazu. Drobne szczegóły często nie są renderowane poprawnie. Należą do nich tekstury tkanin, biżuterii, dzianin, zamków błyskawicznych i innych zwykłych obiektów. Bieżniki opon i felgi w samochodach i samolotach, powierzchnie drewniane i zmarszczki na skórze często wskazują na przetwarzanie AI.







