Notebookcheck Logo

Google wprowadza Gemini 2.5 Flash Image "nano-banana" z większą spójnością edycji

Model "nano-banana" Google DeepMind oferuje precyzyjną edycję obrazu (źródło obrazu: Gemini)
Model "nano-banana" Google DeepMind oferuje precyzyjną edycję obrazu (źródło obrazu: Gemini)
Nowy Gemini 2.5 Flash Image firmy Google DeepMind, nazywany "nano-bananem", obiecuje lepszą kontrolę nad edycją obrazu AI. Utrzymuje spójność postaci w różnych scenach, umożliwia edycję wieloobrotową i łączy obrazy z instrukcjami w języku naturalnym, a wszystko to przy jednoczesnym dodawaniu widocznych i niewidocznych znaków wodnych dla bezpieczeństwa.
AI

Google DeepMind uruchamia https://blog.google/intl/en-mena/product-updates/explore-get-answers/nano-banana-image-editing-in-gemini-just-got-a-major-upgrade/ Gemini 2.5 Flash Image, zwany także "nano-bananem", dla aplikacji Gemini i dla programistów za pośrednictwem Gemini API, Google AI Studio i Vertex AI. Aktualizacja ta rozwiązuje częstą skargę dotyczącą narzędzi graficznych AI: małe zmiany, które kończą się zmianą całego obrazu. Google opisuje tę wersję jako poprawę jakości i kontroli w porównaniu do wcześniejszych wersji.

Główną cechą jest spójność postaci. Można zachować ten sam wygląd osoby, zwierzęcia lub produktu w różnych scenach, nawet po zmianie stroju, fryzury, okresu lub ustawień. Model może również łączyć kilka obrazów w jeden, wprowadzać określone zmiany za pomocą instrukcji w języku naturalnym i wykorzystywać wiedzę o świecie Gemini podczas tworzenia i edycji obrazu.

Za pomocą tego narzędzia można umieścić tę samą postać w różnych sceneriach, pokazać produkt pod różnymi kątami lub zachować spójność wizerunku marki w różnych kampaniach. Wieloobrotowa edycja umożliwia wprowadzanie zmian, takich jak dodawanie mebli i dekoracji do pokoju w celu wypróbowania pomysłów. Można również mieszać projekty, dodawać wzór z jednego obrazu do obiektu na innym lub łączyć osobę i zwierzę w nową scenę.

Ceny są przejrzyste dla deweloperów: Gemini 2.5 Flash Image kosztuje 30 USD za milion tokenów wyjściowych. Każdy obraz liczy się jako 1290 tokenów wyjściowych, co przekłada się na około 0,039 USD za obraz. Inne modalności wejściowe i wyjściowe są zgodne ze standardowymi cenami Gemini 2.5 Flash.

Dla bezpieczeństwa generowane obrazy zawierają widoczny znak AI i niewidoczny cyfrowy znak wodny SynthID. Google twierdzi, że SynthID nadal można wykryć po typowych edycjach, co powinno pomóc w weryfikacji pochodzenia obrazu, ponieważ syntetyczne media stają się trudniejsze do rozpoznania.

Google twierdzi, że wczesne podglądy oceniają to jako wiodący model edycji obrazu. Wbudowana edycja aplikacji Gemini zachowuje teraz subtelne szczegóły na zdjęciach. Można przesłać zdjęcie, poprosić o zmiany, połączyć obrazy ze swoim zwierzakiem, zamienić tła, aby wypróbować nową tapetę lub umieścić siebie w różnych scenach. Można również użyć edytowanego obrazu w Gemini, aby utworzyć krótki film.

Źródło(a)

Google (w języku angielskim)

Please share our article, every link counts!
Mail Logo
> laptopy testy i recenzje notebooki > Nowinki > Archiwum v2 > Archiwum 2025 08 > Google wprowadza Gemini 2.5 Flash Image "nano-banana" z większą spójnością edycji
Nathan Ali, 2025-08-28 (Update: 2025-08-28)