Google DeepMind uruchamia https://blog.google/intl/en-mena/product-updates/explore-get-answers/nano-banana-image-editing-in-gemini-just-got-a-major-upgrade/ Gemini 2.5 Flash Image, zwany także "nano-bananem", dla aplikacji Gemini i dla programistów za pośrednictwem Gemini API, Google AI Studio i Vertex AI. Aktualizacja ta rozwiązuje częstą skargę dotyczącą narzędzi graficznych AI: małe zmiany, które kończą się zmianą całego obrazu. Google opisuje tę wersję jako poprawę jakości i kontroli w porównaniu do wcześniejszych wersji.
Główną cechą jest spójność postaci. Można zachować ten sam wygląd osoby, zwierzęcia lub produktu w różnych scenach, nawet po zmianie stroju, fryzury, okresu lub ustawień. Model może również łączyć kilka obrazów w jeden, wprowadzać określone zmiany za pomocą instrukcji w języku naturalnym i wykorzystywać wiedzę o świecie Gemini podczas tworzenia i edycji obrazu.
Za pomocą tego narzędzia można umieścić tę samą postać w różnych sceneriach, pokazać produkt pod różnymi kątami lub zachować spójność wizerunku marki w różnych kampaniach. Wieloobrotowa edycja umożliwia wprowadzanie zmian, takich jak dodawanie mebli i dekoracji do pokoju w celu wypróbowania pomysłów. Można również mieszać projekty, dodawać wzór z jednego obrazu do obiektu na innym lub łączyć osobę i zwierzę w nową scenę.
Ceny są przejrzyste dla deweloperów: Gemini 2.5 Flash Image kosztuje 30 USD za milion tokenów wyjściowych. Każdy obraz liczy się jako 1290 tokenów wyjściowych, co przekłada się na około 0,039 USD za obraz. Inne modalności wejściowe i wyjściowe są zgodne ze standardowymi cenami Gemini 2.5 Flash.
Dla bezpieczeństwa generowane obrazy zawierają widoczny znak AI i niewidoczny cyfrowy znak wodny SynthID. Google twierdzi, że SynthID nadal można wykryć po typowych edycjach, co powinno pomóc w weryfikacji pochodzenia obrazu, ponieważ syntetyczne media stają się trudniejsze do rozpoznania.
Google twierdzi, że wczesne podglądy oceniają to jako wiodący model edycji obrazu. Wbudowana edycja aplikacji Gemini zachowuje teraz subtelne szczegóły na zdjęciach. Można przesłać zdjęcie, poprosić o zmiany, połączyć obrazy ze swoim zwierzakiem, zamienić tła, aby wypróbować nową tapetę lub umieścić siebie w różnych scenach. Można również użyć edytowanego obrazu w Gemini, aby utworzyć krótki film.
Źródło(a)
Google (w języku angielskim)