Google DeepMind właśnie dokonał wielkiego kroku naprzód w dziedzinie generatywnej sztucznej inteligencji (GenAI): zaprezentował model Gemini 2.5 Flash Image.

Model ten, nazywany przez społeczność pieszczotliwie „Nano Banana”, to potężne narzędzie umożliwiające zamianę tekstu na obrazy i edycję istniejących obrazów z dużą precyzją i elastycznością.

Jest to następca linii modeli Gemini, ale zoptymalizowany specjalnie pod kątem zadań związanych z wizerunkiem.

c732a0fbdcce57900edf.jpg
Słowo kluczowe Gemini znalazło się na szczycie listy trendów Google Trends w Wietnamie 4 września. (Zrzut ekranu)

Dzięki swoim wyjątkowym możliwościom w zakresie tworzenia i edycji obrazu Nano Banana cieszy się coraz większym zainteresowaniem użytkowników technologii na całym świecie, w tym w Wietnamie.

Według Google Trends, liczba wyszukiwań haseł Gemini i Nano Banana gwałtownie wzrosła w ciągu ostatnich 24 godzin. Statystyki z 4 września pokazują, że słowo kluczowe „Gemini” znalazło się na szczycie list przebojów we wszystkich tematach.

Na forach i w grupach w mediach społecznościowych użytkownicy wymieniają się poleceniami tworzenia obrazów i scenariuszami, korzystając z Nano Banana, i eksperymentują z nimi.

Większość osób docenia możliwość szybkiego i wydajnego tworzenia obrazów za pomocą tego narzędzia, a także wysoką jakość uzyskiwanych wyników.

Oprócz prostego tworzenia obrazów z opisów tekstowych Gemini 2.5 Flash Image wyróżnia się w kilku podstawowych obszarach: edycja obrazów oparta na poleceniach, zachowanie spójności znaków, imponująca szybkość przetwarzania i technologia zabezpieczeń SynthID.

Użytkownicy mogą używać języka naturalnego do zmiany elementów na zdjęciu. Na przykład, wystarczy wpisać polecenie „dodaj czerwone krzesło obok stołu” lub „zmień tło na las”, a model wykona edycję precyzyjnie i płynnie.

Zachowanie spójności postaci jest uważane za najbardziej przełomową cechę. Model potrafi zapamiętać i odtworzyć obraz postaci lub obiektu o spójnych cechach (takich jak twarz, ubiór, styl) na wielu różnych obrazach.

Jest to szczególnie przydatne w przypadku projektów kreatywnych, które wymagają wygenerowania serii powiązanych obrazów, od komiksów po kampanie marketingowe.

Dzięki zoptymalizowanej architekturze Gemini 2.5 Flash Image może w ciągu kilku sekund generować wysokiej jakości rezultaty, znacznie przyspieszając proces twórczy.

Wszystkie obrazy stworzone lub edytowane przez modelkę są oznaczane zastrzeżonym, niewidocznym cyfrowym znakiem wodnym Google. Umożliwia to identyfikację obrazów stworzonych przy pomocy sztucznej inteligencji, a tym samym pomaga zapewnić przejrzystość i ustalić pochodzenie treści.

Model Gemini 2.5 Flash Image otwiera wiele potencjalnych zastosowań dla użytkowników indywidualnych i profesjonalnych programistów.

Programiści mogą uzyskać dostęp do modelu za pośrednictwem interfejsu API Gemini i Google AI Studio, aby tworzyć własne aplikacje, natomiast firmy mogą wykorzystywać ten model na platformie Vertex AI.

Dla przeciętnego użytkownika model ten jest bezpośrednio zintegrowany z Google Gemini i innymi aplikacjami, dzięki czemu tworzenie obrazów przy użyciu sztucznej inteligencji staje się przystępnym i intuicyjnym narzędziem.

Dzięki swoim wyjątkowym funkcjom, a zwłaszcza możliwości zachowania spójności znaków, Gemini 2.5 Flash Image ma szansę stać się poważnym konkurentem dla tradycyjnego oprogramowania do edycji zdjęć, takiego jak Photoshop, zmieniając sposób, w jaki twórcy i użytkownicy wchodzą w interakcję z obrazami cyfrowymi.

Chiny niespodziewanie wyprzedzają Stany Zjednoczone w globalnym konkursie tłumaczeń sztucznej inteligencji . Model open source Hunyuan-MT-7B firmy Tencent (Chiny) odniósł niemal absolutne zwycięstwo nad amerykańskimi gigantami w międzynarodowym konkursie tłumaczeń maszynowych, który odbył się podczas konferencji WMT25.

Source: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html