Společnost Google DeepMind právě představila zásadní krok vpřed v oblasti generativní umělé inteligence (GenAI): model Gemini 2.5 Flash Image.

Tento model, komunitou láskyplně známý jako „Nano Banana“, je výkonný nástroj schopný transformovat text do obrázků a upravovat stávající obrázky s vysokou přesností a flexibilitou.

Jedná se o nástupce modelové řady Gemini, ale speciálně optimalizovaného pro úlohy související s obrázky.

c732a0fbdcce57900edf.jpg
Klíčové slovo Gemini se 4. září umístilo na vrcholu žebříčku trendů ve vietnamské službě Google Trends. (Snímek obrazovky)

Díky svým vynikajícím schopnostem v oblasti tvorby a úpravy obrázků přitahuje Nano Banana značnou pozornost uživatelů technologií po celém světě, včetně Vietnamu.

Podle Google Trends se za posledních 24 hodin prudce zvýšil počet vyhledávání výrazů Gemini a Nano Banana. Statistiky ze 4. září ukazují, že klíčové slovo „Gemini“ se umístilo na vrcholu žebříčku Trending ve všech tématech.

Na fórech a ve skupinách sociálních médií uživatelé také sdílejí a experimentují s příkazy a scénáři pro tvorbu obrázků pomocí Nano Banana.

Většina lidí oceňuje schopnost nástroje vytvářet obrázky rychle a efektivně, stejně jako kvalitu jeho výstupu.

Kromě pouhého vytváření obrázků z textových popisů vyniká Gemini 2.5 Flash Image v několika klíčových oblastech: úprava obrázků pomocí příkazů, zachování konzistence znaků, působivá rychlost zpracování a bezpečnostní technologie SynthID.

Uživatelé mohou ke změně prvků na fotografii použít přirozený jazyk. Například pouhým zadáním příkazu „přidat červenou židli vedle stolu“ nebo „změnit pozadí na les“ model provede úpravy přesně a bez problémů.

Zachování konzistence postav je považováno za nejprůlomovější funkci. Model si dokáže zapamatovat a reprodukovat obraz postavy nebo objektu s konzistentními vlastnostmi (jako je obličej, oblečení, styl) napříč více různými obrázky.

To je obzvláště užitečné pro kreativní projekty, které potřebují generovat sérii souvisejících obrázků, od komiksů až po marketingové kampaně.

Díky optimalizované architektuře dokáže Gemini 2.5 Flash Image produkovat vysoce kvalitní výsledky během několika sekund, což výrazně urychluje tvůrčí proces.

Všechny obrázky vytvořené nebo upravené modelem jsou označeny proprietárním neviditelným digitálním vodoznakem od společnosti Google, který umožňuje identifikaci obrázků vytvořených pomocí umělé inteligence a tím pomáhá zajistit transparentnost a původ obsahu.

Model Gemini 2.5 Flash Image odemyká mnoho potenciálních aplikací, od individuálních uživatelů až po profesionální vývojáře.

Vývojáři mohou k modelu přistupovat prostřednictvím rozhraní Gemini API a Google AI Studio a vytvářet si vlastní aplikace, zatímco firmy mohou model používat na platformě Vertex AI.

Pro běžného uživatele je tento model integrován přímo do Google Gemini a dalších aplikací, díky čemuž je tvorba obrázků s využitím umělé inteligence přístupným a intuitivním nástrojem.

Díky svým vynikajícím funkcím, zejména schopnosti zachovat konzistenci znaků, se očekává, že se Gemini 2.5 Flash Image stane silným konkurentem tradičního softwaru pro úpravu fotografií, jako je Photoshop, a změní způsob, jakým tvůrci a uživatelé interagují s digitálními obrázky.

Čína nečekaně překonala USA v globální soutěži v překladu s využitím umělé inteligence . Open-source model Hunyuan-MT-7B od společnosti Tencent (Čína) dosáhl téměř absolutního vítězství nad americkými giganty v mezinárodní soutěži v strojovém překladu, která se konala na konferenci WMT25.

Zdroj: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html