Google DeepMind щойно представив важливий крок вперед у галузі генеративного штучного інтелекту (GenAI): модель Flash Image Gemini 2.5.
Ця модель, яку спільнота ласкаво називає «Нано-банан», є потужним інструментом, здатним перетворювати текст на зображення та редагувати існуючі зображення з великою точністю та гнучкістю.
Це продовження модельної лінійки Gemini, але спеціально оптимізоване для завдань, пов'язаних із зображеннями.

Завдяки видатним перевагам у створенні та редагуванні фотографій, Nano Banana привертає велику увагу користувачів технологій з усього світу, включаючи В'єтнам.
Згідно з Google Trends, кількість пошукових запитів Gemini та Nano Banana різко зросла за останні 24 години. Статистика від 4 вересня показує, що ключове слово «Gemini» очолило чарт трендів за всіма темами.
На форумах та в групах соціальних мереж користувачі також діляться та тестують команди та скрипти для створення зображень за допомогою Nano Banana.
Більшість із них високо оцінюють здатність створювати зображення «швидко, акуратно та гнучко», а також якість вихідного продукту інструменту.
Gemini 2.5 Flash Image не просто створює зображення з текстових описів, він перевершує інші ключові аспекти: редагування зображень на вимогу, узгодженість символів, вражаюча швидкість обробки та технологія безпеки SynthID.
Користувачі можуть використовувати природну мову для зміни елементів на фотографії. Наприклад, просто введіть команду «додати червоний стілець поруч зі столом» або «змінити фон на ліс», і модель виконає редагування точно та бездоганно.
Найреволюційнішою особливістю вважається узгодженість персонажів. Модель може запам'ятовувати та відтворювати зображення персонажа чи об'єкта з узгодженими рисами (такими як обличчя, одяг, стиль) на багатьох різних фотографіях.
Це особливо корисно для творчих проектів, які потребують створення серії пов'язаних зображень, від коміксів до маркетингових кампаній.
Завдяки оптимізованій архітектурі, Gemini 2.5 Flash Image може створювати високоякісні результати за лічені секунди, значно пришвидшуючи творчий робочий процес.
Усі зображення, створені або відредаговані моделлю, позначені власним невидимим цифровим водяним знаком від Google, що дозволяє розпізнавати зображення, згенеровані штучним інтелектом, сприяючи забезпеченню прозорості та походження контенту.
Модель Flash Image Gemini 2.5 відкриває широкий спектр можливостей застосування, від індивідуальних користувачів до професійних розробників.
Розробники можуть отримати доступ до моделі через Gemini API та Google AI Studio для створення власних додатків, тоді як компанії можуть використовувати модель на платформі Vertex AI.
Для пересічного користувача модель вбудована безпосередньо в Google Gemini та інші програми, що робить візуалізацію за допомогою штучного інтелекту доступним та інтуїтивно зрозумілим інструментом.
Завдяки своїм видатним функціям, особливо здатності підтримувати узгодженість символів, очікується, що Gemini 2.5 Flash Image стане серйозним конкурентом традиційному програмному забезпеченню для редагування фотографій, такому як Photoshop, змінюючи спосіб взаємодії творців та користувачів із цифровими зображеннями.

Джерело: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html








Коментар (0)