Що ж таке нанобанан, що викликає такий ажіотаж і очолює Google Trends у В'єтнамі?

Google DeepMind щойно представив значний крок вперед у галузі генеративного штучного інтелекту (GenAI): модель Flash Image Gemini 2.5.

Ця модель, ласкаво відома спільнотою як «Нано-банан», є потужним інструментом, здатним перетворювати текст на зображення та редагувати існуючі зображення з високою точністю та гнучкістю.

Це наступник модельної лінійки Gemini, але спеціально оптимізований для завдань, пов'язаних із зображеннями.

Ключове слово Gemini очолило список трендів у Google Trends у В'єтнамі 4 вересня. (Знімок екрана)

Завдяки своїм видатним можливостям у створенні та редагуванні зображень, Nano Banana привертає значну увагу користувачів технологій у всьому світі, включаючи В'єтнам.

Згідно з Google Trends, кількість пошукових запитів Gemini та Nano Banana різко зросла за останні 24 години. Статистика від 4 вересня показує, що ключове слово «Gemini» очолило чарти трендів за всіма темами.

На форумах та у групах соціальних мереж користувачі також діляться та експериментують з командами та сценаріями створення зображень за допомогою Nano Banana.

Більшість людей цінують здатність інструменту швидко та ефективно створювати зображення, а також якість його результату.

Окрім простого створення зображень з текстових описів, Gemini 2.5 Flash Image перевершує інші ключові аспекти: редагування зображень на основі команд, підтримка узгодженості символів, вражаюча швидкість обробки та технологія безпеки SynthID.

Користувачі можуть використовувати природну мову для зміни елементів на фотографії. Наприклад, просто ввівши команду «додати червоний стілець поруч зі столом» або «змінити фон на ліс», модель виконає редагування точно та бездоганно.

Збереження узгодженості персонажів вважається найреволюційнішою функцією. Модель може запам'ятовувати та відтворювати зображення персонажа або об'єкта з узгодженими характеристиками (такими як обличчя, одяг, стиль) на кількох різних зображеннях.

Це особливо корисно для творчих проектів, яким потрібно створити серію пов'язаних зображень, від коміксів до маркетингових кампаній.

Оригінальне зображення та зображення після редагування за допомогою Gemini 2.5 Flash Image.

Завдяки оптимізованій архітектурі, Gemini 2.5 Flash Image може створювати високоякісні результати за лічені секунди, значно пришвидшуючи творчий процес.

Усі зображення, створені або відредаговані моделлю, позначені власним невидимим цифровим водяним знаком від Google, що дозволяє ідентифікувати зображення, створені за допомогою штучного інтелекту, тим самим допомагаючи забезпечити прозорість та походження контенту.

Модель Flash Image Gemini 2.5 відкриває багато потенційних застосувань, від окремих користувачів до професійних розробників.

Розробники можуть отримати доступ до моделі через Gemini API та Google AI Studio для створення власних додатків, тоді як компанії можуть використовувати модель на платформі Vertex AI.

Для пересічного користувача ця модель інтегрована безпосередньо в Google Gemini та інші програми, що робить створення зображень за допомогою штучного інтелекту доступним та інтуїтивно зрозумілим інструментом.

Завдяки своїм видатним функціям, особливо здатності підтримувати узгодженість символів, очікується, що Gemini 2.5 Flash Image стане серйозним конкурентом традиційному програмному забезпеченню для редагування фотографій, такому як Photoshop, змінюючи спосіб взаємодії творців та користувачів із цифровими зображеннями.

Китай несподівано випередив США у світовому змаганні з машинного перекладу на основі штучного інтелекту . Модель Hunyuan-MT-7B від Tencent (Китай) з відкритим кодом здобула майже абсолютну перемогу над американськими гігантами у міжнародному змаганні з машинного перекладу, що відбулося на конференції WMT25.

Джерело: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html