Google DeepMind acaba de presentar un gran paso adelante en el campo de la inteligencia artificial generativa (GenAI): el modelo Flash Image de Gemini 2.5.

Conocido cariñosamente como “Nano Banana” por la comunidad, este modelo es una herramienta poderosa, capaz de transformar texto en imágenes y editar imágenes existentes con gran precisión y flexibilidad.

Esta es una continuación de la línea de modelos Gemini, pero está específicamente optimizada para tareas relacionadas con la imagen.

c732a0fbdcce57900edf.jpg
La palabra clave Géminis encabezó la lista de tendencias en Google Trends en Vietnam el 4 de septiembre. Captura de pantalla.

Con ventajas excepcionales en capacidades de creación y edición de fotografías, Nano Banana está atrayendo gran atención de los usuarios de tecnología de todo el mundo, incluido Vietnam.

Según Google Trends, las búsquedas de Gemini y Nano Banana se han disparado en las últimas 24 horas. Las estadísticas del 4 de septiembre muestran que la palabra clave "Gemini" encabezó la lista de tendencias en todos los temas.

En foros y grupos de redes sociales, los usuarios también comparten y prueban comandos y scripts de creación de imágenes utilizando Nano Banana.

La mayoría de las personas aprecian la capacidad de la herramienta para crear imágenes "de manera rápida, ordenada y veloz", así como la calidad del producto final.

Más que simplemente crear imágenes a partir de descripciones de texto, Gemini 2.5 Flash Image se destaca en varios aspectos fundamentales: edición de imágenes a pedido, consistencia de caracteres, velocidad de procesamiento impresionante y tecnología de seguridad SynthID.

Los usuarios pueden usar lenguaje natural para modificar elementos de una foto. Por ejemplo, basta con escribir el comando "agregar una silla roja junto a la mesa" o "cambiar el fondo a un bosque" y el modelo realizará la edición con precisión y fluidez.

La consistencia de los personajes se considera la característica más innovadora. El modelo puede recordar y recrear la imagen de un personaje u objeto con rasgos consistentes (como rostro, vestimenta, estilo) en múltiples fotos.

Esto es especialmente útil para proyectos creativos que requieren la creación de una serie de imágenes relacionadas, desde cómics hasta campañas de marketing.

Con su arquitectura optimizada, Gemini 2.5 Flash Image puede producir resultados de alta calidad en segundos, acelerando significativamente el flujo de trabajo creativo.

Todas las imágenes creadas o editadas por la modelo están etiquetadas con una marca de agua digital invisible patentada por Google, lo que permite el reconocimiento de imágenes creadas con IA, contribuyendo a garantizar la transparencia y el origen del contenido.

El modelo Gemini 2.5 Flash Image abre una amplia gama de posibilidades de aplicación, desde usuarios individuales hasta desarrolladores profesionales.

Los desarrolladores pueden acceder al modelo a través de la API de Gemini y Google AI Studio para crear sus propias aplicaciones, mientras que las empresas pueden usar el modelo en la plataforma Vertex AI.

Para el usuario promedio, el modelo está integrado directamente en Google Gemini y otras aplicaciones, lo que hace que las imágenes de IA sean una herramienta accesible e intuitiva.

Con sus características destacadas, especialmente la capacidad de mantener la consistencia de los caracteres, se espera que Gemini 2.5 Flash Image se convierta en un competidor formidable del software de edición de fotografías tradicional como Photoshop, cambiando la forma en que los creadores y usuarios interactúan con las imágenes digitales.

China supera inesperadamente a EE. UU. en la competencia global de traducción de IA . El modelo Hunyuan-MT-7B de código abierto de Tencent (China) se impuso casi por completo a los gigantes estadounidenses en la competencia internacional de traducción automática celebrada en el marco de la conferencia WMT25.

Fuente: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html