O Google DeepMind acaba de apresentar um grande avanço no campo da inteligência artificial generativa (GenAI): o modelo de imagem Flash Gemini 2.5.

Carinhosamente apelidado de "Nano Banana" pela comunidade, este modelo é uma ferramenta poderosa capaz de transformar texto em imagens e editar imagens existentes com alta precisão e flexibilidade.

Este é um sucessor da linha de modelos Gemini, mas especificamente otimizado para tarefas relacionadas a imagens.

c732a0fbdcce57900edf.jpg
A palavra-chave Gemini liderou a lista de tendências do Google Trends no Vietnã em 4 de setembro. (Captura de tela)

Com suas excelentes capacidades de criação e edição de imagens, o Nano Banana está atraindo a atenção de usuários de tecnologia em todo o mundo, incluindo o Vietnã.

De acordo com o Google Trends, as buscas por Gemini e Nano Banana aumentaram consideravelmente nas últimas 24 horas. Estatísticas de 4 de setembro mostram que a palavra-chave "Gemini" liderou os Trending Topics em todos os tópicos.

Em fóruns e grupos de redes sociais, os usuários também compartilham e experimentam comandos e cenários de criação de imagens usando o Nano Banana.

A maioria das pessoas aprecia a capacidade da ferramenta de criar imagens de forma rápida e eficiente, bem como a qualidade do resultado.

Além de simplesmente criar imagens a partir de descrições de texto, o Gemini 2.5 Flash Image se destaca em diversas áreas principais: edição de imagens baseada em comandos, manutenção da consistência de caracteres, velocidade de processamento impressionante e tecnologia de segurança SynthID.

Os usuários podem usar linguagem natural para alterar elementos em uma foto. Por exemplo, basta digitar o comando "adicione uma cadeira vermelha ao lado da mesa" ou "mude o fundo para uma floresta" e o modelo realizará as edições com precisão e fluidez.

A capacidade de manter a consistência dos personagens é considerada a funcionalidade mais inovadora. O modelo consegue memorizar e reproduzir a imagem de um personagem ou objeto com características consistentes (como rosto, vestimenta, estilo) em diversas imagens diferentes.

Isso é especialmente útil para projetos criativos que precisam gerar uma série de imagens relacionadas, desde histórias em quadrinhos até campanhas de marketing.

Com sua arquitetura otimizada, o Gemini 2.5 Flash Image pode produzir resultados de alta qualidade em apenas alguns segundos, acelerando significativamente o processo criativo.

Todas as imagens criadas ou editadas pela modelo são marcadas com uma marca d'água digital invisível e exclusiva do Google, permitindo a identificação de imagens criadas com IA, ajudando assim a garantir a transparência e a origem do conteúdo.

O modelo Gemini 2.5 Flash Image está desbloqueando muitas aplicações potenciais, desde usuários individuais até desenvolvedores profissionais.

Os desenvolvedores podem acessar o modelo por meio da API Gemini e do Google AI Studio para criar seus próprios aplicativos, enquanto as empresas podem usar o modelo na plataforma Vertex AI.

Para o usuário comum, esse modelo está integrado diretamente ao Google Gemini e a outros aplicativos, tornando a criação de imagens com IA uma ferramenta acessível e intuitiva.

Com seus recursos excepcionais, especialmente sua capacidade de manter a consistência dos caracteres, o Gemini 2.5 Flash Image tem tudo para se tornar um concorrente de peso para softwares tradicionais de edição de fotos como o Photoshop, mudando a forma como criadores e usuários interagem com imagens digitais.

A China surpreende ao ultrapassar os EUA na competição global de tradução automática por IA . O modelo de código aberto da Tencent (China), Hunyuan-MT-7B, alcançou uma vitória quase absoluta sobre os gigantes americanos na competição internacional de tradução automática realizada na conferência WMT25.

Fonte: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html