O Google DeepMind acaba de apresentar um grande avanço no campo da inteligência artificial generativa (GenAI): o modelo de imagem Flash Gemini 2.5.
Carinhosamente apelidado de "Nano Banana" pela comunidade, este modelo é uma ferramenta poderosa capaz de transformar texto em imagens e editar imagens existentes com alta precisão e flexibilidade.
Este é um sucessor da linha de modelos Gemini, mas especificamente otimizado para tarefas relacionadas a imagens.

Com suas excelentes capacidades de criação e edição de imagens, o Nano Banana está atraindo a atenção de usuários de tecnologia em todo o mundo, incluindo o Vietnã.
De acordo com o Google Trends, as buscas por Gemini e Nano Banana aumentaram consideravelmente nas últimas 24 horas. Estatísticas de 4 de setembro mostram que a palavra-chave "Gemini" liderou os Trending Topics em todos os tópicos.
Em fóruns e grupos de redes sociais, os usuários também compartilham e experimentam comandos e cenários de criação de imagens usando o Nano Banana.
A maioria das pessoas aprecia a capacidade da ferramenta de criar imagens de forma rápida e eficiente, bem como a qualidade do resultado.
Além de simplesmente criar imagens a partir de descrições de texto, o Gemini 2.5 Flash Image se destaca em diversas áreas principais: edição de imagens baseada em comandos, manutenção da consistência de caracteres, velocidade de processamento impressionante e tecnologia de segurança SynthID.
Os usuários podem usar linguagem natural para alterar elementos em uma foto. Por exemplo, basta digitar o comando "adicione uma cadeira vermelha ao lado da mesa" ou "mude o fundo para uma floresta" e o modelo realizará as edições com precisão e fluidez.
A capacidade de manter a consistência dos personagens é considerada a funcionalidade mais inovadora. O modelo consegue memorizar e reproduzir a imagem de um personagem ou objeto com características consistentes (como rosto, vestimenta, estilo) em diversas imagens diferentes.
Isso é especialmente útil para projetos criativos que precisam gerar uma série de imagens relacionadas, desde histórias em quadrinhos até campanhas de marketing.
Com sua arquitetura otimizada, o Gemini 2.5 Flash Image pode produzir resultados de alta qualidade em apenas alguns segundos, acelerando significativamente o processo criativo.
Todas as imagens criadas ou editadas pela modelo são marcadas com uma marca d'água digital invisível e exclusiva do Google, permitindo a identificação de imagens criadas com IA, ajudando assim a garantir a transparência e a origem do conteúdo.
O modelo Gemini 2.5 Flash Image está desbloqueando muitas aplicações potenciais, desde usuários individuais até desenvolvedores profissionais.
Os desenvolvedores podem acessar o modelo por meio da API Gemini e do Google AI Studio para criar seus próprios aplicativos, enquanto as empresas podem usar o modelo na plataforma Vertex AI.
Para o usuário comum, esse modelo está integrado diretamente ao Google Gemini e a outros aplicativos, tornando a criação de imagens com IA uma ferramenta acessível e intuitiva.
Com seus recursos excepcionais, especialmente sua capacidade de manter a consistência dos caracteres, o Gemini 2.5 Flash Image tem tudo para se tornar um concorrente de peso para softwares tradicionais de edição de fotos como o Photoshop, mudando a forma como criadores e usuários interagem com imagens digitais.

Fonte: https://vietnamnet.vn/nano-banana-la-gi-ma-khien-moi-nguoi-xon-xao-dung-dau-google-trends-viet-nam-2439283.html








Comentário (0)