![]() |
O Nano Banana Pro do Google tem uma qualidade de imagem bastante realista. Foto: Mashable . |
Nos primórdios da tecnologia de imagem por inteligência artificial (IA), os produtos resultantes eram frequentemente facilmente identificáveis como falsos. Imagens com dedos em excesso, detalhes corporais distorcidos ou iluminação irreal eram sinais reveladores comuns.
No entanto, essa era está chegando ao fim. As ferramentas de criação de imagens com inteligência artificial estão se tornando cada vez mais convincentes, não por aperfeiçoarem a imagem em si, mas por incorporarem deliberadamente imperfeições que imitam fotografias reais.
Tendências na criação de imagens com IA
A OpenAI lançou sua ferramenta de geração de imagens DALL-E há menos de cinco anos. A primeira versão só conseguia criar imagens com resolução de 256 x 256 pixels, o que a tornava mais experimental do que prática. Com o DALL-E 2, a resolução foi aumentada para 1024 x 1024 pixels, resultando em imagens significativamente mais realistas. No entanto, os detalhes ainda apresentam anomalias, desde superfícies borradas até objetos difíceis de explicar visualmente.
Ao mesmo tempo, Midjourney e Stable Diffusion também ganharam rapidamente a atenção da comunidade criativa. Nos anos seguintes, os modelos foram continuamente aprimorados, reduzindo erros geométricos e melhorando a visibilidade do texto. No entanto, grande parte da IA ainda parecia "perfeita demais", com iluminação, composição e suavidade assemelhando-se mais a ilustrações do que a fotografias reais.
![]() |
Muitos modelos de IA produzem imagens tão realistas que chegam a ser condizentes com a realidade. Foto: Bloomberg . |
Essa tendência está mudando. Os desenvolvedores estão começando a se voltar para o realismo, recriando as imperfeições inerentes às fotos tiradas com dispositivos comuns, especialmente câmeras de celular.
No segundo semestre de 2025, o Google introduziu o modelo de criação de imagens Nano Banana no aplicativo Gemini, seguido por atualizações adicionais com o Nano Banana Pro. De acordo com a gigante das buscas, este é o modelo de imagem mais realista até o momento, com a capacidade de utilizar conhecimento do mundo real e exibir texto de forma mais eficaz.
Notavelmente, muitas imagens produzidas por este modelo se assemelham bastante às tiradas com smartphones, desde o contraste e a perspectiva até a iluminação e a nitidez.
As fotos tiradas com câmeras de smartphones têm um estilo próprio e único. Devido às limitações do sensor e do tamanho da lente, os smartphones dependem do processamento multiframe para melhorar a qualidade da imagem. Isso cria fotos com áreas escuras realçadas, detalhes destacados e otimizadas para exibição em telas pequenas. A inteligência artificial aprende esse estilo, tornando as imagens mais familiares aos espectadores e, assim, reduzindo a sensação de artificialidade.
O paradoxo das imagens realistas
O Google não é o único caso. O Adobe Firefly oferece uma opção de "aprimoramento de imagem", permitindo que os usuários reduzam o polimento das imagens geradas por IA para que se assemelhem mais a fotografias reais. O Meta também inclui um controle deslizante de "estilo", permitindo que os usuários ajustem o nível de realismo.
Na área de vídeo , ferramentas como o Sora da OpenAI ou o Veo do Google são usadas para criar clipes granulados e de baixa qualidade que imitam imagens de câmeras de segurança, sendo "ruins" o suficiente para serem convincentes.
![]() |
Vídeos produzidos com inteligência artificial estão se tornando cada vez mais realistas. Foto: Bloomberg . |
Segundo alguns especialistas em fotografia, a capacidade da IA de simular imperfeições comuns pode ajudar os modelos a evitar cair no "vale do incomum", um estado em que as imagens se assemelham muito à realidade, mas ainda assim criam uma sensação de desconforto no observador. Em vez de recriar a realidade, a IA precisa simplesmente imitar a forma como os humanos capturam imagens, com todas as suas limitações e imprecisões inerentes.
Esse desenvolvimento representa um desafio significativo para a capacidade de distinguir entre imagens genuínas e falsas. À medida que as imagens geradas por IA se assemelham cada vez mais a fotografias convencionais, identificar sua origem torna-se mais difícil. Em resposta a isso, o padrão C2PA Content Credentials está sendo implementado para adicionar assinaturas criptográficas às imagens, permitindo a rastreabilidade desde o momento da criação.
Atualmente, a maioria das fotos tiradas com smartphones não possui informações de autenticação, e a linha que separa imagens editadas digitalmente daquelas criadas inteiramente por inteligência artificial está cada vez mais tênue. Até que padrões sejam implementados uniformemente em todos os dispositivos e plataformas de compartilhamento, os usuários ainda precisam ter a devida cautela com relação às imagens no espaço digital.
Fonte: https://znews.vn/nghich-ly-cua-ai-tao-anh-post1612058.html









Comentário (0)