(CLO) O Google acaba de lançar uma nova ferramenta de inteligência artificial (IA) chamada "Whisk", que permite aos usuários fazer upload de fotos para obter imagens combinadas geradas por IA, mesmo que o usuário não insira nenhum texto.
O Whisk usa inteligência artificial para combinar o assunto, o contexto e o estilo da foto enviada, criando uma imagem nova e mais original.
O Whisk é descrito pelo Google como uma "ferramenta criativa" que ajuda os usuários a gerar rapidamente novas ideias visuais sem a necessidade de habilidades profissionais em edição de fotos. Segundo o Google, a ferramenta não é um editor de imagens tradicional, mas sim uma ferramenta divertida de IA que visa estimular a criatividade e a descoberta rápida.
Quando um usuário carrega uma foto, o Whisk utiliza uma combinação do serviço de IA do Google, Gemini, com a tecnologia Imagen 3 – uma ferramenta que cria imagens a partir de texto e que o Google adquiriu da DeepMind.
Gemini analisará a foto e criará uma legenda. Em seguida, a Imagen 3 combinará elementos dessa foto de forma criativa, preservando a "essência" do assunto em vez de copiá-lo exatamente.
Interface da ferramenta Whisk. Captura de tela.
Isso significa que o resultado final pode não ser 100% idêntico à imagem original. Por exemplo, a altura, o penteado ou o tom de pele dos indivíduos na nova imagem podem ser diferentes dos da original. No entanto, os usuários ainda podem ajustar as informações de entrada, alterar o contexto, o estilo ou combinar vários indivíduos para criar imagens diferentes.
O Whisk consegue criar imagens não só a partir de texto, mas também de imagens de banco de imagens, expandindo as possibilidades criativas sem exigir que os usuários tenham experiência em edição de fotos. "O Whisk foi projetado para ajudar os usuários a remixar assuntos, contextos e estilos de maneiras criativas, permitindo que eles explorem visualmente em vez de editar meticulosamente cada pixel", disse Thomas Iljic, diretor de gerenciamento de produtos do Google Labs.
Embora o Whisk ainda esteja em fase inicial de desenvolvimento, a ferramenta foi lançada como um site no Google Labs e já está disponível para usuários nos EUA.
Dan Ives, diretor administrativo e analista sênior da Wedbush Securities, disse que o Whisk representa mais um "momento de demonstração de força" do Google na corrida tecnológica.
Ives também observou que o DeepMind, o laboratório de IA adquirido pelo Google em 2014, é um ativo fundamental para ajudar o Google a manter sua posição no campo da IA. Produtos de IA, incluindo o Whisk, são uma parte essencial da estratégia de desenvolvimento de produtos do Google para os próximos anos, com o lançamento de vários novos produtos previsto para 2025.
A ferramenta Whisk abre novas possibilidades para o uso de IA na criação de produtos criativos com mínima intervenção do usuário. Isso demonstra o avanço da IA na compreensão e combinação criativa de elementos visuais.
O Whisk faz parte de uma tendência crescente entre as principais empresas de tecnologia, incluindo Google e OpenAI, de desenvolver ferramentas de IA voltadas para o consumidor que visam possibilitar novas experiências criativas, desde a geração de imagens, texto e vídeos . A OpenAI lançou recentemente um gerador de texto para vídeo chamado Sora, que compete diretamente com o Whisk.
Ngoc Anh (de acordo com a CNN, The Verge e ZDNET)
Fonte: https://www.congluan.vn/google-ra-mat-cong-cu-tao-hinh-anh-ai-tu-hinh-anh-that-post326441.html










Comentário (0)