O ChatGPT "desenha como uma foto"
No dia 26 de março, a comunidade de usuários de IA (inteligência artificial) em todo o mundo , incluindo no Vietnã, ficou em polvorosa quando a OpenAI lançou oficialmente o recurso de Imagens no ChatGPT, com foco na criação de imagens para os usuários do modelo inteligente da empresa. Anteriormente, o ChatGPT também possuía a capacidade de criar imagens, mas era limitada e dependia de outro modelo famoso de conversão de texto em imagem, o DALL-E.
A capacidade da ferramenta de transformar texto em desenhos e "combinar imagens como no Photoshop" rapidamente chamou a atenção. Muitos disseram que a qualidade da imagem resultante era "incrível" e a maioria a classificou como "superior" em comparação com modelos de IA populares no mercado.
O ChatGPT cria xícaras de café realistas com um simples comando.
Segundo Gabriel Goh, líder da equipe de pesquisa da OpenAI, a melhoria significativa nas capacidades de geração de imagens do ChatGPT usando o modelo GPT-4o reside no "Binding" — um termo que descreve a capacidade do gerador de imagens por IA de manter a ligação entre atributos e objetos. Goh afirmou que o GPT-4o consegue associar com precisão os atributos de 15 a 20 objetos diferentes sem confusão, melhorando significativamente a precisão e a confiabilidade do conteúdo gerado.
Além de ser excepcional na criação de imagens, o recurso Imagens no ChatGPT também resolve a principal desvantagem de outras ferramentas de IA para geração de imagens: a exibição de textos e escritas dentro da imagem. De fato, muitas imagens com texto são exibidas com precisão, tornando mais difícil distinguir entre imagens falsas e reais.
A desvantagem dessa ferramenta é o tempo demorado para gerar as imagens, mas isso é considerado razoável, pois a demora se justifica pela necessidade de paciência para obter imagens de boa qualidade, com detalhes precisos e que correspondam à descrição do usuário. A equipe de pesquisa afirmou que o problema da demora será resolvido em melhorias futuras.
Muitas preocupações sobre a possibilidade de combinar fotos.
Além da diversão inicial proporcionada pelo ChatGPT e pela OpenAI aos usuários, a questão da segurança da informação, da privacidade e do risco de exploração volta à tona. "Em um futuro próximo, as imagens que você vê online não serão necessariamente reais", expressou a preocupação de um usuário do Facebook no Vietnã, ao saber que poderia pedir ao ChatGPT para criar imagens completamente irreais, mas que parecem fotos reais, como por exemplo, uma foto do ator e ex-lutador Dwayne Johnson (The Rock) anunciando uma marca de chiclete, ou a imagem de uma gata tricolor sentada no fogão, idêntica à foto.
Com comandos detalhados, os usuários podem criar resultados surpreendentes sem precisar de conhecimento aprofundado sobre o uso de ferramentas tradicionais de edição de fotos.
Muitas pessoas até testaram a função de "despir" da nova ferramenta. TN ( Hanoi ) disse que usou a foto de uma modelo retirada da internet para pedir ao ChatGPT que trocasse de roupa conforme solicitado e quase todos os comandos foram atendidos com alta precisão. "No entanto, ainda houve algumas rejeições, principalmente devido a violações da política do sistema sobre a criação de imagens protegidas por direitos autorais ou conteúdo excessivamente sensual", compartilhou TN.
Nos testes de Thanh Nien , o ChatGPT se recusou a criar imagens relacionadas a personagens famosos ou protegidos por direitos autorais, sejam eles do mundo real, de filmes ou de histórias. "Não posso criar a imagem conforme solicitado porque a imagem de referência enviada mostra claramente o personagem Doutor Estranho - um personagem da Marvel com direitos autorais - e isso viola a política de conteúdo atual", respondeu o sistema quando solicitado a criar uma imagem do Doutor Estranho sentado... bebendo chá gelado no Vietnã.
Jackie Shannon, chefe de produtos multimodais da ChatGPT, confirmou que as imagens na plataforma possuem forte proteção contra deepfakes, conteúdo pornográfico ou fraudulento. Vale ressaltar que as imagens geradas integrarão metadados padrão C2PA para identificá-las como produtos de IA, mas necessitarão de ferramentas específicas para verificação.
No entanto, ainda existem muitas pessoas que conseguem "contornar a lei" e usar imagens de pessoas famosas para fins de entretenimento. Por exemplo, a imagem do CEO Tim Cook segurando um celular Samsung em vez de um iPhone, ou a imagem do ator Robert Downey Jr. mastigando uma bala de legumes, ou a foto de Cristiano Ronaldo disputando uma bola com Lionel Messi em um beco estreito no Vietnã na frente de várias pessoas...
Fonte: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm






Comentário (0)