A ByteDance, empresa controladora do TikTok, acaba de apresentar um modelo de inteligência artificial (IA) capaz de transformar imagens e áudio em vídeos realistas.
O modelo omnimodal, chamado OmniHuman-1, consegue criar vídeos dinâmicos de personagens falando, cantando e se movendo com "qualidade superior em comparação aos métodos atuais de criação de vídeo", segundo a equipe de desenvolvimento da ByteDance.
A tecnologia de inteligência artificial que cria imagens, vídeos e áudios realistas, também conhecida como "deepfake", está sendo cada vez mais usada em golpes e entretenimento.
A ByteDance é atualmente uma das empresas de IA mais promissoras da China. O aplicativo Doubao, da empresa, é o mais popular entre os usuários da China continental.
Embora o OmniHuman-1 ainda não tenha sido amplamente divulgado ao público, vídeos de demonstração se espalharam rapidamente.
Uma demonstração de destaque foi um vídeo de 23 segundos mostrando Albert Einstein discursando. O TechCrunch descreveu o resultado do aplicativo como "incrivelmente surpreendente" e "os vídeos deepfake mais realistas até hoje".
Os desenvolvedores afirmam que o OmniHuman-1 precisa apenas de uma única imagem como dado de referência, juntamente com dados de áudio, como fala ou canto, para criar um vídeo de qualquer duração.
A taxa de quadros do vídeo de saída pode ser ajustada, assim como as "proporções corporais" dos personagens nele presentes.

Além disso, o modelo de IA, treinado com 19.000 horas de conteúdo de vídeo de fontes inéditas, é capaz de editar vídeos existentes e até mesmo alterar os movimentos das mãos e dos pés humanos com um grau de realismo convincente.
No entanto, a ByteDance também admitiu que o OmniHuman-1 não é perfeito, pois ainda apresenta dificuldades com certas poses, e que "imagens de referência de baixa qualidade" não produzirão o melhor vídeo.
O novo modelo de IA da ByteDance demonstra o progresso da China apesar dos esforços de Washington para restringir as exportações de tecnologia.
Preocupações
No ano passado, deepfakes políticos se espalharam pelo mundo. Na Moldávia, vídeos deepfake imitavam a presidente do país, Maia Sandu, proferindo seu discurso de renúncia.
E na África do Sul, um vídeo deepfake do rapper Eminem apoiando um partido da oposição sul-africana viralizou às vésperas das eleições no país.
Os deepfakes também estão sendo cada vez mais usados para cometer crimes financeiros. Consumidores estão sendo enganados por deepfakes de celebridades recomendando investimentos e oferecendo oportunidades de investimento falsas, enquanto empresas estão perdendo milhões de dólares para impostores que se fazem passar por seus executivos.
Segundo a Deloitte, o conteúdo gerado por IA contribuiu para perdas por fraude superiores a 12 mil milhões de dólares em 2023 e poderá atingir os 40 mil milhões de dólares nos EUA até 2027.
Em fevereiro passado, centenas de pessoas da comunidade de IA assinaram uma carta pedindo regulamentações mais rigorosas sobre deepfakes. Embora não existam leis federais que criminalizem deepfakes nos EUA, mais de 10 estados promulgaram leis contra falsificações geradas por IA.
No entanto, detectar deepfakes não é fácil. Embora algumas plataformas de redes sociais e mecanismos de busca tenham implementado medidas para limitar sua disseminação, a quantidade de conteúdo deepfake online continua crescendo a um ritmo alarmante.
Em uma pesquisa realizada em maio de 2024 pela empresa de verificação de identidade Jumio, 60% dos participantes relataram ter se deparado com um deepfake no último ano; 72% dos entrevistados disseram se preocupar diariamente com a possibilidade de serem enganados por deepfakes, enquanto a maioria apoiou a aprovação de legislação para combater a proliferação de vídeos falsos gerados por IA.
Fonte: https://vietnamnet.vn/model-ai-moi-cua-bytedance-noi-ran-ran-nho-kha-nang-deepfake-2368831.html






Comentário (0)