A nova ferramenta da ByteDance supera com folga todos os concorrentes. Foto: ByteDance . |
A ByteDance, empresa controladora do TikTok e do Douyin, apresentou oficialmente o Seedance 1.0, uma ferramenta de inteligência artificial (IA) capaz de criar vídeos a partir de texto e imagens. Isso é visto como um passo significativo para a gigante chinesa de tecnologia na corrida para desenvolver plataformas de criação de conteúdo baseadas em IA.
A empresa publicou recentemente um estudo detalhado sobre o Seedance 1.0. De acordo com o estudo, essa ferramenta foi projetada para converter instruções simples em vídeos de alta qualidade sem a necessidade de roteiros detalhados ou comandos complexos. Ela não só lida com tomadas individuais, como também combina múltiplos ângulos de câmera, garante transições suaves e mantém a consistência dos personagens ao longo do vídeo.
“Descobrimos uma maneira de separar informações espaciais e temporais em vídeos. Essa tecnologia usa um método especial para ‘codificar’ a localização, ajudando a IA a aprender a criar vídeos a partir de texto e imagens dentro do mesmo modelo. Como resultado, a IA pode criar automaticamente vídeos com várias tomadas diferentes de forma fluida”, afirmou a ByteDance no artigo de pesquisa.
A ByteDance afirma com confiança que o Seedance 1.0 supera as ferramentas de criação de vídeo com IA existentes no mercado, principalmente em sua capacidade de seguir de perto as ideias do usuário, nitidez da imagem e movimento natural dos personagens.
De acordo com a Artificial Analysis , uma plataforma especializada em analisar e avaliar o desempenho de modelos de IA, o Seedance 1.0 superou outras ferramentas de criação de vídeo com IA, como o Veo 3 do Google, o Kling 2.0 da Kuaishou e o Sora da OpenAI. Essa ferramenta demonstrou desempenho superior tanto em tarefas de conversão de texto para vídeo quanto de imagem para vídeo.
A empresa também revelou que o Seedance 1.0 foi treinado com um enorme banco de dados de vídeos, coletados de fontes públicas e licenciadas. Os vídeos de treinamento passaram por um rigoroso processo de filtragem para remover conteúdo violento ou sensível.
Muitos acreditam que os dados provêm principalmente do TikTok e do Douyin, duas plataformas operadas pela própria ByteDance.
O processo de treinamento do Seedance 1.0 é dividido em várias etapas: inicialmente, aprendendo com dados ricos de imagens e vídeos e, em seguida, aprofundando o aprendizado sobre técnicas de transição em vários estilos.
Os humanos também desempenham um papel crucial no processo de treinamento, pois os engenheiros selecionam vídeos de alta qualidade para o modelo aprender. O ciclo de treinamento continua até que o Seedance 1.0 consiga selecionar, de forma independente, o resultado ideal dentre vários vídeos gerados sob demanda.
Atualmente, o Seedance 1.0 limita a duração dos vídeos a um máximo de 5 segundos (em comparação com os 8 segundos do Veo 3). No entanto, sua principal vantagem é a alta velocidade de processamento: leva apenas 41 segundos para criar um vídeo em Full HD. Uma desvantagem do Seedance 1.0 é que ele ainda não oferece suporte à sobreposição automática de áudio, como seu concorrente do Google.
A ByteDance planeja lançar essa ferramenta em breve, tanto para usuários em geral quanto para criadores de conteúdo profissionais, atendendo às necessidades de produção de vídeos promocionais ou conteúdo curto para mídias sociais.
Antes do Seedance 1.0, a ByteDance já havia desenvolvido ferramentas de criação de vídeo com IA, como o OmniHuman, o Goku e o Jimeng AI. No entanto, o Seedance 1.0 é o primeiro produto que a empresa afirma com confiança ser capaz de superar seus concorrentes em recursos de criação de vídeo com inteligência artificial.
Fonte: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html






Comentário (0)