La société mère de TikTok lance une technologie pour concurrencer Google.

Le nouvel outil de ByteDance surpasse sans conteste tous ses concurrents. Photo : ByteDance .

ByteDance, la société mère de TikTok et Douyin, a officiellement lancé Seedance 1.0, un outil d'intelligence artificielle (IA) capable de créer des vidéos à partir de textes et d'images. Cette initiative marque une étape importante pour le géant technologique chinois dans la course au développement de plateformes de création de contenu basées sur l'IA.

L'entreprise a récemment publié une étude détaillée sur Seedance 1.0. Selon cette étude, cet outil est conçu pour convertir des instructions simples en vidéos de haute qualité sans nécessiter de scripts détaillés ni de commandes complexes. Il gère non seulement les plans individuels, mais combine également plusieurs angles de caméra, assure des transitions fluides et garantit la cohérence des personnages tout au long de la vidéo.

« Nous avons trouvé un moyen de séparer les informations spatiales et temporelles dans une vidéo. Cette technologie utilise une méthode spéciale pour « encoder » la localisation, permettant ainsi à l'IA d'apprendre à créer des vidéos à partir de texte et d'images au sein d'un même modèle. De ce fait, l'IA peut créer automatiquement des vidéos comportant plusieurs plans différents de manière fluide », a déclaré ByteDance dans son article de recherche.

ByteDance affirme avec assurance que Seedance 1.0 surpasse les outils de création vidéo par IA existants sur le marché, notamment grâce à sa capacité à suivre de près les idées de l'utilisateur, la netteté de l'image et le mouvement naturel des personnages.

D'après Artificial Analysis , une plateforme spécialisée dans l'analyse et l'évaluation des performances des modèles d'IA, Seedance 1.0 surpasse d'autres outils de création vidéo par IA tels que Veo 3 de Google, Kling 2.0 de Kuaishou et Sora d'OpenAI. Cet outil a démontré des performances supérieures aussi bien pour la conversion de texte en vidéo que pour la conversion d'images en vidéo.

L'entreprise a également révélé que Seedance 1.0 avait été entraîné sur une vaste base de données vidéo, constituée à partir de sources publiques et sous licence. Les vidéos d'entraînement ont fait l'objet d'un filtrage rigoureux afin d'éliminer tout contenu violent ou sensible.

Beaucoup pensent que les données proviennent principalement de TikTok et Douyin, deux plateformes exploitées par ByteDance elle-même.

Le processus de formation Seedance 1.0 est divisé en plusieurs étapes : un apprentissage initial à partir de données d’images et de vidéos riches, puis un apprentissage approfondi des techniques de transition dans différents styles.

L'intervention humaine est également cruciale dans le processus d'apprentissage : les ingénieurs sélectionnent des vidéos de haute qualité pour le modèle. Ce cycle d'apprentissage se poursuit jusqu'à ce que Seedance 1.0 soit capable de sélectionner de manière autonome le résultat optimal parmi de nombreuses vidéos générées à la demande.

Actuellement, Seedance 1.0 limite la durée des vidéos à 5 secondes maximum (contre 8 secondes pour Veo 3). Son principal atout réside toutefois dans sa rapidité de traitement : la création d'une vidéo Full HD ne prend que 41 secondes. Un inconvénient de Seedance 1.0 est l'absence, à ce jour, de la fonction d'incrustation audio automatique, contrairement à son concurrent de Google.

ByteDance prévoit de lancer prochainement cet outil à destination des utilisateurs lambda et des créateurs de contenu professionnels, répondant ainsi à leurs besoins en matière de production de vidéos promotionnelles ou de contenus courts pour les réseaux sociaux.

Avant Seedance 1.0, ByteDance avait développé des outils de création vidéo basés sur l'IA, tels qu'OmniHuman, Goku et Jimeng AI. Cependant, Seedance 1.0 est le premier produit dont l'entreprise affirme avec assurance qu'il surpasse ses concurrents en matière de création vidéo assistée par l'IA.

Source : https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html