Le nouvel outil de ByteDance surpasse sans conteste tous ses concurrents. Photo : ByteDance . |
ByteDance, la société mère de TikTok et Douyin, vient de lancer officiellement Seedance 1.0, un outil d'intelligence artificielle (IA) capable de créer des vidéos à partir de texte et d'images. Il s'agit d'une avancée importante pour le groupe technologique chinois dans sa course au développement d'une plateforme de création de contenu basée sur l'IA.
L'entreprise a récemment publié une étude détaillée sur Seedance 1.0, conçu pour convertir des instructions simples en vidéos de haute qualité sans nécessiter de scripts détaillés ni de commandes complexes. L'outil gère non seulement les prises de vue individuelles, mais combine également plusieurs angles de caméra, assure des transitions fluides et garantit la cohérence des personnages tout au long de la vidéo.
« Nous avons trouvé un moyen de séparer les informations spatiales et temporelles dans les vidéos. Cette technologie utilise une méthode unique pour « coder » la localisation, permettant à l'IA d'apprendre à générer des vidéos à partir de texte et d'images dans le même modèle. Ainsi, l'IA peut générer automatiquement et de manière fluide des vidéos avec différentes scènes », explique ByteDance dans son article de recherche.
ByteDance affirme avec confiance que Seedance 1.0 est supérieur aux outils de création vidéo IA existants sur le marché, notamment dans sa capacité à suivre de près les idées des utilisateurs, la netteté de l'image et le naturel des mouvements des personnages.
Selon Artificial Analysis , une plateforme spécialisée dans l'analyse et l'évaluation des performances des modèles d'IA, Seedance 1.0 surpasse d'autres outils d'IA de génération vidéo tels que Veo 3 de Google, Kling 2.0 de Kuaishou ou Sora d'OpenAI. Cet outil affiche des performances exceptionnelles pour les tâches de conversion de texte en vidéo et d'image en vidéo.
L'entreprise a également révélé que Seedance 1.0 a été entraîné à partir d'un vaste ensemble de données vidéo, collectées auprès de sources publiques et sous licence. Les vidéos d'entraînement ont été soumises à un processus de filtrage rigoureux afin d'éliminer les contenus violents ou sensibles.
De nombreux avis indiquent que la source des données provient principalement de TikTok et de Douyin, deux plateformes exploitées par ByteDance elle-même.
Le processus de formation de Seedance 1.0 est divisé en plusieurs étapes : initialement, l'apprentissage à partir de données d'images et de vidéos riches, puis la poursuite de l'apprentissage de techniques de transition de scènes approfondies dans différents styles.
Les humains jouent également un rôle clé dans le processus de formation : les ingénieurs sélectionnent des vidéos de haute qualité pour l'apprentissage du modèle. La boucle d'apprentissage se poursuit jusqu'à ce que Seedance 1.0 puisse choisir le résultat optimal parmi un grand nombre de vidéos générées à la demande.
Actuellement, Seedance 1.0 limite la durée maximale des vidéos à 5 secondes (contre 8 secondes pour Veo 3). Cependant, son principal avantage réside dans sa rapidité de traitement : créer une vidéo Full HD ne prend que 41 secondes. L'inconvénient de Seedance 1.0 est qu'il ne prend pas en charge le doublage audio automatique, contrairement à son concurrent Google.
ByteDance prévoit de publier prochainement cet outil à la fois pour les utilisateurs réguliers et les créateurs de contenu professionnels, répondant aux besoins de production de vidéos promotionnelles ou de contenu court sur les réseaux sociaux.
Avant Seedance 1.0, ByteDance avait développé des outils de création vidéo basés sur l'IA tels qu'OmniHuman, Goku et Jimeng AI. Cependant, Seedance 1.0 est le premier produit dont l'entreprise affirme avec assurance qu'il surpasse ses concurrents en termes de capacités de création vidéo basée sur l'IA.
Source : https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html
Comment (0)