La nueva herramienta de ByteDance supera con creces a la competencia. Foto: ByteDance . |
ByteDance, la empresa matriz de TikTok y Douyin, acaba de presentar oficialmente Seedance 1.0, una herramienta de inteligencia artificial (IA) capaz de crear vídeos a partir de texto e imágenes. Este se considera un importante avance para el grupo tecnológico chino en su carrera por desarrollar una plataforma de creación de contenido basada en IA.
La compañía publicó recientemente un informe de investigación detallado sobre Seedance 1.0, diseñado para convertir instrucciones sencillas en videos de alta calidad sin necesidad de guiones detallados ni comandos complejos. La herramienta no solo gestiona tomas individuales, sino que también combina múltiples ángulos de cámara, transiciones fluidas y garantiza la coherencia de los personajes a lo largo del video.
Hemos descubierto una manera de separar la información espacial y temporal de los vídeos. Esta tecnología utiliza un método único para codificar la ubicación, lo que permite a la IA aprender a generar vídeos a partir de texto e imágenes en el mismo modelo. Como resultado, la IA puede generar automáticamente vídeos con diferentes escenas sin problemas, según ByteDance en el artículo de investigación.
ByteDance afirma con confianza que Seedance 1.0 es superior a las herramientas de creación de videos de IA existentes en el mercado, especialmente en su capacidad de seguir de cerca las ideas del usuario, la nitidez de la imagen y la naturalidad en los movimientos de los personajes.
Según Artificial Analysis , plataforma especializada en el análisis y la evaluación del rendimiento de modelos de IA, Seedance 1.0 ha superado a otras herramientas de IA para la generación de vídeo, como Veo 3 de Google, Kling 2.0 de Kuaishou o Sora de OpenAI. Esta herramienta muestra un rendimiento excepcional tanto en la conversión de texto a vídeo como en la conversión de imagen a vídeo.
La compañía también reveló que Seedance 1.0 se entrenó con un conjunto masivo de datos de video, recopilados de fuentes públicas y con licencia. Los videos de entrenamiento se sometieron a un riguroso proceso de filtrado para eliminar contenido violento o sensible.
Muchas opiniones dicen que la fuente de datos proviene principalmente de TikTok y Douyin, dos plataformas operadas por el propio ByteDance.
El proceso de entrenamiento de Seedance 1.0 se divide en varias etapas: inicialmente se aprende a partir de datos enriquecidos de imágenes y videos y luego se continúa aprendiendo técnicas profundas de transición de escenas en diferentes estilos.
Los humanos también desempeñan un papel fundamental en el proceso de entrenamiento, ya que los ingenieros seleccionan videos de alta calidad para que el modelo aprenda. El ciclo de entrenamiento continúa hasta que Seedance 1.0 pueda seleccionar el resultado óptimo entre una gran cantidad de videos generados bajo demanda.
Actualmente, Seedance 1.0 limita la duración máxima de vídeo a 5 segundos (en comparación con los 8 segundos de Veo 3). Sin embargo, su principal ventaja es su rápida velocidad de procesamiento: solo se necesitan 41 segundos para crear un vídeo Full HD. Una desventaja de Seedance 1.0 es que no admite el doblaje automático de audio como su competidor de Google.
ByteDance planea lanzar pronto esta herramienta tanto para usuarios habituales como para creadores de contenidos profesionales, atendiendo las necesidades de producción de vídeos promocionales o contenidos cortos en redes sociales.
Antes de Seedance 1.0, ByteDance había desarrollado herramientas de creación de videos con IA como OmniHuman, Goku y Jimeng AI. Sin embargo, Seedance 1.0 es el primer producto que la compañía afirma con seguridad que puede superar a sus competidores en cuanto a capacidades de creación de videos con IA.
Fuente: https://znews.vn/cong-ty-me-tiktok-ra-mat-cong-nghe-thach-thuc-google-post1562025.html
Kommentar (0)