OpenAI lanza una herramienta de creación de vídeos basada en texto

[anuncio_1]

Según CNBC , OpenAI acaba de presentar Sora, un modelo de IA de nueva generación que funciona de forma similar a su anterior herramienta de IA para la generación de imágenes DALL-E. Los usuarios solo tienen que introducir la escena deseada y Sora generará un videoclip de alta resolución. Sora también puede crear videoclips inspirados en imágenes fijas y ampliar vídeos existentes o completar fotogramas faltantes.

OpenAI ra mắt công cụ sáng tạo video bằng văn bản- Ảnh 1. — Perros samoyedo y golden retriever retozan por una ciudad con luces de neón por la noche en un video generado por IA.

La creación de videos podría ser el siguiente gran paso para la IA creativa, tras la reciente irrupción de los chatbots y los generadores de imágenes en el mundo del consumo y los negocios. Si bien la creación de contenido entusiasmará a los entusiastas de la IA, estas nuevas tecnologías están generando serias preocupaciones sobre la desinformación a medida que se acercan las principales elecciones políticas mundiales. Según datos de la empresa de aprendizaje automático Clarity, el número de deepfakes generados por IA ha aumentado un 900 % interanual.

Con Sora, OpenAI busca competir con las herramientas de IA para la generación de video de empresas como Google y Meta. Otras startups ofrecen herramientas de IA similares, como Stability AI, que cuenta con un producto llamado Stable Video Diffusion. Amazon también ha lanzado Create with Alexa, un modelo especializado en la creación de contenido animado de corta duración para niños basado en comandos.

Actualmente, Sora se limita a generar vídeos de un minuto o menos. OpenAI se ha propuesto la multimodalidad, un método que combina la generación de texto, imágenes y vídeos, con el fin de ofrecer un conjunto más amplio de modelos de IA.

Hasta el momento, Sora solo ha estado disponible para un pequeño grupo de evaluadores de seguridad, o "equipos rojos", encargados de evaluar el modelo en busca de vulnerabilidades en áreas como la desinformación. La compañía no ha publicado ninguna demostración pública más allá de los 10 clips de muestra disponibles en su sitio web, y afirma que pronto publicará la documentación técnica correspondiente.

OpenAI también afirma estar desarrollando un "clasificador de detección" capaz de identificar videoclips generados por Sora, y planea incluir ciertos metadatos en el resultado para ayudar a identificar el contenido generado por IA. Este es el tipo de metadatos que Meta busca utilizar para identificar imágenes generadas por IA.

Sora es un modelo de IA que utiliza la arquitectura Transformer que los investigadores de Google presentaron en un artículo en 2017. En su anuncio, OpenAI dijo que Sora sirve como base para modelos que entienden y simulan el mundo real.

[anuncio_2]
Enlace de origen