Según CNBC , OpenAI acaba de presentar Sora, un modelo de IA de nueva generación que funciona de forma similar a su anterior herramienta de IA para la generación de imágenes DALL-E. Los usuarios simplemente introducen la escena deseada y Sora genera un videoclip de alta resolución. Sora también puede crear videoclips inspirados en imágenes fijas y ampliar vídeos existentes o completar fotogramas faltantes.
Perros samoyedo y golden retriever retozan por una ciudad iluminada con neón por la noche en un video generado por IA.
La creación de videos podría ser la próxima frontera de la IA creativa, tras la reciente irrupción de los chatbots y los generadores de imágenes en el mundo del consumo y los negocios. Si bien la creación de contenido entusiasmará a los entusiastas de la IA, estas nuevas tecnologías plantean serias preocupaciones sobre la desinformación a medida que se acercan las principales elecciones políticas mundiales. Según datos de la empresa de aprendizaje automático Clarity, el número de deepfakes generados por IA ha aumentado un 900 % interanual.
Con Sora, OpenAI busca competir con las herramientas de IA para la generación de video de empresas como Google y Meta. Otras startups ofrecen herramientas de IA similares, como Stability AI, que cuenta con un producto llamado Stable Video Diffusion. Amazon también ha lanzado Create with Alexa, un modelo especializado en la generación de contenido animado de corta duración para niños mediante comandos.
Actualmente, Sora se limita a generar vídeos de un minuto o menos. OpenAI se ha propuesto la multimodalidad, un método que combina la generación de texto, imágenes y vídeos, con el fin de ofrecer un conjunto más amplio de modelos de IA.
Hasta el momento, Sora solo se ha puesto a disposición de un pequeño grupo de evaluadores de seguridad, o "equipos rojos", que evalúan el modelo para detectar vulnerabilidades en áreas como la desinformación. La compañía no ha publicado ninguna demostración pública más allá de los 10 vídeos de muestra disponibles en su sitio web, y afirma que pronto publicará la documentación técnica correspondiente.
OpenAI también afirma estar desarrollando un "clasificador de detección" capaz de identificar videoclips generados por Sora, y planea incluir ciertos metadatos en el resultado para ayudar a identificar el contenido generado por IA. Este es el tipo de metadatos que Meta busca utilizar para identificar imágenes generadas por IA.
Sora es un modelo de IA que utiliza la arquitectura Transformer que los investigadores de Google presentaron en un artículo en 2017. En su anuncio, OpenAI dijo que Sora sirve como base para modelos que comprenden y simulan el mundo real.
[anuncio_2]
Enlace de origen
Kommentar (0)