Sora est le nouveau modèle d'IA générative d'OpenAI, dont le fonctionnement est similaire à celui du générateur d'images Dall-E. Il suffit aux utilisateurs de saisir du contenu vidéo et Sora renvoie un clip vidéo de haute qualité. Il peut également générer des vidéos à partir d'images fixes, étirer des vidéos ou remplir des cadres vides.
La vidéo pourrait être la prochaine frontière de l'IA générative, avec l'arrivée des chatbots et des générateurs d'images dans le monde réel. Bien qu'accueillie favorablement par les passionnés d'IA, cette nouvelle technologie suscite également de vives inquiétudes quant à la désinformation à l'approche d'élections politiques mondiales majeures. Selon les données de Clarity, une entreprise spécialisée dans l'apprentissage automatique, le nombre de deepfakes générés par l'IA a augmenté de 900 % sur un an.
Avec Sora, OpenAI cherche à concurrencer les outils d'IA de génération de vidéos de concurrents comme Meta, Google et des startups comme Stability AI. Amazon a également lancé Create with Alexa, un modèle basé sur des invites pour générer des contenus animés courts destinés aux enfants.
Actuellement, Sora ne peut créer que des vidéos d'une minute ou moins. Une petite équipe, appelée « équipe rouge », utilise également le modèle pour détecter les failles de sécurité. OpenAI n'a publié aucune démonstration publique au-delà des dix extraits disponibles sur son site web.
OpenAI développe également un classificateur capable d'identifier les clips vidéo comme des produits Sora, et prévoit d'inclure certaines métadonnées dans le résultat pour faciliter l'identification du contenu généré par l'IA. Cette démarche est similaire à celle de Meta pour identifier les images générées par l'IA.
Sora, comme ChatGPT, utilise l'architecture Transformer introduite par les chercheurs de Google dans un article de 2017.
(Selon CNBC)
Source
Comment (0)