Selon CNBC , OpenAI vient de lancer Sora, un modèle d'IA de nouvelle génération fonctionnant de manière similaire à son précédent outil de génération d'images DALL-E. Il suffit aux utilisateurs de saisir la scène souhaitée et Sora renvoie un clip vidéo haute résolution. Sora peut également créer des clips vidéo inspirés d'images fixes et agrandir des vidéos existantes ou compléter les images manquantes.
Des chiens Samoyède et Golden Retriever gambadent dans une ville éclairée au néon la nuit dans une vidéo générée par l'IA
La création vidéo pourrait être la prochaine frontière de l'IA créative, après l'arrivée récente des chatbots et des générateurs d'images dans le monde des consommateurs et des entreprises. Si la création de contenu passionnera les passionnés d'IA, ces nouvelles technologies suscitent de vives inquiétudes quant à la désinformation à l'approche d'élections politiques mondiales majeures. Selon les données de Clarity, une entreprise spécialisée dans l'apprentissage automatique, le nombre de deepfakes générés par l'IA a augmenté de 900 % sur un an.
Avec Sora, OpenAI cherche à concurrencer les outils d'IA de génération de vidéos proposés par des entreprises comme Google et Meta. Des outils d'IA similaires sont disponibles auprès d'autres startups, comme Stability AI, qui propose un produit appelé Stable Video Diffusion. Amazon a également lancé Create with Alexa, un modèle spécialisé dans la génération de contenus animés courts pour enfants, à partir de commandes.
Sora se limite actuellement à la génération de vidéos d'une minute ou moins. OpenAI a fait de la multimodalité, une méthode combinant la génération de texte, d'images et de vidéos, un objectif pour fournir un ensemble plus large de modèles d'IA.
Jusqu'à présent, Sora n'a été mis à la disposition que d'un petit groupe de testeurs de sécurité, ou « équipes rouges », qui testent le modèle pour détecter d'éventuelles vulnérabilités dans des domaines tels que la désinformation. L'entreprise n'a publié aucune démonstration publique au-delà des dix extraits disponibles sur son site web, et indique que la documentation technique correspondante sera bientôt disponible.
OpenAI indique également développer un « classificateur de détection » capable d'identifier les clips vidéo générés par Sora, et prévoit d'inclure certaines métadonnées dans le résultat pour faciliter l'identification du contenu généré par l'IA. C'est ce type de métadonnées que Meta souhaite utiliser pour identifier les images générées par l'IA.
Sora est un modèle d'IA qui utilise l'architecture Transformer que les chercheurs de Google ont présentée dans un article en 2017. Dans son annonce, OpenAI a déclaré que Sora sert de base aux modèles qui comprennent et simulent le monde réel.
Lien source
Comment (0)