x5p2qoem.png
Une scène créée par Sora. (Image : OpenAI)

Sora est le nouveau modèle d'IA générative d'OpenAI, fonctionnant de manière similaire au générateur d'images Dall-E du même éditeur. L'utilisateur lui fournit simplement un contenu vidéo , et Sora génère un clip vidéo de haute qualité. Il peut également créer des vidéos à partir d'images fixes, étirer des vidéos ou remplir des images vides.

La vidéo pourrait bien devenir le prochain champ d'exploration de l'IA générative, à l'instar des chatbots et des générateurs d'images qui font leur entrée dans le monde réel. Si cette nouvelle technologie est accueillie favorablement par les passionnés d'IA, elle soulève également de sérieuses inquiétudes quant à la désinformation, à l'approche d'élections politiques mondiales majeures. Selon les données de la société d'apprentissage automatique Clarity, le nombre de deepfakes générés par l'IA a augmenté de 900 % en un an.

Avec Sora, OpenAI entend concurrencer les outils d'IA de génération vidéo proposés par des rivaux tels que Meta, Google et des startups comme Stability AI. Amazon a également lancé Create with Alexa, un modèle basé sur des instructions vocales permettant de générer des contenus animés courts pour enfants.

Sora ne peut créer que des vidéos d'une minute maximum, et une petite équipe – ou « équipe rouge » – utilise le modèle pour rechercher des failles de sécurité. OpenAI n'a publié aucune démonstration publique au-delà des 10 extraits vidéo disponibles sur son site web.

OpenAI développe également un classificateur capable d'identifier les clips vidéo comme étant des produits Sora, et prévoit d'inclure certaines métadonnées dans les résultats afin de faciliter l'identification du contenu généré par l'IA. Cette initiative est similaire à celle de Meta pour l'identification des images générées par l'IA.

Sora, tout comme ChatGPT, utilise l'architecture Transformer introduite par des chercheurs de Google dans un article de 2017.

(Selon CNBC)