x5p2qoem.png
Une scène créée par Sora. (Image : OpenAI)

Sora est le nouveau modèle d'IA générative d'OpenAI, dont le fonctionnement est similaire à celui du générateur d'images Dall-E du même fabricant. Il suffit aux utilisateurs de saisir du contenu vidéo et Sora renvoie un clip vidéo de haute qualité. Il peut également créer des vidéos à partir d'images fixes, les étirer ou remplir des cadres vides.

La vidéo pourrait être la prochaine frontière de l'IA générative, avec l'arrivée des chatbots et des générateurs d'images dans le monde réel. Bien qu'accueillie favorablement par les adeptes de l'IA, cette nouvelle technologie suscite également de vives inquiétudes quant à la désinformation à l'approche d'élections politiques mondiales majeures. Selon les données de Clarity, une entreprise spécialisée dans l'apprentissage automatique, le nombre de deepfakes générés par l'IA a augmenté de 900 % d'une année sur l'autre.

Avec Sora, OpenAI cherche à concurrencer les outils d'IA de génération de vidéos de concurrents comme Meta, Google et des startups comme Stability AI. Amazon a également lancé Create with Alexa, un modèle basé sur des invites pour générer des contenus animés courts destinés aux enfants.

Sora ne peut créer que des vidéos d'une minute maximum, et un petit groupe, ou « équipe rouge », utilise le modèle pour détecter des failles de sécurité. OpenAI n'a publié aucune démonstration publique au-delà des dix extraits disponibles sur son site web.

OpenAI développe également un classificateur capable d'identifier les clips vidéo comme des produits Sora et prévoit d'inclure certaines métadonnées dans le résultat pour faciliter l'identification du contenu généré par l'IA. Cette initiative est similaire à celle de Meta pour identifier les images générées par l'IA.

Sora, comme ChatGPT, utilise l'architecture Transformer introduite par les chercheurs de Google dans un article de 2017.

(Selon CNBC)