x5p2qoem.png
Eine von Sora erstellte Szene. (Bild: OpenAI)

Sora ist das neue generative KI- Modell von OpenAI und funktioniert ähnlich wie der Bildgenerator Dall-E desselben Unternehmens. Nutzer geben einfach Videomaterial an, und Sora liefert einen hochwertigen Videoclip. Das Modell kann außerdem Videos aus Standbildern erstellen, Videos strecken oder leere Frames auffüllen.

Video könnte die nächste große Herausforderung für generative KI darstellen, da Chatbots und Bildgeneratoren immer mehr Einzug in den Alltag halten. Obwohl KI-Begeisterte die neue Technologie begrüßen, wirft sie angesichts der bevorstehenden globalen Wahlen auch ernsthafte Bedenken hinsichtlich Desinformation auf. Laut Daten des Machine-Learning-Unternehmens Clarity hat die Anzahl KI-generierter Deepfakes im Vergleich zum Vorjahr um 900 % zugenommen.

Mit Sora will OpenAI mit KI-Tools zur Videogenerierung von Konkurrenten wie Meta, Google und Startups wie Stability AI konkurrieren. Amazon hat außerdem Create with Alexa veröffentlicht, ein auf Sprachbefehlen basierendes Modell zur Erstellung kurzer animierter Inhalte für Kinder.

Sora kann nur Videos von maximal einer Minute Länge erstellen, und ein kleines Team – das sogenannte „Red Team“ – nutzt das Modell, um Sicherheitslücken aufzuspüren. OpenAI hat außer den zehn Beispielclips auf seiner Website keine öffentlichen Demos veröffentlicht.

OpenAI entwickelt außerdem einen Klassifikator, der Videoclips als Sora-Produkte identifizieren kann, und plant, bestimmte Metadaten in die Ausgabe einzubinden, um KI-generierte Inhalte besser erkennen zu können. Dieses Vorhaben ähnelt dem von Meta zur Identifizierung KI-generierter Bilder.

Sora verwendet, genau wie ChatGPT, die Transformer-Architektur, die von Google-Forschern in einer Veröffentlichung aus dem Jahr 2017 vorgestellt wurde.

(Laut CNBC)