Das Risiko, dass KI außer Kontrolle gerät.

Tạp chí Doanh Nghiệp•24/02/2024

Die Entwicklung von KI birgt sowohl positive als auch negative Aspekte. Und mit dem Aufkommen von Sora wird die Technologie noch brisanter werden.

Sora – OpenAIs „neuer Horizont“

Soralá stellt einen großen Fortschritt für OpenAI dar und ermöglicht die Umwandlung von Text in Bilder von unglaublicher Qualität.

Im Japanischen bedeutet „Sora“ Himmel. Das Forschungsteam hinter dieser Technologie wählte den Namen Sora, weil er die Idee unbegrenzten kreativen Potenzials weckt.

Sora kann Animationen mit mehreren Charakteren, Bewegungen und detaillierten Hintergründen erstellen. Das Tool versteht nicht nur Befehle, sondern auch deren reale Darstellung. Es hat das Potenzial, die Arbeit von Filmemachern zu beschleunigen und weniger erfahrene Grafiker vollständig zu ersetzen.

Sora ist nicht das einzige KI-Programm, das erfolgreich Text in Bilder umgewandelt hat. Im vergangenen Jahr haben zahlreiche andere Softwareprogramme dasselbe geleistet. Produkte, die mithilfe von KI-Technologie entwickelt werden, werden immer ausgefeilter und realistischer.

Soras überlegene Technologie

Um realistisch wirkende Videos zu erstellen, muss Sora die Sprache, Anfragen und Befehle des Nutzers verstehen können. Doch damit nicht genug: Sora muss auch die Gesetze der Physik, die Bewegung von Objekten und die Veränderungen von Licht und Schatten bei der Bewegung der Spielfigur verstehen.

Die Anweisung lautete beispielsweise, dass ein Mädchen nachts durch eine Straße in Tokio laufen sollte. Und das Ergebnis von Sora war nahezu perfekt. Nur bei genauerem Hinsehen fallen die kleinen Fehler im Video auf.

Das Video ist zu 99 % realistisch und zeigt lebendige Details wie die Schatten von Straßenlaternen, die sich durch die Pfützen auf dem Boden werfen. Diese Elemente sind nicht in der Anleitung enthalten; die KI versteht die Gesetze der realen Physik und erzeugt sie automatisch.

Laut AI News basiert die Technologie hinter Sora teilweise auf GPT-4. Dabei handelt es sich um ein großes multimodales Modell, das Text- und Bildeingaben verarbeiten kann. GPT-4 aktualisiert das große Sprachmodell von OpenAI, das mit umfangreichen Online-Daten trainiert wurde, um komplexe Antworten auf Nutzeranfragen zu generieren.

Der Rest von Sora ist ein Diffusionsmodell, das statisches Rauschen in ein kohärentes Video umwandelt, indem es dieses Rauschen in mehreren Schritten schrittweise reduziert. Sora verwendet außerdem eine ähnliche Technologie wie Dalle-3: die Umwandlung von Text in Bilder, in diesem Fall in unglaublich realistische Videos.

Wie wird KI den Kreativbereich beeinflussen?

Menschen, die in den Bereichen visuelle Kunst, Film und Grafikdesign arbeiten, sind sehr an der Entwicklung von KI interessiert. In Hollywood, der Welthauptstadt des Films, haben Experten die Auswirkungen von KI untersucht.

Laut dem Bericht gehen 21,4 % der Filmemacher, Fernsehproduzenten und Animatoren in Hollywood davon aus, bis 2026 durch KI ersetzt zu werden.

Im vergangenen Sommer begann Netflix mit der Suche nach einem KI-Produktmanager mit einem exorbitanten Gehalt zwischen 300.000 und 900.000 US-Dollar, das um ein Vielfaches höher ist als das Gehalt eines durchschnittlichen, unbekannten Schauspielers.

Bedenken hinsichtlich der unkontrollierten Entwicklung von KI.

Der Trend der künstlichen Intelligenz gleicht einer riesigen Welle. Wer lernt, auf ihr zu surfen und so immer an der Spitze bleibt, sichert sich mit hoher Wahrscheinlichkeit seinen Job und seine Position und kann sogar davon profitieren.

Doch Chancen bergen stets auch Risiken. Auch diese hochentwickelten KI-Programme stellen Risiken dar. Und mit der unvorstellbaren Entwicklung der KI werden diese Risiken immer besorgniserregender.

Laut Dr. Tran Van Canh, einem Datenwissenschaftler an der Fakultät für Informationstechnologie der Universität Heidelberg, weist das aktuelle Sora-Modell zwar viele Mängel auf, wie etwa die Verwechslung von links und rechts oder das Versäumnis, ein durchgehendes Bild im gesamten Video beizubehalten, doch das Risiko, dass Sora Fehlinformationen erzeugt, ist durchaus gegeben, was es noch schwieriger macht, im Internet die Wahrheit zu erkennen.

„Mit der Sora-App ist es sehr schwierig, zwischen echten und gefälschten Nachrichten zu unterscheiden, da die von Sora erstellten Videos äußerst authentisch wirken. OpenAI selbst sucht nach Lösungen, um dieses Problem zu beheben. Wir müssen jedoch akzeptieren, dass es keine absolut sichere Lösung gibt. Zukünftig wird die App es Nutzern ermöglichen, Bilder und Texte bereitzustellen, um neue Videos zu erstellen. Dadurch wird es sehr einfach, Aussagen einflussreicher Persönlichkeiten weltweit zu fälschen und der Öffentlichkeit erheblichen Schaden zuzufügen“, kommentierte Dr. Tran Van Canh.

Vor Sora hatte OpenAI zwei Produkte veröffentlicht: ChatGPT, das menschenähnliche Texte generieren kann, und die DALL-E-Technologie, die sogenannte Deepfakes erzeugt – eine Technik, die mithilfe von KI gefälschte Audio-, Bild- und Videodateien erstellt. Viele Menschen sind bereits Deepfakes zum Opfer gefallen, darunter der Papst, der ehemalige US-Präsident Donald Trump und erst kürzlich Popstar Taylor Swift, deren Gesicht für die Erstellung gefälschter pornografischer Bilder manipuliert wurde.

„OpenAI ist in der Tat ein Pionierunternehmen im Bereich der GenAI-Technologie. Sie verfügen über ein hervorragendes Team von Wissenschaftlern . Die Investitionen in KI-Modelle, Personal und maschinelles Lernen sind enorm, daher weisen die von OpenAI entwickelten Produkte einen sehr hohen Grad an Realismus auf“, sagte Dr. Tran Van Canh.

Dies zeigt, dass die Entwicklung von KI sowohl positive als auch negative Aspekte in die sich ständig wandelnde Welt des Internets einbringt. Mit dem Aufkommen von Sora wird der technologische Wettlauf voraussichtlich noch intensiver werden. Aktuell forschen und entwickeln auch große Technologieunternehmen wie Meta, Google und Runway AI an KI-Technologien zur Erstellung von Videos aus Text und haben bereits mehrere ähnliche Modelle angekündigt.

Laut VTV

Quelle