ChatGPT „zeichnet wie ein Foto“
Am 26. März sorgte die KI-Nutzergemeinde weltweit und auch in Vietnam für Aufsehen, als OpenAI offiziell Images in ChatGPT veröffentlichte. Der Fokus lag dabei auf den Möglichkeiten zur Bilderzeugung für Nutzer des intelligenten Modells des Unternehmens. Zuvor konnte ChatGPT zwar auch Bilder erstellen, allerdings nur eingeschränkt und musste auf ein anderes bekanntes Text-zu-Bild-Modell, DALL-E, zurückgreifen.
Die Fähigkeit des Tools, Text in Zeichnungen umzuwandeln und Bilder wie in Photoshop zu kombinieren, erregte schnell Aufmerksamkeit. Viele bezeichneten die Bildqualität als „erstaunlich“ und die meisten bewerteten es als „überlegen“ im Vergleich zu gängigen KI-Modellen auf dem Markt.
ChatGPT erstellt realistische Kaffeetassen mit nur einem einfachen Befehl
Laut Gabriel Goh, Forschungsteamleiter bei OpenAI, liegt die signifikante Verbesserung der Bildgenerierungsfunktionen von ChatGPT mithilfe des GPT-4o-Modells in der „Bindung“ – ein Begriff für den Grad, in dem der KI-Bildgenerator die Verbindung zwischen Attributen und Objekten aufrechterhält. Herr Goh behauptete, dass GPT-4o Attribute für 15 bis 20 verschiedene Objekte präzise und ohne Verwechslung verknüpfen kann, was die Genauigkeit und Zuverlässigkeit der generierten Inhalte deutlich verbessert.
Images in ChatGPT zeichnet sich nicht nur durch herausragende Bildbearbeitungsfähigkeiten aus, sondern behebt auch die fatale Schwäche anderer KI-Tools zur Bildgenerierung: die Anzeige von Schrift und Text im Bild. Viele Bilder mit Text werden präzise dargestellt, wodurch die Unterscheidung zwischen Fälschung und Original noch schwieriger wird.
Der Nachteil dieses Tools ist die lange Zeit, die zum Generieren von Bildern benötigt wird. Dies wird jedoch als angemessen erachtet, da die Verzögerung entsteht, da qualitativ hochwertige Bilder, genaue Details und die Übereinstimmung mit der Benutzerbeschreibung stets Geduld erfordern. Das Forschungsteam sagte, das Verzögerungsproblem werde in Zukunft behoben.
Viele Bedenken hinsichtlich der Möglichkeit, Fotos zu kombinieren
Neben dem anfänglichen Spaßfaktor, den ChatGPT und OpenAI den Nutzern bieten, rücken auch die Themen Informationssicherheit, Datenschutz und das Risiko der Ausbeutung wieder einmal in den Vordergrund. „In naher Zukunft könnten die Bilder, die Sie online sehen, nicht unbedingt echt sein“, äußerte ein Facebook-Nutzer in Vietnam seine Besorgnis, als er ChatGPT bitten konnte, völlig unwirkliche Bilder zu erstellen, die so echt wie Fotos aussehen, beispielsweise ein Foto des Schauspielers und ehemaligen Wrestlers Dwayne Johnson (The Rock), der für eine Kaugummimarke wirbt, oder ein Foto einer dreifarbigen Katze, die auf dem Herd sitzt und exakt wie ein Foto aussieht.
Mit den bereitgestellten detaillierten Befehlen können Benutzer überraschende Ergebnisse erzielen, ohne über umfassende Kenntnisse in der Verwendung herkömmlicher Fotobearbeitungstools verfügen zu müssen.
Viele Nutzer haben sogar die „Stripping“-Funktion des neuen Tools ausprobiert. TN ( Hanoi ) sagte, er habe ChatGPT anhand eines Modelfotos aus dem Internet gebeten, sich wie gewünscht umzuziehen, und fast alle Aufträge seien mit hoher Genauigkeit ausgeführt worden. „Es gab jedoch immer noch einige Ablehnungen, hauptsächlich aufgrund von Verstößen gegen die Systemrichtlinien zur Erstellung urheberrechtlich geschützter Bilder oder übermäßig sexy Inhalten“, teilte TN mit.
In Thanh Niens Tests weigerte sich ChatGPT, Bilder zu erstellen, die mit berühmten oder urheberrechtlich geschützten Figuren aus der realen Welt oder aus Filmen und Geschichten in Verbindung stehen. „Ich kann das gewünschte Bild nicht erstellen, da das von Ihnen gesendete Referenzbild eindeutig die Figur Doctor Strange zeigt – eine urheberrechtlich geschützte Figur von Marvel, und dies verstößt gegen die aktuellen Inhaltsrichtlinien“, antwortete das System auf die Aufforderung, ein Bild von Doctor Strange zu erstellen, der in Vietnam sitzt und Eistee trinkt.
Jackie Shannon, Leiterin für multimodale Produkte bei ChatGPT, bestätigte, dass Bilder in ChatGPT einen starken Schutz vor Deepfake, pornografischen oder betrügerischen Inhalten bieten. Die generierten Bilder integrieren insbesondere C2PA-Standardmetadaten, um sie als KI-Produkte zu kennzeichnen. Zur Überprüfung sind jedoch separate Tools erforderlich.
Dennoch gibt es immer noch viele Menschen, die erfolgreich das Gesetz brechen und Bilder berühmter Persönlichkeiten zu Unterhaltungszwecken verwenden. Zum Beispiel das Bild von CEO Tim Cook, der ein Samsung-Handy statt eines iPhones hält, oder das Bild von Schauspieler Robert Downey Jr., der auf einem Gemüsebonbon kaut, oder das Bild von Cristiano Ronaldo, der mit Lionel Messi in einer kleinen Gasse in Vietnam vor vielen Menschen um einen Ball spielt …
[Anzeige_2]
Quelle: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm
Kommentar (0)