ChatGPT "zeichnet wie ein Foto"
Am 26. März sorgte die offizielle Veröffentlichung von „Images in ChatGPT“ durch OpenAI, eine KI-Nutzergemeinschaft weltweit und auch in Vietnam, für großes Aufsehen. Im Fokus standen dabei die neuen Möglichkeiten zur Bilderstellung für Nutzer des intelligenten Modells des Unternehmens. Zuvor konnte ChatGPT zwar auch Bilder erzeugen, war aber in seinen Funktionen eingeschränkt und benötigte das bekannte Text-zu-Bild-Modell DALL-E.
Die Fähigkeit des Tools, Text in Zeichnungen umzuwandeln und Bilder wie in Photoshop zu kombinieren, erregte schnell Aufmerksamkeit. Viele bezeichneten die Bildqualität als „erstaunlich“ und die meisten bewerteten sie im Vergleich zu gängigen KI-Modellen auf dem Markt als „überlegen“.
ChatGPT erzeugt realistische Kaffeetassen mit nur einem einfachen Befehl.
Laut Gabriel Goh, Forschungsleiter bei OpenAI, liegt die signifikante Verbesserung der Bildgenerierungsfähigkeiten von ChatGPT durch das GPT-4o-Modell in der sogenannten „Bindung“. Dieser Begriff beschreibt, inwieweit der KI-Bildgenerator die Verbindung zwischen Attributen und Objekten aufrechterhält. Goh betonte, dass GPT-4o Attribute von 15 bis 20 verschiedenen Objekten präzise und ohne Verwechslung verknüpfen kann, wodurch die Genauigkeit und Zuverlässigkeit der generierten Inhalte deutlich verbessert wird.
ChatGPT zeichnet sich nicht nur durch seine Fähigkeit zur Bilderzeugung aus, sondern behebt auch die gravierende Schwäche anderer KI-gestützter Bildgenerierungstools: die Darstellung von Text innerhalb des Bildes. Tatsächlich werden viele Bilder mit Text präzise dargestellt, wodurch die Unterscheidung zwischen Fälschung und Original deutlich erschwert wird.
Der Nachteil dieses Tools liegt in der langen Dauer der Bilderstellung. Dies wird jedoch als vertretbar angesehen, da die Erstellung qualitativ hochwertiger Bilder mit präzisen Details und der Übereinstimmung mit der Benutzerbeschreibung stets Geduld erfordert. Das Forschungsteam gab an, dass dieses Problem zukünftig behoben wird.
Viele Bedenken hinsichtlich der Möglichkeit, Fotos zu kombinieren
Neben dem anfänglichen Spaß, den ChatGPT und OpenAI den Nutzern bieten, rücken die Themen Informationssicherheit, Datenschutz und Missbrauchsrisiko erneut in den Vordergrund. „In naher Zukunft werden die Bilder, die man online sieht, nicht unbedingt real sein“, äußerte ein Facebook-Nutzer in Vietnam seine Besorgnis, als er ChatGPT bitten konnte, völlig unrealistische Bilder zu erstellen, die täuschend echt aussahen – beispielsweise ein Foto des Schauspielers und ehemaligen Wrestlers Dwayne Johnson (The Rock) in einer Kaugummiwerbung oder ein Bild einer dreifarbigen Katze auf dem Herd, das einem Foto zum Verwechseln ähnlich sieht.
Dank der bereitgestellten detaillierten Befehle können Benutzer überraschende Ergebnisse erzielen, ohne über tiefgreifende Kenntnisse im Umgang mit herkömmlichen Fotobearbeitungsprogrammen verfügen zu müssen.
Viele haben sogar die „Entkleidungsfunktion“ des neuen Tools ausprobiert. TN ( Hanoi ) berichtete, er habe ein Modelbild aus dem Internet verwendet, um ChatGPT anzuweisen, die Kleidung wie gewünscht zu wechseln, und fast alle Befehle seien präzise ausgeführt worden. „Allerdings gab es einige wenige Ablehnungen, hauptsächlich aufgrund von Verstößen gegen die Systemrichtlinien bezüglich urheberrechtlich geschützter Bilder oder zu freizügiger Inhalte“, so TN.
In Thanh Niens Tests weigerte sich ChatGPT, Bilder von bekannten oder urheberrechtlich geschützten Figuren aus der realen Welt, Filmen oder Geschichten zu erstellen. „Ich kann das gewünschte Bild nicht erstellen, da das von Ihnen gesendete Referenzbild eindeutig Doctor Strange zeigt – eine urheberrechtlich geschützte Figur von Marvel. Dies verstößt gegen die geltenden Inhaltsrichtlinien“, antwortete das System auf die Aufforderung, ein Bild von Doctor Strange zu erstellen, der in Vietnam sitzt und Eistee trinkt.
Jackie Shannon, Leiterin der Abteilung für multimodale Produkte bei ChatGPT, bestätigte, dass Bilder in ChatGPT einen starken Schutz vor Deepfakes, pornografischen oder betrügerischen Inhalten bieten. Die generierten Bilder enthalten Metadaten nach C2PA-Standard, um sie als KI-Produkte zu kennzeichnen, benötigen aber separate Tools zur Überprüfung.
Dennoch gibt es immer noch viele, die die Gesetze erfolgreich umgehen und Bilder von Prominenten zu Unterhaltungszwecken verwenden. Beispiele hierfür sind das Bild von CEO Tim Cook mit einem Samsung-Handy anstelle eines iPhones, das Bild von Schauspieler Robert Downey Jr., der ein Gemüsebonbon kaut, oder das Foto von Cristiano Ronaldo, der sich in einer kleinen Gasse in Vietnam vor vielen Zuschauern mit Lionel Messi um einen Ball kämpft.
Quelle: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm






Kommentar (0)