ChatGPT "zeichnet wie ein Foto"
Am 26. März sorgte die offizielle Veröffentlichung von „Images in ChatGPT“ durch OpenAI, ein Tool zur Bilderstellung für Nutzer seines intelligenten Modells, für Aufsehen in der globalen und vietnamesischen KI-Nutzergemeinschaft. ChatGPT bot zwar bereits zuvor Bildbearbeitungsfunktionen, diese waren jedoch eingeschränkt und basierten auf dem bekannten Text-zu-Bild-Modell DALL-E.
Die Fähigkeit des Tools, Text in Zeichnungen umzuwandeln und Bilder in Photoshop-Qualität zusammenzufügen, erregte schnell Aufmerksamkeit. Viele Nutzer bezeichneten die Bildqualität als „verblüffend“, und die meisten bewerteten sie als „überlegen“ gegenüber anderen gängigen KI-Modellen auf dem Markt.
ChatGPT erzeugt realistische Kaffeetassenbilder mit nur einem einfachen Befehl.
Laut Gabriel Goh, Forschungsleiter bei OpenAI, liegt die signifikante Verbesserung der Bildgenerierungsfähigkeiten von ChatGPT durch den Einsatz des GPT-4o-Modells in der sogenannten „Bindung“. Dieser Begriff beschreibt, inwieweit der KI-Bildgenerator Verbindungen zwischen Attributen und Objekten aufrechterhält. Goh betont, dass GPT-4o Attribute für 15 bis 20 verschiedene Objekte fehlerfrei verknüpfen kann, wodurch die Genauigkeit und Zuverlässigkeit der generierten Inhalte deutlich verbessert wird.
ChatGPT zeichnet sich nicht nur durch seine hervorragende Bilderstellung aus, sondern behebt auch eine entscheidende Schwäche anderer KI-gestützter Bildbearbeitungswerkzeuge: die Darstellung von Text in Bildern. Tatsächlich werden viele Bilder mit Text präzise gerendert, wodurch es zunehmend schwieriger wird, zwischen echten und gefälschten Bildern zu unterscheiden.
Ein Nachteil des Tools ist die relativ lange Bildgenerierungszeit. Dies wird jedoch als vertretbar angesehen, da die Erstellung hochwertiger Bilder mit präzisen Details, die der Benutzerbeschreibung entsprechen, Geduld erfordert. Das Forschungsteam gab an, dass dieses Problem zukünftig behoben wird.
Es wurden zahlreiche Bedenken hinsichtlich der Möglichkeit der Bildmanipulation geäußert.
Neben dem anfänglichen Vergnügen, das ChatGPT und OpenAI den Nutzern bereiten, rücken Bedenken hinsichtlich Informationssicherheit, Datenschutz und Missbrauchsgefahr erneut in den Vordergrund. „Bald könnten die Bilder, die man online sieht, nicht mehr echt sein“, äußerte ein Facebook-Nutzer in Vietnam seine Besorgnis. Er könnte ChatGPT beauftragen, komplett gefälschte Bilder zu erstellen, die täuschend echt aussehen, beispielsweise ein Bild des Schauspielers und ehemaligen Wrestlers Dwayne Johnson (The Rock) für eine Kaugummimarke oder eine dreifarbige Katze auf einem Herd, die aussieht wie ein Foto.
Dank der bereitgestellten detaillierten Befehle können Benutzer überraschende Ergebnisse erzielen, ohne über tiefgreifende Kenntnisse herkömmlicher Fotobearbeitungswerkzeuge verfügen zu müssen.
Tatsächlich haben viele Nutzer sogar die neue „Ausziehfunktion“ des Tools ausprobiert. TN ( Hanoi ) berichtete, sie habe das Foto eines Models aus dem Internet verwendet, um ChatGPT zu bitten, ihre Kleidung wie gewünscht zu wechseln. Fast alle Anfragen seien präzise erfüllt worden. „Allerdings gab es einige wenige Fälle, in denen Anfragen abgelehnt wurden, hauptsächlich aufgrund von Verstößen gegen die Systemrichtlinien bezüglich der Erstellung urheberrechtlich geschützter Bilder oder zu anzüglicher Inhalte“, so TN.
In Tests der Zeitung Thanh Nien weigerte sich ChatGPT, Bilder von bekannten oder urheberrechtlich geschützten Figuren aus der realen Welt, Filmen oder Comics zu erstellen. „Ich kann das gewünschte Bild nicht erstellen, da das von Ihnen gesendete Referenzbild eindeutig Doctor Strange zeigt – eine urheberrechtlich geschützte Figur von Marvel – und dies gegen unsere aktuellen Inhaltsrichtlinien verstößt“, antwortete das System auf die Aufforderung, ein Bild von Doctor Strange zu erstellen, der in Vietnam sitzt und Eistee trinkt.
Jackie Shannon, Leiterin der multimodalen Produktentwicklung bei ChatGPT, bestätigt, dass die Bilder in ChatGPT einen zuverlässigen Schutz vor Deepfakes, pornografischen oder betrügerischen Inhalten bieten. Die generierten Bilder enthalten standardmäßige C2PA-Metadaten, um sie als KI-Produkte zu kennzeichnen, benötigen aber ein separates Tool zur Verifizierung.
Viele Menschen umgehen jedoch weiterhin erfolgreich die Regeln und verwenden Bilder von Prominenten zu Unterhaltungszwecken. Beispiele hierfür sind ein Foto von CEO Tim Cook mit einem Samsung-Handy anstelle eines iPhones, ein Bild von Schauspieler Robert Downey Jr., der ein Gemüsebonbon kaut, oder eine Reihe von Gemälden, die Cristiano Ronaldo und Lionel Messi beim Ballspiel in einer kleinen Gasse in Vietnam vor zahlreichen Zuschauern zeigen.
Quelle: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm






Kommentar (0)