ChatGPT "rita som ett foto"
Den 26 mars var AI-användargemenskapen (artificiell intelligens) runt om i världen såväl som i Vietnam i full gång när OpenAI officiellt släppte Images i ChatGPT, med fokus på bildskapandefunktioner för användare av företagets intelligenta modell. Tidigare hade ChatGPT också möjligheten att skapa bilder men var begränsad och fick gå igenom en annan berömd text-till-bild-modell, DALL-E.
Verktygets förmåga att omvandla text till teckningar och ”kombinera bilder som Photoshop” väckte snabbt uppmärksamhet. Många sa att bildkvaliteten var ”fantastisk” och de flesta betygsatte den som ”överlägsen” jämfört med populära AI-modeller på marknaden.
ChatGPT skapar realistiska kaffekoppar med bara ett enkelt kommando
Enligt Gabriel Goh, en forskargruppsledare på OpenAI, är den betydande förbättringen av ChatGPT:s bildgenereringskapacitet med hjälp av GPT-4o-modellen "bindande" - en term för i vilken utsträckning AI-bildgeneratorn upprätthåller länken mellan attribut och objekt. Goh hävdade att GPT-4o korrekt kan länka attribut för 15-20 olika objekt utan förvirring, vilket avsevärt förbättrar noggrannheten och tillförlitligheten hos det genererade innehållet.
Bilder i ChatGPT är inte bara enastående i sin förmåga att skapa bilder, utan löser även den "dödliga" svagheten hos andra bildgenererande AI-verktyg, vilket är att visa text och text inuti bilden. Faktum är att många bilder som innehåller text visas korrekt, vilket gör bilden svårare att skilja mellan falsk och äkta.
Nackdelen med det här verktyget är att det tar lång tid att generera bilder, men det anses rimligt eftersom fördröjningen uppstår eftersom bilder av god kvalitet, korrekta detaljer och att de matchar användarens beskrivning alltid kräver tålamod. Forskargruppen sa att fördröjningsproblemet kommer att förbättras i framtiden.
Många farhågor kring möjligheten att kombinera foton
Förutom den roliga introduktionsupplevelsen som ChatGPT och OpenAI ger användarna, lyfts återigen fram frågan om informationssäkerhet, integritet samt risken för utnyttjande. ”Inom en snar framtid är bilderna du ser online inte nödvändigtvis verkliga”, uttryckte en Facebook-användare i Vietnam oro när han kunde be ChatGPT att skapa helt overkliga bilder men som ser lika verkliga ut som foton, till exempel ett foto på skådespelaren och före detta brottaren Dwayne Johnson (The Rock) som gör reklam för ett tuggummimärke, eller en bild på en kaliköt som sitter på spisen och som ser exakt ut som ett foto.
Med detaljerade kommandon kan användare skapa överraskande resultat utan att behöva djupgående kunskaper i traditionella fotoredigeringsverktyg.
Många har till och med provat det nya verktygets "strippnings"-funktion. TN ( Hanoi ) sa att han använde ett modellfoto taget från internet för att be ChatGPT att byta kläder enligt begäran och nästan alla kommandon uppfylldes med hög noggrannhet. "Det förekom dock fortfarande några gånger avslag, främst på grund av brott mot systemets policy för att skapa upphovsrättsskyddade bilder eller ha alltför sexigt innehåll", delade TN.
I Thanh Niens tester vägrade ChatGPT att skapa bilder relaterade till kända eller upphovsrättsskyddade karaktärer i den verkliga världen eller i filmer och berättelser. "Jag kan inte skapa bilden som begärts eftersom referensbilden du skickade tydligt visar karaktären Doctor Strange - en upphovsrättsskyddad Marvel-karaktär och detta bryter mot den nuvarande innehållspolicyn", svarade systemet när de ombads att skapa en bild av Doctor Strange som satt... och dricker iste i Vietnam.
Jackie Shannon, chef för multimodala produkter på ChatGPT, bekräftade att bilder i ChatGPT har ett starkt skydd mot deepfakes, pornografiskt eller bedrägligt innehåll. Det är värt att notera att de genererade bilderna kommer att integrera C2PA-standardmetadata för att markera dem som AI-produkter, men att de behöver separata verktyg för att kontrollera.
Det finns dock fortfarande många människor som framgångsrikt "bryter mot lagen" och använder bilder av kända personer för att infoga dem i underhållningssyfte. Till exempel bilden av VD:n Tim Cook som håller en Samsung-telefon istället för en iPhone, eller bilden av skådespelaren Robert Downey Jr. som tuggar på en grönsaksgodis, eller bilden av Cristiano Ronaldo som slåss om en boll med Lionel Messi i en liten gränd i Vietnam framför många människor...
[annons_2]
Källa: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm






Kommentar (0)