ChatGPT "rita som ett foto"
Den 26 mars var AI-användargemenskapen (artificiell intelligens) runt om i världen såväl som i Vietnam i full gång när OpenAI officiellt släppte Images i ChatGPT med fokus på bildskapandefunktioner för användare av företagets intelligenta modell. Tidigare hade ChatGPT också möjligheten att skapa bilder men var begränsad och var tvungen att gå igenom en annan berömd text-till-bild-modell, DALL-E.
Verktygets förmåga att omvandla text till teckningar och "kombinera bilder som Photoshop" väckte snabbt uppmärksamhet. Många sa att bildkvaliteten var "fantastisk" och de flesta betygsatte den som "överlägsen" jämfört med populära AI-modeller på marknaden.
ChatGPT skapar realistiska kaffekoppar med bara ett enkelt kommando
Enligt Gabriel Goh, en forskargruppsledare på OpenAI, är den betydande förbättringen i ChatGPT:s bildgenereringskapacitet med hjälp av GPT-4o-modellen "bindande" - en term för i vilken grad AI-bildgeneratorn upprätthåller kopplingen mellan attribut och objekt. Goh hävdade att GPT-4o korrekt kan länka attribut för 15-20 olika objekt utan förvirring, vilket avsevärt förbättrar noggrannheten och tillförlitligheten hos det genererade innehållet.
Bilder i ChatGPT är inte bara enastående i sin bildskapande förmåga, utan löser även den "dödliga" svagheten hos andra bildgenererande AI-verktyg, vilket är att visa text och text inuti bilden. Faktum är att många bilder som innehåller text visas korrekt, vilket gör bilden ännu svårare att skilja mellan falsk och äkta.
Nackdelen med det här verktyget är att det tar lång tid att generera bilder, men det anses rimligt eftersom fördröjningen uppstår eftersom bilder av god kvalitet, korrekta detaljer och att de matchar användarens beskrivning alltid kräver tålamod. Forskargruppen sa att fördröjningsproblemet kommer att förbättras i framtiden.
Många farhågor kring möjligheten att kombinera foton
Förutom den roliga introduktionsupplevelsen som ChatGPT och OpenAI ger användarna, lyfts återigen fram frågan om informationssäkerhet, integritet samt risken för utnyttjande. ”Inom en snar framtid kanske bilderna du ser online inte nödvändigtvis är verkliga”, uttryckte en Facebook-användare i Vietnam oro när han kunde be ChatGPT att skapa helt overkliga bilder som ser lika verkliga ut som foton, till exempel ett foto på skådespelaren och före detta brottaren Dwayne Johnson (The Rock) som gör reklam för ett tuggummimärke, eller ett foto på en kaliköt som sitter på spisen och som ser exakt ut som ett foto.
Med detaljerade kommandon kan användare skapa överraskande resultat utan att behöva djupgående kunskaper i traditionella fotoredigeringsverktyg.
Många har till och med provat det nya verktygets "strippnings"-funktion. TN ( Hanoi ) sa att han använde ett modellfoto taget från internet för att be ChatGPT att byta kläder enligt begäran och nästan alla beställningar uppfylldes med hög noggrannhet. "Det fanns dock fortfarande några avslag, främst på grund av brott mot systemets policy för att skapa upphovsrättsskyddade bilder eller ha alltför sexigt innehåll", delade TN.
I Thanh Niens tester vägrade ChatGPT att skapa bilder relaterade till kända eller upphovsrättsskyddade karaktärer i den verkliga världen eller i filmer och berättelser. "Jag kan inte skapa bilden som begärts eftersom referensbilden du skickade tydligt visar karaktären Doctor Strange - en upphovsrättsskyddad karaktär från Marvel och detta bryter mot den nuvarande innehållspolicyn", svarade systemet när de ombads att skapa en bild av Doctor Strange som sitter... dricker iste i Vietnam.
Jackie Shannon, chef för multimodala produkter på ChatGPT, bekräftade att bilder i ChatGPT har ett starkt skydd mot deepfakes, pornografiskt eller bedrägligt innehåll. Det är värt att notera att de genererade bilderna kommer att integrera C2PA-standardmetadata för att markera dem som AI-produkter, men att de behöver separata verktyg för att kontrollera.
Det finns dock fortfarande många människor som framgångsrikt "bryter mot lagen" och använder bilder av kända personer i underhållningssyfte. Till exempel bilden av VD Tim Cook som håller i en Samsung-telefon istället för en iPhone, eller bilden av skådespelaren Robert Downey Jr. som tuggar på en grönsaksgodis, eller bilden av Cristiano Ronaldo som spelar boll med Lionel Messi i en liten gränd i Vietnam framför många människor...
[annons_2]
Källa: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm
Kommentar (0)