ChatGPT «tegner som et bilde»
26. mars var det stor aktivitet i AI-brukermiljøet (kunstig intelligens) verden over, så vel som i Vietnam, da OpenAI offisielt lanserte Images i ChatGPT, med fokus på bildeopprettingsmuligheter for brukere av selskapets intelligente modell. Tidligere hadde ChatGPT også muligheten til å lage bilder, men var begrenset og måtte gå gjennom en annen kjent tekst-til-bilde-modell, DALL-E.
Verktøyets evne til å gjøre tekst om til tegninger og «kombinere bilder som Photoshop» vakte raskt oppmerksomhet. Mange sa at bildekvaliteten var «fantastisk», og de fleste vurderte den som «overlegen» sammenlignet med populære AI-modeller på markedet.
ChatGPT lager realistiske kaffekopper med bare en enkel kommando
Ifølge Gabriel Goh, en leder for et forskerteam hos OpenAI, er den betydelige forbedringen i ChatGPTs bildegenereringsmuligheter ved bruk av GPT-4o-modellen «binding» – en betegnelse på i hvilken grad AI-bildegeneratoren opprettholder forbindelsen mellom attributter og objekter. Goh hevdet at GPT-4o nøyaktig kan koble attributter for 15–20 forskjellige objekter uten forvirring, noe som forbedrer nøyaktigheten og påliteligheten til det genererte innholdet betydelig.
Bilder i ChatGPT er ikke bare fremragende når det gjelder bildegenereringsevne, men løser også den «fatale» svakheten til andre bildegenererende AI-verktøy, som er å vise skrift og tekst inni bildet. Faktisk vises mange bilder som inneholder tekst nøyaktig, noe som gjør det enda vanskeligere å skille mellom falske og ekte bilder.
Ulempen med dette verktøyet er at det tar lang tid å generere bilder, men det anses som rimelig fordi forsinkelsen oppstår fordi bilder av god kvalitet, nøyaktige detaljer og samsvar med brukerens beskrivelse alltid krever tålmodighet. Forskerteamet sa at forsinkelsesproblemet vil bli forbedret i fremtiden.
Mange bekymringer om muligheten til å kombinere bilder
I tillegg til moroa i den første opplevelsen som ChatGPT og OpenAI gir brukerne, blir spørsmålet om informasjonssikkerhet, personvern samt risikoen for utnyttelse nok en gang satt i forgrunnen. «I nær fremtid er det ikke sikkert at bildene du ser på nettet er ekte», uttrykte en Facebook-bruker i Vietnam bekymring da han kunne be ChatGPT om å lage helt uvirkelige bilder som ser like ekte ut som bilder, for eksempel et bilde av skuespiller og tidligere bryter Dwayne Johnson (The Rock) som reklamerer for et tyggegummimerke, eller et bilde av en kalikokatt som sitter på komfyren og ser akkurat ut som et bilde.
Med detaljerte kommandoer kan brukere skape overraskende resultater uten å trenge inngående kunnskap om bruk av tradisjonelle bilderedigeringsverktøy.
Mange har til og med prøvd «strippings»-funksjonen til det nye verktøyet. TN ( Hanoi ) sa at han brukte et modellbilde hentet fra internett for å be ChatGPT om å skifte klær som forespurt, og nesten alle bestillinger ble møtt med høy nøyaktighet. «Det var imidlertid fortsatt noen avslag, hovedsakelig på grunn av brudd på systemets retningslinjer for å lage opphavsrettsbeskyttede bilder eller ha altfor sexy innhold», delte TN.
I Thanh Niens tester nektet ChatGPT å lage bilder relatert til kjente eller opphavsrettsbeskyttede karakterer i den virkelige verden eller i filmer og historier. «Jeg kan ikke lage bildet som forespurt fordi referansebildet du sendte tydelig viser karakteren Doctor Strange – en opphavsrettsbeskyttet karakter fra Marvel, og dette bryter med gjeldende innholdspolicy», svarte systemet da de ble bedt om å lage et bilde av Doctor Strange som satt ... og drakk iste i Vietnam.
Jackie Shannon, leder for multimodale produkter hos ChatGPT, bekreftet at bilder i ChatGPT har sterk beskyttelse mot deepfake, pornografisk eller uredelig innhold. Det er verdt å merke seg at de genererte bildene vil integrere C2PA-standardmetadata for å merke dem som AI-produkter, men trenger separate verktøy for å sjekke.
Det er imidlertid fortsatt mange som lykkes med å «bøye loven» og bruke bilder av kjente personer til underholdningsformål. For eksempel bildet av administrerende direktør Tim Cook som holder en Samsung-telefon i stedet for en iPhone, eller bildet av skuespiller Robert Downey Jr. som tygger på et grønnsaksgodteri, eller bildet av Cristiano Ronaldo som spiller ball med Lionel Messi i en liten bakgate i Vietnam foran mange mennesker ...
[annonse_2]
Kilde: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm
Kommentar (0)