A ChatGPT „úgy rajzol, mint egy fotó”
Március 26-án a mesterséges intelligencia (MI) felhasználói közössége világszerte , valamint Vietnámban is izgatott volt, amikor az OpenAI hivatalosan is kiadta az Images in ChatGPT alkalmazást, amely a vállalat intelligens modelljének felhasználói számára kínált képalkotási képességekre összpontosít. Korábban a ChatGPT is képes volt képek létrehozására, de ez korlátozott volt, és egy másik híres szöveg-kép modellen, a DALL-E-n kellett keresztülmennie.
Az eszköz azon képessége, hogy szöveget rajzokká alakított, és „képeket kombinált, mint a Photoshop”, gyorsan felkeltette a figyelmet. Sokan azt mondták, hogy a kimeneti képminőség „elképesztő”, és a legtöbben „kiválónak” értékelték a piacon népszerű AI-modellekhez képest.
A ChatGPT valósághű kávéscsészéket készít egyetlen paranccsal
Gabriel Goh, az OpenAI kutatócsoportjának vezetője szerint a ChatGPT képgeneráló képességeinek jelentős javulása a GPT-4o modell használatával a „kötés” – egy kifejezés arra a mértékre, amennyire az AI képgenerátora fenntartja a kapcsolatot az attribútumok és az objektumok között. Goh úr azt állította, hogy a GPT-4o 15-20 különböző objektum attribútumait képes pontosan összekapcsolni zavar nélkül, jelentősen javítva a generált tartalom pontosságát és megbízhatóságát.
A ChatGPT képei nemcsak a képek létrehozásának képességében kiemelkedőek, hanem megoldják más képgeneráló mesterséges intelligencia eszközök „végzetes” gyengeségét is, ami az írás és a szöveg megjelenítése a képen belül. Valójában sok szöveget tartalmazó kép pontosan jelenik meg, így nehezebb megkülönböztetni a hamis és a valódi képet.
Ennek az eszköznek a hátránya, hogy hosszú időt vesz igénybe a képek generálása, de ez ésszerűnek tekinthető, mivel a késés azért keletkezik, mert a jó minőségű képek, a pontos részletek és a felhasználói leírásnak való megfelelés mindig türelmet igényel. A kutatócsoport szerint a késés problémáját a jövőben javítani fogják.
Sok aggodalomra ad okot a fényképek kombinálásának lehetősége
A ChatGPT és az OpenAI által nyújtott kezdeti élmény élvezetessége mellett ismét előtérbe kerül az információbiztonság, az adatvédelem, valamint a visszaélések kockázatának kérdése. „A közeljövőben az online látható képek nem feltétlenül lesznek valóságosak” – fejezte ki aggodalmát egy vietnami Facebook-felhasználó, amiért megkérheti a ChatGPT-t, hogy teljesen valótlan képeket készítsen, de olyan valóságosakat, mint a fotók, például egy Dwayne Johnson (The Rock) színész és volt birkózó rágógumi márkát reklámozó fotóját, vagy egy tűzhelyen ülő kaliszta macskát ábrázoló képet, amely pontosan úgy néz ki, mint egy fotó.
A részletes parancsoknak köszönhetően a felhasználók meglepő eredményeket hozhatnak létre anélkül, hogy mélyreható ismeretekkel kellene rendelkezniük a hagyományos fotószerkesztő eszközök használatáról.
Sokan kipróbálták már az új eszköz „sztriptíz” képességét is. TN ( Hanoi ) elmondta, hogy egy internetről letöltött modellfotó segítségével kérte meg a ChatGPT-t, hogy öltözzön át a kérésnek megfelelően, és szinte minden parancsot nagy pontossággal teljesítettek. „Azonban még mindig voltak visszautasítások, főként a rendszer szerzői joggal védett képek létrehozására vonatkozó irányelveinek megsértése vagy a túlzottan szexi tartalom miatt” – osztotta meg TN.
Thanh Nien tesztjeiben a ChatGPT nem volt hajlandó olyan képeket létrehozni, amelyek a való világban, filmekben és történetekben szereplő híres vagy szerzői jogvédelem alatt álló karakterekhez kapcsolódtak. „Nem tudom létrehozni a kért képet, mert az Ön által küldött referenciaképen tisztán látható Doctor Strange karakter – egy Marvel szerzői jogvédelem alatt álló karakter, és ez sérti a jelenlegi tartalomszabályzatot” – válaszolta a rendszer, amikor arra kérték, hogy készítsen egy képet, amelyen Doctor Strange jeges teát iszik Vietnámban.
Jackie Shannon, a ChatGPT multimodális termékekért felelős vezetője megerősítette, hogy a ChatGPT képei erős védelmet nyújtanak a deepfake, pornográf vagy csalárd tartalmak ellen. Fontos megjegyezni, hogy a létrehozott képek integrálják a C2PA szabványos metaadatokat, hogy AI-termékekként jelöljék meg őket, de külön eszközökre van szükség az ellenőrzéshez.
Azonban még mindig sokan vannak, akik sikeresen „megkerülik a törvényt”, és híres emberek képeit használják fel szórakoztatási célokra. Például Tim Cook vezérigazgató képe, aki iPhone helyett Samsung telefont tart a kezében, vagy Robert Downey Jr. színész képe, aki zöldséges cukorkát rágcsál, vagy Cristiano Ronaldo képe, amint egy kis sikátorban sok ember előtt küzd Lionel Messivel egy labdáért Vietnámban...
[hirdetés_2]
Forrás: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm






Hozzászólás (0)