A ChatGPT „úgy rajzol, mint egy fotó”
Március 26-án a mesterséges intelligencia (MI) felhasználói közössége világszerte , valamint Vietnámban is izgatott volt, amikor az OpenAI hivatalosan is kiadta az Images in ChatGPT alkalmazást, amely a vállalat intelligens modelljének felhasználói számára kínált képalkotási képességekre összpontosít. Korábban a ChatGPT is képes volt képek létrehozására, de ez korlátozott volt, és egy másik híres szöveg-kép modellen, a DALL-E-n kellett keresztülmennie.
Az eszköz azon képessége, hogy szöveget rajzokká alakított, és „képeket kombinált, mint a Photoshop”, gyorsan felkeltette a figyelmet. Sokan azt mondták, hogy a kimeneti képminőség „elképesztő”, és a legtöbben „kiválónak” értékelték a piacon népszerű AI-modellekhez képest.
A ChatGPT valósághű kávéscsészéket készít egyetlen paranccsal
Gabriel Goh, az OpenAI kutatócsoportjának vezetője szerint a ChatGPT képgeneráló képességeinek jelentős javulása a GPT-4o modell használatával a „kötés” – egy kifejezés arra a mértékre, amelyre az AI képgenerátora milyen mértékben tartja fenn a kapcsolatot az attribútumok és az objektumok között. Goh úr azt állította, hogy a GPT-4o 15-20 különböző objektum attribútumait képes pontosan összekapcsolni zavar nélkül, jelentősen javítva a generált tartalom pontosságát és megbízhatóságát.
Az Images in ChatGPT nemcsak a képalkotási képességében kiemelkedő, hanem megoldja más képgeneráló mesterséges intelligencia eszközök „végzetes” gyengeségét is, ami az írás és a szöveg megjelenítése a képen belül. Valójában sok szöveget tartalmazó kép pontosan jelenik meg, ami még nehezebbé teszi a kép megkülönböztetését a hamis és a valódi között.
Ennek az eszköznek a hátránya, hogy hosszú időt vesz igénybe a képek generálása, de ez ésszerűnek tekinthető, mivel a késés azért keletkezik, mert a jó minőségű képek, a pontos részletek és a felhasználói leírásnak való megfelelés mindig türelmet igényel. A kutatócsoport szerint a késés problémáját a jövőben javítani fogják.
Sok aggodalomra ad okot a fényképek kombinálásának lehetősége
A ChatGPT és az OpenAI által nyújtott kezdeti élmény élvezetessége mellett ismét előtérbe kerül az információbiztonság, az adatvédelem, valamint a visszaélések kockázatának kérdése. „A közeljövőben az online látható képek nem feltétlenül lesznek valóságosak” – fejezte ki aggodalmát egy vietnami Facebook-felhasználó, amiért megkérheti a ChatGPT-t, hogy teljesen valótlan képeket készítsen, amelyek ugyanolyan valóságosnak tűnnek, mint a fotók, például egy fotót Dwayne Johnson színészről és egykori birkózóról (The Rock), amint egy rágógumi márkát reklámoz, vagy egy kalisztós macskáról, amint a tűzhelyen ül, és pontosan úgy néz ki, mint egy fotó.
A részletes parancsoknak köszönhetően a felhasználók meglepő eredményeket hozhatnak létre anélkül, hogy mélyreható ismeretekkel kellene rendelkezniük a hagyományos fotószerkesztő eszközök használatáról.
Sokan kipróbálták már az új eszköz „sztriptíz” képességét is. TN ( Hanoi ) elmondta, hogy egy internetről letöltött modellfotó segítségével kérte meg a ChatGPT-t, hogy a kérésnek megfelelően öltözzön át, és szinte minden megrendelést nagy pontossággal teljesítettek. „Azonban még mindig voltak elutasítások, főként a rendszer szerzői joggal védett képek létrehozására vonatkozó irányelveinek megsértése vagy a túlzottan szexi tartalom miatt” – osztotta meg TN.
Thanh Nien tesztjeiben a ChatGPT nem volt hajlandó olyan képeket létrehozni, amelyek a való világban, filmekben és történetekben szereplő híres vagy szerzői jogvédelem alatt álló karakterekhez kapcsolódnak. „Nem tudom létrehozni a kért képet, mert az Ön által küldött referenciaképen tisztán látható Doctor Strange karakter – a Marvel egy szerzői jogvédelem alatt álló karaktere –, és ez sérti a jelenlegi tartalomszabályzatot” – válaszolta a rendszer, amikor arra kérték, hogy készítsen egy képet, amelyen Doctor Strange jeges teát iszik Vietnámban.
Jackie Shannon, a ChatGPT multimodális termékekért felelős vezetője megerősítette, hogy a ChatGPT képei erős védelmet nyújtanak a deepfake, pornográf vagy csalárd tartalmak ellen. Fontos megjegyezni, hogy a létrehozott képek integrálják a C2PA szabványos metaadatokat, hogy AI-termékekként jelöljék meg őket, de külön eszközökre van szükség az ellenőrzéshez.
Azonban még mindig sokan vannak, akik sikeresen „megkerülik a törvényt”, és híres emberek képeit használják fel szórakoztatási célokra. Például Tim Cook vezérigazgató képe, amint iPhone helyett Samsung telefont tart a kezében, vagy Robert Downey Jr. színész képe, amint egy zöldséges cukorkát rágcsál, vagy Cristiano Ronaldo képe, amint Lionel Messivel játszik labdáért egy kis sikátorban Vietnámban, sok ember előtt...
[hirdetés_2]
Forrás: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm
Hozzászólás (0)