ChatGPT «малює як фотографія»
26 березня світова та в'єтнамська спільноти користувачів штучного інтелекту були схвильовані, коли OpenAI офіційно випустив Images in ChatGPT, інструмент, орієнтований на створення зображень, для користувачів своєї інтелектуальної моделі. Раніше ChatGPT також мав можливості створення зображень, але вони були обмежені та спиралися на іншу відому модель перетворення тексту на зображення під назвою DALL-E.
Здатність інструменту перетворювати текст на малюнки та виконувати «об’єднання зображень у якості Photoshop» швидко привернула увагу. Багато користувачів повідомили про якість вихідного зображення як «вражаючу», причому більшість оцінила її як «вищу» за інші популярні моделі штучного інтелекту на ринку.
ChatGPT створює реалістичні зображення кавових чашок за допомогою простої команди.
За словами Габріеля Гоха, керівника досліджень OpenAI, значним покращенням можливостей ChatGPT щодо генерації зображень за допомогою моделі GPT-4o є «зв'язування» — термін, що стосується ступеня, до якого генератор зображень на основі штучного інтелекту підтримує зв'язки між атрибутами та об'єктами. Гох стверджує, що GPT-4o може точно пов'язувати атрибути для 15-20 різних об'єктів без помилок, що значно підвищує точність і надійність згенерованого контенту.
Зображення в ChatGPT не лише чудово справляються зі створенням зображень, але й усувають критичну слабкість інших інструментів для створення зображень на основі штучного інтелекту: рендеринг тексту всередині зображень. Фактично, багато зображень, що містять текст, відображаються точно, що ускладнює розрізнення справжніх зображень від підроблених.
Недоліком інструменту є відносно тривалий час створення зображень, але це вважається прийнятним, оскільки затримка пов'язана з тим, що високоякісні зображення з точними деталями та відповідністю опису користувача завжди вимагають терпіння. Дослідницька група заявила, що проблема затримки буде вирішена в майбутньому.
Було висловлено багато побоювань щодо можливості маніпуляції зображеннями.
Окрім початкового задоволення, яке ChatGPT та OpenAI пропонують користувачам, на перший план знову вийшли побоювання щодо інформаційної безпеки, конфіденційності та ризику експлуатації. «Незабаром зображення, які ви бачите в Інтернеті, можуть не обов’язково бути справжніми», – висловив своє занепокоєння користувач Facebook у В’єтнамі, оскільки він може попросити ChatGPT створити повністю сфабриковані зображення, які виглядають так само реалістично, як фотографії, наприклад, фотографію актора та колишнього рестлера Двейна Джонсона («Скеля»), який рекламує бренд жувальної гумки, або ситцевого кота, що сидить на плиті, який виглядає точнісінько як фотографія.
Завдяки детальним командам користувачі можуть створювати дивовижні результати без необхідності глибоких знань традиційних інструментів редагування фотографій.
Насправді, багато людей навіть спробували функцію «роздягання» нового інструменту. TN ( Ханой ) розповіла, що використала фотографію моделі з інтернету, щоб попросити ChatGPT переодягнути її, як було запропоновано, і майже всі запити були виконані з високою точністю. «Однак було кілька випадків, коли запити відхиляли, головним чином через порушення політики системи щодо створення зображень, захищених авторським правом, або надмірно непристойного контенту», – поділилася TN.
У тестах, проведених газетою Thanh Nien , ChatGPT відмовився створювати зображення, пов’язані з відомими або захищеними авторським правом персонажами з реального світу, фільмів та коміксів. «Я не можу створити зображення, як запитувалося, оскільки на надісланому вами зразковому зображенні чітко зображено Доктора Стренджа – персонажа Marvel, захищеного авторським правом, – і це порушує нашу поточну політику щодо контенту», – відповіла система, коли її попросили створити зображення Доктора Стренджа, який сидить... і п’є холодний чай у В’єтнамі.
Джекі Шеннон, керівник відділу мультимодальних продуктів у ChatGPT, стверджує, що зображення в ChatGPT пропонують надійний захист від дипфейків, порнографічного або шахрайського контенту. Примітно, що згенеровані зображення містять стандартні метадані C2PA для ідентифікації їх як продуктів штучного інтелекту, але для перевірки потрібен окремий інструмент.
Однак багато людей все ще успішно «обходять правила» та використовують зображення знаменитостей для розважальних цілей. Наприклад, фотографія генерального директора Тіма Кука, який тримає телефон Samsung замість iPhone, або зображення актора Роберта Дауні-молодшого, який жує овочеву цукерку, або серія картин Кріштіану Роналду та Ліонеля Мессі, які змагаються за м'яч у невеликому провулку у В'єтнамі на очах у багатьох глядачів...
Джерело: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm






Коментар (0)