ChatGPT "малює як фото"
26 березня спільнота користувачів штучного інтелекту (ШІ) по всьому світу , а також у В'єтнамі, була схвильована, коли OpenAI офіційно випустила функцію «Зображення в ChatGPT», зосередившись на можливостях створення зображень для користувачів інтелектуальної моделі компанії. Раніше ChatGPT також мав можливість створювати зображення, але була обмежена та мала пройти через іншу відому модель перетворення тексту в зображення – DALL-E.
Здатність інструменту перетворювати текст на малюнки та «поєднувати зображення, як у Photoshop» швидко привернула увагу. Багато хто сказав, що якість вихідного зображення була «дивовижною», а більшість оцінила її як «вищу» порівняно з популярними моделями штучного інтелекту на ринку.
ChatGPT створює реалістичні кавові чашки за допомогою простої команди
За словами Габріеля Гоха, керівника дослідницької групи OpenAI, значним покращенням можливостей ChatGPT щодо генерації зображень за допомогою моделі GPT-4o є «зв'язування» – термін, що позначає ступінь, до якої генератор зображень на основі штучного інтелекту підтримує зв'язок між атрибутами та об'єктами. Пан Гох стверджував, що GPT-4o може точно пов'язувати атрибути для 15-20 різних об'єктів без плутанини, що значно підвищує точність і надійність згенерованого контенту.
Зображення в ChatGPT не лише видатні у своїй здатності створювати зображення, але й вирішують «фатальну» слабкість інших інструментів штучного інтелекту для створення зображень, а саме відображення тексту та тексту всередині зображення. Фактично, багато зображень, що містять текст, відображаються точно, що ще більше ускладнює розрізнення між підробкою та справжнім зображенням.
Недоліком цього інструменту є те, що генерація зображень займає багато часу, але це вважається прийнятним, оскільки затримка створюється завдяки тому, що якісні зображення, точні деталі та відповідність опису користувача завжди вимагають терпіння. Дослідницька група заявила, що проблема затримки буде вирішена в майбутньому.
Багато занепокоєнь щодо можливості поєднання фотографій
Окрім задоволення від початкового досвіду, який ChatGPT та OpenAI приносять користувачам, питання інформаційної безпеки, конфіденційності, а також ризику експлуатації знову виходять на перший план. «У найближчому майбутньому зображення, які ви бачите в Інтернеті, не обов’язково будуть реальними», – висловив стурбованість користувач Facebook у В’єтнамі, коли він може попросити ChatGPT створювати абсолютно нереальні зображення, які виглядають так само реально, як фотографії, наприклад, фотографію актора та колишнього рестлера Двейна Джонсона (The Rock), який рекламує бренд жувальної гумки, або фотографію ситцевого кота, що сидить на плиті, яка виглядає точнісінько як фотографія.
Завдяки детальним командам користувачі можуть створювати дивовижні результати без необхідності глибоких знань про використання традиційних інструментів редагування фотографій.
Багато людей навіть випробували можливості нового інструменту для «стриптизування». TN ( Ханой ) розповів, що він використав фотографію моделі, взяту з інтернету, щоб попросити ChatGPT переодягнутися, як було запропоновано, і майже всі замовлення були виконані з високою точністю. «Однак, все ж були деякі відмови, головним чином через порушення політики системи щодо створення зображень, захищених авторським правом, або надмірно сексуального контенту», – поділився TN.
У тестах Тхань Нієна ChatGPT відмовився створювати зображення, пов’язані з відомими або захищеними авторським правом персонажами з реального світу, фільмів та оповідань. «Я не можу створити зображення, як запитувалося, оскільки на надісланому вами зразковому зображенні чітко зображено персонажа Доктора Стренджа — персонажа Marvel, захищеного авторським правом, і це порушує чинну політику щодо контенту», — відповіла система, коли її попросили створити зображення Доктора Стренджа, який сидить... п’є холодний чай у В’єтнамі.
Джекі Шеннон, керівник відділу мультимодальних продуктів у ChatGPT, підтвердила, що зображення в ChatGPT мають надійний захист від Deepfake, порнографічного або шахрайського контенту. Примітно, що згенеровані зображення інтегруватимуть стандартні метадані C2PA, щоб позначити їх як продукти штучного інтелекту, але для перевірки потрібні окремі інструменти.
Однак, все ще є багато людей, які успішно «обходять закон» та використовують зображення відомих людей для розважальних цілей. Наприклад, зображення генерального директора Тіма Кука, який тримає телефон Samsung замість iPhone, або зображення актора Роберта Дауні-молодшого, який жує овочеву цукерку, або фотографія Кріштіану Роналду, який грає за м'яч з Ліонелем Мессі у невеликому провулку у В'єтнамі перед багатьма людьми...
Джерело: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm
Коментар (0)