ChatGPT «рисует как фотография»
26 марта сообщество пользователей искусственного интеллекта (ИИ) по всему миру , в том числе и во Вьетнаме, было в восторге от официального запуска OpenAI модуля «Изображения в ChatGPT», ориентированного на возможности создания изображений для пользователей интеллектуальной модели компании. Ранее ChatGPT также мог создавать изображения, но с ограничениями и для этого требовалась другая известная модель преобразования текста в изображение — DALL-E.
Способность инструмента преобразовывать текст в рисунки и «комбинировать изображения, как в Photoshop» быстро привлекла внимание. Многие отметили «потрясающее» качество выходных изображений, и большинство оценили его как «превосходное» по сравнению с популярными моделями искусственного интеллекта на рынке.
ChatGPT создает реалистичные кофейные чашки с помощью простой команды
По словам Габриэля Го, руководителя исследовательской группы OpenAI, существенное улучшение возможностей ChatGPT по генерации изображений с использованием модели GPT-4o заключается в «связывании» — термине, обозначающем степень, в которой генератор изображений с использованием ИИ поддерживает связь между атрибутами и объектами. Г-н Го утверждает, что GPT-4o может точно связывать атрибуты 15–20 различных объектов без ошибок, что значительно повышает точность и надёжность генерируемого контента.
Функция «Изображения в ChatGPT» не только превосходна в плане создания изображений, но и решает «фатальную» проблему других инструментов искусственного интеллекта для генерации изображений — отображение текста и надписей внутри изображения. Более того, многие изображения с текстом отображаются корректно, что ещё больше затрудняет различение поддельных и настоящих изображений.
Недостатком этого инструмента является длительное время генерации изображений, но это считается оправданным, поскольку задержка возникает из-за того, что качественные изображения, точные детали и соответствие описанию пользователя всегда требуют терпения. Исследовательская группа заявила, что проблема задержки будет решена в будущем.
Много опасений по поводу возможности объединения фотографий
Помимо удовольствия от первого опыта, которое ChatGPT и OpenAI дарят пользователям, на первый план снова выходят вопросы информационной безопасности, конфиденциальности и риска злоупотреблений. «В ближайшем будущем изображения, которые вы видите в интернете, могут не обязательно быть реальными», — выразил обеспокоенность пользователь Facebook из Вьетнама, попросив ChatGPT создать совершенно нереальные изображения, которые выглядят так же реалистично, как фотографии, например, фотографию актёра и бывшего рестлера Дуэйна Джонсона (Скалы), рекламирующего бренд жевательной резинки, или фотографию трёхцветного кота, сидящего на плите, которая выглядит точь-в-точь как фотография.
Благодаря подробным командам пользователи могут создавать удивительные результаты, не обладая глубокими знаниями в использовании традиционных инструментов для редактирования фотографий.
Многие даже опробовали функцию «раздевания» нового инструмента. TN ( Ханой ) рассказал, что использовал фотографию модели из интернета, чтобы попросить ChatGPT переодеться, и почти все заказы были выполнены с высокой точностью. «Однако некоторые отказы всё же были, в основном из-за нарушения политики системы в отношении создания изображений, защищённых авторским правом, или чрезмерно сексуального контента», — поделился TN.
В тестах Тхань Ньена ChatGPT отказался создавать изображения, связанные с известными или защищёнными авторским правом персонажами из реального мира, фильмов и рассказов. «Я не могу создать запрошенное изображение, потому что на присланном вами референсном изображении отчётливо изображён Доктор Стрэндж — персонаж Marvel, защищённый авторским правом, и это нарушает действующую политику в отношении контента», — ответила система на запрос создать изображение Доктора Стрэнджа, сидящего... за чашкой холодного чая во Вьетнаме.
Джеки Шеннон, руководитель отдела мультимодальных продуктов ChatGPT, подтвердила, что изображения в ChatGPT обеспечивают надежную защиту от дипфейков, порнографического и мошеннического контента. В частности, сгенерированные изображения будут интегрировать стандартные метаданные C2PA, что позволит отметить их как продукты ИИ, но для их проверки потребуются отдельные инструменты.
Однако многие всё ещё успешно «обходят закон» и используют изображения известных людей в развлекательных целях. Например, фотография генерального директора Тима Кука с телефоном Samsung вместо iPhone, или актёра Роберта Дауни-младшего, жующего овощные конфеты, или фотография Криштиану Роналду, играющего с Лионелем Месси в маленьком переулке во Вьетнаме перед множеством людей...
Источник: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm
Комментарий (0)