در جریان یک رویداد پخش زنده در ۲۵ مارس، OpenAI نشان داد که چگونه کاربران میتوانند با صحبت کردن با ChatGPT، تصاویر را ویرایش کنند. به عنوان مثال، آنها میتوانند از ChatGPT بخواهند که عکسی از یک حلزون در یک شهر ایجاد کند و سپس جزئیاتی مانند کلاه را اضافه کند یا پسزمینه را تغییر دهد.
تصویری که توسط ChatGPT تولید شده است. عکس: OpenAI
OpenAI میگوید ChatGPT میتواند با دریافت ورودیهای واضح، تصاویر بهتری تولید کند و به ترسیم نمودارها و طراحی لوگو برای کار کمک کند. کاربران میتوانند از این چتبات بخواهند منوها، نقشهها را ایجاد کند یا دستورالعملهای پیچیدهای را در مورد طرحبندی تصویر انجام دهد.
OpenAI با هدف تبدیل شدن به یک برنامه کاربردی عمومی، ChatGPT را با ویژگیهایی مانند جستجو، دستیار صوتی و ساخت ویدیو ادغام میکند. آخرین پیشرفتها به این محصول کمک میکند تا با سایر چتباتها، از جمله Grok ایلان ماسک، رقابت کند و نیازهای افراد و مشاغل را برآورده سازد.
با این حال، تولید تصویر ChatGPT بینقص نیست، برای مثال، میتواند در تصاویر اشتباهات املایی ایجاد کند. طبق گفته OpenAI، این خطاها اغلب در صورتی رخ میدهند که درخواستهای کاربر به اندازه کافی دقیق نباشند. این هوش مصنوعی همچنین در تولید کاراکترهای کوچک یا حروف خارج از الفبای لاتین مشکل دارد.
به گفتهی سم آلتمن، مدیرعامل ChatGPT، به دلیل سطح جزئیات بالاتر، تولید تصویر در ChatGPT حدود یک دقیقه طول میکشد. GPT-4o جایگزین DALL·E به عنوان مدل پیشفرض تولید تصویر در ChatGPT خواهد شد و برای همه کاربران، از جمله ChatGPT Free، Plus، Team و Pro، در دسترس است.
OpenAI میگوید پیشرفتهای GPT-4o - که سال گذشته منتشر شد - توسط تیمی از «مربیان انسانی» که دادههای آموزشی مدل را برچسبگذاری کردند، امکانپذیر شده است.
با این حال، استفاده از هوش مصنوعی برای تولید تصاویر همچنان بحثبرانگیز است، و برخی از هنرمندان نگرانند که این ابزارها از آثار آنها «کپیبرداری» کنند و معیشت آنها را تهدید کنند. OpenAI میگوید GPT-4o بر اساس دادههای عمومی و منابع اختصاصی شرکایی مانند Shutterstock آموزش دیده است.
(طبق گزارش وال استریت ژورنال، بلومبرگ)
منبع: https://vietnamnet.vn/chatgpt-tao-anh-sieu-thuc-ve-do-thi-cho-nguoi-dung-2384665.html
نظر (0)