ChatGPT «مثل یک عکس نقاشی میکند»
در تاریخ ۲۶ مارس، جامعه کاربران هوش مصنوعی (AI) در سراسر جهان و همچنین در ویتنام، زمانی که OpenAI رسماً تصاویر را در ChatGPT با تمرکز بر قابلیتهای ایجاد تصویر برای کاربران مدل هوشمند این شرکت منتشر کرد، بسیار هیجانزده شدند. پیش از این، ChatGPT نیز توانایی ایجاد تصاویر را داشت، اما محدود بود و مجبور بود از مدل معروف دیگری برای تبدیل متن به تصویر، DALL-E، عبور کند.
توانایی این ابزار در تبدیل متن به نقاشی و "ترکیب تصاویر مانند فتوشاپ" به سرعت توجه را به خود جلب کرد. بسیاری گفتند کیفیت تصویر خروجی "شگفت انگیز" است و اکثر آنها آن را در مقایسه با مدل های هوش مصنوعی رایج در بازار "برتر" ارزیابی کردند.
ChatGPT تنها با یک دستور ساده، فنجانهای قهوهی واقعی میسازد
به گفته گابریل گو، سرپرست تیم تحقیقاتی در OpenAI، بهبود قابل توجه در قابلیتهای تولید تصویر ChatGPT با استفاده از مدل GPT-4o، «اتصال» است - اصطلاحی برای میزان حفظ ارتباط بین ویژگیها و اشیاء توسط مولد تصویر هوش مصنوعی. آقای گو ادعا کرد که GPT-4o میتواند ویژگیهای ۱۵ تا ۲۰ شیء مختلف را بدون سردرگمی به طور دقیق پیوند دهد و به طور قابل توجهی دقت و قابلیت اطمینان محتوای تولید شده را بهبود بخشد.
نه تنها در توانایی ایجاد تصویر برجسته است، بلکه تصاویر در ChatGPT ضعف "مهلک" سایر ابزارهای هوش مصنوعی تولید تصویر، یعنی نمایش نوشته و متن درون تصویر را نیز حل میکند. در واقع، بسیاری از تصاویر حاوی متن به طور دقیق نمایش داده میشوند و تشخیص تصویر جعلی از واقعی را دشوارتر میکنند.
نکته منفی این ابزار این است که تولید تصاویر زمان زیادی میبرد، اما منطقی تلقی میشود زیرا این تأخیر ایجاد میشود زیرا تصاویر با کیفیت خوب، جزئیات دقیق و مطابقت با توضیحات کاربر همیشه نیاز به صبر و شکیبایی دارند. تیم تحقیقاتی اعلام کرد که مشکل تأخیر در آینده بهبود خواهد یافت.
نگرانیهای زیادی در مورد قابلیت ترکیب عکسها وجود دارد
علاوه بر لذتی که ChatGPT و OpenAI در تجربه اولیه برای کاربران به ارمغان میآورند، مسئله امنیت اطلاعات، حریم خصوصی و همچنین خطر سوءاستفاده بار دیگر مطرح میشود. یک کاربر فیسبوک در ویتنام ابراز نگرانی کرد که آیا میتواند از ChatGPT بخواهد تصاویری کاملاً غیرواقعی ایجاد کند که به اندازه عکسها واقعی به نظر برسند، مثلاً عکسی از بازیگر و کشتیگیر سابق دواین جانسون (راک) که در حال تبلیغ یک برند آدامس است، یا عکسی از یک گربه کالیکو که روی اجاق گاز نشسته و دقیقاً شبیه یک عکس است.
با دستورات دقیق ارائه شده، کاربران میتوانند بدون نیاز به دانش عمیق در مورد استفاده از ابزارهای سنتی ویرایش عکس، نتایج شگفتانگیزی ایجاد کنند.
بسیاری از افراد حتی قابلیت «برداشتن» این ابزار جدید را امتحان کردهاند. TN ( هانوی ) گفت که او با استفاده از یک عکس مدل گرفته شده از اینترنت، از ChatGPT خواسته است که لباسهای درخواستی را تعویض کند و تقریباً همه سفارشات با دقت بالایی انجام شده است. TN به اشتراک گذاشت: «با این حال، هنوز برخی درخواستها رد شدهاند، که عمدتاً به دلیل نقض سیاستهای سیستم در ایجاد تصاویر دارای حق چاپ یا داشتن محتوای بیش از حد سکسی بوده است.»
در آزمایشهای Thanh Nien ، ChatGPT از ایجاد تصاویر مربوط به شخصیتهای معروف یا دارای حق چاپ در دنیای واقعی یا در فیلمها و داستانها خودداری کرد. وقتی از سیستم خواسته شد تصویری از دکتر استرنج که در ویتنام نشسته و چای سرد مینوشد، ایجاد کند، پاسخ داد: «من نمیتوانم تصویر مورد نظر را ایجاد کنم زیرا تصویر مرجعی که ارسال کردید به وضوح شخصیت دکتر استرنج را نشان میدهد - یک شخصیت دارای حق چاپ از مارول و این سیاست محتوای فعلی را نقض میکند.»
جکی شانون، رئیس محصولات چندوجهی در ChatGPT، تأیید کرد که تصاویر موجود در ChatGPT از محافظت قوی در برابر محتوای دیپفیک، مستهجن یا جعلی برخوردارند. نکته قابل توجه این است که تصاویر تولید شده، فرادادههای استاندارد C2PA را برای علامتگذاری آنها به عنوان محصولات هوش مصنوعی ادغام میکنند، اما برای بررسی به ابزارهای جداگانهای نیاز دارند.
با این حال، هنوز افراد زیادی هستند که با موفقیت «قانون را دور میزنند» و از تصاویر افراد مشهور برای اهداف سرگرمی استفاده میکنند. به عنوان مثال، تصویر تیم کوک، مدیرعامل اپل، که به جای آیفون، یک گوشی سامسونگ در دست دارد، یا تصویر رابرت داونی جونیور، بازیگر، که در حال جویدن یک آب نبات گیاهی است، یا تصویر کریستیانو رونالدو که در یک کوچه کوچک در ویتنام و در مقابل دیدگان بسیاری از مردم با لیونل مسی توپ بازی میکند...
منبع: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm
نظر (0)