ChatGPT "يرسم مثل الصورة"
في 26 مارس، ضجّ مجتمع مستخدمي الذكاء الاصطناعي حول العالم ، بما في ذلك في فيتنام، بإصدار OpenAI رسميًا ميزة "الصور في ChatGPT"، التي تُركّز على إمكانيات إنشاء الصور لمستخدمي نموذج الشركة الذكي. في السابق، كانت ChatGPT قادرة أيضًا على إنشاء الصور، لكنها كانت محدودة، إذ كانت تعتمد على نموذج DALL-E الشهير لتحويل النص إلى صورة.
لفتت قدرة الأداة على تحويل النصوص إلى رسومات ودمج الصور مثل فوتوشوب الانتباه بسرعة. ووصف الكثيرون جودة الصورة المُخرجة بأنها "مذهلة"، وقيّمها معظمهم بأنها "متفوقة" مقارنةً بنماذج الذكاء الاصطناعي الشائعة في السوق.
يقوم ChatGPT بإنشاء أكواب قهوة واقعية بمجرد أمر بسيط
وفقًا لغابرييل جو، قائد فريق بحثي في OpenAI، فإن التحسين الملحوظ في قدرات ChatGPT على توليد الصور باستخدام نموذج GPT-4o يكمن في "الربط" - وهو مصطلح يُشير إلى مدى قدرة مُولّد صور الذكاء الاصطناعي على الحفاظ على الارتباط بين السمات والأشياء. وأكد السيد جو أن GPT-4o قادر على ربط سمات 15-20 كائنًا مختلفًا بدقة ودون أي لبس، مما يُحسّن بشكل كبير من دقة وموثوقية المحتوى المُولّد.
لا يقتصر تميز الصور في ChatGPT على قدرتها على إنشاء الصور فحسب، بل يُعالج أيضًا ثغرة خطيرة في أدوات الذكاء الاصطناعي الأخرى لتوليد الصور، وهي عرض الكتابة والنص داخل الصورة. في الواقع، تُعرض العديد من الصور التي تحتوي على نص بدقة، مما يُصعّب التمييز بين الصور المزيفة والحقيقية.
عيب هذه الأداة هو أنها تستغرق وقتًا طويلاً لإنشاء الصور، لكنها تُعتبر معقولة نظرًا لطبيعة التأخير الناتج عن جودة الصور ودقة التفاصيل ومطابقة وصف المستخدم، وهو ما يتطلب الصبر دائمًا. وأكد فريق البحث أن مشكلة التأخير ستُحل في المستقبل.
هناك الكثير من المخاوف بشأن القدرة على دمج الصور
بالإضافة إلى المتعة التي يوفرها ChatGPT وOpenAI للمستخدمين في التجربة الأولية، تُطرح مسألة أمن المعلومات والخصوصية، بالإضافة إلى خطر الاستغلال، مجددًا. أعرب مستخدم فيسبوك في فيتنام عن قلقه عندما طلب من ChatGPT إنشاء صور غير واقعية تمامًا، لكنها تبدو حقيقية كالصور الفوتوغرافية، على سبيل المثال، صورة للممثل والمصارع السابق دواين جونسون (ذا روك) وهو يُعلن عن علامة تجارية للعلكة، أو صورة لقطة كاليكو جالسة على الموقد، تبدو تمامًا كصورة فوتوغرافية.
بفضل الأوامر التفصيلية المقدمة، يمكن للمستخدمين إنشاء نتائج مذهلة دون الحاجة إلى معرفة متعمقة بكيفية استخدام أدوات تحرير الصور التقليدية.
حتى أن الكثيرين جرّبوا ميزة "التجريد" في الأداة الجديدة. صرّح TN ( هانوي ) بأنه استخدم صورة عارضة أزياء مأخوذة من الإنترنت ليطلب من ChatGPT تغيير ملابسه بناءً على الطلب، وقد استجابت جميع الأوامر تقريبًا بدقة عالية. وأضاف TN: "مع ذلك، واجهنا بعض الرفض، ويرجع ذلك أساسًا إلى مخالفات لسياسة النظام المتعلقة بإنشاء صور محمية بحقوق الطبع والنشر أو محتوى جنسي مبالغ فيه".
في اختبارات ثانه نين ، رفض ChatGPT إنشاء صور متعلقة بشخصيات شهيرة أو محمية بحقوق الطبع والنشر في العالم الحقيقي أو في الأفلام والقصص. أجاب النظام عند طلب إنشاء صورة للدكتور سترينج جالسًا... يشرب شايًا مثلجًا في فيتنام: "لا أستطيع إنشاء الصورة المطلوبة لأن الصورة المرجعية التي أرسلتها تُظهر بوضوح شخصية دكتور سترينج - وهي شخصية محمية بحقوق الطبع والنشر من مارفل، وهذا يُخالف سياسة المحتوى الحالية".
أكدت جاكي شانون، رئيسة قسم المنتجات متعددة الوسائط في ChatGPT، أن الصور في ChatGPT تتمتع بحماية قوية ضد المحتوى المُزيّف أو الإباحي أو الاحتيالي. والجدير بالذكر أن الصور المُولّدة ستدمج بيانات تعريفية قياسية C2PA لتمييزها كمنتجات ذكاء اصطناعي، ولكنها تحتاج إلى أدوات منفصلة للتحقق منها.
ومع ذلك، لا يزال الكثيرون ينجحون في "تحريف القانون" واستخدام صور المشاهير لأغراض ترفيهية. على سبيل المثال، صورة الرئيس التنفيذي تيم كوك وهو يحمل هاتف سامسونج بدلاً من آيفون، أو صورة الممثل روبرت داوني جونيور وهو يمضغ حلوى نباتية، أو صورة كريستيانو رونالدو وهو يتنافس على الكرة مع ليونيل ميسي في زقاق صغير بفيتنام أمام حشد من الناس...
[إعلان 2]
المصدر: https://thanhnien.vn/lo-ngai-gia-mao-voi-kha-nang-tao-anh-nhu-that-cua-chatgpt-185250327005110274.htm






تعليق (0)