يقوم برنامج "جيميني"، وهو الاسم الجديد لروبوت الدردشة "بارد"، بإنشاء صور بناءً على أوصاف المستخدمين بطريقة مشابهة لبرنامج "ChatGPT" من شركة "OpenAI". ومثل النماذج الأخرى، تم تدريب "جيميني" على تجنب الاستجابة للأوامر الخطيرة أو التحريضية، كما أنه يدمج التنوع في مخرجاته.
مع ذلك، انتقد بعض المستخدمين هذا التنوع باعتباره مبالغًا فيه، إذ يُؤدي إلى تصوير غير دقيق للأشخاص والشخصيات التاريخية. فعلى سبيل المثال، يُصوّر تطبيق Gemini أول رئيس للولايات المتحدة، جورج واشنطن، كشخص من ذوي البشرة الملونة.
ومن الأمثلة الأخرى صورة تم إنشاؤها بواسطة الذكاء الاصطناعي لامرأة من جنوب شرق آسيا ترتدي زيًا بابويًا، في حين أن جميع الباباوات الـ 266 على مر التاريخ كانوا رجالًا بيضًا.
علّقت جوجل مؤقتاً ميزة إنشاء الصور بالذكاء الاصطناعي في جهاز جيميني. |
بل إن شركة جيميني ابتكرت صوراً "متنوعة" للجنود الألمان خلال الحقبة النازية، بما في ذلك امرأة آسيوية ورجل أسود يرتدي زياً عسكرياً في عام 1943.
بما أن جوجل لم تنشر المعايير التي تحكم سلوك برنامج الدردشة الآلي Gemini، فمن الصعب الحصول على تفسير واضح لسبب قيام هذا البرنامج باختراع العديد من النسخ المتنوعة للشخصيات والأحداث التاريخية.
حدثت مشكلة Gemini بعد أيام قليلة من قيام OpenAI، الشركة التي تدير ChatGPT الشهيرة، بتقديم أداة ذكاء اصطناعي جديدة تسمى Sora، والتي يمكنها إنشاء مقاطع فيديو بناءً على أوصاف نصية من المستخدمين.
أقرت جوجل سابقًا بأن سلوك برنامج الدردشة الآلي غير المنتظم يحتاج إلى إصلاح. ربما أعطى برنامج جيميني الأولوية للتنوع القسري في توليد الصور، مما أدى إلى أوصاف غير دقيقة تاريخيًا.
بدأت جوجل في فبراير الماضي بتقديم ميزة توليد الصور باستخدام نموذج الذكاء الاصطناعي Gemini (المعروف سابقًا باسم Bard)، بهدف منافسة OpenAI وCopilot من مايكروسوفت. وكما هو الحال مع منافسيها، تُنشئ هذه الأداة مجموعة من الصور بناءً على النص الوصفي الذي يُدخله المستخدم.
مصدر










تعليق (0)