Vietnam.vn - Nền tảng quảng bá Việt Nam

أمثلة على تشوهات الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي.

Công LuậnCông Luận13/07/2023


كيف تعمل مولدات الصور المدعومة بالذكاء الاصطناعي؟

تستخدم مولدات الصور القائمة على الذكاء الاصطناعي نماذج التعلم الآلي، حيث توظف النصوص التي يدخلها المستخدم لإنشاء صورة واحدة أو أكثر تتطابق مع الوصف. ويتطلب تدريب هذه النماذج مجموعات بيانات ضخمة تحتوي على ملايين الصور.

إن عدم الدقة المقلقة في الصورة يعود إلى من قام بإنشائها (الصورة 1).

أصبح إنشاء الصور باستخدام الذكاء الاصطناعي أمراً في غاية السهولة. الصورة: Ijnet

على الرغم من أن شركتي Midjourney وDALL-E 2 لم تكشفا علنًا عن آلية عمل خوارزمياتهما، فإن معظم مولدات الصور التي تعمل بالذكاء الاصطناعي تستخدم عملية تُسمى الانتشار. تعمل نماذج الانتشار عن طريق إضافة "ضوضاء" عشوائية إلى بيانات التدريب، ثم تعلم إعادة بناء البيانات بإزالة هذه الضوضاء. يكرر النموذج هذه العملية حتى ينتج صورة مطابقة للصورة المدخلة.

يختلف هذا عن نماذج اللغة واسعة النطاق مثل ChatGPT. يتم تدريب نماذج اللغة واسعة النطاق على بيانات نصية غير مصنفة، والتي تقوم بتحليلها لتعلم أنماط اللغة وتوليد استجابات شبيهة باستجابات البشر.

في الذكاء الاصطناعي بشكل عام، تؤثر المدخلات على المخرجات. فإذا حدد المستخدم أنه يريد فقط تضمين أشخاص من ألوان بشرة أو أجناس معينة في الصورة، فسيأخذ النموذج ذلك في الاعتبار.

مع ذلك، بالإضافة إلى ذلك، يميل النموذج أيضاً إلى إرجاع صور معينة بشكل افتراضي. غالباً ما يكون هذا نتيجة لنقص التنوع في بيانات التدريب.

استكشفت دراسة حديثة كيف قامت شركة Midjourney بتصوير المصطلحات العامة ظاهريًا، بما في ذلك المهن الإعلامية المتخصصة (مثل "محلل الأخبار" و"معلق الأخبار" و"مدقق الحقائق") والمهن الأكثر عمومية (مثل "الصحفي" و"المراسل" و"الصحافة").

بدأ البحث في أغسطس الماضي، وأُعيد تقييم النتائج بعد ستة أشهر لتقييم مدى تقدم النظام خلال تلك الفترة. وقد حلل الباحثون خلال هذه الفترة أكثر من 100 صورة مُولّدة بواسطة الذكاء الاصطناعي.

التمييز على أساس السن والتمييز على أساس الجنس

إن التناقضات المقلقة في الصورة الثانية تعود إلى من قام بإنشائها.

في بعض المهن، يكون الشخص الأكبر سناً ذكراً دائماً. الصورة: IJN

بالنسبة للمسميات الوظيفية غير المحددة، لا يصور موقع Midjourney إلا الشباب من الرجال والنساء. أما بالنسبة للأدوار المتخصصة، فيتم تصوير كل من الشباب وكبار السن، ولكن كبار السن يكونون دائماً من الذكور.

تعزز هذه النتائج ضمنيًا العديد من الصور النمطية، بما في ذلك الافتراض بأن كبار السن لا يعملون في وظائف غير متخصصة، وأن الرجال الأكبر سنًا فقط هم المؤهلون للعمل المتخصص، وأن العمل الأقل تخصصًا عادة ما يكون مخصصًا للنساء.

توجد أيضاً اختلافات ملحوظة في كيفية تقديم الرجال والنساء. على سبيل المثال، تظهر النساء أصغر سناً وببشرة خالية من التجاعيد، بينما يُسمح للرجال بظهور التجاعيد.

ويبدو أن الذكاء الاصطناعي يمثل النوع الاجتماعي بصيغة ثنائية، بدلاً من عرض أمثلة على التعبير الأكثر مرونة عن النوع الاجتماعي.

التحيز العنصري

إن الأخطاء المقلقة في الصورة رقم 3 قد تم إنشاؤها بواسطة شخص ما.

الصور المخصصة لـ"المراسلين" أو "الصحفيين" عادةً ما تقتصر على صور لأشخاص بيض البشرة. الصورة: IJN

جميع الصور التي تظهر عند البحث عن مصطلحات مثل "صحفي" أو "مراسل" لا تعرض سوى صور لأشخاص بيض.

قد يعكس هذا نقصًا في التنوع والتمثيل في بيانات تدريب الذكاء الاصطناعي الأساسية.

الطبقية والمحافظة

جميع الشخصيات في الصور تتمتع بمظهر "محافظ". على سبيل المثال، لا يوجد لدى أي منهم وشم أو ثقوب في الجسم أو تسريحات شعر غير عادية أو أي سمات أخرى تميزهم عن الصور النمطية التقليدية.

يرتدي الكثيرون أيضاً ملابس رسمية كالقمصان والبدلات، وهذا مؤشر على مستوى الطبقة الاجتماعية. ورغم أن هذه الملابس قد تكون مناسبة لبعض الأدوار، كمقدمي البرامج التلفزيونية، إلا أنها لا تعكس بالضرورة قواعد اللباس العامة للمراسلين أو الصحفيين.

التخطيط العمراني

إن الأخطاء المقلقة في الصورة رقم 4 قد تم إنشاؤها بواسطة شخص ما.

جميع الصور ملتقطة في المدينة، على الرغم من عدم وجود أي إشارة جغرافية. الصورة: IJN

على الرغم من عدم تحديد موقع جغرافي أو سياق معين، فإن الصور التي يُنتجها الذكاء الاصطناعي تتضمن مساحات حضرية مثل ناطحات السحاب أو الأحياء الصاخبة. وهذا غير صحيح، إذ أن ما يزيد قليلاً عن نصف سكان العالم يعيشون في المدن.

قديم

غالباً ما تظهر صور العاملين في مجال الإعلام تقنيات قديمة مثل الآلات الكاتبة والطابعات والكاميرات القديمة.

نظراً لأن العديد من المهنيين يبدون متشابهين هذه الأيام، يبدو أن الذكاء الاصطناعي يعتمد على تقنيات أكثر تمايزاً (بما في ذلك تلك القديمة والتي لم تعد قيد الاستخدام) لجعل الأدوار الموصوفة أكثر وضوحاً.

لذا، إذا كنت تُنشئ صورًا خاصة بك باستخدام الذكاء الاصطناعي، فضع في اعتبارك التحيزات المحتملة عند كتابة الأوصاف. وإلا، فقد تُعزز دون قصد الصور النمطية الضارة التي سعى المجتمع لعقود من الزمن للقضاء عليها.

هوانغ تون (وفقًا للبحرية الإمبراطورية اليابانية)



مصدر

علامة: إجحاف

تعليق (0)

يرجى ترك تعليق لمشاركة مشاعرك!

نفس الموضوع

نفس الفئة

صورة مقربة لورشة العمل التي تصنع نجمة LED لكاتدرائية نوتردام.
تُعد نجمة عيد الميلاد التي يبلغ ارتفاعها 8 أمتار والتي تضيء كاتدرائية نوتردام في مدينة هو تشي منه لافتة للنظر بشكل خاص.
هوينه نهو يصنع التاريخ في دورة ألعاب جنوب شرق آسيا: رقم قياسي سيكون من الصعب جداً تحطيمه.
أضاءت الكنيسة المذهلة الواقعة على الطريق السريع رقم 51 احتفالاً بعيد الميلاد، ما لفت انتباه كل من يمر بها.

نفس المؤلف

إرث

شكل

عمل

ينشغل المزارعون في قرية سا ديك للزهور بالاعتناء بأزهارهم استعداداً للمهرجان وعيد رأس السنة القمرية (تيت) لعام 2026.

الأحداث الجارية

النظام السياسي

محلي

منتج