AI کے ذریعے تخلیق کردہ تصویری بگاڑ کی مثالیں۔

AI سے چلنے والے امیج جنریٹر کیسے کام کرتے ہیں؟

مصنوعی ذہانت پر مبنی امیج جنریٹر مشین لرننگ ماڈلز کا استعمال کرتے ہیں، صارف کے درج کردہ متن کو استعمال کرتے ہوئے ایک یا زیادہ تصاویر بنانے کے لیے جو تفصیل سے مماثل ہیں۔ ان ماڈلز کی تربیت کے لیے لاکھوں تصاویر والے بڑے ڈیٹا سیٹس کی ضرورت ہوتی ہے۔

تصویر میں تشویشناک غلطیاں اس وجہ سے ہیں کہ اسے کس نے بنایا (تصویر 1)۔ — AI کا استعمال کرتے ہوئے تصاویر بنانا بہت آسان ہوتا جا رہا ہے۔ تصویر: اجنیٹ

اگرچہ Midjourney اور DALL-E 2 نے اپنے الگورتھم کے درست کام کا عوامی طور پر انکشاف نہیں کیا ہے، لیکن زیادہ تر AI امیج جنریٹر ایک ایسا عمل استعمال کرتے ہیں جسے ڈفیوژن کہتے ہیں۔ ڈفیوژن ماڈل ٹریننگ ڈیٹا میں بے ترتیب "شور" شامل کرکے کام کرتے ہیں، پھر شور کو ہٹا کر ڈیٹا کی تشکیل نو کرنا سیکھتے ہیں۔ ماڈل اس عمل کو اس وقت تک دہراتا ہے جب تک کہ یہ ان پٹ سے مماثل امیج تیار نہ کرے۔

یہ بڑے پیمانے پر زبان کے ماڈلز جیسے ChatGPT سے مختلف ہے۔ بڑے پیمانے پر زبان کے ماڈلز کو بغیر لیبل والے ٹیکسٹ ڈیٹا پر تربیت دی جاتی ہے، جس کا تجزیہ وہ زبان کے نمونوں کو سیکھنے اور انسانوں کی طرح ردعمل پیدا کرنے کے لیے کرتے ہیں۔

عام طور پر AI، ان پٹ آؤٹ پٹ کو متاثر کرتا ہے۔ اگر صارف یہ بتاتا ہے کہ وہ تصویر میں صرف جلد کے مخصوص رنگوں یا جنس کے لوگوں کو شامل کرنا چاہتے ہیں، تو ماڈل اس کو مدنظر رکھے گا۔

تاہم، اس کے علاوہ، ماڈل کچھ تصاویر کو واپس کرنے کے لیے بھی ڈیفالٹ ہوتا ہے۔ یہ اکثر تربیتی ڈیٹا میں تنوع کی کمی کا نتیجہ ہوتا ہے۔

ایک حالیہ مطالعہ نے دریافت کیا کہ کس طرح مڈجرنی نے بظاہر عام اصطلاحات کو تصور کیا، بشمول میڈیا کے خصوصی پیشے (جیسے "خبروں کے تجزیہ کار،" "خبروں کے مبصر،" اور "فیکٹ چیکر") اور مزید عام پیشے (جیسے "صحافی،" "رپورٹر،" اور "اخبار نگاری")۔

یہ تحقیق گزشتہ اگست میں شروع ہوئی، اور اس وقت کے دوران نظام کی پیشرفت کا اندازہ لگانے کے لیے چھ ماہ کے بعد نتائج کا دوبارہ جائزہ لیا گیا۔ مجموعی طور پر، محققین نے اس عرصے کے دوران 100 سے زیادہ AI سے تیار کردہ تصاویر کا تجزیہ کیا۔

عمر کی تفریق اور صنفی امتیاز

تصویر 2 میں تشویشناک تضادات ان کی تخلیق کی وجہ سے ہیں۔ — مخصوص پیشوں کے لیے، بوڑھا شخص ہمیشہ مرد ہوتا ہے۔ تصویر: آئی جے این

غیر مخصوص ملازمت کے عنوانات کے لیے، مڈجرنی صرف نوجوان مردوں اور عورتوں کی تصویر کشی کرتا ہے۔ خصوصی کرداروں کے لیے، جوان اور بوڑھے دونوں کو دکھایا گیا ہے، لیکن بوڑھے لوگ ہمیشہ مرد ہوتے ہیں۔

یہ نتائج واضح طور پر کئی دقیانوسی تصورات کو تقویت دیتے ہیں، بشمول یہ مفروضہ کہ بوڑھے لوگ غیر خصوصی عہدوں پر کام نہیں کرتے، کہ صرف بوڑھے مرد خصوصی کام کے لیے موزوں ہوتے ہیں، اور یہ کہ کم خصوصی کام عام طور پر خواتین کے لیے مخصوص ہوتے ہیں۔

مردوں اور عورتوں کو کس طرح پیش کیا جاتا ہے اس میں بھی نمایاں فرق موجود ہیں۔ مثال کے طور پر، خواتین کم عمر اور جھریوں سے پاک ہوتی ہیں، جبکہ مردوں کو جھریاں رکھنے کی "اجازت" ہوتی ہے۔

AI زیادہ لچکدار صنفی اظہار کی مثالیں ظاہر کرنے کے بجائے ایک بائنری فارمیٹ میں صنف کی نمائندگی کرتا دکھائی دیتا ہے۔

نسلی تعصب

تصویر 3 میں تشویشناک غلطیاں کسی نے بنائی تھیں۔ — "نامہ نگاروں" یا "صحافیوں" کے لیے بنائی گئی تصاویر میں عام طور پر صرف سفید فام لوگوں کو دکھایا جاتا ہے۔ تصویر: آئی جے این

"صحافی" یا "رپورٹر" جیسی اصطلاحات کے لیے واپس کی گئی تمام تصاویر صرف سفید فام لوگوں کی تصاویر دکھاتی ہیں۔

یہ بنیادی AI تربیتی ڈیٹا میں تنوع اور نمائندگی کی کمی کو ظاہر کر سکتا ہے۔

طبقاتی اور قدامت پرستی

تصاویر کے تمام کردار بھی "قدامت پسند" ظاہری شکل کے حامل ہیں۔ مثال کے طور پر، ان میں سے کسی میں بھی ٹیٹوز، چھیدنے، غیر معمولی بالوں کے انداز، یا کوئی دوسری خصوصیات نہیں ہیں جو انہیں روایتی تصویروں سے ممتاز کرتی ہیں۔

بہت سے لوگ رسمی لباس بھی پہنتے ہیں جیسے شرٹ اور سوٹ۔ یہ طبقاتی توقعات کے اشارے ہیں۔ اگرچہ یہ لباس کچھ کرداروں کے لیے موزوں ہو سکتا ہے، جیسے کہ ٹیلی ویژن کے پیش کنندگان، لیکن یہ ضروری نہیں کہ عام طور پر صحافیوں یا صحافیوں کے لباس کو ظاہر کرے۔

شہریت

تصویر 4 میں تشویشناک غلطیاں کسی نے بنائی تھیں۔ — تمام تصاویر شہر میں ترتیب دی گئی ہیں، حالانکہ کوئی جغرافیائی اشارہ نہیں ہے۔ تصویر: آئی جے این

اگرچہ کوئی خاص جغرافیائی محل وقوع یا سیاق و سباق متعین نہیں کیا گیا ہے، لیکن AI کی طرف سے واپس کی گئی تصاویر میں شہری جگہیں جیسے فلک بوس عمارتیں یا ہلچل مچانے والے محلے شامل ہیں۔ یہ غلط ہے، کیونکہ دنیا کی نصف سے زیادہ آبادی شہروں میں رہتی ہے۔

فرسودہ

میڈیا ورکرز کی تصاویر میں اکثر فرسودہ ٹیکنالوجیز جیسے ٹائپ رائٹرز، پرنٹرز اور ونٹیج کیمرے شامل ہوتے ہیں۔

چونکہ ان دنوں بہت سے پیشہ ور افراد ایک جیسے نظر آتے ہیں، ایسا لگتا ہے کہ AI بیان کردہ کرداروں کو واضح کرنے کے لیے زیادہ مختلف ٹیکنالوجیز (بشمول پرانی اور اب استعمال میں نہ ہونے والی) پر انحصار کر رہا ہے۔

لہذا، اگر آپ اپنی خود کی AI تصاویر بنا رہے ہیں، تو تفصیل لکھتے وقت ممکنہ تعصبات پر غور کریں۔ بصورت دیگر، آپ نادانستہ طور پر نقصان دہ دقیانوسی تصورات کو تقویت دے رہے ہوں گے جن کو ختم کرنے کی کوشش میں معاشرے نے دہائیاں گزاری ہیں۔

ہوانگ ٹن (آئی جے این کے مطابق)

ماخذ