AI امیج جنریٹر کیسے کام کرتا ہے؟
AI پر مبنی امیج جنریٹر مشین لرننگ ماڈلز کا استعمال کرتے ہیں جو صارف کے درج کردہ متن کو لیتے ہیں اور ایک یا زیادہ تصاویر تیار کرتے ہیں جو تفصیل سے مماثل ہوں۔ ان ماڈلز کو تربیت دینے کے لیے لاکھوں تصاویر والے بڑے ڈیٹا سیٹس کی ضرورت ہوتی ہے۔
AI کے ساتھ تصاویر بنانا آسان ہوتا جا رہا ہے۔ تصویر: اجنیٹ
اگرچہ نہ تو Midjourney اور نہ ہی DALL-E 2 عوامی طور پر اس بات کا انکشاف کرتے ہیں کہ ان کے الگورتھم کیسے کام کرتے ہیں، زیادہ تر AI امیج جنریٹر ایک ایسا عمل استعمال کرتے ہیں جسے ڈفیوژن کہتے ہیں۔ ڈفیوژن ماڈلز ٹریننگ ڈیٹا میں بے ترتیب "شور" شامل کرکے کام کرتے ہیں، پھر شور والے حصوں کو ہٹا کر ڈیٹا کو دوبارہ بنانا سیکھیں۔ ماڈل اس عمل کو اس وقت تک دہراتا ہے جب تک کہ یہ ان پٹ سے مماثل امیج تیار نہ کرے۔
یہ ChatGPT جیسے بڑے زبان کے ماڈلز سے مختلف ہے۔ بڑے زبان کے ماڈلز کو بغیر لیبل والے ٹیکسٹ ڈیٹا پر تربیت دی جاتی ہے، جس کا تجزیہ وہ زبان کے نمونوں کو سیکھنے اور انسانوں کی طرح کے ردعمل پیدا کرنے کے لیے کرتے ہیں۔
جنریٹو AI میں، ان پٹ آؤٹ پٹ کو متاثر کرتا ہے۔ اگر کوئی صارف یہ بتاتا ہے کہ وہ کسی تصویر میں صرف جلد کے مخصوص رنگ یا جنس والے لوگوں کو شامل کرنا چاہتے ہیں، تو ماڈل اس کو مدنظر رکھے گا۔
تاہم، اس کے علاوہ، ماڈل کچھ تصاویر کو واپس کرنے کے لیے بھی ڈیفالٹ ہوتا ہے۔ یہ اکثر تربیتی ڈیٹا میں تنوع کی کمی کا نتیجہ ہوتا ہے۔
ایک حالیہ مطالعہ نے اس بات کی کھوج کی کہ کس طرح مڈجرنی بظاہر عام اصطلاحات کا تصور کرتا ہے، بشمول میڈیا کے خصوصی پیشے (جیسے "خبروں کا تجزیہ کار،" "نیوز مبصر،" اور "حقائق جانچنے والا") اور مزید عمومی پیشے (جیسے "صحافی،" "رپورٹر،" "صحافت")۔
یہ مطالعہ گزشتہ اگست میں شروع ہوا، اور نتائج چھ ماہ بعد دوبارہ چلائے گئے تاکہ یہ دیکھا جا سکے کہ اس وقت کے دوران نظام میں کس طرح بہتری آئی ہے۔ مجموعی طور پر، محققین نے اس وقت کے دوران 100 سے زیادہ AI سے تیار کردہ تصاویر کا تجزیہ کیا۔
عمر پرستی اور جنس پرستی
مخصوص پیشوں کے لیے، بزرگ ہمیشہ مرد ہوتے ہیں۔ تصویر: آئی جے این
غیر مخصوص ملازمت کے عنوانات کے لیے، مڈجرنی صرف نوجوان مردوں اور عورتوں کی تصاویر دکھاتا ہے۔ مخصوص کرداروں کے لیے، چھوٹے اور بڑے دونوں کو دکھایا گیا ہے، لیکن بوڑھے لوگ ہمیشہ مرد ہوتے ہیں۔
یہ نتائج واضح طور پر متعدد دقیانوسی تصورات کو تقویت دیتے ہیں، بشمول یہ مفروضہ کہ بوڑھے لوگ غیر خصوصی عہدوں پر کام نہیں کرتے، کہ صرف بوڑھے مرد ہی پیشہ ورانہ کام کے لیے موزوں ہوتے ہیں، اور یہ کہ کم خصوصی کام عام طور پر خواتین کے لیے مخصوص ہیں۔
مردوں اور عورتوں کو کس طرح پیش کیا جاتا ہے اس میں بھی نمایاں فرق موجود ہیں۔ مثال کے طور پر، خواتین کم عمر اور جھریوں سے پاک ہوتی ہیں، جبکہ مردوں کو جھریاں رکھنے کی "اجازت" ہوتی ہے۔
AI زیادہ سیال صنفی اظہار کی مثالیں دکھانے کے بجائے جنس کو بائنری کے طور پر ظاہر کرتا ہے۔
نسلی تعصب
"نامہ نگاروں" یا "صحافیوں" کی تصاویر اکثر صرف سفید فام لوگوں کو دکھاتی ہیں۔ تصویر: آئی جے این
"صحافی"، "رپورٹر" جیسی اصطلاحات کے لیے واپس کی گئی تمام تصاویر صرف سفید فام لوگوں کی تصاویر دکھاتی ہیں۔
یہ AI کے بنیادی تربیتی ڈیٹا میں تنوع اور کم نمائندگی کی کمی کو ظاہر کر سکتا ہے۔
طبقاتی اور قدامت پرستی
تصویر میں موجود تمام کرداروں کی بھی ایک "قدامت پسند" شکل ہے۔ مثال کے طور پر، ان میں سے کسی میں بھی ٹیٹوز، چھیدنے، غیر معمولی بالوں کے انداز، یا کوئی دوسری خصوصیات نہیں ہیں جو انہیں روایتی عکاسی سے ممتاز کرتی ہیں۔
بہت سے لوگ رسمی لباس بھی پہنتے ہیں جیسے شرٹ اور سوٹ۔ یہ طبقاتی توقعات کے اشارے ہیں۔ اگرچہ یہ کچھ مخصوص کرداروں کے لیے موزوں ہو سکتا ہے، جیسے کہ ٹیلی ویژن کے پیش کنندگان، لیکن یہ ضروری نہیں کہ صحافی یا صحافی عام طور پر کس طرح کے لباس پہنتے ہیں اس کا صحیح عکاس ہو۔
شہریت
تمام تصاویر شہر میں بطور ڈیفالٹ سیٹ کی گئی ہیں، حالانکہ کوئی جغرافیائی حوالہ نہیں ہے۔ تصویر: آئی جے این
کسی مقام یا جغرافیائی سیاق و سباق کی وضاحت نہ کرنے کے باوجود، AI کی طرف سے واپس کی گئی تصاویر میں شہری جگہیں جیسے فلک بوس عمارتیں یا مصروف سڑکیں شامل تھیں۔ یہ درست نہیں ہے کیونکہ دنیا کی نصف سے زیادہ آبادی شہروں میں رہتی ہے۔
فرسودہ
میڈیا ورکرز کی تصاویر میں پرانی ٹیکنالوجیز جیسے ٹائپ رائٹرز، پرنٹرز اور ونٹیج کیمرے شامل ہیں۔
چونکہ آج کل بہت سے پیشہ ور ایک جیسے نظر آتے ہیں، ایسا لگتا ہے کہ AI بیان کردہ کرداروں کو مزید واضح بنانے کے لیے مزید مختلف ٹیکنالوجیز (بشمول فرسودہ اور غیر استعمال شدہ) پر کام کر رہا ہے۔
لہذا اگر آپ اپنی خود کی AI تصاویر بنا رہے ہیں، تو تفصیل لکھتے وقت ممکنہ تعصبات پر غور کریں۔ بصورت دیگر، آپ نادانستہ طور پر نقصان دہ دقیانوسی تصورات کو تقویت دے رہے ہوں گے جنہیں دور کرنے کی کوشش میں معاشرے نے دہائیاں گزاری ہیں۔
ہوانگ ٹن (آئی جے این کے مطابق)
ماخذ
تبصرہ (0)