Vietnam.vn - Nền tảng quảng bá Việt Nam

AI کے ذریعے تخلیق کردہ تصویری بگاڑ کی مثالیں۔

Công LuậnCông Luận13/07/2023


AI سے چلنے والے امیج جنریٹر کیسے کام کرتے ہیں؟

مصنوعی ذہانت پر مبنی امیج جنریٹر مشین لرننگ ماڈلز کا استعمال کرتے ہیں، صارف کے درج کردہ متن کو استعمال کرتے ہوئے ایک یا زیادہ تصاویر بنانے کے لیے جو تفصیل سے مماثل ہیں۔ ان ماڈلز کی تربیت کے لیے لاکھوں تصاویر والے بڑے ڈیٹا سیٹس کی ضرورت ہوتی ہے۔

تصویر میں تشویشناک غلطیاں اس وجہ سے ہیں کہ اسے کس نے بنایا (تصویر 1)۔

AI کا استعمال کرتے ہوئے تصاویر بنانا بہت آسان ہوتا جا رہا ہے۔ تصویر: اجنیٹ

اگرچہ Midjourney اور DALL-E 2 نے اپنے الگورتھم کے درست کام کا عوامی طور پر انکشاف نہیں کیا ہے، لیکن زیادہ تر AI امیج جنریٹر ایک ایسا عمل استعمال کرتے ہیں جسے ڈفیوژن کہتے ہیں۔ ڈفیوژن ماڈل ٹریننگ ڈیٹا میں بے ترتیب "شور" شامل کرکے کام کرتے ہیں، پھر شور کو ہٹا کر ڈیٹا کی تشکیل نو کرنا سیکھتے ہیں۔ ماڈل اس عمل کو اس وقت تک دہراتا ہے جب تک کہ یہ ان پٹ سے مماثل امیج تیار نہ کرے۔

یہ بڑے پیمانے پر زبان کے ماڈلز جیسے ChatGPT سے مختلف ہے۔ بڑے پیمانے پر زبان کے ماڈلز کو بغیر لیبل والے ٹیکسٹ ڈیٹا پر تربیت دی جاتی ہے، جس کا تجزیہ وہ زبان کے نمونوں کو سیکھنے اور انسانوں کی طرح ردعمل پیدا کرنے کے لیے کرتے ہیں۔

عام طور پر AI، ان پٹ آؤٹ پٹ کو متاثر کرتا ہے۔ اگر صارف یہ بتاتا ہے کہ وہ تصویر میں صرف جلد کے مخصوص رنگوں یا جنس کے لوگوں کو شامل کرنا چاہتے ہیں، تو ماڈل اس کو مدنظر رکھے گا۔

تاہم، اس کے علاوہ، ماڈل کچھ تصاویر کو واپس کرنے کے لیے بھی ڈیفالٹ ہوتا ہے۔ یہ اکثر تربیتی ڈیٹا میں تنوع کی کمی کا نتیجہ ہوتا ہے۔

ایک حالیہ مطالعہ نے دریافت کیا کہ کس طرح مڈجرنی نے بظاہر عام اصطلاحات کو تصور کیا، بشمول میڈیا کے خصوصی پیشے (جیسے "خبروں کے تجزیہ کار،" "خبروں کے مبصر،" اور "فیکٹ چیکر") اور مزید عام پیشے (جیسے "صحافی،" "رپورٹر،" اور "اخبار نگاری")۔

یہ تحقیق گزشتہ اگست میں شروع ہوئی، اور اس وقت کے دوران نظام کی پیشرفت کا اندازہ لگانے کے لیے چھ ماہ کے بعد نتائج کا دوبارہ جائزہ لیا گیا۔ مجموعی طور پر، محققین نے اس عرصے کے دوران 100 سے زیادہ AI سے تیار کردہ تصاویر کا تجزیہ کیا۔

عمر کی تفریق اور صنفی امتیاز

تصویر 2 میں تشویشناک تضادات ان کی تخلیق کی وجہ سے ہیں۔

مخصوص پیشوں کے لیے، بوڑھا شخص ہمیشہ مرد ہوتا ہے۔ تصویر: آئی جے این

غیر مخصوص ملازمت کے عنوانات کے لیے، مڈجرنی صرف نوجوان مردوں اور عورتوں کی تصویر کشی کرتا ہے۔ خصوصی کرداروں کے لیے، جوان اور بوڑھے دونوں کو دکھایا گیا ہے، لیکن بوڑھے لوگ ہمیشہ مرد ہوتے ہیں۔

یہ نتائج واضح طور پر کئی دقیانوسی تصورات کو تقویت دیتے ہیں، بشمول یہ مفروضہ کہ بوڑھے لوگ غیر خصوصی عہدوں پر کام نہیں کرتے، کہ صرف بوڑھے مرد خصوصی کام کے لیے موزوں ہوتے ہیں، اور یہ کہ کم خصوصی کام عام طور پر خواتین کے لیے مخصوص ہوتے ہیں۔

مردوں اور عورتوں کو کس طرح پیش کیا جاتا ہے اس میں بھی نمایاں فرق موجود ہیں۔ مثال کے طور پر، خواتین کم عمر اور جھریوں سے پاک ہوتی ہیں، جبکہ مردوں کو جھریاں رکھنے کی "اجازت" ہوتی ہے۔

AI زیادہ لچکدار صنفی اظہار کی مثالیں ظاہر کرنے کے بجائے ایک بائنری فارمیٹ میں صنف کی نمائندگی کرتا دکھائی دیتا ہے۔

نسلی تعصب

تصویر 3 میں تشویشناک غلطیاں کسی نے بنائی تھیں۔

"نامہ نگاروں" یا "صحافیوں" کے لیے بنائی گئی تصاویر میں عام طور پر صرف سفید فام لوگوں کو دکھایا جاتا ہے۔ تصویر: آئی جے این

"صحافی" یا "رپورٹر" جیسی اصطلاحات کے لیے واپس کی گئی تمام تصاویر صرف سفید فام لوگوں کی تصاویر دکھاتی ہیں۔

یہ بنیادی AI تربیتی ڈیٹا میں تنوع اور نمائندگی کی کمی کو ظاہر کر سکتا ہے۔

طبقاتی اور قدامت پرستی

تصاویر کے تمام کردار بھی "قدامت پسند" ظاہری شکل کے حامل ہیں۔ مثال کے طور پر، ان میں سے کسی میں بھی ٹیٹوز، چھیدنے، غیر معمولی بالوں کے انداز، یا کوئی دوسری خصوصیات نہیں ہیں جو انہیں روایتی تصویروں سے ممتاز کرتی ہیں۔

بہت سے لوگ رسمی لباس بھی پہنتے ہیں جیسے شرٹ اور سوٹ۔ یہ طبقاتی توقعات کے اشارے ہیں۔ اگرچہ یہ لباس کچھ کرداروں کے لیے موزوں ہو سکتا ہے، جیسے کہ ٹیلی ویژن کے پیش کنندگان، لیکن یہ ضروری نہیں کہ عام طور پر صحافیوں یا صحافیوں کے لباس کو ظاہر کرے۔

شہریت

تصویر 4 میں تشویشناک غلطیاں کسی نے بنائی تھیں۔

تمام تصاویر شہر میں ترتیب دی گئی ہیں، حالانکہ کوئی جغرافیائی اشارہ نہیں ہے۔ تصویر: آئی جے این

اگرچہ کوئی خاص جغرافیائی محل وقوع یا سیاق و سباق متعین نہیں کیا گیا ہے، لیکن AI کی طرف سے واپس کی گئی تصاویر میں شہری جگہیں جیسے فلک بوس عمارتیں یا ہلچل مچانے والے محلے شامل ہیں۔ یہ غلط ہے، کیونکہ دنیا کی نصف سے زیادہ آبادی شہروں میں رہتی ہے۔

فرسودہ

میڈیا ورکرز کی تصاویر میں اکثر فرسودہ ٹیکنالوجیز جیسے ٹائپ رائٹرز، پرنٹرز اور ونٹیج کیمرے شامل ہوتے ہیں۔

چونکہ ان دنوں بہت سے پیشہ ور افراد ایک جیسے نظر آتے ہیں، ایسا لگتا ہے کہ AI بیان کردہ کرداروں کو واضح کرنے کے لیے زیادہ مختلف ٹیکنالوجیز (بشمول پرانی اور اب استعمال میں نہ ہونے والی) پر انحصار کر رہا ہے۔

لہذا، اگر آپ اپنی خود کی AI تصاویر بنا رہے ہیں، تو تفصیل لکھتے وقت ممکنہ تعصبات پر غور کریں۔ بصورت دیگر، آپ نادانستہ طور پر نقصان دہ دقیانوسی تصورات کو تقویت دے رہے ہوں گے جن کو ختم کرنے کی کوشش میں معاشرے نے دہائیاں گزاری ہیں۔

ہوانگ ٹن (آئی جے این کے مطابق)



ماخذ

موضوع: تعصب

تبصرہ (0)

برائے مہربانی اپنی جذبات کا اظہار کرنے کے لیے تبصرہ کریں!

اسی موضوع میں

اسی زمرے میں

نوٹری ڈیم کیتھیڈرل کے لیے ایل ای ڈی اسٹار بنانے والی ورکشاپ کا قریبی منظر۔
ہو چی منہ شہر میں نوٹری ڈیم کیتھیڈرل کو روشن کرنے والا 8 میٹر لمبا کرسمس ستارہ خاص طور پر حیرت انگیز ہے۔
Huynh Nhu SEA گیمز میں تاریخ رقم کرتا ہے: ایک ایسا ریکارڈ جسے توڑنا بہت مشکل ہو گا۔
ہائی وے 51 پر شاندار چرچ کرسمس کے لیے جگمگا اٹھا، جو وہاں سے گزرنے والے ہر شخص کی توجہ مبذول کر رہا تھا۔

اسی مصنف کی

ورثہ

پیکر

کاروبار

سا دسمبر پھولوں کے گاؤں میں کسان فیسٹیول اور ٹیٹ (قمری نئے سال) 2026 کی تیاری میں اپنے پھولوں کی دیکھ بھال میں مصروف ہیں۔

کرنٹ افیئرز

سیاسی نظام

مقامی

پروڈکٹ