Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

AI-जनित छवियों में पूर्वाग्रह के उदाहरण

Công LuậnCông Luận13/07/2023

[विज्ञापन_1]

एआई इमेज जनरेटर कैसे काम करता है?

एआई-आधारित इमेज जनरेटर मशीन लर्निंग मॉडल का उपयोग करते हैं जो उपयोगकर्ता द्वारा दर्ज किए गए टेक्स्ट को लेकर विवरण से मेल खाने वाली एक या अधिक इमेज उत्पन्न करते हैं। इन मॉडलों को प्रशिक्षित करने के लिए लाखों इमेज वाले विशाल डेटासेट की आवश्यकता होती है।

चित्र में ये अजीबोगरीब गलतियाँ किसने कीं? चित्र 1

AI से चित्र बनाना अब आसान होता जा रहा है। फोटो: Ijnet

हालाँकि मिडजर्नी और DALL-E 2 दोनों ही सार्वजनिक रूप से यह नहीं बताते कि उनके एल्गोरिदम कैसे काम करते हैं, ज़्यादातर AI इमेज जनरेटर डिफ्यूज़न नामक एक प्रक्रिया का इस्तेमाल करते हैं। डिफ्यूज़न मॉडल प्रशिक्षण डेटा में यादृच्छिक "शोर" जोड़कर काम करते हैं, फिर शोर वाले हिस्सों को हटाकर डेटा का पुनर्निर्माण करना सीखते हैं। मॉडल इस प्रक्रिया को तब तक दोहराता है जब तक कि वह इनपुट से मेल खाने वाली छवि नहीं बना लेता।

यह चैटजीपीटी जैसे बड़े भाषा मॉडल से अलग है। बड़े भाषा मॉडल बिना लेबल वाले टेक्स्ट डेटा पर प्रशिक्षित होते हैं, जिसका विश्लेषण करके वे भाषा पैटर्न सीखते हैं और मानव जैसी प्रतिक्रियाएँ उत्पन्न करते हैं।

जनरेटिव एआई में, इनपुट आउटपुट को प्रभावित करता है। अगर कोई उपयोगकर्ता निर्दिष्ट करता है कि वह किसी छवि में केवल एक निश्चित त्वचा के रंग या लिंग वाले लोगों को ही शामिल करना चाहता है, तो मॉडल इसे ध्यान में रखेगा।

हालाँकि, इसके अलावा, मॉडल डिफ़ॉल्ट रूप से कुछ खास छवियाँ भी लौटाएगा। यह अक्सर प्रशिक्षण डेटा में विविधता की कमी का परिणाम होता है।

एक हालिया अध्ययन में पता लगाया गया कि मिडजर्नी किस प्रकार सामान्य शब्दों को दर्शाता है, जिसमें विशिष्ट मीडिया व्यवसाय (जैसे "समाचार विश्लेषक", "समाचार टिप्पणीकार" और "तथ्य जांचकर्ता") और अधिक सामान्य व्यवसाय (जैसे "पत्रकार", "रिपोर्टर", "पत्रकारिता") शामिल हैं।

यह अध्ययन पिछले अगस्त में शुरू हुआ था, और छह महीने बाद इसके नतीजों का फिर से विश्लेषण किया गया ताकि यह देखा जा सके कि उस दौरान सिस्टम में कितना सुधार हुआ है। कुल मिलाकर, शोधकर्ताओं ने उस दौरान 100 से ज़्यादा एआई-जनित छवियों का विश्लेषण किया।

आयुवाद और लिंगवाद

चित्र में ये अजीबोगरीब गलतियाँ किसने कीं? चित्र 2

विशिष्ट व्यवसायों के लिए, बुजुर्ग हमेशा पुरुष ही होते हैं। फोटो: IJN

गैर-विशिष्ट पदों के लिए, मिडजर्नी केवल युवा पुरुषों और महिलाओं की तस्वीरें दिखाता है। विशिष्ट भूमिकाओं के लिए, युवा और वृद्ध दोनों लोगों को दिखाया जाता है, लेकिन वृद्ध लोग हमेशा पुरुष ही होते हैं।

ये परिणाम अप्रत्यक्ष रूप से अनेक रूढ़िबद्ध धारणाओं को पुष्ट करते हैं, जिनमें यह धारणा भी शामिल है कि वृद्ध लोग गैर-विशिष्ट पदों पर काम नहीं करते, केवल वृद्ध पुरुष ही व्यावसायिक कार्य के लिए उपयुक्त होते हैं, तथा कम विशिष्ट कार्य आमतौर पर महिलाओं के लिए आरक्षित होते हैं।

पुरुषों और महिलाओं को जिस तरह से पेश किया जाता है, उसमें भी काफ़ी अंतर हैं। उदाहरण के लिए, महिलाएँ कम उम्र की और झुर्रियों से मुक्त होती हैं, जबकि पुरुषों को झुर्रियाँ होने की "इजाज़त" होती है।

ऐसा प्रतीत होता है कि एआई लिंग को द्विआधारी रूप में प्रस्तुत करता है, बजाय इसके कि वह अधिक तरल लिंग अभिव्यक्ति के उदाहरण दिखाए।

नस्लीय पूर्वाग्रह

चित्र में ये अजीबोगरीब गलतियाँ किसने कीं? चित्र 3

"रिपोर्टरों" या "पत्रकारों" की तस्वीरों में अक्सर सिर्फ़ गोरे लोग ही दिखाई देते हैं। फोटो: IJN

"पत्रकार", "रिपोर्टर" जैसे शब्दों के लिए लौटाई गई सभी छवियां केवल श्वेत लोगों की छवियां दिखाती हैं।

यह एआई के अंतर्निहित प्रशिक्षण डेटा में विविधता की कमी और कम प्रतिनिधित्व को प्रतिबिंबित कर सकता है।

वर्गवाद और रूढ़िवाद

चित्र में सभी पात्र "रूढ़िवादी" रूप-रंग में भी दिखाई देते हैं। उदाहरण के लिए, उनमें से किसी के भी शरीर पर टैटू, छेद, असामान्य हेयरस्टाइल या कोई अन्य विशेषता नहीं है जो उन्हें पारंपरिक चित्रणों से अलग करती हो।

कई लोग शर्ट और सूट जैसे औपचारिक कपड़े भी पहनते हैं। ये वर्गीय अपेक्षाओं के सूचक हैं। हालाँकि यह कुछ भूमिकाओं, जैसे टेलीविजन प्रस्तुतकर्ता, के लिए उपयुक्त हो सकता है, लेकिन यह ज़रूरी नहीं कि यह पत्रकारों या पत्रकारों के सामान्य पहनावे का सही प्रतिबिंब हो।

शहरीकरण

चित्र में ये अजीबोगरीब गलतियाँ किसने कीं? चित्र 4

सभी तस्वीरें डिफ़ॉल्ट रूप से शहर में सेट की गई हैं, हालाँकि कोई भौगोलिक संदर्भ नहीं है। फोटो: IJN

किसी भी स्थान या भौगोलिक संदर्भ का उल्लेख न करने के बावजूद, AI द्वारा लौटाई गई तस्वीरों में गगनचुंबी इमारतें या व्यस्त सड़कें जैसे शहरी स्थान शामिल थे। यह सच नहीं है क्योंकि दुनिया की आधी से ज़्यादा आबादी शहरों में रहती है।

रगड़ा हुआ

मीडियाकर्मियों की छवियों में पुरानी तकनीकें जैसे टाइपराइटर, प्रिंटर और पुराने कैमरे शामिल हैं।

चूंकि आज बहुत से पेशेवर एक जैसे दिखते हैं, इसलिए ऐसा प्रतीत होता है कि AI वर्णित भूमिकाओं को अधिक विशिष्ट बनाने के लिए अधिक विभेदित प्रौद्योगिकियों (पुरानी और अप्रयुक्त प्रौद्योगिकियों सहित) का उपयोग कर रहा है।

इसलिए अगर आप अपनी खुद की AI इमेज बना रहे हैं, तो विवरण लिखते समय संभावित पूर्वाग्रहों पर विचार करें। अन्यथा, आप अनजाने में उन हानिकारक रूढ़ियों को मज़बूत कर रहे होंगे जिन्हें दूर करने में समाज दशकों से लगा हुआ है।

होआंग टन (आईजेएन के अनुसार)


[विज्ञापन_2]
स्रोत

टिप्पणी (0)

No data
No data

उसी विषय में

उसी श्रेणी में

2 बिलियन TikTok व्यूज़ ने Le Hoang Hiep को A50 से A80 तक का सबसे हॉट सैनिक बताया
मिशन A80 को पूरा करने के 100 से अधिक दिनों के बाद सैनिकों ने भावुक होकर हनोई को अलविदा कहा
रात में हो ची मिन्ह शहर को रोशनी से जगमगाते देखना
राजधानी के लोगों ने धीमी विदाई के साथ ए80 सैनिकों को हनोई से विदा किया।

उसी लेखक की

विरासत

आकृति

व्यापार

No videos available

समाचार

राजनीतिक प्रणाली

स्थानीय

उत्पाद