एआई इमेज जनरेटर कैसे काम करता है?
एआई-आधारित इमेज जनरेटर मशीन लर्निंग मॉडल का उपयोग करते हैं जो उपयोगकर्ता द्वारा दर्ज किए गए टेक्स्ट को लेकर विवरण से मेल खाने वाली एक या अधिक इमेज उत्पन्न करते हैं। इन मॉडलों को प्रशिक्षित करने के लिए लाखों इमेज वाले विशाल डेटासेट की आवश्यकता होती है।
AI से चित्र बनाना अब आसान होता जा रहा है। फोटो: Ijnet
हालाँकि मिडजर्नी और DALL-E 2 दोनों ही सार्वजनिक रूप से यह नहीं बताते कि उनके एल्गोरिदम कैसे काम करते हैं, ज़्यादातर AI इमेज जनरेटर डिफ्यूज़न नामक एक प्रक्रिया का इस्तेमाल करते हैं। डिफ्यूज़न मॉडल प्रशिक्षण डेटा में यादृच्छिक "शोर" जोड़कर काम करते हैं, फिर शोर वाले हिस्सों को हटाकर डेटा का पुनर्निर्माण करना सीखते हैं। मॉडल इस प्रक्रिया को तब तक दोहराता है जब तक कि वह इनपुट से मेल खाने वाली छवि नहीं बना लेता।
यह चैटजीपीटी जैसे बड़े भाषा मॉडल से अलग है। बड़े भाषा मॉडल बिना लेबल वाले टेक्स्ट डेटा पर प्रशिक्षित होते हैं, जिसका विश्लेषण करके वे भाषा पैटर्न सीखते हैं और मानव जैसी प्रतिक्रियाएँ उत्पन्न करते हैं।
जनरेटिव एआई में, इनपुट आउटपुट को प्रभावित करता है। अगर कोई उपयोगकर्ता निर्दिष्ट करता है कि वह किसी छवि में केवल एक निश्चित त्वचा के रंग या लिंग वाले लोगों को ही शामिल करना चाहता है, तो मॉडल इसे ध्यान में रखेगा।
हालाँकि, इसके अलावा, मॉडल डिफ़ॉल्ट रूप से कुछ खास छवियाँ भी लौटाएगा। यह अक्सर प्रशिक्षण डेटा में विविधता की कमी का परिणाम होता है।
एक हालिया अध्ययन में पता लगाया गया कि मिडजर्नी किस प्रकार सामान्य शब्दों को दर्शाता है, जिसमें विशिष्ट मीडिया व्यवसाय (जैसे "समाचार विश्लेषक", "समाचार टिप्पणीकार" और "तथ्य जांचकर्ता") और अधिक सामान्य व्यवसाय (जैसे "पत्रकार", "रिपोर्टर", "पत्रकारिता") शामिल हैं।
यह अध्ययन पिछले अगस्त में शुरू हुआ था, और छह महीने बाद इसके नतीजों का फिर से विश्लेषण किया गया ताकि यह देखा जा सके कि उस दौरान सिस्टम में कितना सुधार हुआ है। कुल मिलाकर, शोधकर्ताओं ने उस दौरान 100 से ज़्यादा एआई-जनित छवियों का विश्लेषण किया।
आयुवाद और लिंगवाद
विशिष्ट व्यवसायों के लिए, बुजुर्ग हमेशा पुरुष ही होते हैं। फोटो: IJN
गैर-विशिष्ट पदों के लिए, मिडजर्नी केवल युवा पुरुषों और महिलाओं की तस्वीरें दिखाता है। विशिष्ट भूमिकाओं के लिए, युवा और वृद्ध दोनों लोगों को दिखाया जाता है, लेकिन वृद्ध लोग हमेशा पुरुष ही होते हैं।
ये परिणाम अप्रत्यक्ष रूप से अनेक रूढ़िबद्ध धारणाओं को पुष्ट करते हैं, जिनमें यह धारणा भी शामिल है कि वृद्ध लोग गैर-विशिष्ट पदों पर काम नहीं करते, केवल वृद्ध पुरुष ही व्यावसायिक कार्य के लिए उपयुक्त होते हैं, तथा कम विशिष्ट कार्य आमतौर पर महिलाओं के लिए आरक्षित होते हैं।
पुरुषों और महिलाओं को जिस तरह से पेश किया जाता है, उसमें भी काफ़ी अंतर हैं। उदाहरण के लिए, महिलाएँ कम उम्र की और झुर्रियों से मुक्त होती हैं, जबकि पुरुषों को झुर्रियाँ होने की "इजाज़त" होती है।
ऐसा प्रतीत होता है कि एआई लिंग को द्विआधारी रूप में प्रस्तुत करता है, बजाय इसके कि वह अधिक तरल लिंग अभिव्यक्ति के उदाहरण दिखाए।
नस्लीय पूर्वाग्रह
"रिपोर्टरों" या "पत्रकारों" की तस्वीरों में अक्सर सिर्फ़ गोरे लोग ही दिखाई देते हैं। फोटो: IJN
"पत्रकार", "रिपोर्टर" जैसे शब्दों के लिए लौटाई गई सभी छवियां केवल श्वेत लोगों की छवियां दिखाती हैं।
यह एआई के अंतर्निहित प्रशिक्षण डेटा में विविधता की कमी और कम प्रतिनिधित्व को प्रतिबिंबित कर सकता है।
वर्गवाद और रूढ़िवाद
चित्र में सभी पात्र "रूढ़िवादी" रूप-रंग में भी दिखाई देते हैं। उदाहरण के लिए, उनमें से किसी के भी शरीर पर टैटू, छेद, असामान्य हेयरस्टाइल या कोई अन्य विशेषता नहीं है जो उन्हें पारंपरिक चित्रणों से अलग करती हो।
कई लोग शर्ट और सूट जैसे औपचारिक कपड़े भी पहनते हैं। ये वर्गीय अपेक्षाओं के सूचक हैं। हालाँकि यह कुछ भूमिकाओं, जैसे टेलीविजन प्रस्तुतकर्ता, के लिए उपयुक्त हो सकता है, लेकिन यह ज़रूरी नहीं कि यह पत्रकारों या पत्रकारों के सामान्य पहनावे का सही प्रतिबिंब हो।
शहरीकरण
सभी तस्वीरें डिफ़ॉल्ट रूप से शहर में सेट की गई हैं, हालाँकि कोई भौगोलिक संदर्भ नहीं है। फोटो: IJN
किसी भी स्थान या भौगोलिक संदर्भ का उल्लेख न करने के बावजूद, AI द्वारा लौटाई गई तस्वीरों में गगनचुंबी इमारतें या व्यस्त सड़कें जैसे शहरी स्थान शामिल थे। यह सच नहीं है क्योंकि दुनिया की आधी से ज़्यादा आबादी शहरों में रहती है।
रगड़ा हुआ
मीडियाकर्मियों की छवियों में पुरानी तकनीकें जैसे टाइपराइटर, प्रिंटर और पुराने कैमरे शामिल हैं।
चूंकि आज बहुत से पेशेवर एक जैसे दिखते हैं, इसलिए ऐसा प्रतीत होता है कि AI वर्णित भूमिकाओं को अधिक विशिष्ट बनाने के लिए अधिक विभेदित प्रौद्योगिकियों (पुरानी और अप्रयुक्त प्रौद्योगिकियों सहित) का उपयोग कर रहा है।
इसलिए अगर आप अपनी खुद की AI इमेज बना रहे हैं, तो विवरण लिखते समय संभावित पूर्वाग्रहों पर विचार करें। अन्यथा, आप अनजाने में उन हानिकारक रूढ़ियों को मज़बूत कर रहे होंगे जिन्हें दूर करने में समाज दशकों से लगा हुआ है।
होआंग टन (आईजेएन के अनुसार)
[विज्ञापन_2]
स्रोत
टिप्पणी (0)