Vietnam.vn - Nền tảng quảng bá Việt Nam

এআই-জেনারেটেড ছবিতে পক্ষপাতের উদাহরণ

Công LuậnCông Luận13/07/2023

[বিজ্ঞাপন_১]

এআই ইমেজ জেনারেটর কিভাবে কাজ করে?

এআই-ভিত্তিক ইমেজ জেনারেটরগুলি মেশিন লার্নিং মডেল ব্যবহার করে যা ব্যবহারকারীর দ্বারা প্রবেশ করা টেক্সট নেয় এবং বর্ণনার সাথে মেলে এমন এক বা একাধিক ছবি তৈরি করে। এই মডেলগুলিকে প্রশিক্ষণের জন্য লক্ষ লক্ষ ছবি সহ বিশাল ডেটাসেট প্রয়োজন।

ছবিতে অদ্ভুত ভুলগুলো কে তৈরি করেছে? ছবি ১

AI দিয়ে ছবি তৈরি করা আরও সহজ হয়ে উঠছে। ছবি: Ijnet

যদিও মিডজার্নি বা DALL-E 2 তাদের অ্যালগরিদম কীভাবে কাজ করে তা প্রকাশ্যে প্রকাশ করে না, বেশিরভাগ AI ইমেজ জেনারেটর ডিফিউশন নামক একটি প্রক্রিয়া ব্যবহার করে। ডিফিউশন মডেলগুলি প্রশিক্ষণের ডেটাতে এলোমেলো "নয়েজ" যোগ করে কাজ করে, তারপর শব্দযুক্ত অংশগুলি সরিয়ে ডেটা পুনর্গঠন করতে শেখে। মডেলটি এই প্রক্রিয়াটি পুনরাবৃত্তি করে যতক্ষণ না এটিতে ইনপুটের সাথে মেলে এমন একটি চিত্র পাওয়া যায়।

এটি ChatGPT-এর মতো বৃহৎ ভাষা মডেল থেকে আলাদা। বৃহৎ ভাষা মডেলগুলিকে লেবেলবিহীন টেক্সট ডেটার উপর প্রশিক্ষণ দেওয়া হয়, যা তারা ভাষার ধরণ শিখতে এবং মানুষের মতো প্রতিক্রিয়া তৈরি করতে বিশ্লেষণ করে।

জেনারেটিভ এআই-তে, ইনপুট আউটপুটকে প্রভাবিত করে। যদি কোনও ব্যবহারকারী নির্দিষ্ট করে যে তারা শুধুমাত্র একটি নির্দিষ্ট ত্বকের রঙ বা লিঙ্গের লোকদের একটি ছবিতে অন্তর্ভুক্ত করতে চান, তাহলে মডেলটি সেই বিষয়টি বিবেচনা করবে।

তবে, এর পাশাপাশি, মডেলটি নির্দিষ্ট কিছু ছবি ফেরত দেওয়ার ক্ষেত্রেও ডিফল্ট হবে। এটি প্রায়শই প্রশিক্ষণের তথ্যে বৈচিত্র্যের অভাবের ফলে ঘটে।

সাম্প্রতিক একটি গবেষণায় অনুসন্ধান করা হয়েছে যে মিডজার্নি কীভাবে আপাতদৃষ্টিতে সাধারণ শব্দগুলিকে কল্পনা করে, যার মধ্যে রয়েছে বিশেষায়িত মিডিয়া পেশা (যেমন "সংবাদ বিশ্লেষক," "সংবাদ ভাষ্যকার," এবং "তথ্য পরীক্ষক") এবং আরও সাধারণ পেশা (যেমন "সাংবাদিক," "প্রতিবেদক," "সাংবাদিকতা")।

গত বছরের আগস্টে এই গবেষণাটি পরিচালিত হয়েছিল এবং ছয় মাস পরে ফলাফলগুলি পুনরায় চালানো হয়েছিল যাতে দেখা যায় যে সেই সময়ের মধ্যে সিস্টেমটি কতটা উন্নত হয়েছে। মোট, গবেষকরা সেই সময়ের মধ্যে ১০০ টিরও বেশি AI-উত্পাদিত ছবি বিশ্লেষণ করেছেন।

বয়সবাদ এবং যৌনতাবাদ

ছবি ২-এর অদ্ভুত ত্রুটিগুলো কে তৈরি করেছে?

নির্দিষ্ট পেশার ক্ষেত্রে, বয়স্ক ব্যক্তি সর্বদা পুরুষ। ছবি: আইজেএন

নির্দিষ্ট পদবি ছাড়া, মিডজার্নিতে শুধুমাত্র অল্পবয়সী পুরুষ এবং মহিলাদের ছবি দেখানো হয়। নির্দিষ্ট পদের জন্য, অল্পবয়সী এবং বয়স্ক উভয়কেই দেখানো হয়, তবে বয়স্ক ব্যক্তিরা সর্বদা পুরুষ।

এই ফলাফলগুলি পরোক্ষভাবে বেশ কিছু স্টেরিওটাইপকে শক্তিশালী করে, যার মধ্যে রয়েছে এই ধারণা যে বয়স্ক ব্যক্তিরা অ-বিশেষায়িত পদে কাজ করেন না, কেবল বয়স্ক পুরুষরা পেশাদার কাজের জন্য উপযুক্ত, এবং কম বিশেষায়িত কাজ সাধারণত মহিলাদের জন্য সংরক্ষিত।

পুরুষ এবং মহিলাদের উপস্থাপনের ক্ষেত্রেও লক্ষণীয় পার্থক্য রয়েছে। উদাহরণস্বরূপ, মহিলারা কম বয়সী এবং বলিরেখা মুক্ত, যেখানে পুরুষদের বলিরেখা থাকার "অনুমোদিত"।

এআই লিঙ্গকে আরও তরল লিঙ্গ প্রকাশের উদাহরণ দেখানোর পরিবর্তে বাইনারি হিসাবে উপস্থাপন করে বলে মনে হচ্ছে।

জাতিগত কুসংস্কার

৩ নম্বর ছবিতে অদ্ভুত ত্রুটিগুলো কে তৈরি করেছে?

"প্রতিবেদক" বা "সাংবাদিকদের" ছবিতে প্রায়শই কেবল শ্বেতাঙ্গদের দেখানো হয়। ছবি: আইজেএন

"সাংবাদিক", "প্রতিবেদক" এর মতো শব্দের জন্য ফেরত পাঠানো সমস্ত ছবিতে কেবল শ্বেতাঙ্গদের ছবি দেখানো হয়েছে।

এটি AI-এর অন্তর্নিহিত প্রশিক্ষণ তথ্যে বৈচিত্র্যের অভাব এবং কম প্রতিনিধিত্বকে প্রতিফলিত করতে পারে।

শ্রেণীবাদ এবং রক্ষণশীলতা

ছবির সকল চরিত্রের চেহারাও "রক্ষণশীল"। উদাহরণস্বরূপ, তাদের কারোরই ট্যাটু, ছিদ্র, অস্বাভাবিক চুলের স্টাইল বা অন্য কোনও বৈশিষ্ট্য নেই যা তাদের ঐতিহ্যবাহী চিত্রণ থেকে আলাদা করে।

অনেকে শার্ট এবং স্যুটের মতো আনুষ্ঠানিক পোশাকও পরেন। এগুলি শ্রেণীগত প্রত্যাশার সূচক। যদিও এটি টেলিভিশন উপস্থাপকের মতো নির্দিষ্ট ভূমিকার জন্য উপযুক্ত হতে পারে, তবে এটি সাংবাদিক বা সাংবাদিকরা সাধারণত কীভাবে পোশাক পরেন তার প্রকৃত প্রতিফলন নয়।

নগরায়ন

ছবিতে অদ্ভুত ভুলগুলো কে তৈরি করেছে? ছবি ৪

ছবিগুলো সবই ডিফল্টভাবে শহরের জন্য সেট করা আছে, যদিও এর কোনও ভৌগোলিক উল্লেখ নেই। ছবি: আইজেএন

কোনও অবস্থান বা ভৌগোলিক প্রেক্ষাপট উল্লেখ না করলেও, AI দ্বারা ফেরত দেওয়া ছবিগুলিতে আকাশচুম্বী ভবন বা ব্যস্ত রাস্তার মতো শহুরে স্থান অন্তর্ভুক্ত রয়েছে। এটি সত্য নয় কারণ বিশ্বের জনসংখ্যার অর্ধেকেরও বেশি শহরে বাস করে।

পুরনো

মিডিয়া কর্মীদের ছবিতে টাইপরাইটার, প্রিন্টার এবং ভিনটেজ ক্যামেরার মতো পুরনো প্রযুক্তির ছবি রয়েছে।

যেহেতু আজকাল অনেক পেশাদার একই রকম দেখতে, তাই বর্ণিত ভূমিকাগুলিকে আরও স্বতন্ত্র করে তুলতে AI আরও ভিন্ন প্রযুক্তির (পুরানো এবং অব্যবহৃত প্রযুক্তি সহ) ব্যবহার করছে বলে মনে হচ্ছে।

তাই যদি আপনি নিজের AI ছবি তৈরি করেন, তাহলে বর্ণনা লেখার সময় সম্ভাব্য পক্ষপাতগুলি বিবেচনা করুন। অন্যথায়, আপনি অসাবধানতাবশত ক্ষতিকারক স্টেরিওটাইপগুলিকে শক্তিশালী করতে পারেন যা সমাজ কয়েক দশক ধরে দূর করার চেষ্টা করে আসছে।

হোয়াং টন (আইজেএন অনুসারে)


[বিজ্ঞাপন_২]
উৎস

মন্তব্য (0)

No data
No data

একই বিষয়ে

একই বিভাগে

মধ্য-শরৎ উৎসবে ফুল সাজানো শিখতে, বন্ধনের অভিজ্ঞতা খুঁজে পেতে লক্ষ লক্ষ টাকা খরচ করুন
সন লা-র আকাশে বেগুনি সিম ফুলের একটি পাহাড় আছে
তা জুয়ায় মেঘের খোঁজে হারিয়ে যাওয়া
হা লং বে-এর সৌন্দর্য ইউনেস্কো তিনবার ঐতিহ্যবাহী স্থান হিসেবে স্বীকৃতি দিয়েছে।

একই লেখকের

ঐতিহ্য

;

চিত্র

;

ব্যবসায়

;

No videos available

খবর

;

রাজনৈতিক ব্যবস্থা

;

স্থানীয়

;

পণ্য

;