এআই ইমেজ জেনারেটর কিভাবে কাজ করে?
এআই-ভিত্তিক ইমেজ জেনারেটরগুলি মেশিন লার্নিং মডেল ব্যবহার করে যা ব্যবহারকারীর দ্বারা প্রবেশ করা টেক্সট নেয় এবং বর্ণনার সাথে মেলে এমন এক বা একাধিক ছবি তৈরি করে। এই মডেলগুলিকে প্রশিক্ষণের জন্য লক্ষ লক্ষ ছবি সহ বিশাল ডেটাসেট প্রয়োজন।
AI দিয়ে ছবি তৈরি করা আরও সহজ হয়ে উঠছে। ছবি: Ijnet
যদিও মিডজার্নি বা DALL-E 2 তাদের অ্যালগরিদম কীভাবে কাজ করে তা প্রকাশ্যে প্রকাশ করে না, বেশিরভাগ AI ইমেজ জেনারেটর ডিফিউশন নামক একটি প্রক্রিয়া ব্যবহার করে। ডিফিউশন মডেলগুলি প্রশিক্ষণের ডেটাতে এলোমেলো "নয়েজ" যোগ করে কাজ করে, তারপর শব্দযুক্ত অংশগুলি সরিয়ে ডেটা পুনর্গঠন করতে শেখে। মডেলটি এই প্রক্রিয়াটি পুনরাবৃত্তি করে যতক্ষণ না এটিতে ইনপুটের সাথে মেলে এমন একটি চিত্র পাওয়া যায়।
এটি ChatGPT-এর মতো বৃহৎ ভাষা মডেল থেকে আলাদা। বৃহৎ ভাষা মডেলগুলিকে লেবেলবিহীন টেক্সট ডেটার উপর প্রশিক্ষণ দেওয়া হয়, যা তারা ভাষার ধরণ শিখতে এবং মানুষের মতো প্রতিক্রিয়া তৈরি করতে বিশ্লেষণ করে।
জেনারেটিভ এআই-তে, ইনপুট আউটপুটকে প্রভাবিত করে। যদি কোনও ব্যবহারকারী নির্দিষ্ট করে যে তারা শুধুমাত্র একটি নির্দিষ্ট ত্বকের রঙ বা লিঙ্গের লোকদের একটি ছবিতে অন্তর্ভুক্ত করতে চান, তাহলে মডেলটি সেই বিষয়টি বিবেচনা করবে।
তবে, এর পাশাপাশি, মডেলটি নির্দিষ্ট কিছু ছবি ফেরত দেওয়ার ক্ষেত্রেও ডিফল্ট হবে। এটি প্রায়শই প্রশিক্ষণের তথ্যে বৈচিত্র্যের অভাবের ফলে ঘটে।
সাম্প্রতিক একটি গবেষণায় অনুসন্ধান করা হয়েছে যে মিডজার্নি কীভাবে আপাতদৃষ্টিতে সাধারণ শব্দগুলিকে কল্পনা করে, যার মধ্যে রয়েছে বিশেষায়িত মিডিয়া পেশা (যেমন "সংবাদ বিশ্লেষক," "সংবাদ ভাষ্যকার," এবং "তথ্য পরীক্ষক") এবং আরও সাধারণ পেশা (যেমন "সাংবাদিক," "প্রতিবেদক," "সাংবাদিকতা")।
গত বছরের আগস্টে এই গবেষণাটি পরিচালিত হয়েছিল এবং ছয় মাস পরে ফলাফলগুলি পুনরায় চালানো হয়েছিল যাতে দেখা যায় যে সেই সময়ের মধ্যে সিস্টেমটি কতটা উন্নত হয়েছে। মোট, গবেষকরা সেই সময়ের মধ্যে ১০০ টিরও বেশি AI-উত্পাদিত ছবি বিশ্লেষণ করেছেন।
বয়সবাদ এবং যৌনতাবাদ
নির্দিষ্ট পেশার ক্ষেত্রে, বয়স্ক ব্যক্তি সর্বদা পুরুষ। ছবি: আইজেএন
নির্দিষ্ট পদবি ছাড়া, মিডজার্নিতে শুধুমাত্র অল্পবয়সী পুরুষ এবং মহিলাদের ছবি দেখানো হয়। নির্দিষ্ট পদের জন্য, অল্পবয়সী এবং বয়স্ক উভয়কেই দেখানো হয়, তবে বয়স্ক ব্যক্তিরা সর্বদা পুরুষ।
এই ফলাফলগুলি পরোক্ষভাবে বেশ কিছু স্টেরিওটাইপকে শক্তিশালী করে, যার মধ্যে রয়েছে এই ধারণা যে বয়স্ক ব্যক্তিরা অ-বিশেষায়িত পদে কাজ করেন না, কেবল বয়স্ক পুরুষরা পেশাদার কাজের জন্য উপযুক্ত, এবং কম বিশেষায়িত কাজ সাধারণত মহিলাদের জন্য সংরক্ষিত।
পুরুষ এবং মহিলাদের উপস্থাপনের ক্ষেত্রেও লক্ষণীয় পার্থক্য রয়েছে। উদাহরণস্বরূপ, মহিলারা কম বয়সী এবং বলিরেখা মুক্ত, যেখানে পুরুষদের বলিরেখা থাকার "অনুমোদিত"।
এআই লিঙ্গকে আরও তরল লিঙ্গ প্রকাশের উদাহরণ দেখানোর পরিবর্তে বাইনারি হিসাবে উপস্থাপন করে বলে মনে হচ্ছে।
জাতিগত কুসংস্কার
"প্রতিবেদক" বা "সাংবাদিকদের" ছবিতে প্রায়শই কেবল শ্বেতাঙ্গদের দেখানো হয়। ছবি: আইজেএন
"সাংবাদিক", "প্রতিবেদক" এর মতো শব্দের জন্য ফেরত পাঠানো সমস্ত ছবিতে কেবল শ্বেতাঙ্গদের ছবি দেখানো হয়েছে।
এটি AI-এর অন্তর্নিহিত প্রশিক্ষণ তথ্যে বৈচিত্র্যের অভাব এবং কম প্রতিনিধিত্বকে প্রতিফলিত করতে পারে।
শ্রেণীবাদ এবং রক্ষণশীলতা
ছবির সকল চরিত্রের চেহারাও "রক্ষণশীল"। উদাহরণস্বরূপ, তাদের কারোরই ট্যাটু, ছিদ্র, অস্বাভাবিক চুলের স্টাইল বা অন্য কোনও বৈশিষ্ট্য নেই যা তাদের ঐতিহ্যবাহী চিত্রণ থেকে আলাদা করে।
অনেকে শার্ট এবং স্যুটের মতো আনুষ্ঠানিক পোশাকও পরেন। এগুলি শ্রেণীগত প্রত্যাশার সূচক। যদিও এটি টেলিভিশন উপস্থাপকের মতো নির্দিষ্ট ভূমিকার জন্য উপযুক্ত হতে পারে, তবে এটি সাংবাদিক বা সাংবাদিকরা সাধারণত কীভাবে পোশাক পরেন তার প্রকৃত প্রতিফলন নয়।
নগরায়ন
ছবিগুলো সবই ডিফল্টভাবে শহরের জন্য সেট করা আছে, যদিও এর কোনও ভৌগোলিক উল্লেখ নেই। ছবি: আইজেএন
কোনও অবস্থান বা ভৌগোলিক প্রেক্ষাপট উল্লেখ না করলেও, AI দ্বারা ফেরত দেওয়া ছবিগুলিতে আকাশচুম্বী ভবন বা ব্যস্ত রাস্তার মতো শহুরে স্থান অন্তর্ভুক্ত রয়েছে। এটি সত্য নয় কারণ বিশ্বের জনসংখ্যার অর্ধেকেরও বেশি শহরে বাস করে।
পুরনো
মিডিয়া কর্মীদের ছবিতে টাইপরাইটার, প্রিন্টার এবং ভিনটেজ ক্যামেরার মতো পুরনো প্রযুক্তির ছবি রয়েছে।
যেহেতু আজকাল অনেক পেশাদার একই রকম দেখতে, তাই বর্ণিত ভূমিকাগুলিকে আরও স্বতন্ত্র করে তুলতে AI আরও ভিন্ন প্রযুক্তির (পুরানো এবং অব্যবহৃত প্রযুক্তি সহ) ব্যবহার করছে বলে মনে হচ্ছে।
তাই যদি আপনি নিজের AI ছবি তৈরি করেন, তাহলে বর্ণনা লেখার সময় সম্ভাব্য পক্ষপাতগুলি বিবেচনা করুন। অন্যথায়, আপনি অসাবধানতাবশত ক্ষতিকারক স্টেরিওটাইপগুলিকে শক্তিশালী করতে পারেন যা সমাজ কয়েক দশক ধরে দূর করার চেষ্টা করে আসছে।
হোয়াং টন (আইজেএন অনুসারে)
[বিজ্ঞাপন_২]
উৎস
মন্তব্য (0)