এআই চিত্র তৈরির প্যারাডক্স

ছবির মান উন্নত করার পরিবর্তে, অনেক এআই মডেল বাস্তবতা বাড়ানোর জন্য সক্রিয়ভাবে নয়েজ, অপর্যাপ্ত আলো এবং দৃশ্যগত বিকৃতির অনুকরণ করে।

ZNews•17/12/2025

গুগলের ন্যানো ব্যানানা প্রো-এর ছবির মান বেশ বাস্তবসম্মত। ছবি: ম্যাশাবল ।

কৃত্রিম বুদ্ধিমত্তা (এআই) ইমেজিং প্রযুক্তির প্রাথমিক বছরগুলিতে, এর ফলে তৈরি হওয়া ছবিগুলো প্রায়শই সহজেই নকল হিসেবে শনাক্ত করা যেত। ছবিতে অতিরিক্ত আঙুল, শরীরের বিকৃত বিবরণ, বা অবাস্তব আলো ছিল এর সাধারণ লক্ষণ।

তবে, সেই যুগের অবসান ঘটছে। এআই-চালিত ছবি তৈরির টুলগুলো ক্রমশ আরও বেশি বিশ্বাসযোগ্য হয়ে উঠছে; তবে তা ছবিটিকে নিখুঁত করার মাধ্যমে নয়, বরং ইচ্ছাকৃতভাবে এমন সব ত্রুটি যুক্ত করার মাধ্যমে যা আসল ছবির অনুকরণ করে।

এআই ইমেজ তৈরির প্রবণতা

ওপেনএআই পাঁচ বছরেরও কম সময় আগে তাদের DALL-E ইমেজ জেনারেশন টুলটি চালু করেছিল। এর প্রথম সংস্করণটি কেবল ২৫৬ x ২৫৬ পিক্সেল রেজোলিউশনের ছবি তৈরি করতে পারত, যা এটিকে ব্যবহারিকতার চেয়ে বেশি পরীক্ষামূলক করে তুলেছিল। DALL-E 2-তে রেজোলিউশন বাড়িয়ে ১০২৪ x ১০২৪ পিক্সেল করা হয়, যার ফলে ছবিগুলো উল্লেখযোগ্যভাবে আরও বাস্তবসম্মত হয়ে ওঠে। তবে, এখনও ছবির খুঁটিনাটিতে কিছু অসঙ্গতির চিহ্ন দেখা যায়, যেমন ঝাপসা পৃষ্ঠতল থেকে শুরু করে এমন বস্তু যা চোখে দেখে ব্যাখ্যা করা কঠিন।

একই সময়ে, মিডজার্নি এবং স্টেবল ডিফিউশনও সৃজনশীল মহলের দ্রুত দৃষ্টি আকর্ষণ করে। পরবর্তী কয়েক বছর ধরে, জ্যামিতিক ত্রুটি হ্রাস করে এবং লেখার দৃশ্যমানতা বাড়িয়ে মডেলগুলোকে ক্রমাগত উন্নত করা হয়েছিল। তবে, এআই-এর বেশিরভাগ অংশই তখনও "অতিরিক্ত নিখুঁত" বলে মনে হতো, যার আলো, বিন্যাস এবং মসৃণতা আসল ছবির চেয়ে চিত্রকলার সাথে বেশি সাদৃশ্যপূর্ণ ছিল।

অনেক এআই মডেল এমন বাস্তবসম্মত ছবি তৈরি করে যা বাস্তব জীবনের সঙ্গে মেলে না। ছবি: ব্লুমবার্গ ।

এই ধারাটি বদলাচ্ছে। ডেভেলপাররা বাস্তবতার দিকে ঝুঁকতে শুরু করেছেন, এবং সাধারণ ডিভাইস, বিশেষ করে ফোনের ক্যামেরা দিয়ে তোলা ছবির সহজাত অসম্পূর্ণতাগুলোকে ফুটিয়ে তুলছেন।

২০২৫ সালের দ্বিতীয়ার্ধে, গুগল জেমিনি অ্যাপে ন্যানো ব্যানানা ইমেজ তৈরির মডেল চালু করে, যার পরে ন্যানো ব্যানানা প্রো-এর মাধ্যমে আরও উন্নত সংস্করণ আনা হয়। এই সার্চ জায়ান্টের মতে, এটি এখন পর্যন্ত সবচেয়ে বাস্তবসম্মত ইমেজ মডেল, যা বাস্তব জগতের জ্ঞান ব্যবহার করতে এবং আরও কার্যকরভাবে টেক্সট প্রদর্শন করতে সক্ষম।

উল্লেখযোগ্যভাবে, এই মডেল দ্বারা তোলা অনেক ছবি কনট্রাস্ট ও পার্সপেক্টিভ থেকে শুরু করে আলো ও শার্পনেস পর্যন্ত স্মার্টফোনে তোলা ছবির সাথে হুবহু মিলে যায়।

স্মার্টফোন ক্যামেরায় তোলা ছবির নিজস্ব একটি স্বতন্ত্র শৈলী রয়েছে। সেন্সর এবং লেন্সের আকারের সীমাবদ্ধতার কারণে, ছবির মান উন্নত করতে স্মার্টফোনগুলো মাল্টি-ফ্রেম প্রসেসিংয়ের ওপর নির্ভর করে। এর ফলে এমন ছবি তৈরি হয়, যেখানে অন্ধকার অংশগুলো আরও স্পষ্ট হয়, খুঁটিনাটি বিষয়গুলো ফুটে ওঠে এবং যা ছোট পর্দায় প্রদর্শনের জন্য বিশেষভাবে উপযোগী হয়। কৃত্রিম বুদ্ধিমত্তা (AI) এই শৈলীটি শিখে নেওয়ায় ছবিগুলো দর্শকদের কাছে আরও পরিচিত হয়ে ওঠে, যার ফলে কৃত্রিমতার অনুভূতি কমে যায়।

বাস্তবসম্মত চিত্রের প্যারাডক্স

শুধু গুগলই এর ব্যতিক্রম নয়। অ্যাডোবি ফায়ারফ্লাই-এ একটি 'ইমেজ এনহ্যান্সমেন্ট' অপশন রয়েছে, যা ব্যবহারকারীদের এআই ইমেজের মসৃণতা কমিয়ে সেগুলোকে আসল ছবির কাছাকাছি নিয়ে আসতে সাহায্য করে। মেটা-তেও একটি 'স্টাইলিং' স্লাইডার আছে, যা ব্যবহারকারীদের ছবির বাস্তবতার মাত্রা নিয়ন্ত্রণ করতে দেয়।

ভিডিওর ক্ষেত্রে, ওপেনএআই-এর সোরা (Sora) বা গুগল-এর ভিও (Veo)-এর মতো টুল ব্যবহার করে নিম্নমানের ও ঝাপসা ক্লিপ তৈরি করা হয়, যা সিকিউরিটি ক্যামেরার ছবির অনুকরণে তৈরি এবং এতটাই 'খারাপ' যে তা বিশ্বাসযোগ্য মনে হয়।

কৃত্রিম বুদ্ধিমত্তা ব্যবহার করে তৈরি ভিডিওগুলো ক্রমশ আরও বাস্তবসম্মত হয়ে উঠছে। ছবি: ব্লুমবার্গ ।

কিছু ফটোগ্রাফি বিশেষজ্ঞের মতে, পরিচিত ত্রুটিগুলো অনুকরণ করার এআই-এর ক্ষমতা মডেলগুলোকে 'আনইউজুয়াল ভ্যালি' নামক একটি অবস্থা এড়াতে সাহায্য করতে পারে। এই অবস্থায় ছবিগুলো বাস্তবতার সাথে খুব সাদৃশ্যপূর্ণ হলেও দর্শকের মনে এক ধরনের অস্বস্তি তৈরি করে। বাস্তবতাকে হুবহু পুনর্নির্মাণ করার পরিবর্তে, এআই-এর কেবল মানুষের ছবি তোলার সহজাত সীমাবদ্ধতা ও ভুলত্রুটিসহ সেটিকে অনুকরণ করা প্রয়োজন।

এই অগ্রগতি আসল এবং নকল ছবির মধ্যে পার্থক্য করার ক্ষমতার ক্ষেত্রে একটি উল্লেখযোগ্য চ্যালেঞ্জ তৈরি করেছে। যেহেতু এআই-নির্মিত ছবিগুলো ক্রমশ প্রচলিত ফটোগ্রাফের মতো হয়ে উঠছে, তাই সেগুলোর উৎস শনাক্ত করা আরও কঠিন হয়ে পড়ছে। এর প্রতিক্রিয়ায়, ছবিতে ক্রিপ্টোগ্রাফিক স্বাক্ষর যুক্ত করার জন্য C2PA কন্টেন্ট ক্রেডেনশিয়ালস স্ট্যান্ডার্ড বাস্তবায়ন করা হচ্ছে, যা তৈরির মুহূর্ত থেকেই এর উৎস শনাক্ত করা সম্ভব করে তোলে।

বর্তমানে, স্মার্টফোন দিয়ে তোলা বেশিরভাগ ছবিতে প্রমাণীকরণ তথ্যের অভাব থাকে, এবং ডিজিটালভাবে সম্পাদিত ছবি ও সম্পূর্ণভাবে কৃত্রিম বুদ্ধিমত্তা দ্বারা তৈরি ছবির মধ্যে পার্থক্য ক্রমশ অস্পষ্ট হয়ে যাচ্ছে। হার্ডওয়্যার এবং শেয়ারিং প্ল্যাটফর্ম জুড়ে অভিন্ন মানদণ্ড বাস্তবায়িত না হওয়া পর্যন্ত, ডিজিটাল জগতের ছবির বিষয়ে ব্যবহারকারীদের এখনও প্রয়োজনীয় সতর্কতা অবলম্বন করতে হবে।

উৎস: https://znews.vn/nghich-ly-cua-ai-tao-anh-post1612058.html