Vietnam.vn - Nền tảng quảng bá Việt Nam

এআই ইমেজ তৈরির প্যারাডক্স

ছবির মান উন্নত করার পরিবর্তে, অনেক AI মডেল বাস্তবতা বৃদ্ধির জন্য সক্রিয়ভাবে শব্দ, দুর্বল আলো এবং দৃশ্য বিকৃতি অনুকরণ করে।

ZNewsZNews17/12/2025

গুগলের ন্যানো ব্যানানা প্রো-এর ছবির মান মোটামুটি বাস্তবসম্মত। ছবি: ম্যাশেবল

কৃত্রিম বুদ্ধিমত্তা (এআই) ইমেজিং প্রযুক্তির প্রাথমিক বছরগুলিতে, ফলস্বরূপ পণ্যগুলি প্রায়শই সহজেই জাল হিসাবে শনাক্ত করা যেত। অনেক আঙুল, বিকৃত শরীরের বিবরণ, বা অবাস্তব আলো সহ ছবিগুলি সাধারণ লক্ষণ ছিল।

তবে, সেই যুগের সমাপ্তি ঘটছে। কৃত্রিম বুদ্ধিমত্তা-চালিত ছবি তৈরির সরঞ্জামগুলি ক্রমশ বিশ্বাসযোগ্য হয়ে উঠছে, ছবিকে নিখুঁত করে নয়, বরং ইচ্ছাকৃতভাবে এমন ত্রুটিগুলিকে অন্তর্ভুক্ত করে যা বাস্তব ছবির অনুকরণ করে।

এআই ইমেজ তৈরির প্রবণতা

OpenAI পাঁচ বছরেরও কম সময় আগে তাদের DALL-E ইমেজ জেনারেশন টুল চালু করেছে। প্রথম সংস্করণটি শুধুমাত্র 256 x 256 পিক্সেল রেজোলিউশনের ছবি তৈরি করতে পারত, যা এটিকে ব্যবহারিকের চেয়ে বেশি পরীক্ষামূলক করে তুলেছিল। DALL-E 2 এর মাধ্যমে, রেজোলিউশন 1024 x 1024 পিক্সেল পর্যন্ত বৃদ্ধি করা হয়েছিল, যার ফলে উল্লেখযোগ্যভাবে বাস্তবসম্মত ছবি তৈরি করা হয়েছিল। তবে, বিশদ বিবরণ এখনও অসঙ্গতির লক্ষণ দেখায়, ঝাপসা পৃষ্ঠ থেকে শুরু করে এমন বস্তু যা দৃশ্যত ব্যাখ্যা করা কঠিন।

একই সময়ে, মিডজার্নি এবং স্টেবল ডিফিউশনও দ্রুত সৃজনশীল সম্প্রদায়ের দৃষ্টি আকর্ষণ করে। পরবর্তী কয়েক বছর ধরে, মডেলগুলি ক্রমাগত উন্নত করা হয়েছিল, জ্যামিতিক ত্রুটি হ্রাস করে এবং পাঠ্যের দৃশ্যমানতা বৃদ্ধি করে। যাইহোক, AI-এর বেশিরভাগ অংশ এখনও "অত্যধিক নিখুঁত" বলে মনে হয়েছিল, যেখানে আলো, রচনা এবং মসৃণতা বাস্তব ছবির চেয়ে চিত্রের মতো বেশি ছিল।

AI anh 1

অনেক AI মডেল এমন ছবি তৈরি করে যা জীবনের সাথে খাপ খাওয়ার মতো বাস্তবসম্মত নয়। ছবি: ব্লুমবার্গ

এই ধারাটি পরিবর্তন হচ্ছে। ডেভেলপাররা বাস্তববাদের দিকে এগিয়ে যাচ্ছেন, সাধারণ ডিভাইস, বিশেষ করে ফোন ক্যামেরা দিয়ে তোলা ছবিগুলির অন্তর্নিহিত ত্রুটিগুলি পুনরায় তৈরি করছেন।

২০২৫ সালের শেষার্ধে, গুগল জেমিনি অ্যাপে ন্যানো ব্যানানা ইমেজ তৈরির মডেল চালু করে, এরপর ন্যানো ব্যানানা প্রো-এর সাথে আরও আপগ্রেড করা হয়। সার্চ জায়ান্টের মতে, এটি এখন পর্যন্ত সবচেয়ে বাস্তবসম্মত ইমেজ মডেল, যেখানে বাস্তব জগতের জ্ঞান ব্যবহার করা এবং টেক্সট আরও কার্যকরভাবে প্রদর্শন করার ক্ষমতা রয়েছে।

উল্লেখযোগ্যভাবে, এই মডেলের তৈরি অনেক ছবি স্মার্টফোন দিয়ে তোলা ছবিগুলির সাথে খুব মিল, বৈসাদৃশ্য এবং দৃষ্টিকোণ থেকে আলো এবং তীক্ষ্ণতা পর্যন্ত।

স্মার্টফোন ক্যামেরা দিয়ে তোলা ছবির নিজস্ব অনন্য স্টাইল আছে। সেন্সর এবং লেন্সের আকারের সীমাবদ্ধতার কারণে, স্মার্টফোনগুলি ছবির মান উন্নত করার জন্য মাল্টি-ফ্রেম প্রসেসিংয়ের উপর নির্ভর করে। এটি উন্নত অন্ধকার এলাকা, হাইলাইট করা বিবরণ সহ ছবি তৈরি করে এবং ছোট স্ক্রিনে প্রদর্শনের জন্য অপ্টিমাইজ করা হয়। AI এই স্টাইলটি শেখার ফলে ছবিগুলি দর্শকদের কাছে আরও পরিচিত হয়ে ওঠে, যার ফলে কৃত্রিমতার অনুভূতি হ্রাস পায়।

বাস্তবসম্মত ছবির প্যারাডক্স

গুগলই একমাত্র ঘটনা নয়। অ্যাডোবি ফায়ারফ্লাই একটি "ছবি বর্ধন" বিকল্প অফার করে, যা ব্যবহারকারীদের AI ছবির পলিশ কমিয়ে বাস্তব ছবির সাথে সাদৃশ্যপূর্ণ করে তুলতে সাহায্য করে। মেটাতে একটি "স্টাইলিং" স্লাইডারও রয়েছে, যা ব্যবহারকারীদের বাস্তবতার স্তর সামঞ্জস্য করতে দেয়।

ভিডিওর ক্ষেত্রে, OpenAI-এর Sora বা Google-এর Veo-এর মতো টুলগুলি নিম্নমানের, দানাদার ক্লিপ তৈরি করতে ব্যবহৃত হয় যা নিরাপত্তা ক্যামেরা থেকে আসা ছবিগুলিকে নকল করে, যা বিশ্বাসযোগ্য হওয়ার জন্য যথেষ্ট "খারাপ"।

AI anh 2

কৃত্রিম বুদ্ধিমত্তা ব্যবহার করে তৈরি ভিডিওগুলি ক্রমশ বাস্তবসম্মত হয়ে উঠছে। ছবি: ব্লুমবার্গ

কিছু ফটোগ্রাফি বিশেষজ্ঞের মতে, পরিচিত ত্রুটিগুলি অনুকরণ করার জন্য AI-এর ক্ষমতা মডেলদের "অস্বাভাবিক উপত্যকা"-তে পড়া এড়াতে সাহায্য করতে পারে, এমন একটি অবস্থা যেখানে ছবিগুলি বাস্তবতার সাথে ঘনিষ্ঠভাবে সাদৃশ্যপূর্ণ কিন্তু তবুও দর্শকদের জন্য অস্বস্তির অনুভূতি তৈরি করে। বাস্তবতাকে পুনরুজ্জীবিত করার পরিবর্তে, AI-কে কেবল অনুকরণ করতে হবে যে কীভাবে মানুষ তাদের সমস্ত অন্তর্নিহিত সীমাবদ্ধতা এবং ভুলত্রুটি সহ ছবিগুলি ধারণ করে।

এই উন্নয়ন আসল এবং নকল ছবির মধ্যে পার্থক্য করার ক্ষমতার জন্য একটি গুরুত্বপূর্ণ চ্যালেঞ্জ তৈরি করে। যেহেতু AI ছবিগুলি ক্রমশ প্রচলিত ছবির সাথে সাদৃশ্যপূর্ণ হয়ে উঠছে, তাই তাদের উৎপত্তি সনাক্তকরণ আরও কঠিন হয়ে উঠছে। এর প্রতিক্রিয়ায়, C2PA কন্টেন্ট ক্রেডেনশিয়াল স্ট্যান্ডার্ড বাস্তবায়িত হচ্ছে যাতে ছবিগুলিতে ক্রিপ্টোগ্রাফিক স্বাক্ষর যুক্ত করা যায়, যা তৈরির মুহূর্ত থেকে ট্রেসেবিলিটি সক্ষম করে।

বর্তমানে, স্মার্টফোন দিয়ে তোলা বেশিরভাগ ছবিতে প্রমাণীকরণের তথ্য থাকে না, অন্যদিকে ডিজিটালি সম্পাদিত ছবি এবং সম্পূর্ণরূপে AI দ্বারা তৈরি ছবিগুলির মধ্যে সীমা ক্রমশ ঝাপসা হয়ে আসছে। হার্ডওয়্যার এবং শেয়ারিং প্ল্যাটফর্মগুলিতে মানগুলি সমানভাবে বাস্তবায়িত না হওয়া পর্যন্ত, ব্যবহারকারীদের ডিজিটাল স্পেসে ছবিগুলির বিষয়ে প্রয়োজনীয় সতর্কতা অবলম্বন করতে হবে।

সূত্র: https://znews.vn/nghich-ly-cua-ai-tao-anh-post1612058.html


মন্তব্য (0)

আপনার অনুভূতি শেয়ার করতে একটি মন্তব্য করুন!

একই বিভাগে

নটরডেম ক্যাথেড্রালের জন্য LED তারকা তৈরির কর্মশালার একটি ঘনিষ্ঠ দৃশ্য।
হো চি মিন সিটির নটরডেম ক্যাথেড্রালকে আলোকিত করে ৮ মিটার লম্বা ক্রিসমাস তারকাটি বিশেষভাবে আকর্ষণীয়।
সিএ গেমসে হুইন নু ইতিহাস গড়লেন: এমন একটি রেকর্ড যা ভাঙা খুব কঠিন হবে।
হাইওয়ে ৫১-এর অত্যাশ্চর্য গির্জাটি বড়দিনের জন্য আলোকিত হয়ে উঠল, যা পাশ দিয়ে যাওয়া সকলের দৃষ্টি আকর্ষণ করল।

একই লেখকের

ঐতিহ্য

চিত্র

ব্যবসায়

সা ডিসেম্বরের ফুল গ্রামের কৃষকরা ২০২৬ সালের উৎসব এবং টেট (চন্দ্র নববর্ষ) এর প্রস্তুতির জন্য তাদের ফুলের যত্নে ব্যস্ত।

বর্তমান ঘটনাবলী

রাজনৈতিক ব্যবস্থা

স্থানীয়

পণ্য