![]() |
گوگل کے نینو کیلے پرو میں کافی حد تک حقیقت پسندانہ تصویر کا معیار ہے۔ تصویر: Mashable |
مصنوعی ذہانت (AI) امیجنگ ٹیکنالوجی کے ابتدائی سالوں میں، نتیجے میں آنے والی مصنوعات اکثر آسانی سے جعلی کے طور پر پہچانی جا سکتی تھیں۔ بہت زیادہ انگلیاں، مسخ شدہ جسم کی تفصیلات، یا غیر حقیقی روشنی والی تصاویر عام بتائی جانے والی علامات تھیں۔
تاہم، یہ دور قریب آ رہا ہے. AI سے چلنے والے امیج بنانے کے ٹولز تیزی سے قائل ہوتے جا رہے ہیں، خود تصویر کو مکمل کرنے سے نہیں، بلکہ جان بوجھ کر ایسی خامیوں کو شامل کر کے جو حقیقی تصویروں کی نقل کرتی ہیں۔
AI امیج کی تخلیق میں رجحانات
OpenAI نے اپنا DALL-E امیج جنریشن ٹول پانچ سال سے بھی کم عرصہ قبل لانچ کیا تھا۔ پہلا ورژن صرف 256 x 256 پکسلز کی ریزولوشن والی تصاویر ہی بنا سکتا ہے، جو اسے عملی سے زیادہ تجرباتی بناتا ہے۔ DALL-E 2 کے ساتھ، ریزولوشن کو بڑھا کر 1024 x 1024 پکسلز کر دیا گیا، جس کے نتیجے میں نمایاں طور پر زیادہ حقیقت پسندانہ تصاویر سامنے آئیں۔ تاہم، تفصیلات اب بھی بے ضابطگیوں کے آثار دکھاتی ہیں، دھندلی سطحوں سے لے کر ایسی اشیاء تک جن کی بصری طور پر وضاحت کرنا مشکل ہے۔
ایک ہی وقت میں، Midjourney اور Stable Diffusion نے بھی تیزی سے تخلیقی برادری کی توجہ حاصل کی۔ اگلے چند سالوں میں، ماڈلز کو مسلسل بہتر کیا گیا، جیومیٹرک غلطیوں کو کم کیا گیا اور متن کی مرئیت کو بڑھایا گیا۔ تاہم، زیادہ تر AI ابھی بھی "بہت پرفیکٹ" محسوس کرتا ہے، جس میں لائٹنگ، کمپوزیشن، اور ہمواری حقیقی تصویروں سے زیادہ مثالوں سے ملتی جلتی ہے۔
![]() |
بہت سے AI ماڈل ایسی تصاویر تیار کرتے ہیں جو زندگی کے لیے حقیقت پسندانہ ہیں۔ تصویر: بلومبرگ ۔ |
یہ رجحان بدل رہا ہے۔ ڈویلپرز حقیقت پسندی کی طرف بڑھنا شروع کر رہے ہیں، عام آلات، خاص طور پر فون کیمروں کے ساتھ لی گئی تصاویر میں موجود خامیوں کو دوبارہ بنا رہے ہیں۔
2025 کے آخری نصف میں، گوگل نے جیمنی ایپ میں نینو کیلے کی تصویر بنانے کا ماڈل متعارف کرایا، جس کے بعد نینو کیلے پرو کے ساتھ مزید اپ گریڈ کیا گیا۔ سرچ دیو کے مطابق، یہ اب تک کا سب سے حقیقت پسندانہ تصویری ماڈل ہے، جس میں حقیقی دنیا کے علم کو استعمال کرنے اور متن کو زیادہ مؤثر طریقے سے ظاہر کرنے کی صلاحیت ہے۔
قابل ذکر بات یہ ہے کہ اس ماڈل کے ذریعہ تیار کردہ بہت سی تصاویر سمارٹ فونز کے ساتھ لی گئی تصاویر سے مشابہت رکھتی ہیں، اس کے برعکس اور نقطہ نظر سے روشنی اور نفاست تک۔
اسمارٹ فون کیمروں سے لی گئی تصاویر کا اپنا منفرد انداز ہے۔ سینسر اور لینس کے سائز کی حدود کی وجہ سے، اسمارٹ فونز تصویر کے معیار کو بہتر بنانے کے لیے ملٹی فریم پروسیسنگ پر انحصار کرتے ہیں۔ یہ بہتر بنائے گئے تاریک علاقوں، نمایاں تفصیلات، اور چھوٹی اسکرینوں پر ڈسپلے کے لیے موزوں تصاویر بناتا ہے۔ اس انداز کو سیکھنے سے AI تصاویر کو ناظرین کے لیے زیادہ مانوس بناتا ہے، اس طرح مصنوعی پن کا احساس کم ہوتا ہے۔
حقیقت پسندانہ امیجز کا تضاد
گوگل واحد معاملہ نہیں ہے۔ ایڈوب فائر فلائی ایک "امیج اینہانسمنٹ" آپشن پیش کرتا ہے، جس سے صارفین AI امیجز کی پولش کو کم کر کے حقیقی تصویروں سے ملتے جلتے ہیں۔ میٹا میں "اسٹائلنگ" سلائیڈر بھی شامل ہے، جو صارفین کو حقیقت پسندی کی سطح کو ایڈجسٹ کرنے کی اجازت دیتا ہے۔
ویڈیو کے میدان میں، OpenAI's Sora یا Google's Veo جیسے ٹولز کو کم معیار کے، دانے دار کلپس بنانے کے لیے استعمال کیا جاتا ہے جو سیکیورٹی کیمروں سے تصاویر کی نقل کرتے ہیں، جو کہ قابل اعتبار ہونے کے لیے کافی "خراب" ہیں۔
![]() |
AI کا استعمال کرتے ہوئے تیار کردہ ویڈیوز تیزی سے حقیقت پسند ہوتے جا رہے ہیں۔ تصویر: بلومبرگ ۔ |
کچھ فوٹو گرافی کے ماہرین کے مطابق، AI کی واقف خامیوں کی نقالی کرنے کی صلاحیت ماڈلز کو "غیر معمولی وادی" میں گرنے سے بچنے میں مدد دے سکتی ہے، ایک ایسی ریاست جہاں تصاویر حقیقت سے قریب تر ہوتی ہیں لیکن پھر بھی ناظرین کے لیے بے چینی کا احساس پیدا کرتی ہیں۔ حقیقت کو دوبارہ بنانے کے بجائے، AI کو صرف اس کی نقل کرنے کی ضرورت ہے کہ انسان اپنی تمام موروثی حدود اور غلطیوں کے ساتھ تصویروں کو کیسے گرفت میں لیتے ہیں۔
یہ ترقی حقیقی اور جعلی تصاویر میں فرق کرنے کی صلاحیت کے لیے ایک اہم چیلنج ہے۔ چونکہ AI تصاویر تیزی سے روایتی تصویروں سے مشابہت رکھتی ہیں، ان کی اصلیت کی شناخت کرنا زیادہ مشکل ہو جاتا ہے۔ اس کے جواب میں، C2PA مواد کی اسناد کے معیار کو امیجز میں کرپٹوگرافک دستخط شامل کرنے کے لیے لاگو کیا جا رہا ہے، تخلیق کے لمحے سے ہی ٹریس ایبلٹی کو قابل بناتا ہے۔
فی الحال، اسمارٹ فونز کے ساتھ لی گئی زیادہ تر تصاویر میں تصدیقی معلومات کی کمی ہوتی ہے، جبکہ ڈیجیٹل طور پر ترمیم شدہ تصاویر اور مکمل طور پر AI کی طرف سے بنائی گئی تصاویر کے درمیان لائن تیزی سے دھندلی ہوتی جارہی ہے۔ جب تک ہارڈ ویئر اور شیئرنگ پلیٹ فارمز پر معیارات یکساں طور پر لاگو نہیں ہوتے، صارفین کو اب بھی ڈیجیٹل اسپیس میں تصاویر کے حوالے سے ضروری احتیاط برتنے کی ضرورت ہے۔
ماخذ: https://znews.vn/nghich-ly-cua-ai-tao-anh-post1612058.html









تبصرہ (0)