
گوگل نے ابھی جیمنی 2.5 کمپیوٹر یوز کے نام سے ایک نئے AI ماڈل کا اعلان کیا ہے، جو مصنوعی ذہانت کو ایک حقیقی صارف کی طرح ویب براؤزر کے ساتھ براہ راست بات چیت کرنے کی اجازت دیتا ہے۔

اس AI کی صلاحیتوں میں کلک کرنا، سکرول کرنا، ٹائپ کرنا، گھسیٹنا اور چھوڑنا، اور ویب سائٹس کو نیویگیٹ کرنا شامل ہے۔

یہ AI کو APIs یا براہ راست کنکشن کے بغیر انٹرفیس پر کاموں کو ہینڈل کرنے کے قابل بنانے میں ایک اہم قدم ہے۔

گوگل کے مطابق، Gemini 2.5 کمپیوٹر کا استعمال اسکرین پر موجود مواد کو سمجھنے اور صارف کی درخواستوں کو پورا کرنے کے لیے بصری تفہیم اور استدلال کی صلاحیتوں سے لیس ہے، جیسے کہ فارم بھرنا، ڈیٹا جمع کرنا، یا یوزر انٹرفیس (UI ٹیسٹنگ) کو نیویگیٹ کرنا۔

اس ماڈل کے کچھ پرانے ورژنز کو AI Mode اور Project Mariner جیسے اندرونی پروجیکٹس میں آزمایا گیا ہے، جہاں AI خود بخود براؤزر میں کاموں کو مکمل کر سکتا ہے، جیسے صارف کی فراہم کردہ اجزاء کی فہرست کی بنیاد پر شاپنگ کارٹ میں مصنوعات شامل کرنا۔

قابل ذکر بات یہ ہے کہ گوگل کا یہ اعلان اوپن اے آئی نے اپنے دیو ڈے ایونٹ میں چیٹ جی پی ٹی کے لیے نئی ایپلی کیشنز کی ایک سیریز کی نقاب کشائی کے صرف ایک دن بعد سامنے آیا ہے، جب کہ انتھروپک نے گزشتہ سال اپنے کلاڈ ماڈل کے لیے ایک "کمپیوٹر استعمال" فیچر بھی متعارف کرایا تھا۔

گوگل کے مطابق، جیمنی 2.5 کمپیوٹر استعمال بہت سے ویب اور موبائل بینچ مارک ٹیسٹوں پر مسابقتی ماڈلز کو پیچھے چھوڑ دیتا ہے۔

تاہم، چیٹ جی پی ٹی ایجنٹ یا کلاڈ کے برعکس، گوگل کا ماڈل صرف براؤزر کے ماحول میں کام کرتا ہے اور کمپیوٹر کے آپریٹنگ سسٹم کے مکمل کنٹرول کے لیے موزوں نہیں ہے۔

یہ فی الحال 13 قسم کے اعمال کو سپورٹ کرتا ہے، بشمول براؤزر کھولنا، ٹیکسٹ داخل کرنا، گھسیٹنا اور چھوڑنا، اور انٹرفیس عناصر کو منتقل کرنا۔ یہ ماڈل گوگل اے آئی اسٹوڈیو اور ورٹیکس اے آئی کے ذریعے ڈویلپرز کے لیے دستیاب ہے، اور صارفین براؤزر بیس پر ایک لائیو ڈیمو دیکھ سکتے ہیں، جہاں اے آئی "پلے 2048" یا "ہیکر نیوز پر متنازعہ عنوانات تلاش کرنا" جیسے کام انجام دیتا ہے۔
ماخذ: https://khoahocdoisong.vn/ai-google-gemini-25-thao-tac-voi-trinh-duyet-nhu-nguoi-that-post2149059532.html
تبصرہ (0)