![]() |
گوگل جیمنی لوگو۔ تصویر: بلومبرگ ۔ |
گوگل نے نومبر کے آخر میں جیمنی 3 ماڈل لانچ کیا۔ کمپنی نے قابل ذکر اپ گریڈز کا ایک سلسلہ لایا جیسے کہ بہتر کوڈنگ کی صلاحیتیں، ویژولائزیشن اور ایجنٹس، صارفین کی جانب سے کچھ کام انجام دیتے ہیں۔
جیمنی 3 کو متعارف کرواتے وقت، گوگل نے اس بات پر زور دیا کہ یہ کمپنی کا "ابھی تک کا سب سے ہوشیار ماڈل" ہے۔ عملی تجربہ ظاہر کرتا ہے کہ ماڈل تیزی سے عمل کرتا ہے، اس میں بہتر استدلال کی صلاحیت ہوتی ہے، حالانکہ کچھ ایسے عوامل ہیں جن کو بہتر کرنے کی ضرورت ہے۔
تیزی سے انٹرایکٹو انٹرفیس بنائیں
Gemini 3 میں بڑے اپ گریڈز میں سے ایک Canvas کے گرد گھومتا ہے، Gemini میں ایک انٹرایکٹو ورک اسپیس جو آپ کو چیٹ بوٹس سے کوڈ لکھنے، نتائج کو دیکھنے اور مواد میں ترمیم کرنے کے لیے کہنے دیتا ہے۔
جب جیمنی 3 سے فٹ بال کی گیند، زمین، سورج اور آکاشگنگا کے سائز کے درمیان فرق کا 3D ماڈل بنانے کے لیے کہا جاتا ہے، تو یہ ٹول ایک انٹرایکٹو کوڈنگ، پروسیسنگ اور تخلیق انٹرفیس کو متحرک کرتا ہے جو اشیاء کو منتخب کرنے اور سائز میں موازنہ کرنے کی اجازت دیتا ہے۔
![]() |
Gemini 3 میں کینوس کی خصوصیت کے ساتھ انٹرایکٹو اسپیس بنانے کی صلاحیت۔ |
گوگل کے ڈیمو کے مقابلے میں تصویر کے معیار کے لحاظ سے نتائج قدرے خراب ہیں۔ بدلے میں، اشیاء کے بارے میں معلومات واضح طور پر فراہم کی جاتی ہیں اور آسانی سے سمجھا جاتا ہے. پروسیسنگ میں تقریباً 2 منٹ لگتے ہیں۔ کینوس انٹرفیس میں، صارف براہ راست کوڈ میں ترمیم کر سکتے ہیں، مواد کو کاپی یا شیئر کر سکتے ہیں۔
ایک اور کمانڈ کے ساتھ، Gemini 3 کو درخت کی شاخ پر بیٹھا ہوا ووکسیل طرز کا عقاب بنانے کو کہا گیا۔ ٹول نے تقریباً 45 سیکنڈ کے بعد نتائج دیے، اور صارف ماؤس کا استعمال کرتے ہوئے منظر کو زوم ان اور گھما سکتے ہیں۔ تاہم، تصویر میں کچھ تفصیلات میں گرافک غلطیاں تھیں اور وہ صحیح طریقے سے ظاہر نہیں کی گئیں۔
اس کے علاوہ ایک عقاب کے ساتھ جو درخت کی شاخ پر بیٹھا ہے لیکن اس سے زیادہ مشکل درخواست (3D ماڈل) کے ساتھ۔ پہلی بار Gemini 3 کے ذریعے تیار کردہ کوڈ کریش ہو گیا اور چلنے میں ناکام رہا۔ درست کرنے کی درخواست کرنے کے بعد تصویر نمودار ہوئی اور انٹرایکٹو تھی۔
![]() |
Gemini 3 کی انٹرایکٹو ماحول کی تخلیق کی صلاحیتیں۔ |
اگرچہ کچھ مسائل ہیں، سوال و جواب کے ماڈل سے باہمی ترمیم کی طرف جانا ایک دلچسپ سمت ہے جو جیمنی 3 کو پیچیدہ، طویل مدتی کاموں کے لیے مفید بنائے گی۔
بلاشبہ، Gemini 3 صرف گرافکس یا بصری ماڈل بنانے کے لیے نہیں ہے۔ گوگل اے آئی پرو صارفین کے لیے "جنریٹیو UI" فیچر کی جانچ کر رہا ہے۔ چند کمانڈز کے ساتھ، ماڈل انٹرایکٹو میگزین طرز کے انٹرفیس یا بصری ویب سائٹس بنا سکتا ہے۔
گوگل کا کہنا ہے کہ یہ فیچر مرحلہ وار متعارف کرایا جا رہا ہے۔ جیسا کہ The Verge نے تجربہ کیا ہے، صارفین کو بصری لے آؤٹ فیچر کو منتخب کرنے کی ضرورت ہے، پھر ایک کمانڈ ٹائپ کریں جیسا کہ "میرے لیے روم کے 3 دن کے سفر کا منصوبہ بنائیں۔"
پروسیسنگ کے بعد، Gemini 3 سفر کی ترجیحات اور کھانے کے انداز کے بارے میں متعدد سوالات کے ساتھ تفصیلی نظام الاوقات اور تصاویر کے ساتھ ٹریول ویب سائٹ کی طرح نتائج پیدا کرتا ہے۔ وہاں سے، ماڈل اس کے مطابق جوابات کو ایڈجسٹ کرے گا۔ یہ فیچر ان موضوعات کے لیے بھی کافی کارآمد ہے جیسے کہ کمپیوٹر کو کیسے اسمبل کیا جائے، فش ٹینک کیسے بنایا جائے وغیرہ۔
زیادہ مؤثر طریقے سے وجہ اور تجزیہ کریں۔
گوگل کے مطابق جیمنی 3 میں اپنے پیشرو سے بہتر استدلال کی صلاحیتیں ہیں۔ کمپنی کا دعویٰ ہے کہ Gemini 3 Pro کی استدلال کی صلاحیت ڈاکٹریٹ کی سطح پر ہے، ہیومینٹی کے آخری امتحان میں 37.5% اور GPQA ڈائمنڈ کے امتحان میں 91.9% کے اسکور کے ساتھ۔
بلاشبہ، صارفین صرف اس وقت فرق محسوس کر سکتے ہیں جب ماڈل کے ساتھ براہ راست بات چیت کریں۔ جب GPQA ڈائمنڈ ریفرنس سیٹ سے لیا گیا مسئلہ حل کرنے کے لیے کہا گیا (ڈاکٹر کی سطح پر مرکوز)، Gemini 3 Pro نے ایک تفصیلی حل فراہم کرنے میں تقریباً 30 سیکنڈ کا وقت لیا، جس میں مسئلہ کا ہر مرحلہ اور مثالی تصاویر شامل ہیں۔
![]() |
Gemini 3 پیچیدہ سوالات کا جواب دے سکتا ہے، سوچنے کی صلاحیت پی ایچ ڈی کی سطح کے برابر ہے۔ |
تشخیص کے مطابق، حل کافی تفصیلی ہے اور طریقہ کار کی پیروی کرتا ہے. مقابلے کے لیے، GPT-5.1 میں بھی تقریباً 30 سیکنڈ لگے، درست جواب دیا لیکن حل کم تفصیلی تھا۔ اسی طرح، Claude 4.5 Sonnet نے درست جواب دیا، Gemini 3 سے تیز لیکن کم تفصیل کے ساتھ۔
گوگل کا کہنا ہے کہ جیمنی 3 ایک ہی وقت میں متعدد ذرائع سے دستاویزات نکال سکتا ہے، جیسے کہ متن، تصاویر اور ویڈیوز ۔ جن کاموں کی اسے پہلے تربیت نہیں دی گئی تھی وہ بھی Gemini 3 پر بہتر طریقے سے نمٹائے جاتے ہیں۔
![]() |
Gemini 3 ویڈیو تجزیاتی صلاحیتیں۔ |
مثال کے طور پر، جب 57 منٹ کی ویڈیو کے مرکزی موضوع کا تجزیہ کرنے کے لیے کہا گیا، تو Gemini 3 نے ایک نتیجہ واپس کرنے میں صرف ایک منٹ کا وقت لیا جس میں ویڈیو کے متعلقہ حصے کے ٹائم اسٹیمپ کے ساتھ ساتھ درخواست کردہ دلائل بھی شامل تھے۔ اسی طرح، ماڈل نے ٹینس کے بارے میں ایک ویڈیو کو درست طریقے سے شناخت کیا، میچوں کا تجزیہ کیا اور ہر کھلاڑی نے کیسے کھیلا۔
صارفین Gemini 3 سے بیرونی ذرائع کا حوالہ دیتے ہوئے ویڈیوز دیکھنے کے لیے کہہ سکتے ہیں، اور گہرے تجزیہ کے لیے سوالات بھی پوچھ سکتے ہیں۔ مجموعی طور پر، Gemini 3 دستاویزات کا تجزیہ کرنے اور حوالہ دینے میں کافی حد تک جوابدہ ہے، جس کا ایک حصہ گوگل سرچ ڈیٹا بیس سے اس کے تعلق کی بدولت ہے۔
ایجنٹ مددگار ہے لیکن مسائل ہیں۔
ایجنٹ جیمنی 3 پر بھی ایک قابل ذکر اپ گریڈ ہے۔ AI الٹرا پیکیج کے صارفین کے لیے (فی الحال صرف امریکی مارکیٹ کو سپورٹ کر رہا ہے)، یہ موڈ صارفین کی جانب سے پیچیدہ عمل انجام دے سکتا ہے جیسے کہ ای میلز کو چھانٹنا اور ترتیب دینا، معلومات کی تلاش، سفری ٹکٹوں کی بکنگ...
جب گوگل نے جیمنی 3 لانچ کیا، تو اس نے Gmail میں آپ کے ان باکس کو منظم کرنے کی صلاحیت کو ظاہر کیا، اور The Verge کے تجربے میں، اس نے بالکل ویسا ہی کام کیا جیسا کہ اسے ہونا چاہیے تھا: اس نے ایک ہفتے سے بغیر پڑھے ہوئے ای میلز کی مکمل فہرست تیار کی۔
کینوس کی خصوصیت کی طرح، ای میل کی فہرست اور تجویز کردہ اعمال ایک علیحدہ علاقے میں ظاہر ہوتے ہیں۔ Gemini کچھ اختیارات فراہم کرتا ہے جیسے اہم ای میلز کے لیے یاد دہانیاں ترتیب دینا، پروموشنل ای میلز کو آرکائیو کرنا...
![]() |
جیمنی 3 کا ایجنٹ فیچر Gmail ان باکس مینجمنٹ کو سپورٹ کرتا ہے۔ تصویر: دی ورج ۔ |
جب بل کی ادائیگی کی یاد دہانی بنانے کے لیے کہا جاتا ہے، تو Gemini تیزی سے متعلقہ معلومات کو Google Tasks میں کھینچ لیتا ہے۔ ادائیگی کے کام کے لیے، جب صارف کو ادائیگی کی معلومات درج کرنے کی ضرورت ہوتی ہے تو ایجنٹ خود بخود تشریف لے جاتا ہے اور رک جاتا ہے۔
مجموعی طور پر، Gemini 3 ایجنٹ ان ای میلز کا پتہ لگانے میں کافی کارآمد ہے جنہیں صارفین بھول جاتے ہیں۔ یہ ٹول اشتہاری پتوں سے ای میلز کو تلاش اور ان سبسکرائب بھی کر سکتا ہے جو اب کارآمد نہیں ہیں۔
درحقیقت، کچھ چیٹ بوٹ ایجنٹس جیسے Perplexity اور ChatGPT پہلے ہی Gmail کے انضمام کی حمایت کرتے ہیں۔ تاہم، Gemini کی انضمام کی صلاحیتیں سب سے زیادہ متنوع ہیں۔ مثال کے طور پر، Perplexity صارفین کو خاص طور پر وہ ای میلز درج کرنا ہوں گی جو وہ رکھنا یا حذف کرنا چاہتے ہیں، جبکہ Gemini کے آپریشن بٹنوں کے ذریعے کیے جا سکتے ہیں۔
![]() |
Gemini 3 کی انٹرایکٹو انٹرفیس تخلیق کی خصوصیت۔ تصویر: دی ورج ۔ |
چیٹ جی پی ٹی کی ای میل شیڈولنگ کی خصوصیت بھی متضاد ہے۔ تاہم، Gemini کی ای میل کی ترسیل کی رفتار Perplexity کی نسبت سست ہے۔ کچھ کاموں میں، جیسے ریسٹورنٹ ریزرویشن کرنا، میں بعض اوقات مسائل ہوتے ہیں۔
اگرچہ اسے ادائیگی کرنے یا ای میل بھیجنے جیسی حساس کارروائیوں کو انجام دینے سے پہلے ہمیشہ صارف کی تصدیق کی ضرورت ہوتی ہے، لیکن کچھ کاموں کو AI پر چھوڑنا اب بھی صارفین کو تذبذب کا شکار بناتا ہے۔ Gemini 3 پر ایجنٹ موڈ کافی کارآمد ہے، لیکن صارفین کو اب بھی آؤٹ پٹ کی نگرانی کرنی ہوگی۔
ماخذ: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















تبصرہ (0)