![]() |
لوگوی گوگل جمینی. عکس: بلومبرگ . |
گوگل مدل Gemini 3 را در پایان ماه نوامبر عرضه کرد. این شرکت مجموعهای از بهروزرسانیهای قابل توجه مانند بهبود قابلیتهای کدنویسی، تجسم و عاملها (agents) را که وظایف خاصی را از طرف کاربران انجام میدهند، به ارمغان آورد.
گوگل هنگام معرفی جمینی ۳ تأکید کرد که این «هوشمندترین مدل این شرکت تاکنون» است. تجربه عملی نشان میدهد که این مدل سریعتر پردازش میکند و توانایی استدلال بهتری دارد، اگرچه برخی عوامل وجود دارند که باید بهبود یابند.
رابطهای تعاملی را به سرعت ایجاد کنید
یکی از بزرگترین بهروزرسانیها در Gemini 3 حول Canvas میچرخد، یک فضای کاری تعاملی در Gemini که به شما امکان میدهد از چتباتها بخواهید کد بنویسند، نتایج را تجسم کنند و محتوا را ویرایش کنند.
وقتی از جمینی ۳ خواسته میشود که یک مدل سهبعدی از تفاوت اندازه یک توپ فوتبال، زمین، خورشید و کهکشان راه شیری ایجاد کند، این ابزار یک رابط برنامهنویسی، پردازش و ایجاد تعاملی را فعال میکند که امکان انتخاب و مقایسه اندازه اشیاء را فراهم میکند.
![]() |
امکان ایجاد فضاهای تعاملی با ویژگی Canvas در Gemini 3. |
در مقایسه با نسخه آزمایشی گوگل، نتایج از نظر کیفیت تصویر کمی بدتر است. در عوض، اطلاعات مربوط به اشیاء به وضوح و به راحتی قابل فهم ارائه میشود. زمان پردازش حدود ۲ دقیقه طول میکشد. در رابط Canvas، کاربران میتوانند مستقیماً کد را ویرایش کنند، محتوا را کپی یا به اشتراک بگذارند.
با دستور دیگری، از Gemini 3 خواسته شد تا یک عقاب به سبک وکسل را که روی شاخه درخت نشسته است، ایجاد کند. این ابزار پس از حدود ۴۵ ثانیه نتایج را ارائه داد و کاربران میتوانستند با استفاده از ماوس، بزرگنمایی کرده و تصویر را بچرخانند. با این حال، برخی از جزئیات در تصویر دارای خطاهای گرافیکی بودند و به درستی نمایش داده نمیشدند.
همچنین با یک عقاب که روی شاخه درخت نشسته بود اما با درخواست دشوارتری (مدل سهبعدی). اولین باری که کد تولید شده توسط Gemini 3 از کار افتاد و اجرا نشد. پس از درخواست رفع مشکل، تصویر ظاهر شد و تعاملی بود.
![]() |
قابلیتهای ایجاد محیط تعاملی در جمینی ۳. |
اگرچه برخی مشکلات وجود دارد، اما حرکت از مدل پرسش و پاسخ به ویرایش مشارکتی، جهتگیری جالبی است که جمینی ۳ را برای کارهای پیچیده و بلندمدت مفید خواهد کرد.
البته، Gemini 3 فقط برای ایجاد گرافیک یا مدلهای بصری نیست. گوگل در حال آزمایش یک ویژگی «رابط کاربری مولد» برای کاربران AI Pro است. با چند دستور، این مدل میتواند رابطهای کاربری تعاملی به سبک مجله یا وبسایتهای بصری ایجاد کند.
گوگل میگوید این ویژگی به صورت مرحلهای در حال اجرا است. همانطور که The Verge تجربه کرد، کاربران باید ویژگی طرحبندی بصری را انتخاب کنند، سپس دستوری مانند «برای من یک سفر ۳ روزه به رم برنامهریزی کنید» را تایپ کنند.
پس از پردازش، Gemini 3 نتایجی مشابه یک وبسایت مسافرتی با برنامهها و تصاویر دقیق، همراه با تعدادی سوال در مورد ترجیحات سفر و سبکهای غذایی تولید میکند. از آنجا، مدل پاسخها را بر اساس آن تنظیم میکند. این ویژگی همچنین برای موضوعاتی مانند نحوه مونتاژ کامپیوتر، ساخت آکواریوم و غیره بسیار مفید است.
استدلال و تحلیل مؤثرتر
طبق گفته گوگل، Gemini 3 تواناییهای استدلال بهتری نسبت به مدل قبلی خود دارد. این شرکت ادعا میکند که توانایی استدلال Gemini 3 Pro در سطح دکترا است و امتیاز 37.5٪ در آخرین امتحان Humanity و 91.9٪ در امتحان GPQA Diamond را کسب کرده است.
البته، کاربران فقط زمانی میتوانند تفاوت را احساس کنند که مستقیماً با مدل تعامل داشته باشند. وقتی از آنها خواسته شد مسئلهای برگرفته از مجموعه مرجع GPQA Diamond (با تمرکز بر سطح دکترا) را حل کنند، Gemini 3 Pro حدود 30 ثانیه طول کشید تا یک راهحل دقیق، شامل هر مرحله از مسئله و تصاویر گویا، ارائه دهد.
![]() |
جمینی ۳ میتواند به سوالات پیچیده پاسخ دهد، توانایی تفکری معادل سطح دکترا دارد. |
طبق ارزیابی، راهحل کاملاً دقیق است و از رویه پیروی میکند. برای مقایسه، GPT-5.1 نیز حدود 30 ثانیه طول کشید، به درستی پاسخ داد اما راهحل آن جزئیات کمتری داشت. به طور مشابه، Claude 4.5 Sonnet به درستی پاسخ داد، سریعتر از Gemini 3 اما با جزئیات کمتر.
گوگل میگوید جمینی ۳ میتواند اسناد را از چندین منبع، مانند متن، تصاویر و ویدیوها ، به طور همزمان استخراج کند. وظایفی که قبلاً برای آنها آموزش ندیده است، در جمینی ۳ بهتر انجام میشوند.
![]() |
قابلیتهای تجزیه و تحلیل ویدیویی Gemini 3. |
برای مثال، وقتی از Gemini 3 خواسته شد موضوع اصلی یک ویدیوی ۵۷ دقیقهای را تجزیه و تحلیل کند، تنها حدود یک دقیقه طول کشید تا نتیجهای را که شامل آرگومانهای درخواستی به همراه یک مهر زمانی برای بخش مربوطه از ویدیو بود، برگرداند. به طور مشابه، مدل به درستی ویدیویی در مورد تنیس را شناسایی کرد و مسابقات و نحوه بازی هر بازیکن را تجزیه و تحلیل کرد.
کاربران میتوانند از Gemini 3 بخواهند که هنگام ارجاع به منابع خارجی، ویدیوها را تماشا کند و حتی برای تحلیل عمیقتر سؤال بپرسند. در مجموع، Gemini 3 در تحلیل و ارجاع اسناد کاملاً پاسخگو است، که بخشی از آن به دلیل اتصال آن به پایگاه داده جستجوی گوگل است.
نماینده مفید است اما مشکلاتی دارد
حالت Agent همچنین یک ارتقاء قابل توجه در Gemini 3 است. برای کاربران بسته AI Ultra (که در حال حاضر فقط از بازار ایالات متحده پشتیبانی میکند)، این حالت میتواند فرآیندهای پیچیدهای را از طرف کاربران انجام دهد، مانند مرتبسازی و سازماندهی ایمیلها، جستجوی اطلاعات، رزرو بلیط سفر و ...
وقتی گوگل Gemini 3 را عرضه کرد، قابلیت سازماندهی صندوق ورودی شما در Gmail را به نمایش گذاشت و طبق تجربهی وبسایت The Verge ، این قابلیت دقیقاً همانطور که قرار بود کار کرد: فهرستی کامل از ایمیلهای خوانده نشدهی یک هفته را ایجاد میکرد.
مشابه ویژگی Canvas، لیست ایمیل و اقدامات پیشنهادی در یک قسمت جداگانه نمایش داده میشوند. Gemini گزینههایی مانند تنظیم یادآوری برای ایمیلهای مهم، بایگانی ایمیلهای تبلیغاتی و... را ارائه میدهد.
![]() |
ویژگی عامل Gemini 3 از مدیریت صندوق ورودی Gmail پشتیبانی میکند. عکس: The Verge . |
وقتی از او خواسته میشود یادآوری پرداخت قبوض ایجاد کند، Gemini به سرعت اطلاعات مربوطه را به Google Tasks منتقل میکند. برای وظیفه پرداخت، عامل به طور خودکار پیمایش میکند و زمانی که نیاز به وارد کردن اطلاعات پرداخت توسط کاربر دارد، متوقف میشود.
در مجموع، ابزار Gemini 3 در تشخیص ایمیلهایی که کاربران احتمالاً فراموش میکنند، بسیار مفید است. این ابزار همچنین میتواند ایمیلهای آدرسهای تبلیغاتی که دیگر مفید نیستند را پیدا کرده و اشتراک آنها را لغو کند.
در واقع، برخی از عاملهای چتبات مانند Perplexity و ChatGPT از قبل از ادغام با جیمیل پشتیبانی میکنند. با این حال، قابلیتهای ادغام Gemini متنوعترین است. به عنوان مثال، کاربران Perplexity باید ایمیلهایی را که میخواهند نگه دارند یا حذف کنند، به طور خاص وارد کنند، در حالی که عملیات Gemini را میتوان از طریق دکمهها انجام داد.
![]() |
ویژگی ایجاد رابط کاربری تعاملی در جمینی ۳. عکس: The Verge . |
ویژگی زمانبندی ایمیل ChatGPT نیز ناپایدار است. با این حال، سرعت تحویل ایمیل Gemini کندتر از Perplexity است. برخی از کارها، مانند رزرو رستوران، گاهی اوقات با مشکل مواجه میشوند.
اگرچه همیشه قبل از انجام اقدامات حساس مانند پرداخت یا ارسال ایمیل، نیاز به تأیید کاربر است، اما سپردن برخی وظایف به هوش مصنوعی هنوز کاربران را مردد میکند. حالت عامل در Gemini 3 بسیار مفید است، اما کاربران هنوز هم باید خروجی را رصد کنند.
منبع: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















نظر (0)