![]() |
لوگوی گوگل جمینی. عکس: بلومبرگ . |
گوگل مدل Gemini 3 را در اواخر نوامبر عرضه کرد. این شرکت مجموعهای از بهروزرسانیهای قابل توجه مانند قابلیتهای کدنویسی بهبود یافته، ایجاد تصویر بصری و عواملی که وظایف خاصی را از طرف کاربر انجام میدهند، معرفی کرد.
گوگل هنگام معرفی جمینی ۳ تأکید کرد که این «هوشمندترین مدل این شرکت تاکنون» است. تجربه دنیای واقعی نشان میدهد که این مدل سریعتر پردازش میکند و قابلیتهای استدلال بهتری دارد، اگرچه هنوز برخی زمینهها برای بهبود وجود دارد.
رابطهای تعاملی را به سرعت ایجاد کنید.
یکی از بهروزرسانیهای اصلی در جمینی ۳ حول محور Canvas میچرخد. این یک فضای کاری تعاملی در جمینی است که به شما امکان میدهد از چتباتها بخواهید کد بنویسند، نتایج را تجسم کنند و محتوا را ویرایش کنند.
وقتی از جمینی ۳ خواسته میشود که یک مدل سهبعدی از تفاوت اندازه بین یک توپ فوتبال، زمین، خورشید و کهکشان راه شیری ایجاد کند، این ابزار یک رابط برنامهنویسی را فعال میکند، پردازش انجام میدهد و یک محیط تعاملی ایجاد میکند که به کاربران امکان میدهد اندازه اشیاء را انتخاب و مقایسه کنند.
![]() |
امکان ایجاد فضاهای تعاملی با استفاده از ویژگی Canvas در Gemini 3. |
در مقایسه با نسخه آزمایشی گوگل، نتایج از نظر کیفیت تصویر کمی پایینتر هستند. با این حال، اطلاعات مربوط به اشیاء واضح و قابل فهم است. زمان پردازش تقریباً ۲ دقیقه است. در رابط Canvas، کاربران میتوانند مستقیماً کد را ویرایش، کپی یا محتوا را به اشتراک بگذارند.
با دستور دیگری، از جمینی ۳ خواسته شد تا یک مدل سهبعدی مکعبی (وکسل) از یک عقاب نشسته بر شاخه درخت ایجاد کند. این ابزار نتیجه را در حدود ۴۵ ثانیه تولید کرد و کاربران میتوانستند با استفاده از ماوس بزرگنمایی کرده و نمای آن را بچرخانند. با این حال، برخی از جزئیات در تصویر دارای خطاهای گرافیکی بودند و به طور پایدار نمایش داده نمیشدند.
عقابی که روی شاخه درخت نشسته بود نیز وجود داشت، اما نیاز به آن دشوارتر بود (یک مدل سهبعدی). در ابتدا، کد تولید شده توسط Gemini 3 با شکست مواجه شد و اجرا نشد. پس از درخواست اصلاحات، تصویر ظاهر شد و تعاملی شد.
![]() |
توانایی جمینی ۳ در ایجاد محیطهای تعاملی. |
با وجود برخی مشکلات باقیمانده، تغییر از مدل پرسش و پاسخ به رویکرد ویرایش مشارکتی، جهتگیری جالبی است و Gemini 3 را برای کارهای پیچیده و بلندمدت مفید میکند.
البته، Gemini 3 فقط برای ایجاد گرافیک یا مدلهای بصری نیست. گوگل در حال آزمایش یک ویژگی «رابط کاربری مولد» برای کاربران AI Pro است. با دستورات خاص، این مدل میتواند رابطهای کاربری تعاملی به سبک مجله یا وبسایتهای بصری ایجاد کند.
گوگل میگوید این ویژگی به صورت مرحلهای در حال عرضه است. طبق تجربهی وبسایت The Verge ، کاربران باید ویژگی Visual Layout را انتخاب کنند، سپس دستوری مانند «برنامهریزی سفر ۳ روزه من به رم» را وارد کنند.
پس از پردازش، Gemini 3 نتایجی مشابه یک وبسایت مسافرتی ، شامل برنامههای سفر، تصاویر دقیق و برخی سوالات در مورد ترجیحات سفر و عادات غذایی، تولید میکند. سپس مدل، پاسخها را بر اساس آن تنظیم میکند. این ویژگی همچنین برای موضوعاتی مانند نحوه مونتاژ کامپیوتر یا ساخت آکواریوم بسیار مفید است.
استدلال و تحلیل مؤثرتر.
طبق گفته گوگل، Gemini 3 از قابلیتهای استدلال بهتری نسبت به مدل قبلی خود برخوردار است. این شرکت ادعا میکند که توانایی استدلال Gemini 3 Pro به سطح دکترا میرسد و در آخرین آزمون Humanity’s Last Exam امتیاز ۳۷.۵٪ و در آزمون GPQA Diamond امتیاز ۹۱.۹٪ را کسب کرده است.
البته، کاربران فقط زمانی میتوانند تفاوت را واقعاً درک کنند که مستقیماً با مدل تعامل داشته باشند. وقتی از آنها خواسته شد تا مسئلهای از مجموعه سوالات مرجع GPQA Diamond (با تمرکز بر سطح دکترا) را حل کنند، Gemini 3 Pro تقریباً 30 ثانیه طول کشید تا یک راهحل دقیق، شامل دستورالعملهای گام به گام و تصاویر گویا، ارائه دهد.
![]() |
جمینی ۳ میتواند به سوالات پیچیده پاسخ دهد و تواناییهای تفکری معادل سطح دکترا را نشان دهد. |
طبق ارزیابی، راه حل کاملاً دقیق است و از رویه صحیح پیروی میکند. برای مقایسه، GPT-5.1 نیز حدود 30 ثانیه طول کشید تا به درستی پاسخ دهد، اما راه حل آن جزئیات کمتری داشت. به طور مشابه، Claude 4.5 Sonnet به درستی و سریعتر از Gemini 3 پاسخ داد، اما جزئیات کمتری داشت.
گوگل میگوید جمینی ۳ میتواند اسناد را بهطور همزمان از چندین منبع، مانند متن، تصاویر و ویدیوها ، استخراج کند. وظایفی که قبلاً هرگز در مورد آنها آموزش ندیدهایم، در جمینی ۳ بهتر انجام میشوند.
![]() |
قابلیتهای تحلیل ویدیویی جمینی ۳. |
برای مثال، وقتی از Gemini 3 خواسته شد موضوع اصلی یک ویدیوی ۵۷ دقیقهای را تجزیه و تحلیل کند، تنها حدود یک دقیقه طول کشید تا نتایجی شامل آرگومانهای درخواستی و مهرهای زمانی مربوط به بخش مربوطه از ویدیو را ارائه دهد. به طور مشابه، این مدل به درستی یک ویدیوی تنیس را شناسایی کرد و مسابقات و سبک بازی هر ورزشکار را تجزیه و تحلیل کرد.
کاربران میتوانند از Gemini 3 بخواهند که همزمان ویدیوها را تماشا کند و به منابع خارجی مراجعه کند، حتی برای تحلیل عمیقتر سوال بپرسد. در مجموع، Gemini 3 در وظایف تحلیلی و ارجاع به اسناد کاملاً پاسخگو است، که تا حدودی به لطف ارتباط آن با پایگاه داده جستجوی گوگل است.
نماینده مفید است، اما هنوز مشکلاتی وجود دارد.
ویژگی Agent نیز یک ارتقاء قابل توجه در Gemini 3 است. برای کاربران طرح AI Ultra (که در حال حاضر فقط در بازار ایالات متحده موجود است)، این حالت میتواند وظایف پیچیدهای را از طرف کاربر انجام دهد، مانند دستهبندی و سازماندهی ایمیلها، جستجوی اطلاعات و رزرو بلیط سفر.
گوگل هنگام عرضه جمینی ۳، از مثال قابلیت سازماندهی صندوق ورودی در جیمیل استفاده کرد. طبق تجربه وبسایت ورج ، این ویژگی دقیقاً همانطور که درخواست شده بود عمل میکند: ایجاد فهرست کاملی از ایمیلهای خوانده نشده به مدت یک هفته.
مشابه ویژگی Canvas، لیست ایمیلها و اقدامات پیشنهادی در یک قسمت جداگانه نمایش داده میشوند. Gemini گزینههای مختلفی مانند تنظیم یادآوری برای ایمیلهای مهم، بایگانی ایمیلهای تبلیغاتی و غیره را ارائه میدهد.
![]() |
ویژگی عامل Gemini 3 به مدیریت صندوقهای ورودی Gmail کمک میکند. تصویر: The Verge . |
وقتی از Gemini خواسته میشود یادآوری پرداخت قبوض ایجاد کند، به سرعت اطلاعات مربوطه را در Google Tasks وارد میکند. برای وظیفه پرداخت، اپراتور به طور خودکار پیمایش میکند و در صورت نیاز به وارد کردن اطلاعات پرداخت توسط کاربر، متوقف میشود.
در مجموع، ابزار Gemini 3 در شناسایی ایمیلهایی که کاربران معمولاً فراموش میکنند، بسیار مفید است. این ابزار همچنین میتواند ایمیلهای ارسالی از آدرسهای تبلیغاتی را که دیگر مفید نیستند، پیدا کرده و اشتراک خود را لغو کند.
در واقع، عوامل برخی از چتباتها مانند Perplexity و ChatGPT از قبل از ادغام با Gmail پشتیبانی میکنند. با این حال، Gemini متنوعترین قابلیتهای ادغام را ارائه میدهد. به عنوان مثال، کاربران Perplexity باید ایمیلهایی را که میخواهند نگه دارند یا حذف کنند، به طور خاص وارد کنند، در حالی که این اقدامات را میتوان از طریق دکمههایی در Gemini انجام داد.
![]() |
ویژگی ایجاد رابط تعاملی Gemini 3. عکس: The Verge . |
قابلیت مرتبسازی ایمیل در ChatGPT نیز ناپایدار است. با این حال، سرعت ارسال ایمیل در Gemini از Perplexity کندتر است. برخی کارها، مانند رزرو رستوران، گاهی اوقات با مشکل مواجه میشوند.
اگرچه همیشه قبل از انجام اقدامات حساس مانند پرداخت یا ارسال ایمیل، نیاز به تأیید کاربر است، اما واگذاری وظایف خاص به هوش مصنوعی هنوز کاربران را مردد میکند. حالت عامل در Gemini 3 بسیار مفید است، اما کاربران هنوز هم باید خروجی را رصد کنند.
منبع: https://znews.vn/gemini-3-tot-den-dau-post1607493.html













نظر (0)