بزرگترین رقیب ChatGPT

لوگوی گوگل جمینی. عکس: بلومبرگ .

گوگل مدل Gemini 3 را در اواخر نوامبر عرضه کرد. این شرکت مجموعه‌ای از به‌روزرسانی‌های قابل توجه مانند قابلیت‌های کدنویسی بهبود یافته، ایجاد تصویر بصری و عواملی که وظایف خاصی را از طرف کاربر انجام می‌دهند، معرفی کرد.

گوگل هنگام معرفی جمینی ۳ تأکید کرد که این «هوشمندترین مدل این شرکت تاکنون» است. تجربه دنیای واقعی نشان می‌دهد که این مدل سریع‌تر پردازش می‌کند و قابلیت‌های استدلال بهتری دارد، اگرچه هنوز برخی زمینه‌ها برای بهبود وجود دارد.

رابط‌های تعاملی را به سرعت ایجاد کنید.

یکی از به‌روزرسانی‌های اصلی در جمینی ۳ حول محور Canvas می‌چرخد. این یک فضای کاری تعاملی در جمینی است که به شما امکان می‌دهد از چت‌بات‌ها بخواهید کد بنویسند، نتایج را تجسم کنند و محتوا را ویرایش کنند.

وقتی از جمینی ۳ خواسته می‌شود که یک مدل سه‌بعدی از تفاوت اندازه بین یک توپ فوتبال، زمین، خورشید و کهکشان راه شیری ایجاد کند، این ابزار یک رابط برنامه‌نویسی را فعال می‌کند، پردازش انجام می‌دهد و یک محیط تعاملی ایجاد می‌کند که به کاربران امکان می‌دهد اندازه اشیاء را انتخاب و مقایسه کنند.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 1

امکان ایجاد فضاهای تعاملی با استفاده از ویژگی Canvas در Gemini 3.

در مقایسه با نسخه آزمایشی گوگل، نتایج از نظر کیفیت تصویر کمی پایین‌تر هستند. با این حال، اطلاعات مربوط به اشیاء واضح و قابل فهم است. زمان پردازش تقریباً ۲ دقیقه است. در رابط Canvas، کاربران می‌توانند مستقیماً کد را ویرایش، کپی یا محتوا را به اشتراک بگذارند.

با دستور دیگری، از جمینی ۳ خواسته شد تا یک مدل سه‌بعدی مکعبی (وکسل) از یک عقاب نشسته بر شاخه درخت ایجاد کند. این ابزار نتیجه را در حدود ۴۵ ثانیه تولید کرد و کاربران می‌توانستند با استفاده از ماوس بزرگنمایی کرده و نمای آن را بچرخانند. با این حال، برخی از جزئیات در تصویر دارای خطاهای گرافیکی بودند و به طور پایدار نمایش داده نمی‌شدند.

عقابی که روی شاخه درخت نشسته بود نیز وجود داشت، اما نیاز به آن دشوارتر بود (یک مدل سه‌بعدی). در ابتدا، کد تولید شده توسط Gemini 3 با شکست مواجه شد و اجرا نشد. پس از درخواست اصلاحات، تصویر ظاهر شد و تعاملی شد.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 2

توانایی جمینی ۳ در ایجاد محیط‌های تعاملی.

با وجود برخی مشکلات باقی‌مانده، تغییر از مدل پرسش و پاسخ به رویکرد ویرایش مشارکتی، جهت‌گیری جالبی است و Gemini 3 را برای کارهای پیچیده و بلندمدت مفید می‌کند.

البته، Gemini 3 فقط برای ایجاد گرافیک یا مدل‌های بصری نیست. گوگل در حال آزمایش یک ویژگی «رابط کاربری مولد» برای کاربران AI Pro است. با دستورات خاص، این مدل می‌تواند رابط‌های کاربری تعاملی به سبک مجله یا وب‌سایت‌های بصری ایجاد کند.

گوگل می‌گوید این ویژگی به صورت مرحله‌ای در حال عرضه است. طبق تجربه‌ی وب‌سایت The Verge ، کاربران باید ویژگی Visual Layout را انتخاب کنند، سپس دستوری مانند «برنامه‌ریزی سفر ۳ روزه من به رم» را وارد کنند.

پس از پردازش، Gemini 3 نتایجی مشابه یک وب‌سایت مسافرتی ، شامل برنامه‌های سفر، تصاویر دقیق و برخی سوالات در مورد ترجیحات سفر و عادات غذایی، تولید می‌کند. سپس مدل، پاسخ‌ها را بر اساس آن تنظیم می‌کند. این ویژگی همچنین برای موضوعاتی مانند نحوه مونتاژ کامپیوتر یا ساخت آکواریوم بسیار مفید است.

استدلال و تحلیل مؤثرتر.

طبق گفته گوگل، Gemini 3 از قابلیت‌های استدلال بهتری نسبت به مدل قبلی خود برخوردار است. این شرکت ادعا می‌کند که توانایی استدلال Gemini 3 Pro به سطح دکترا می‌رسد و در آخرین آزمون Humanity’s Last Exam امتیاز ۳۷.۵٪ و در آزمون GPQA Diamond امتیاز ۹۱.۹٪ را کسب کرده است.

البته، کاربران فقط زمانی می‌توانند تفاوت را واقعاً درک کنند که مستقیماً با مدل تعامل داشته باشند. وقتی از آنها خواسته شد تا مسئله‌ای از مجموعه سوالات مرجع GPQA Diamond (با تمرکز بر سطح دکترا) را حل کنند، Gemini 3 Pro تقریباً 30 ثانیه طول کشید تا یک راه‌حل دقیق، شامل دستورالعمل‌های گام به گام و تصاویر گویا، ارائه دهد.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 3

جمینی ۳ می‌تواند به سوالات پیچیده پاسخ دهد و توانایی‌های تفکری معادل سطح دکترا را نشان دهد.

طبق ارزیابی، راه حل کاملاً دقیق است و از رویه صحیح پیروی می‌کند. برای مقایسه، GPT-5.1 نیز حدود 30 ثانیه طول کشید تا به درستی پاسخ دهد، اما راه حل آن جزئیات کمتری داشت. به طور مشابه، Claude 4.5 Sonnet به درستی و سریعتر از Gemini 3 پاسخ داد، اما جزئیات کمتری داشت.

گوگل می‌گوید جمینی ۳ می‌تواند اسناد را به‌طور همزمان از چندین منبع، مانند متن، تصاویر و ویدیوها ، استخراج کند. وظایفی که قبلاً هرگز در مورد آنها آموزش ندیده‌ایم، در جمینی ۳ بهتر انجام می‌شوند.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 4

قابلیت‌های تحلیل ویدیویی جمینی ۳.

برای مثال، وقتی از Gemini 3 خواسته شد موضوع اصلی یک ویدیوی ۵۷ دقیقه‌ای را تجزیه و تحلیل کند، تنها حدود یک دقیقه طول کشید تا نتایجی شامل آرگومان‌های درخواستی و مهرهای زمانی مربوط به بخش مربوطه از ویدیو را ارائه دهد. به طور مشابه، این مدل به درستی یک ویدیوی تنیس را شناسایی کرد و مسابقات و سبک بازی هر ورزشکار را تجزیه و تحلیل کرد.

کاربران می‌توانند از Gemini 3 بخواهند که همزمان ویدیوها را تماشا کند و به منابع خارجی مراجعه کند، حتی برای تحلیل عمیق‌تر سوال بپرسد. در مجموع، Gemini 3 در وظایف تحلیلی و ارجاع به اسناد کاملاً پاسخگو است، که تا حدودی به لطف ارتباط آن با پایگاه داده جستجوی گوگل است.

نماینده مفید است، اما هنوز مشکلاتی وجود دارد.

ویژگی Agent نیز یک ارتقاء قابل توجه در Gemini 3 است. برای کاربران طرح AI Ultra (که در حال حاضر فقط در بازار ایالات متحده موجود است)، این حالت می‌تواند وظایف پیچیده‌ای را از طرف کاربر انجام دهد، مانند دسته‌بندی و سازماندهی ایمیل‌ها، جستجوی اطلاعات و رزرو بلیط سفر.

گوگل هنگام عرضه جمینی ۳، از مثال قابلیت سازماندهی صندوق ورودی در جیمیل استفاده کرد. طبق تجربه وب‌سایت ورج ، این ویژگی دقیقاً همانطور که درخواست شده بود عمل می‌کند: ایجاد فهرست کاملی از ایمیل‌های خوانده نشده به مدت یک هفته.

مشابه ویژگی Canvas، لیست ایمیل‌ها و اقدامات پیشنهادی در یک قسمت جداگانه نمایش داده می‌شوند. Gemini گزینه‌های مختلفی مانند تنظیم یادآوری برای ایمیل‌های مهم، بایگانی ایمیل‌های تبلیغاتی و غیره را ارائه می‌دهد.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 5

ویژگی عامل Gemini 3 به مدیریت صندوق‌های ورودی Gmail کمک می‌کند. تصویر: The Verge .

وقتی از Gemini خواسته می‌شود یادآوری پرداخت قبوض ایجاد کند، به سرعت اطلاعات مربوطه را در Google Tasks وارد می‌کند. برای وظیفه پرداخت، اپراتور به طور خودکار پیمایش می‌کند و در صورت نیاز به وارد کردن اطلاعات پرداخت توسط کاربر، متوقف می‌شود.

در مجموع، ابزار Gemini 3 در شناسایی ایمیل‌هایی که کاربران معمولاً فراموش می‌کنند، بسیار مفید است. این ابزار همچنین می‌تواند ایمیل‌های ارسالی از آدرس‌های تبلیغاتی را که دیگر مفید نیستند، پیدا کرده و اشتراک خود را لغو کند.

در واقع، عوامل برخی از چت‌بات‌ها مانند Perplexity و ChatGPT از قبل از ادغام با Gmail پشتیبانی می‌کنند. با این حال، Gemini متنوع‌ترین قابلیت‌های ادغام را ارائه می‌دهد. به عنوان مثال، کاربران Perplexity باید ایمیل‌هایی را که می‌خواهند نگه دارند یا حذف کنند، به طور خاص وارد کنند، در حالی که این اقدامات را می‌توان از طریق دکمه‌هایی در Gemini انجام داد.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 6

ویژگی ایجاد رابط تعاملی Gemini 3. عکس: The Verge .

قابلیت مرتب‌سازی ایمیل در ChatGPT نیز ناپایدار است. با این حال، سرعت ارسال ایمیل در Gemini از Perplexity کندتر است. برخی کارها، مانند رزرو رستوران، گاهی اوقات با مشکل مواجه می‌شوند.

اگرچه همیشه قبل از انجام اقدامات حساس مانند پرداخت یا ارسال ایمیل، نیاز به تأیید کاربر است، اما واگذاری وظایف خاص به هوش مصنوعی هنوز کاربران را مردد می‌کند. حالت عامل در Gemini 3 بسیار مفید است، اما کاربران هنوز هم باید خروجی را رصد کنند.

منبع: https://znews.vn/gemini-3-tot-den-dau-post1607493.html