![]() |
مدل DeepseekMath-V2 در حل مسائل ریاضی به عملکرد چشمگیری دست مییابد. عکس: Decoder . |
شرکت دیپسیک (Deepseek) به تازگی مدل DeepseekMath-V2 خود را معرفی کرده است که در مجموعهای از مسابقات معتبر ریاضی به نتایجی در سطح مدال طلا دست یافته است. این اقدام، این شرکت چینی را در رقابت مستقیم با آزمایشگاههای پیشرو هوش مصنوعی ایالات متحده قرار میدهد که در استدلال مدل زبانی پیشرو هستند.
طبق اسناد فنی، DeepseekMath-V2 در المپیاد بینالمللی ریاضی (IMO) 2025 و CMO چین 2024 به نتایجی در سطح مدال طلا دست یافت. در آزمون پاتنام، این مدل 118/120 امتیاز کسب کرد که بسیار بیشتر از امتیاز 90 بالاترین امتیاز شرکتکننده انسانی در تاریخ است. این نتایج گواهی بر توانایی آن در حل مسائل پیچیده است.
این شرکت چینی توضیح داد که محدودیت مدلهای هوش مصنوعی قبلی این بود که اگرچه میتوانستند پاسخهای صحیح ارائه دهند، اما نمیتوانستند راهحلهای معتبری ارائه دهند. برای غلبه بر این مشکل، DeepseekMath-V2 از یک فرآیند چند مرحلهای استفاده میکند که شامل ارزیابی صحت، بررسی استدلالهای مخالف و ارائه نتیجه نهایی است. این روش کار به سیستم اجازه میدهد تا راهحلها را در زمان واقعی بررسی و اصلاح کند و از موقعیت نتیجهگیریهای صحیح اما استدلال نادرست جلوگیری کند.
نکته قابل توجه این است که مستندات Deepseek هیچ اشارهای به استفاده از ابزارهای خارجی مانند رایانه یا مفسر در این مدل نمیکند. تنظیمات آزمایشی نشان میدهد که تمام نتایج کاملاً به زبان طبیعی تولید میشوند.
دیپسیک تأکید میکند که افزایش عملکرد از توانایی خودانتقادی و خوداصلاحی راهحلها ناشی میشود، نه از اتکا به نرمافزارهای تخصصی ریاضی. برای مسائل دشوار، سیستم با تولید چندین راهحل به صورت موازی، محاسبات را افزایش میدهد و در نتیجه قابلیت اطمینان نتیجه نهایی را افزایش میدهد.
عرضه DeepseekMath-V2 اندکی پس از آن صورت میگیرد که OpenAI و Google DeepMind اعلام کردند مدلهای منتشر نشده آنها نیز در IMO مدال طلا کسب کردهاند، شاهکاری که قبلاً فراتر از قابلیتهای مدلهای زبان بزرگ بود. با این حال، اطلاعات مربوط به این سیستمها در حال حاضر بسیار محدود است، به جز اینکه یک محقق OpenAI گفت که نسخهای از این سیستمها که از نظر ریاضی قدرتمندتر است، در ماههای آینده در دسترس خواهد بود.
برخلاف پنهانکاری شرکتهای آمریکایی، دیپسیک تصمیم گرفته است جزئیات روشها و معماری فنی خود را منتشر کند. این رویکرد به شرکت اجازه میدهد تا شفافیت را نشان دهد و در عین حال فشار رقابتی بر اکوسیستم هوش مصنوعی آمریکا ایجاد کند. به گفته اکونومیست ، برخی از استارتآپهای آمریکایی برای صرفهجویی در هزینهها، به تغییر به مدل متنباز کمهزینه از چین فکر کردهاند.
منبع: https://znews.vn/deepseek-pha-ky-luc-post1606990.html







نظر (0)