دیپ‌سیک رکوردها را شکست

مدل DeepseekMath-V2 در حل مسائل ریاضی به عملکرد چشمگیری دست می‌یابد. عکس: Decoder .

شرکت دیپ‌سیک (Deepseek) به تازگی مدل DeepseekMath-V2 خود را معرفی کرده است که در مجموعه‌ای از مسابقات معتبر ریاضی به نتایجی در سطح مدال طلا دست یافته است. این اقدام، این شرکت چینی را در رقابت مستقیم با آزمایشگاه‌های پیشرو هوش مصنوعی ایالات متحده قرار می‌دهد که در استدلال مدل زبانی پیشرو هستند.

طبق اسناد فنی، DeepseekMath-V2 در المپیاد بین‌المللی ریاضی (IMO) 2025 و CMO چین 2024 به نتایجی در سطح مدال طلا دست یافت. در آزمون پاتنام، این مدل 118/120 امتیاز کسب کرد که بسیار بیشتر از امتیاز 90 بالاترین امتیاز شرکت‌کننده انسانی در تاریخ است. این نتایج گواهی بر توانایی آن در حل مسائل پیچیده است.

این شرکت چینی توضیح داد که محدودیت مدل‌های هوش مصنوعی قبلی این بود که اگرچه می‌توانستند پاسخ‌های صحیح ارائه دهند، اما نمی‌توانستند راه‌حل‌های معتبری ارائه دهند. برای غلبه بر این مشکل، DeepseekMath-V2 از یک فرآیند چند مرحله‌ای استفاده می‌کند که شامل ارزیابی صحت، بررسی استدلال‌های مخالف و ارائه نتیجه نهایی است. این روش کار به سیستم اجازه می‌دهد تا راه‌حل‌ها را در زمان واقعی بررسی و اصلاح کند و از موقعیت نتیجه‌گیری‌های صحیح اما استدلال نادرست جلوگیری کند.

نکته قابل توجه این است که مستندات Deepseek هیچ اشاره‌ای به استفاده از ابزارهای خارجی مانند رایانه یا مفسر در این مدل نمی‌کند. تنظیمات آزمایشی نشان می‌دهد که تمام نتایج کاملاً به زبان طبیعی تولید می‌شوند.

دیپ‌سیک تأکید می‌کند که افزایش عملکرد از توانایی خودانتقادی و خوداصلاحی راه‌حل‌ها ناشی می‌شود، نه از اتکا به نرم‌افزارهای تخصصی ریاضی. برای مسائل دشوار، سیستم با تولید چندین راه‌حل به صورت موازی، محاسبات را افزایش می‌دهد و در نتیجه قابلیت اطمینان نتیجه نهایی را افزایش می‌دهد.

عرضه DeepseekMath-V2 اندکی پس از آن صورت می‌گیرد که OpenAI و Google DeepMind اعلام کردند مدل‌های منتشر نشده آنها نیز در IMO مدال طلا کسب کرده‌اند، شاهکاری که قبلاً فراتر از قابلیت‌های مدل‌های زبان بزرگ بود. با این حال، اطلاعات مربوط به این سیستم‌ها در حال حاضر بسیار محدود است، به جز اینکه یک محقق OpenAI گفت که نسخه‌ای از این سیستم‌ها که از نظر ریاضی قدرتمندتر است، در ماه‌های آینده در دسترس خواهد بود.

برخلاف پنهان‌کاری شرکت‌های آمریکایی، دیپ‌سیک تصمیم گرفته است جزئیات روش‌ها و معماری فنی خود را منتشر کند. این رویکرد به شرکت اجازه می‌دهد تا شفافیت را نشان دهد و در عین حال فشار رقابتی بر اکوسیستم هوش مصنوعی آمریکا ایجاد کند. به گفته اکونومیست ، برخی از استارت‌آپ‌های آمریکایی برای صرفه‌جویی در هزینه‌ها، به تغییر به مدل متن‌باز کم‌هزینه از چین فکر کرده‌اند.

منبع: https://znews.vn/deepseek-pha-ky-luc-post1606990.html