تحقیقات جدید راز موفقیت DeepSeek را آشکار می‌کند

مدل هوش مصنوعی R1 استارتاپ چینی DeepSeek - که با عرضه در ژانویه، بازار سهام ایالات متحده را شوکه کرد - در اولین مطالعه بررسی‌شده توسط همتایان منتشر شده است و نشان می‌دهد که چگونه این شرکت یک LLM قدرتمند را با قیمتی حدود ۳۰۰۰۰۰ دلار توسعه داده است.

R1 برای برتری در وظایف استدلالی مانند ریاضی و برنامه‌نویسی طراحی شده است، و این آن را به رقیبی کم‌هزینه برای ابزارهای توسعه‌یافته توسط غول‌های فناوری ایالات متحده تبدیل می‌کند.

این یک مدل «باز» است که دانلود آن رایگان است و در حال حاضر با بیش از ۱۰.۹ میلیون دانلود، محبوب‌ترین مدل در پلتفرم Hugging Face است.

مطالعه‌ی نیچر، که به‌روزرسانی نسخه‌ی خطی ژانویه است، ابتدا نشان داد که آموزش R1 علاوه بر حدود ۶ میلیون دلاری که برای ساخت مدل پایه هزینه شده، تنها ۲۹۴۰۰۰ دلار هزینه داشته است.

این رقم بسیار کمتر از ده‌ها میلیون دلاری است که گفته می‌شود رقبا هزینه کرده‌اند.

دیپ‌سیک اعلام کرد که R1 در درجه اول با استفاده از تراشه‌های انویدیا H800 آموزش دیده است، که ایالات متحده از سال 2023 صادرات آن به چین را ممنوع کرده است.

پیشرفت R1 استفاده از «یادگیری تقویتی خالص» بود، که در آن مدل به جای یادگیری از نمونه‌های انتخاب‌شده توسط انسان‌ها، بر اساس آزمون و خطا آموزش می‌بیند و برای پاسخ‌های صحیح پاداش می‌گیرد. همچنین با استفاده از تخمین‌های داخلی، تکنیکی به نام «بهینه‌سازی نسبی سیاست گروهی» که به افزایش عملکرد کمک می‌کند، به تلاش‌های خود امتیاز می‌دهد.

محقق هوان سان (دانشگاه ایالتی اوهایو) می‌گوید: «فرآیند دقیق بررسی همتا به اعتبارسنجی ارزش و قابلیت اطمینان مدل کمک می‌کند. سایر شرکت‌ها نیز باید همین کار را انجام دهند.»

لوئیس تانستال، مهندس یادگیری ماشین در شرکت هاگینگ فیس، گفت که این یک سابقه مهم است زیرا شفافیت در توسعه هوش مصنوعی به ارزیابی دقیق‌تر خطرات کمک می‌کند.

دیپ‌سیک ادعا می‌کند که R1 با استفاده از داده‌های مدل‌های OpenAI آموزش ندیده است، هرچند اذعان می‌کند که مدل اصلی بر اساس داده‌های وب آموزش دیده است - که می‌تواند شامل محتوای تولید شده توسط هوش مصنوعی باشد.

کارشناسان می‌گویند اگرچه تأیید قطعی این موضوع دشوار است، شواهد فعلی نشان می‌دهد که تقویت صرف برای دستیابی به عملکرد بالا کافی است.

در آزمون ScienceAgentBench، R1 در صدر جدول دقت قرار نگرفت، اما تعادل خوبی بین کارایی و هزینه برقرار کرد. محققان اکنون به دنبال به‌کارگیری روش DeepSeek برای افزایش قابلیت‌های استدلال LLM های موجود و همچنین گسترش آن به حوزه‌هایی فراتر از ریاضی و برنامه‌نویسی هستند.

به گفته آقای توانستال، R1 «انقلابی را در توسعه هوش مصنوعی آغاز کرده است».

(TTXVN/ویتنام+)

منبع: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp