مدل هوش مصنوعی R1 استارتاپ چینی DeepSeek - که با عرضه در ژانویه، بازار سهام ایالات متحده را شوکه کرد - در اولین مطالعه بررسیشده توسط همتایان منتشر شده است و نشان میدهد که چگونه این شرکت یک LLM قدرتمند را با قیمتی حدود ۳۰۰۰۰۰ دلار توسعه داده است.
R1 برای برتری در وظایف استدلالی مانند ریاضی و برنامهنویسی طراحی شده است، و این آن را به رقیبی کمهزینه برای ابزارهای توسعهیافته توسط غولهای فناوری ایالات متحده تبدیل میکند.
این یک مدل «باز» است که دانلود آن رایگان است و در حال حاضر با بیش از ۱۰.۹ میلیون دانلود، محبوبترین مدل در پلتفرم Hugging Face است.
مطالعهی نیچر، که بهروزرسانی نسخهی خطی ژانویه است، ابتدا نشان داد که آموزش R1 علاوه بر حدود ۶ میلیون دلاری که برای ساخت مدل پایه هزینه شده، تنها ۲۹۴۰۰۰ دلار هزینه داشته است.
این رقم بسیار کمتر از دهها میلیون دلاری است که گفته میشود رقبا هزینه کردهاند.
دیپسیک اعلام کرد که R1 در درجه اول با استفاده از تراشههای انویدیا H800 آموزش دیده است، که ایالات متحده از سال 2023 صادرات آن به چین را ممنوع کرده است.
پیشرفت R1 استفاده از «یادگیری تقویتی خالص» بود، که در آن مدل به جای یادگیری از نمونههای انتخابشده توسط انسانها، بر اساس آزمون و خطا آموزش میبیند و برای پاسخهای صحیح پاداش میگیرد. همچنین با استفاده از تخمینهای داخلی، تکنیکی به نام «بهینهسازی نسبی سیاست گروهی» که به افزایش عملکرد کمک میکند، به تلاشهای خود امتیاز میدهد.
محقق هوان سان (دانشگاه ایالتی اوهایو) میگوید: «فرآیند دقیق بررسی همتا به اعتبارسنجی ارزش و قابلیت اطمینان مدل کمک میکند. سایر شرکتها نیز باید همین کار را انجام دهند.»
لوئیس تانستال، مهندس یادگیری ماشین در شرکت هاگینگ فیس، گفت که این یک سابقه مهم است زیرا شفافیت در توسعه هوش مصنوعی به ارزیابی دقیقتر خطرات کمک میکند.
دیپسیک ادعا میکند که R1 با استفاده از دادههای مدلهای OpenAI آموزش ندیده است، هرچند اذعان میکند که مدل اصلی بر اساس دادههای وب آموزش دیده است - که میتواند شامل محتوای تولید شده توسط هوش مصنوعی باشد.
کارشناسان میگویند اگرچه تأیید قطعی این موضوع دشوار است، شواهد فعلی نشان میدهد که تقویت صرف برای دستیابی به عملکرد بالا کافی است.
در آزمون ScienceAgentBench، R1 در صدر جدول دقت قرار نگرفت، اما تعادل خوبی بین کارایی و هزینه برقرار کرد. محققان اکنون به دنبال بهکارگیری روش DeepSeek برای افزایش قابلیتهای استدلال LLM های موجود و همچنین گسترش آن به حوزههایی فراتر از ریاضی و برنامهنویسی هستند.
به گفته آقای توانستال، R1 «انقلابی را در توسعه هوش مصنوعی آغاز کرده است».
منبع: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp






نظر (0)