بحث جديد يكشف سر نجاح DeepSeek

تم نشر نموذج الذكاء الاصطناعي R1 لشركة DeepSeek الصينية الناشئة - والذي صدم سوق الأسهم الأمريكية عندما تم إطلاقه في يناير - في أول دراسة تمت مراجعتها من قبل النظراء، والتي تُظهر كيف طورت برنامج ماجستير قوي في القانون مقابل حوالي 300 ألف دولار.

تم تصميم R1 ليكون متميزًا في مهام التفكير مثل الرياضيات والبرمجة، مما يجعله منافسًا منخفض التكلفة للأدوات التي طورتها شركات التكنولوجيا العملاقة في الولايات المتحدة.

هذا هو نموذج "الوزن المفتوح"، والذي يمكن تنزيله مجانًا وهو حاليًا النموذج الأكثر شعبية على منصة Hugging Face، مع أكثر من 10.9 مليون عملية تنزيل.

وكشفت الدراسة التي نشرتها مجلة Nature، وهي تحديث لمخطوطة صدرت في يناير/كانون الثاني، أن تدريب R1 كلف 294 ألف دولار فقط، بالإضافة إلى حوالي 6 ملايين دولار تم إنفاقها على بناء النموذج الأساسي.

وهذا الرقم أقل بكثير من عشرات الملايين من الدولارات التي يقال إن المنافسين أنفقوها.

وقالت شركة DeepSeek إن R1 تم تدريبه في المقام الأول باستخدام شرائح Nvidia H800، والتي حظرت الولايات المتحدة تصديرها إلى الصين منذ عام 2023.

كان إنجاز R1 هو استخدامه "للتعلم التعزيزي الصرف"، حيث يُدرَّب النموذج على التجربة والخطأ ويُكافأ على الإجابات الصحيحة، بدلاً من التعلم من أمثلة يختارها البشر. كما يُقيِّم جهوده باستخدام تقديرات داخلية، وهي تقنية تُسمى "تحسين نهج المجموعة النسبية"، مما يُساعد على تعزيز الأداء.

يقول الباحث هوان صن (من جامعة ولاية أوهايو): "إن عملية مراجعة الأقران الدقيقة تُساعد على التحقق من قيمة النموذج وموثوقيته". ويضيف: "ينبغي على الشركات الأخرى أن تحذو حذوها".

وقال لويس تونستول، مهندس التعلم الآلي في شركة Hugging Face، إن هذه سابقة مهمة لأن الشفافية في تطوير الذكاء الاصطناعي تساعد على تقييم المخاطر بدقة أكبر.

تزعم شركة DeepSeek أن R1 لم يتم تدريبه باستخدام بيانات من نماذج OpenAI، على الرغم من أنها تعترف بأن النموذج الأساسي تم تدريبه على بيانات الويب - والتي قد تتضمن محتوى تم إنشاؤه بواسطة الذكاء الاصطناعي.

ويقول الخبراء إنه على الرغم من صعوبة التحقق بشكل قاطع، فإن الأدلة الحالية تشير إلى أن التعزيز الخالص كافٍ لتحقيق الأداء العالي.

في اختبار ScienceAgentBench، لم يتفوق R1 على مستوى الدقة، ولكنه حقق توازنًا جيدًا بين الكفاءة والتكلفة. يسعى الباحثون الآن إلى تطبيق أسلوب DeepSeek لتعزيز قدرات التفكير المنطقي لدى طلاب الماجستير في القانون الحاليين، بالإضافة إلى توسيع نطاقه ليشمل مجالات تتجاوز الرياضيات والبرمجة.

وبحسب السيد تونستال، فإن R1 "بدأ ثورة" في تطوير الذكاء الاصطناعي.

(TTXVN/فيتنام+)

المصدر: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp