يكشف برنامج DeepSeek عن أسراره.

تكشف شركة DeepSeek عن كيفية بناء نماذج الذكاء الاصطناعي منخفضة التكلفة. الصورة: بلومبيرغ .

في تقرير بحثي نُشر في 15 مايو، شاركت شركة DeepSeek لأول مرة تفاصيل حول كيفية بناء أحد أقوى أنظمة الذكاء الاصطناعي مفتوحة المصدر في العالم بجزء بسيط من تكلفة منافسيها.

الدراسة، التي تحمل عنوان "رؤى حول DeepSeek-V3: تحديات التوسع وتأملات حول الأجهزة لبنى الذكاء الاصطناعي"، شارك في تأليفها المؤسس ليانغ وينفنغ. ويعزو DeepSeek نجاحه إلى التصميم المتوازي للأجهزة والبرمجيات، وهو نهج مميز مقارنة بالعديد من الشركات التي لا تزال تركز على تحسين البرمجيات بشكل منفصل.

أوضح فريق البحث في تقريره أن "نموذج DeepSeek-V3، الذي تم تدريبه على 2048 وحدة معالجة رسومية من نوع Nvidia H800، أثبت كيف يمكن للتصميم المتوازي أن يحل التحديات بكفاءة، مما يتيح التدريب والاستدلال الفعال على نطاق واسع". وكانت شركة DeepSeek وصندوق التحوط High-Flyer قد خزّنتا رقائق H800 قبل أن تحظر الولايات المتحدة تصديرها إلى الصين ابتداءً من عام 2023.

بحسب المقال، كان فريق بحث DeepSeek على دراية تامة بالقيود التقنية للأجهزة والتكاليف الباهظة لتدريب نماذج اللغة الكبيرة (LLMs)، وهي التقنية الأساسية وراء روبوتات المحادثة مثل ChatGPT من OpenAI. ولذلك، قاموا بتطبيق سلسلة من التحسينات التقنية لزيادة أداء الذاكرة، وتحسين التواصل بين الشرائح، وتعزيز الكفاءة العامة للبنية التحتية للذكاء الاصطناعي.

علاوة على ذلك، يُركز DeepSeek على دور بنية نموذج الخبراء المختلط (MoE). وهي طريقة تعلم آلي تُقسّم نموذج الذكاء الاصطناعي إلى شبكات فرعية، تُعالج كل منها جزءًا منفصلاً من بيانات الإدخال، وتعمل هذه الشبكات بشكل تعاوني لتحسين النتائج.

تساعد طريقة التعلم الآلي على خفض تكاليف التدريب وتسريع سرعة التفكير. وقد تم اعتماد هذه الطريقة على نطاق واسع في قطاع التكنولوجيا الصيني، بما في ذلك أحدث طراز من شركة علي بابا، وهو Qwen3.

لفتت شركة DeepSeek الأنظار لأول مرة عندما أطلقت نموذجها الأساسي V3 في ديسمبر 2024 ونموذجها R1 للاستدلال في يناير. وقد أحدثت هذه المنتجات ضجة في السوق العالمية، مما ساهم في انخفاض واسع النطاق في أسهم شركات التكنولوجيا المرتبطة بالذكاء الاصطناعي.

على الرغم من أن شركة DeepSeek لم تكشف عن أي خطط مستقبلية مؤخرًا، إلا أنها حافظت على اهتمام مجتمع المستخدمين من خلال التقارير الدورية. في أواخر مارس، أصدرت الشركة تحديثًا بسيطًا لبرنامج DeepSeek-V3، وبحلول نهاية أبريل، أطلقت بهدوء نظام Prover-V2 لمعالجة البراهين الرياضية.

المصدر: https://znews.vn/deepseek-tiet-lo-bi-mat-post1554222.html