كشفت شركة DeepSeek عن كيفية بناء نموذج ذكاء اصطناعي رخيص. الصورة: بلومبرج . |
في تقرير بحثي نُشر في 15 مايو، شاركت شركة DeepSeek تفاصيل لأول مرة حول كيفية بناء أحد أقوى أنظمة الذكاء الاصطناعي مفتوحة المصدر في العالم مقابل جزء بسيط من تكلفة منافسيها.
شارك في تأليف الدراسة، المعنونة "رؤى حول DeepSeek-V3: تحديات التوسع وانعكاسات على الأجهزة لبنى الذكاء الاصطناعي"، المؤسس ليانغ وينفينغ. تُعزي DeepSeek نجاحها إلى تصميم الأجهزة والبرمجيات بالتوازي، وهي خطوة تختلف عن العديد من الشركات التي تُركز على تحسين البرمجيات بشكل مُنفصل.
كتب الفريق في ورقته البحثية: "يُظهر DeepSeek-V3، المُدرَّب على 2048 وحدة معالجة رسومية من طراز Nvidia H800، كيف يُمكن للتصميمات المتوازية معالجة هذه التحديات بفعالية، مما يُتيح تدريبًا واستنتاجًا فعالين على نطاق واسع". وقد خزّنت DeepSeek وصندوق التحوط High-Flyer خط شرائح H800 قبل أن تحظر الولايات المتحدة تصديرها إلى الصين في عام 2023.
وبحسب البحث، فإن فريق DeepSeek، الذي يدرك القيود المادية و"التكاليف الباهظة" لتدريب نماذج اللغة الكبيرة (LLMs)، وهي التكنولوجيا الأساسية وراء برامج الدردشة الآلية مثل ChatGPT من OpenAI، قد نفذ سلسلة من التحسينات الفنية التي تزيد من كفاءة الذاكرة، وتحسن الاتصال بين الشرائح، وتحسن كفاءة البنية التحتية للذكاء الاصطناعي بالكامل.
بالإضافة إلى ذلك، يُركز DeepSeek على دور بنية نموذج الخبير (MoE). وهي طريقة تعلّم آلي تُقسّم نموذج الذكاء الاصطناعي إلى شبكات فرعية، تُعالج كل منها جزءًا مُنفصلًا من بيانات الإدخال، وتعمل بشكل تعاوني لتحسين النتائج.
تُخفّض MoE تكاليف التدريب وتُسرّع الاستدلال. وقد تمّ اعتماد هذه الطريقة على نطاق واسع في قطاع التكنولوجيا الصيني، بما في ذلك أحدث طراز Qwen3 من Alibaba.
تصدرت شركة DeepSeek عناوين الأخبار بإصدارها نموذجها الأساسي V3 في ديسمبر 2024 ونموذجها المنطقي R1 في يناير. وقد أحدثت هذه المنتجات ضجة في الأسواق العالمية، مما ساهم في انخفاض حاد في أسهم التكنولوجيا المرتبطة بالذكاء الاصطناعي.
على الرغم من أن DeepSeek لم تكشف عن أي خطط جديدة مؤخرًا، إلا أنها حافظت على اهتمامها بالمجتمع من خلال نشر تقارير منتظمة. في أواخر مارس، أصدرت الشركة تحديثًا طفيفًا لنظام DeepSeek-V3، وفي أواخر أبريل، أطلقت بهدوء نظام Prover-V2 لمعالجة البراهين الرياضية.
المصدر: https://znews.vn/deepseek-tiet-lo-bi-mat-post1554222.html
تعليق (0)