كشفت شركة DeepSeek عن كيفية بنائها لنموذج ذكاء اصطناعي رخيص الثمن. الصورة: بلومبرج . |
في تقرير بحثي نُشر في 15 مايو، شاركت شركة DeepSeek تفاصيل لأول مرة حول كيفية بناء أحد أقوى أنظمة الذكاء الاصطناعي مفتوحة المصدر في العالم مقابل جزء بسيط من تكلفة منافسيها.
تم تأليف الدراسة، التي تحمل عنوان "رؤى حول DeepSeek-V3: تحديات التوسع وانعكاسات على الأجهزة لهندسة الذكاء الاصطناعي"، بالاشتراك مع المؤسس ليانغ وينفينغ. وتعزو شركة DeepSeek نجاحها إلى تصميم الأجهزة والبرامج بالتوازي. وهذه خطوة مختلفة في سياق لا تزال فيه العديد من الشركات تركز على تحسين البرامج المستقلة.
وكتب الفريق في ورقته البحثية: "أظهر DeepSeek-V3، الذي تم تدريبه على 2048 وحدة معالجة رسومية من نوع Nvidia H800، كيف يمكن للتصميم المتوازي معالجة هذه التحديات بشكل فعال، مما يتيح التدريب والاستدلال بكفاءة على نطاق واسع". قامت شركة DeepSeek وصندوق التحوط High-Flyer بتخزين سلسلة H800 من الرقائق قبل أن يتم حظر تصديرها إلى الصين من قبل الولايات المتحدة في عام 2023.
وبحسب الورقة البحثية، فإن فريق DeepSeek يدرك جيدًا القيود المتعلقة بالأجهزة بالإضافة إلى "التكاليف الباهظة" لتدريب نماذج اللغة الكبيرة (LLMs)، وهي التكنولوجيا الأساسية وراء برامج الدردشة الآلية مثل ChatGPT من OpenAI. ونتيجة لذلك، قاموا بتنفيذ سلسلة من التحسينات التقنية التي أدت إلى زيادة أداء الذاكرة، وتحسين الاتصال بين الرقائق، وتحسين كفاءة البنية التحتية للذكاء الاصطناعي بالكامل.
بالإضافة إلى ذلك، يؤكد DeepSeek على دور بنية نموذج الخبير (MoE). إنها طريقة تعلُّم آلي تقسم نموذج الذكاء الاصطناعي إلى شبكات فرعية، كل منها تعالج جزءًا منفصلاً من بيانات الإدخال وتعمل بشكل تعاوني لتحسين النتيجة.
تساعد وزارة التعليم على خفض تكاليف التدريب وتسريع الاستدلال. وقد تم اعتماد هذه الطريقة على نطاق واسع في صناعة التكنولوجيا في الصين، بما في ذلك أحدث طراز Qwen3 من علي بابا.
تصدرت شركة DeepSeek عناوين الأخبار عندما أصدرت نموذجها الأساسي V3 في ديسمبر 2024 ونموذجها المنطقي R1 في يناير. وأثارت هذه المنتجات ضجة في الأسواق العالمية، مما ساهم في انخفاض حاد في أسهم التكنولوجيا المرتبطة بالذكاء الاصطناعي.
على الرغم من عدم الكشف عن أي خطط أخرى مؤخرًا، فقد حافظت DeepSeek على اهتمام المجتمع من خلال نشر تقارير منتظمة. في أواخر شهر مارس، أصدرت الشركة تحديثًا بسيطًا لبرنامج DeepSeek-V3، وفي أواخر شهر أبريل، أطلقت بهدوء نظام Prover-V2 لمعالجة الإثباتات الرياضية.
المصدر: https://znews.vn/deepseek-tiet-lo-bi-mat-post1554222.html
تعليق (0)