بفضل تقنيات مُحسّنة من تدريب الذكاء الاصطناعي من DeepSeek، قدّمت شريحة Huawei Ascend أداءً متميزًا. الصورة: رويترز . |
أعلن باحثون يعملون على نموذج اللغة الكبيرة Pangu (LLM) التابع لشركة هواوي في الرابع من يونيو أنهم تمكنوا من تحسين النهج الأصلي لشركة DeepSeek لتدريب الذكاء الاصطناعي (AI) من خلال الاستفادة من الأجهزة الملكية للشركة، حسبما ذكرت صحيفة ساوث تشاينا مورنينج بوست .
وعلى وجه التحديد، قدمت الورقة البحثية التي نشرها فريق Pangu التابع لشركة Huawei، والذي يضم 22 متعاونًا أساسيًا و56 باحثًا إضافيًا، مفهوم مزيج الخبراء المجمعين (MoGE)، وهو نسخة مطورة من تقنية مزيج الخبراء (MoE) التي لعبت دورًا رئيسيًا في نماذج الذكاء الاصطناعي الفعالة من حيث التكلفة في DeepSeek.
وفقًا للورقة البحثية، على الرغم من أن MoE يوفر تكاليف تنفيذ منخفضة لمعلمات النماذج الكبيرة وقدرات التعلم المتقدمة، إلا أنه غالبًا ما يؤدي إلى انخفاض الكفاءة. وينشأ هذا عن التنشيط غير المتساوي، مما يعيق الأداء عند التشغيل على أجهزة متعددة بالتوازي.
وفي الوقت نفسه، تم تحسين MoGE من خلال فريق من الخبراء في عملية الاختيار وموازنة عبء العمل على "الخبراء" بشكل أفضل، وفقًا للباحثين.
في تدريب الذكاء الاصطناعي، يشير مصطلح "الخبير" إلى نماذج فرعية متخصصة أو مكونات ضمن نموذج أكبر. يُصمَّم كل نموذج من هذه النماذج للتعامل مع مهام محددة أو أنواع مختلفة من البيانات. وهذا يسمح للنظام ككل بالاستفادة من خبرات متنوعة لتحسين الأداء.
وفقًا لهواوي، تتكون عملية التدريب من ثلاث مراحل رئيسية: ما قبل التدريب، والتوسع طويل الأمد، وما بعد التدريب. وشملت العملية بأكملها تدريبًا مسبقًا على 13.2 تريليون رمز، وتوسعًا طويل الأمد باستخدام 8192 شريحة Ascend، أقوى معالج ذكاء اصطناعي من هواوي، يُستخدم لتدريب نماذج الذكاء الاصطناعي، ويهدف إلى تحدي هيمنة إنفيديا في تصميم الرقائق المتطورة.
ومن خلال اختبار البنية الجديدة على وحدة المعالجة العصبية Ascend (NPU) المصممة خصيصًا لتسريع مهام الذكاء الاصطناعي، وجد الباحثون أن MoGE "يؤدي إلى موازنة أفضل للتحميل الخبير وأداء أكثر كفاءة لكل من تدريب النموذج والاستدلال".
ونتيجة لذلك، وبالمقارنة مع نماذج مثل DeepSeek-V3، وQwen2.5-72B من Alibaba، وLlama-405B من Meta Platforms، يتفوق Pangu على معظم معايير اللغة الإنجليزية العامة وجميع معايير اللغة الصينية، مما يدل على أداء متفوق في التدريب في سياق طويل.
المصدر: https://znews.vn/huawei-tuyen-bo-huan-luyen-ai-tot-hon-deepseek-post1558359.html
تعليق (0)