وحدة معالجة الرسومات (GPU) هي عقل الكمبيوتر الذي يعمل بالذكاء الاصطناعي
ببساطة، تعمل وحدة معالجة الرسوميات (GPU) بمثابة عقل الكمبيوتر الذكاء الاصطناعي.
كما تعلمون، تُعدّ وحدة المعالجة المركزية (CPU) بمثابة عقل الحاسوب. وتكمن ميزة وحدة معالجة الرسومات (GPU) في أنها وحدة معالجة مركزية متخصصة قادرة على إجراء عمليات حسابية معقدة. وأسرع طريقة لتحقيق ذلك هي استخدام مجموعات من وحدات معالجة الرسومات لحل نفس المشكلة. ومع ذلك، قد يستغرق تدريب نموذج الذكاء الاصطناعي أسابيع أو حتى أشهرًا. بمجرد بناء النموذج، يُوضع في نظام حاسوبي أمامي، ويمكن للمستخدمين طرح أسئلة على نموذج الذكاء الاصطناعي، وهي عملية تُسمى الاستدلال.
كمبيوتر الذكاء الاصطناعي يحتوي على وحدات معالجة رسومية متعددة
أفضل بنية لمشاكل الذكاء الاصطناعي هي استخدام مجموعة من وحدات معالجة الرسومات (GPU) في رف، متصلة بمفتاح أعلى الرف. يمكن ربط عدة رفوف لوحدات معالجة الرسومات (GPU) بتسلسل هرمي للشبكات. مع ازدياد تعقيد المشكلة، تزداد متطلبات وحدات معالجة الرسومات، وقد تحتاج بعض المشاريع إلى نشر مجموعات من آلاف وحدات معالجة الرسومات.
كل مجموعة من الذكاء الاصطناعي عبارة عن شبكة صغيرة
عند بناء مجموعة الذكاء الاصطناعي، من الضروري إنشاء شبكة كمبيوتر صغيرة للاتصال والسماح لوحدات معالجة الرسومات بالعمل معًا ومشاركة البيانات بكفاءة.
يوضح الشكل أعلاه مجموعة ذكاء اصطناعي، حيث تُمثل الدوائر في الأسفل سير العمل الجاري على وحدات معالجة الرسومات. تتصل وحدات معالجة الرسومات بمفاتيح أعلى الرف (ToR). كما تتصل هذه المفاتيح بمفاتيح الشبكة الأساسية الموضحة أعلى الرسم التخطيطي، مما يُظهر التسلسل الهرمي الواضح للشبكة المطلوب عند استخدام وحدات معالجة رسومات متعددة.
الشبكات تشكل عنق زجاجة في نشر الذكاء الاصطناعي
في خريف العام الماضي، خلال القمة العالمية لمشروع الحاسوب المفتوح (OCP)، حيث كان المندوبون يعملون على بناء الجيل القادم من البنية التحتية للذكاء الاصطناعي، أثار المندوب لوي نجوين من شركة مارفيل تكنولوجي نقطة رئيسية: "الشبكات هي عنق الزجاجة الجديد".
من الناحية الفنية، قد يؤدي ارتفاع زمن وصول الحزم أو فقدانها بسبب ازدحام الشبكة إلى إعادة إرسالها، مما يزيد بشكل كبير من وقت إكمال المهمة (JCT). ونتيجةً لذلك، تُهدر الشركات ملايين أو عشرات الملايين من الدولارات من وحدات معالجة الرسومات (GPUs) بسبب أنظمة الذكاء الاصطناعي غير الفعّالة، مما يُكلفها إيراداتٍ ووقتًا للوصول إلى السوق.
القياس هو شرط أساسي للتشغيل الناجح لشبكات الذكاء الاصطناعي
لتشغيل مجموعة ذكاء اصطناعي بفعالية، يجب الاستفادة الكاملة من وحدات معالجة الرسومات (GPUs) لتقصير وقت التدريب وتطبيق نموذج التعلم لتحقيق أقصى عائد على الاستثمار. لذلك، من الضروري اختبار أداء مجموعة الذكاء الاصطناعي وتقييمه (الشكل 2). مع ذلك، هذه المهمة ليست سهلة، نظرًا لوجود العديد من الإعدادات والعلاقات بين وحدات معالجة الرسومات وهياكل الشبكة، من حيث بنية النظام، والتي يجب أن تتكامل لحل المشكلة.
وهذا يخلق العديد من التحديات في قياس شبكات الذكاء الاصطناعي:
- صعوبة إعادة إنتاج شبكات الإنتاج بأكملها في المختبر بسبب القيود المفروضة على التكلفة والمعدات ونقص مهندسي الذكاء الاصطناعي المتخصصين في الشبكات والمساحة والطاقة ودرجة الحرارة.
- يؤدي القياس على نظام الإنتاج إلى تقليل القدرة المعالجة المتاحة لنظام الإنتاج نفسه.
- صعوبة إعادة إنتاج المشاكل بدقة بسبب الاختلافات في حجم ونطاق المشاكل.
- تعقيد كيفية ربط وحدات معالجة الرسوميات معًا.
لمواجهة هذه التحديات، يمكن للشركات اختبار مجموعة فرعية من الإعدادات الموصى بها في بيئة معملية لقياس أداء مقاييس رئيسية، مثل وقت إنجاز المهمة (JCT)، وعرض النطاق الترددي الذي يمكن لفريق الذكاء الاصطناعي تحقيقه، ومقارنته باستخدام منصة التبديل واستخدام ذاكرة التخزين المؤقت. يساعد هذا القياس على إيجاد التوازن الأمثل بين عبء عمل وحدة معالجة الرسومات/المعالجة وتصميم/إعداد الشبكة. بمجرد الرضا عن النتائج، يمكن لمهندسي الحاسوب ومهندسي الشبكات نقل هذه الإعدادات إلى مرحلة الإنتاج وقياس النتائج الجديدة.
تعمل مختبرات الأبحاث المؤسسية والمؤسسات الأكاديمية والجامعات على تحليل جميع جوانب بناء وتشغيل شبكات الذكاء الاصطناعي الفعّالة لمواجهة تحديات العمل على الشبكات الكبيرة، لا سيما مع استمرار تطور أفضل الممارسات. هذا النهج التعاوني القابل للتكرار هو السبيل الوحيد للشركات لإجراء قياسات قابلة للتكرار واختبار سيناريوهات "ماذا لو" بسرعة، وهي أساس تحسين الشبكات للذكاء الاصطناعي.
(المصدر: Keysight Technologies)
[إعلان 2]
المصدر: https://vietnamnet.vn/ket-noi-mang-ai-5-dieu-can-biet-2321288.html
تعليق (0)