
تتجه شركات التكنولوجيا العملاقة إلى نماذج الذكاء الاصطناعي الحديثة الموفرة للطاقة
في السنوات الأخيرة، اتبعت صناعة الذكاء الاصطناعي مبدأ "الأكبر هو الأفضل": بيانات أكثر، معايير أكثر، حسابات أكثر. إلا أن أبحاثًا جديدة من جوجل ومعهد ماساتشوستس للتكنولوجيا وجامعة ستانفورد تُظهر اتجاهًا مختلفًا تمامًا.
يمكن تدريب النماذج الحديثة بكفاءة باستخدام بيانات أقل، واستهلاك طاقة أقل، مع الحفاظ على أداء عالٍ. هذا لا يقلل تكاليف التدريب ووقته فحسب، بل يفتح أيضًا آفاقًا جديدة لتطبيقات الذكاء الاصطناعي لفرق البحث الصغيرة والشركات المتوسطة، التي كانت تواجه سابقًا صعوبة في الوصول إلى التقنيات واسعة النطاق.
تساعد التطورات التكنولوجية في جعل الذكاء الاصطناعي "صغيرًا ولكنه قوي"
وفقًا لبحث أجرته Tuoi Tre Online، في اختبار معالجة الإعلانات، نجحت Google في تقليل بيانات التدريب من 100000 عينة إلى أقل من 500 عينة مع زيادة التوافق مع الخبراء بنسبة 65%.
وبالتوازي مع ذلك، يظهر مسح شامل للتدريب الفعال للبيانات أن "جودة البيانات، والعينات الذكية، وتقنيات "التقطير" تحدد الأداء"، وليس مجرد زيادة عدد البيانات.
من الناحية النظرية، تشير "قوانين التوسع" إلى أن زيادة معلمات النموذج والبيانات والحوسبة سوف تساعد، لكن خبراء مثل يان ليكون، مدير الذكاء الاصطناعي في ميتا، يؤكدون: "لا يمكنك فقط زيادة البيانات والحوسبة وجعل الذكاء الاصطناعي أكثر ذكاءً تلقائيًا".
وهذا يعني أنه بدلاً من الاضطرار إلى بناء ووضع علامات على ملايين إلى مليارات العينات، تتطلع فرق البحث إلى إعادة استخدام البيانات، وإنشاء بيانات اصطناعية، واستخدام نماذج أصغر، والتركيز على الخوارزميات الأكثر كفاءة في استخدام الطاقة والبيانات.
على سبيل المثال، تتيح تقنية "تقطير المعرفة" نقل المعرفة من "المعلم" (نموذج المعلم الكبير) إلى "الطالب" (نموذج الطالب المُدمج)، مع الحفاظ على العديد من القدرات. ويؤكد باحثون في معهد ستانفورد للذكاء الاصطناعي أن هذا التوجه فعال من حيث التكلفة الحسابية وصديق للبيئة، كما أنه يتيح فرصًا لمجموعات البحث الصغيرة أو الشركات الصغيرة والمتوسطة لتطبيق الذكاء الاصطناعي بفعالية.
تتيح هذه التطورات لنماذج الذكاء الاصطناعي استخدام بيانات أقل، والعمل بشكل أسرع، واستهلاك طاقة أقل، وخفض التكاليف، وزيادة الاستدامة، وتوسيع التطبيقات إلى بيئات محدودة الموارد للتحرك نحو التحسين الذكي، والتعلم بشكل أسرع، واستهلاك موارد أقل، مع ضمان الجودة.
التطبيقات العملية والتحديات المتعلقة بتدريب الذكاء الاصطناعي الموفر للبيانات
في الواقع، لتدريب الذكاء الاصطناعي باستخدام بيانات وطاقة أقل تأثير واسع النطاق. بالنسبة للشركات الصغيرة أو فرق البحث في الدول النامية، فإن "استخدام ملايين العينات وخوادم ضخمة" أمر غير ممكن. عندما يتمكن شخص ما من تدريب نموذج باستخدام بضعة آلاف من العينات وأجهزة كمبيوتر عادية، ستصبح تطبيقات الذكاء الاصطناعي أقرب إلى المستخدمين النهائيين والبيئات الواقعية.
على سبيل المثال، في مربعات حوار تعديل الإعلانات، توضح Google أن اختيار عينة "قيمة" من البيانات أفضل من مئات الآلاف من العينات العشوائية - مما يقلل من كمية البيانات المطلوبة مع الاستمرار في تحقيق النتائج.
ومع ذلك، يبقى التحدي قائمًا: فعندما تكون البيانات نادرة، يكون النموذج عرضة للمبالغة في التجهيز، وضعف التعميم، وصعوبة التعامل مع التغيرات في البيئة. تُظهر الأبحاث المتعلقة بتعلم النقل البصري أنه عندما تكون بيانات الإدخال محدودة للغاية، يكون التقطير أكثر فعالية، ولكن عندما تكون البيانات كبيرة بما يكفي، تظل الطريقة التقليدية هي الأنسب.
من حيث استهلاك الطاقة والتكلفة، فإن تقليل البيانات يعني أيضًا تقليل العمليات الحسابية والخوادم والكهرباء، وهو أمر مهم في سياق نماذج الذكاء الاصطناعي الكبيرة (LLM) التي تكلف ملايين الدولارات لكل تدريب.
وبحسب تقرير صادر عن معهد ستانفورد للذكاء الاصطناعي، فإن اتجاه الذكاء الاصطناعي الموفر للبيانات والطاقة يُنظر إليه باعتباره "تحولاً كبيراً" في عام 2025.
وبالنسبة للصحفيين والقراء بشكل عام، من الجدير بالذكر أنه عندما لا يصبح الذكاء الاصطناعي حكراً على "عمالقة التكنولوجيا" ولكن يمكن إنشاؤه بواسطة فرق صغيرة باستخدام بيانات أقل وتكاليف أقل، فسوف تظهر العديد من التطبيقات الجديدة من إدارة الأعمال الصغيرة، والتطبيقات الطبية الإقليمية، إلى التعلم الشخصي.
ولكن ينبغي للمستخدمين أيضًا أن يكونوا حذرين من أن نموذج "البيانات" قد يكون أقل دقة وأكثر عرضة للتحيز إذا لم يتم التحكم فيه جيدًا.
المصدر: https://tuoitre.vn/ai-khong-con-can-du-lieu-khong-lo-cuoc-dua-huan-luyen-ai-tiet-kiem-nang-luong-20251031115025169.htm






تعليق (0)