نقطة الضعف القاتلة للذكاء الاصطناعي

لا يزال الذكاء الاصطناعي غير قادر على استبدال البشر في مجال البرمجة. الصورة: جون ماكغواير .

في الآونة الأخيرة، باتت نماذج الذكاء الاصطناعي الرائدة من OpenAI وAnthropic تُستخدم بشكل متزايد في تطبيقات البرمجة. وقد تم تزويد ChatGPT وClaude بذاكرة وقدرة معالجة أكبر لتحليل مئات أسطر التعليمات البرمجية، بينما يدمج Gemini ميزة عرض نتائج Canvas مخصصة للمبرمجين.

في أكتوبر 2024، صرّح سوندار بيتشاي، الرئيس التنفيذي لشركة جوجل، بأن 25% من الشيفرة البرمجية الجديدة في الشركة تم توليدها بواسطة الذكاء الاصطناعي. كما أعرب مارك زوكربيرج، الرئيس التنفيذي لشركة ميتا، عن طموحه في نشر نماذج برمجة الذكاء الاصطناعي على نطاق واسع داخل الشركة.

ومع ذلك، تُظهر دراسة جديدة من قسم البحث والتطوير في مايكروسوفت أن نماذج الذكاء الاصطناعي، بما في ذلك Claude 3.7 Sonnet من Anthropic و o3-mini من OpenAI، غير قادرة على التعامل مع العديد من الأخطاء في معيار برمجة يسمى SWE-bench Lite.

قام مؤلفو الدراسة بفحص تسعة نماذج ذكاء اصطناعي مختلفة، تضمنت مجموعة من أدوات تصحيح الأخطاء، مثل مصحح أخطاء بايثون، وكانت قادرة على معالجة المشكلات في سطر برمجي واحد. وتم تكليف هذه النماذج بحل 300 خطأ برمجي تم اختيارها من مجموعة بيانات SWE-bench Lite.

نسبة النجاح في حل مسائل البرمجة من مجموعة بيانات SWE-bench Lite. الصورة: مايكروسوفت.

حتى عند استخدام نماذج أحدث وأكثر قوة، أظهرت النتائج أن وكيل الذكاء الاصطناعي نادرًا ما أنجز بنجاح أكثر من نصف مهام تصحيح الأخطاء الموكلة إليه. ومن بين النماذج المختبرة، حقق نموذج Claude 3.7 Sonnet أعلى معدل نجاح بمتوسط 48.4%، يليه نموذج OpenAI o1 بنسبة 30.2%، ثم o3-mini بنسبة 22.1%.

من بين أسباب انخفاض الأداء المذكورة أعلاه، عدم فهم بعض النماذج لكيفية استخدام أدوات تصحيح الأخطاء المتوفرة. إضافةً إلى ذلك، يرى المؤلفون أن المشكلة الأكبر تكمن في نقص البيانات الكافية.

يزعمون أن نظام تدريب النماذج لا يزال يفتقر إلى بيانات تحاكي خطوات تصحيح الأخطاء التي يتبعها البشر من البداية إلى النهاية. بعبارة أخرى، لم يتعلم الذكاء الاصطناعي ما يكفي عن كيفية تفكير البشر وتصرفهم خطوة بخطوة عند التعامل مع خطأ برمجي حقيقي.

سيساعد تدريب النماذج وتحسينها على جعلها أكثر كفاءة في تصحيح أخطاء البرامج. وذكر المؤلفون: "مع ذلك، سيتطلب ذلك مجموعات بيانات متخصصة لعملية التدريب".

أشارت دراسات عديدة إلى وجود ثغرات أمنية وأخطاء في الذكاء الاصطناعي أثناء توليد التعليمات البرمجية، نتيجةً لنقاط ضعف مثل محدودية فهم منطق البرمجة. وقد أظهرت مراجعة حديثة لأداة ديفين، وهي أداة برمجة مدعومة بالذكاء الاصطناعي، أنها لم تُكمل سوى 3 اختبارات من أصل 20 اختبارًا برمجيًا.

لا تزال قدرات الذكاء الاصطناعي البرمجية موضع نقاش واسع. وقد أشار كيفن ويل، مدير المنتجات في OpenAI، سابقاً إلى أن الذكاء الاصطناعي سيتفوق على المبرمجين البشريين بحلول نهاية هذا العام.

من جهة أخرى، يعتقد بيل غيتس، المؤسس المشارك لشركة مايكروسوفت، أن البرمجة ستظل مهنة مستدامة في المستقبل. وقد أعرب قادة آخرون، مثل أمجد مسعد (الرئيس التنفيذي لشركة ريبليت)، وتود ماكينون (الرئيس التنفيذي لشركة أوكتا)، وأرفيند كريشنا (الرئيس التنفيذي لشركة آي بي إم)، عن دعمهم لهذا الرأي.

على الرغم من أن بحث مايكروسوفت ليس جديدًا، إلا أنه بمثابة تذكير للمبرمجين، بمن فيهم المديرون، بالتفكير بعناية أكبر قبل تسليم سلطة البرمجة الكاملة للذكاء الاصطناعي.

المصدر: https://znews.vn/diem-yeu-chi-mang-cua-ai-post1545220.html