لم يحل الذكاء الاصطناعي محل البشر في البرمجة بعد. تصوير: جون ماكجواير . |
في الآونة الأخيرة، ازداد استخدام نماذج الذكاء الاصطناعي الرائدة من OpenAI وAnthropic في تطبيقات البرمجة. وقد عززت ChatGPT وClaude سعة الذاكرة وقوة المعالجة لتحليل مئات أسطر التعليمات البرمجية، بينما دمجت Gemini عرض نتائج Canvas خصيصًا للمبرمجين.
في أكتوبر 2024، صرّح الرئيس التنفيذي لشركة جوجل، سوندار بيتشاي، بأن 25% من الأكواد البرمجية الجديدة في الشركة ستُولّد بواسطة الذكاء الاصطناعي. كما أعرب مارك زوكربيرج، الرئيس التنفيذي لشركة ميتا، عن طموحاته لنشر نماذج الذكاء الاصطناعي لكتابة الأكواد البرمجية على نطاق واسع داخل الشركة.
ومع ذلك، أظهرت دراسة جديدة من Microsoft Research، الذراع البحثية والتطويرية لشركة Microsoft، أن نماذج الذكاء الاصطناعي، بما في ذلك Claude 3.7 Sonnet من Anthropic وo3-mini من OpenAI، فشلت في التعامل مع العديد من الأخطاء في معيار اختبار البرمجة المسمى SWE-bench Lite.
اختبر مؤلفو الدراسة تسعة نماذج ذكاء اصطناعي مختلفة مُدمجة مع مجموعة متنوعة من أدوات تصحيح الأخطاء، مثل مصحح أخطاء بايثون، وتمكنوا من حل المشكلات بجملة واحدة. كُلِّفت النماذج بحل 300 خطأ برمجي مُختارة من مجموعة بيانات SWE-bench Lite.
![]() |
معدل النجاح في حل مسائل البرمجة من مجموعة بيانات SWE-bench Lite. الصورة: مايكروسوفت. |
حتى مع استخدام نماذج أحدث وأكثر قوة، أظهرت النتائج أن وكلاء الذكاء الاصطناعي نادرًا ما أكملوا بنجاح أكثر من نصف مهام التصحيح المُكلَّفة. من بين النماذج المُختَبَرة، حقق Claude 3.7 Sonnet أعلى معدل نجاح متوسط بنسبة 48.4%، يليه OpenAI's o1 بنسبة 30.2%، ثم o3-mini بنسبة 22.1%.
من أسباب هذا الأداء المتدني عدم فهم بعض النماذج لكيفية استخدام أدوات التصحيح المُتاحة. إضافةً إلى ذلك، ووفقًا للمؤلفين، تكمن المشكلة الأكبر في نقص البيانات.
يجادلون بأن النظام الذي يُدرّب النماذج لا يزال يفتقر إلى بيانات تُحاكي خطوات تصحيح الأخطاء التي يتخذها البشر من البداية إلى النهاية. بمعنى آخر، لم يتعلم الذكاء الاصطناعي ما يكفي عن كيفية تفكير البشر وتصرفهم خطوة بخطوة عند التعامل مع خطأ برمجي حقيقي.
إن تدريب النماذج وضبطها بدقة سيجعلها أكثر قدرة على تصحيح أخطاء البرامج. وصرح الباحثون: "مع ذلك، يتطلب هذا مجموعات بيانات تدريبية متخصصة".
أشارت دراسات عديدة إلى ثغرات أمنية وأخطاء في توليد أكواد الذكاء الاصطناعي، نتيجةً لضعف القدرة على فهم منطق البرمجة. وقد وجدت مراجعة حديثة لأداة برمجة الذكاء الاصطناعي "ديفين" أنها لم تُكمل سوى 3 اختبارات برمجة من أصل 20 اختبارًا.
لا تزال قدرة الذكاء الاصطناعي على البرمجة مثيرة للجدل. في السابق، صرّح السيد كيفن ويل، رئيس قسم المنتجات في OpenAI، بأنه بحلول نهاية هذا العام، سيتفوق الذكاء الاصطناعي على المبرمجين البشريين.
من ناحية أخرى، يعتقد بيل جيتس، المؤسس المشارك لشركة مايكروسوفت، أن البرمجة ستظل مهنة مستدامة في المستقبل. وقد أعرب قادة آخرون، مثل أمجد مسعد (الرئيس التنفيذي لشركة ريبليت)، وتود ماكينون (الرئيس التنفيذي لشركة أوكتا)، وأرفيند كريشنا (الرئيس التنفيذي لشركة آي بي إم)، عن دعمهم لهذا الرأي.
ورغم أن بحث مايكروسوفت ليس جديدًا، فإنه يعد بمثابة تذكير للمبرمجين، بما في ذلك المديرين، بالتفكير بشكل أكثر دقة قبل منح الذكاء الاصطناعي السيطرة الكاملة على البرمجة.
المصدر: https://znews.vn/diem-yeu-chi-mang-cua-ai-post1545220.html
تعليق (0)