هل ستنجح شركة الذكاء الاصطناعي بالكامل؟ الصورة: Business Insiders . |
في تجربة حديثة، قام باحثون في جامعة كارنيجي ميلون بمحاكاة شركة برمجيات تسمى TheAgentCompany، مع سياسات الموظفين وموقع ويب داخلي. حيث أن جميع الموظفين هم عملاء الذكاء الاصطناعي، وهو الذكاء الاصطناعي المصمم للتفكير والتخطيط لأداء المهام من تلقاء نفسه.
يأتي برنامج الذكاء الاصطناعي الذي يدعم "العمال" من Google وOpenAI وAnthropic وMeta. تتولى هذه الذكاءات الاصطناعية أدوارًا تتراوح من المحللين الماليين ومهندسي البرمجيات إلى مديري المشاريع. إنهم يعملون معًا كزملاء، في أقسام محاكاة، بدءًا من الموارد البشرية وحتى الهندسة في الحياة الواقعية.
تطلبت التجربة من نموذج الذكاء الاصطناعي التعامل مع مهام تحاكي المهام اليومية للموظفين الحقيقيين في شركة برمجيات. أراد الفريق تقييم مدى قدرة الذكاء الاصطناعي على الأداء في بيئات العالم الحقيقي بشكل دقيق، وما إذا كان قادرًا بما يكفي على استبدال البشر.
تتراوح المهام التي يتعين التعامل معها من التنقل عبر مجلدات الملفات، والتجول في المكتب الجديد "افتراضيًا"، وكتابة تقييمات الأداء لمهندسي البرمجيات بناءً على التعليقات التي تم جمعها.
في إحدى المهام، كان على الذكاء الاصطناعي الوصول إلى أدلة متعددة لتحليل قاعدة بيانات سلسلة من المقاهي. وفي وظيفة أخرى، طُلب منهم جمع تعليقات حول مهندس يبلغ من العمر 36 عامًا وكتابة مراجعات الأداء.
ومع ذلك، وفقا لموقع Business Insider ، كانت النتائج قاتمة. كان النموذج الأفضل أداءً، Claude 3.5 Sonnet من Anthropic، قادرًا على إكمال 24% فقط من المهام الموكلة إليه. ويشير الفريق إلى أن هذا المستوى المتواضع من الأداء يأتي بتكلفة عالية للغاية. في المتوسط، يستغرق كلود ما يقرب من 30 خطوة ويتكلف أكثر من 6 دولارات لإكمال كل مهمة.
ويأتي في المركز الثاني جهاز Gemini 2.0 Flash من شركة Google. تستغرق الأداة المتوسطة 40 خطوة لإكمال مهمة ما، لكنها تحقق معدل نجاح يبلغ 11.4% فقط. وفي المرتبة الأخيرة جاء جهاز Nova Pro v1 من Amazon بنسبة إكمال 1.7% من المهام، ومتوسط ما يقرب من 20 خطوة.
وبحسب الباحثين، فإن سبب هذه النتيجة هو أن وكلاء الذكاء الاصطناعي ما زالوا يفتقرون إلى المعرفة الأساسية المشتركة، والمهارات الاجتماعية الضعيفة. علاوة على ذلك، فإن الملاحة والوصول إلى الإنترنت ضعيفان للغاية أيضًا.
تعاني برامج المحادثة الآلية أيضًا من خداع الذات، الذي يتخذ تلقائيًا مسارًا أسهل، ولكنه يؤدي في النهاية إلى فشل المهمة. على سبيل المثال، أثناء أداء مهمة ما، لا يتمكن وكيل الذكاء الاصطناعي من العثور على الشخص المناسب لسؤاله في غرفة الدردشة الخاصة بالشركة. لذلك توصلوا إلى اختصار: استخدام اسم الشخص الذي يبحثون عنه لتسمية كائن آخر.
يقول ستيفن كاسبر، الباحث في مجال الذكاء الاصطناعي، إن الناس يبالغون في تقدير قدرات وكلاء الذكاء الاصطناعي. وقال كل من جينسن هوانج، الرئيس التنفيذي لشركة إنفيديا، وسام ألتمان، الرئيس التنفيذي لشركة OpenAI، إن الذكاء الاصطناعي سيدخل سوق العمل هذا العام، ليحل محل بعض أجزاء الشركة.
ومع ذلك، فقد أثبتت العديد من الدراسات الأخرى عكس ذلك. وأشارت كلية هارفارد للأعمال إلى أن الذكاء الاصطناعي لا يتكيف بشكل جيد في البيئات التي تشهد تغيرات كبيرة. ووجد تقرير Langchain أيضًا أنهم واجهوا صعوبة في استخدام الأدوات واتباع التعليمات.
من المفترض أن يكون وكلاء الذكاء الاصطناعي قادرين على أداء بعض المهام الصغيرة بشكل جيد. لكن وفقًا لنتائج الدراسة المذكورة أعلاه، فإنهم يتمتعون بمعدل نجاح أعلى في المهام الأكثر صعوبة بالنسبة للبشر، مثل تطوير البرمجيات.
وتظهر نتائج تجربة كارنيجي ميلون أن الذكاء الاصطناعي لم يحل محل البشر بعد في المهام المهمة. ومن ناحية أخرى، يستطيع البشر الاستفادة من الذكاء الاصطناعي لتحسين عملهم اليومي.
المصدر: https://znews.vn/cong-ty-co-toan-bo-nhan-vien-la-ai-post1549608.html
تعليق (0)