في الآونة الأخيرة، أحدثت أداة الذكاء الاصطناعي الصينية "مانوس" ضجةً في أوساط التكنولوجيا العالمية . ووفقًا للمطور، تستطيع الأداة القيام بمهام معقدة، مثل مسح ملفات تعريف المرشحين، وتخطيط برامج السفر، وتحليل الأسهم، وذلك بناءً على تعليمات بسيطة من المستخدمين.

قبل أن يُطلق مانوس تطبيق AI Agent، قدّمت شركة OpenAI الأمريكية العملاقة في مجال الذكاء الاصطناعي تطبيق Operator لمستخدمي ChatGPT Pro في الولايات المتحدة. ووفقًا لـ OpenAI، يُمكن لهذا التطبيق تنفيذ مهام بسيطة نيابةً عن مالكه عبر المتصفح، مثل حجز تذاكر الحفلات الموسيقية أو تقديم الطلبات عبر الإنترنت.

يعتمد المشغل على نموذج جديد يُسمى "وكيل استخدام الحاسوب" (CUA)، وهو مبني على نموذج اللغة متعدد الوسائط GPT-4o. ويعترف ياش كومار، الباحث في OpenAI، بأنه لا يزال في مراحله الأولى، ولا يزال يعاني من بعض العيوب.

مثل غيره من وكلاء الذكاء الاصطناعي، يلتقط المشغل لقطة شاشة لشاشة الحاسوب، ويمسح البكسلات لتحديد الإجراءات اللازمة. أما النموذج الذي يقف وراءه، فهو CUA، مُدرّب على التفاعل مع واجهات رسومية مألوفة للبشر، مثل الأزرار والقوائم ومربعات الحوار النصية.

وفقًا لريتشيرو ناكانو، وهو عالم آخر في OpenAI، تستخدم النماذج التقليدية البرامج من خلال واجهات برمجة التطبيقات المتخصصة، مما يؤدي إلى العديد من القيود.

يُقسّم CUA أيضًا المهام إلى خطوات أصغر، ويحاول إكمالها واحدةً تلو الأخرى، مع إمكانية العودة إلى نقطة البداية في حال حدوث أي مشكلة. حاليًا، لا يمكن للمُشغّل سوى تنفيذ بعض المهام عبر متصفحه الخاص.

تخطط OpenAI لتوسيع قدرات CUA في المستقبل من خلال واجهة برمجة التطبيقات (API) التي تسمح للمطورين بكتابة تطبيقاتهم الخاصة بناءً عليها.

كما قامت OpenAI باختبار سلامة CUA، باستخدام فريق أحمر لتحديد ما سيحدث إذا طلب المستخدم من وكيل الذكاء الاصطناعي القيام بمهام غير مقبولة (مثل إنتاج أسلحة بيولوجية).

طلب كيفن روز، الصحفي في صحيفة نيويورك تايمز، من أوبيريتور القيام بعدد من الأشياء نيابة عنه، بما في ذلك طلب كرات الآيس كريم من خلال أمازون، وشراء اسم نطاق جديد وإعادة تكوينه، وحجز مطعم في 14 فبراير، وجدولة موعد لقص الشعر.

وعلق الكاتب بأن العميل الذكاء الاصطناعي قام بمعظم العمل بنفسه، لكن في بعض الأحيان كان عليه أن "ينقذه" بعد بعض المحاولات الفاشلة.

يصف Roose المشغل بأنه مشابه لبرنامج ChatGPT العادي، إلا أنه عند إعطاء مهمة، يفتح وكيل الذكاء الاصطناعي نافذة متصفح صغيرة، ويكتب Amazon.com في شريط العناوين، ويبدأ في النقر لاتخاذ إجراء.

خلال العملية، سيتم طرح بعض الأسئلة لتوضيح نوايا المالك مثل وقت التسليم... بعد التأكد من الاختيار الصحيح، يتم إرسال تأكيد نهائي، ووضع العنصر في سلة التسوق، ثم الشروع في تقديم الطلب.

النقطة الأهم هنا هي أن المستخدم لا يحتاج إلى مراقبته لأنه يعمل في الخلفية.

ومع ذلك، فشل المشغل أيضًا في بعض المهام الأخرى لأنه تم حظره على بعض المواقع الإلكترونية مثل Reddit أو YouTube أو فشل في اختبار CAPTCHA.

لا يوجد حاليًا تعريف "قياسي" لـ AI Agent، ولكن وفقًا لرودينا سيسيري، مؤسس ومدير شركة رأس المال الاستثماري Glasswing، فإن AI Agent هو نظام برمجي ذكي، مصمم لفهم بيئة التشغيل، والتفكير، واتخاذ القرارات، والعمل على تحقيق الأهداف تلقائيًا.

يستخدم AI Agent العديد من تقنيات الذكاء الاصطناعي/التعلم الآلي للقيام بذلك، مثل معالجة اللغة الطبيعية، والتعلم الآلي، ورؤية الكمبيوتر.

ويشير آرون ليفي، مؤسس شركة Box والرئيس التنفيذي لها، إلى أنه مع مرور الوقت، ومع تزايد قدرة الذكاء الاصطناعي، سوف يتمكن وكلاء الذكاء الاصطناعي من القيام بمزيد من العمل للبشر.

يرى جاريد سباتارو، مدير تسويق الذكاء الاصطناعي في بيئة العمل لدى مايكروسوفت، أن وكلاء الذكاء الاصطناعي "تطبيقات جديدة في عالمٍ يعتمد على الذكاء الاصطناعي". فهم يضيفون ميزاتٍ جديدةً لمعالجة "أكبر نقاط الضعف" لدى كل فرد في مكان العمل، لتحقيق نتائج أعمال حقيقية.

يُعزز وكلاء الذكاء الاصطناعي قوة الذكاء الاصطناعي التوليدي ليس فقط بمساعدة البشر، بل أيضًا بالعمل معهم أو نيابةً عنهم. ووفقًا لشركة IBM، يتصرف وكلاء الذكاء الاصطناعي بناءً على المعلومات التي يتلقونها.

نظرًا لأنه لا يحتوي على قاعدة معرفية شاملة للتعامل مع كل مهمة، فسوف يستخدم الأدوات المتاحة، بما في ذلك مجموعات البيانات الخارجية، وعمليات البحث على الويب، وواجهات برمجة التطبيقات، أو حتى وكلاء الذكاء الاصطناعي الآخرين.

بعد جمع المعلومات الناقصة، يُحسّن الوكيل معرفته. هذا يعني أنه في كل خطوة، سيُعيد تقييم خطة عمله ويُعدّلها.

من السابق لأوانه الجزم بأن برامج الذكاء الاصطناعي تُشكل تهديدًا للبشر. لكن ليس من الصعب تخيّل مستقبل قريب يمتلئ فيه الإنترنت بالروبوتات التي تتحدث مع بعضها البعض، وتتسوق، وتكتب رسائل البريد الإلكتروني نيابةً عن أصحابها.

ويختتم الكاتب روس في صحيفة نيويورك تايمز مقاله قائلا: "إن الإنترنت الخالي من الطائرات بدون طيار أصبح حقيقة واقعة تدريجيا، لذا انقروا على الرابط بينما تستطيعون" .