أطلقت شركة جوجل روبوت الدردشة Bard في شكل محدود في شهر مارس الماضي، في محاولة للرد على ChatGPT من OpenAI.
لتقييم جودة ردود روبوت الدردشة الذكي، وظّفت الشركة فريقًا كبيرًا من الموظفين الخارجيين. مع ذلك، أقرّ الشركاء بأنهم غالبًا ما لم يكن لديهم الوقت الكافي لتقييم دقة ردود الاستفسارات.
شركة Appen متعاقدة تُساعد في تحسين روبوت الدردشة الخاص بجوجل. لم يُبلَّغ موظفو الشركة بأن مهمتهم تتضمن بارد، لكن المناقشات الداخلية حول المهمة الجديدة بدأت في 7 فبراير، تقريبًا في الوقت الذي أعلنت فيه جوجل عن روبوت الدردشة الخاص بها.
أصبحت دقة الإجابات التي تقدمها Bard AI موضع تساؤل، حيث يعترف شركاء Google بأنهم مضطرون إلى "تخمين" الإجابات في بعض الحالات.
يقوم الشركاء، المعروفون باسم "المصنفين"، عادةً بمراجعة خوارزميات بحث Google ومدى ملاءمة الإعلانات المدرجة في نتائج البحث، بالإضافة إلى الإبلاغ عن المواقع الضارة حتى لا تظهر في صفحة النتائج.
منذ يناير، انتقل معظم عمل المراجعين إلى مراجعة طلبات الذكاء الاصطناعي، وفقًا لمصادر Insider. وأوضحوا أنهم لا يملكون الوقت الكافي لتقييم دقة إجابات الروبوت، لذا يكتفون أحيانًا بـ"التخمين الأفضل".
تعرّض بارد لانتقادات بعد اكتشاف أن روبوت المحادثة يُعطي إجابات خاطئة خلال حفل إطلاقه. وقالت جوجل إن روبوت المحادثة سيتحسن مع مرور الوقت، ولا ينبغي اعتباره بديلاً عن محرك البحث الخاص بها.
قبل إطلاقه في فبراير/شباط، كانت جوجل تطلب من الموظفين أيضًا قضاء ما بين ساعتين إلى أربع ساعات في اختبار الروبوت، وطرح الأسئلة عليه والإشارة إلى الإجابات التي لا تفي بمعايير الشركة.
أفاد المقاولون بأن لديهم مدة زمنية محددة لإنجاز كل مهمة، تتراوح بين 60 ثانية فقط وعدة دقائق. ومع ذلك، أشار المُقيّمون إلى صعوبة تقييم الردود عندما لم يفهموا الموضوع الذي يتناوله روبوت المحادثة، والذي شمل مواضيع تقنية مثل تقنية البلوك تشين.
تمثل كل مهمة معينة وقتًا قابلًا للفوترة، وبالتالي سيجد الموظفون طرقًا لإكمال المهمة حتى لو لم يتمكنوا من تقييم الاستجابات التي يقدمها برنامج المحادثة الآلي بدقة.
يقول هؤلاء الموظفون إنهم يريدون الحصول على الحقائق الصحيحة وتوفير أفضل تجربة دردشة روبوتية ممكنة، ولكن ببساطة ليس لديهم الوقت الكافي للبحث في المشكلة قبل إعطاء التقييم.
"تحتاج إلى 3 ساعات من البحث لإكمال مهمة مدتها 60 ثانية، وهذه هي المشكلة التي نواجهها الآن"، شارك أحد المراجعين.
(المصدر: Vietnamnet/Insider)
مفيد
العاطفة
مبدع
فريد
الغضب
[إعلان 2]
مصدر
تعليق (0)