تُعدّ مسابقة معالجة اللغة والكلام الفيتنامية (VLSP) جزءًا من المؤتمر الدولي السنوي لمعالجة اللغة والكلام الفيتنامية، الذي يُنظّمه نادي VLSP، وهو فرع من جمعية تكنولوجيا المعلومات الفيتنامية. يُنظّم VLSP 2023 عشر مسابقات في معالجة الكلام والنصوص، تجمع نخبة من الباحثين والخبراء ووحدات تطوير التكنولوجيا.

على الرغم من أن هذه كانت المرة الرابعة التي تشارك فيها شركة Viettel AI في المسابقة وقد فازت بها ثلاث مرات من قبل، إلا أن مهندسي Viettel ما زالوا يواجهون العديد من الصعوبات بسبب التغييرات في هيكل فئة المسابقة.

تحديدًا، مقارنةً بالعام الماضي، تم دمج فئتي التعرف على الكلام والتعرف على المشاعر هذا العام في فئة واحدة. يجب على الفرق حل مشكلتين في الوقت نفسه لضمان التعرف على كلٍّ من النص والمشاعر في الجملة، مما ضاعف من عبء العمل والصعوبة.

استخدم كل البيانات، سواء كانت منخفضة الجودة أو عالية الجودة

لا يقتصر امتحان هذا العام على تغيير هيكل الفئات فحسب، بل يركز أيضًا على بناء نماذج من الصفر بشروط بيانات محدودة، بما في ذلك البيانات الخام، وغير المصنفة، ورديئة الجودة. يوفر الامتحان أربع مجموعات من البيانات بجودة وشكل مختلفين. فهناك بيانات تتضمن فقط الصوت غير المصنف، وبيانات تتضمن فقط الصوت والنص، وبيانات تتضمن العواطف والصوت بجودة عالية، وتصنيفات قياسية، وبيانات تتضمن العواطف والصوت بجودة منخفضة. كل مجموعة بيانات محددة بوضوح لخدمة كل غرض وفئة امتحان، بإجمالي أكثر من 300 ساعة لجميع مجموعات البيانات. وهذا عدد متواضع جدًا مقارنةً بمجموعات البيانات القياسية لتدريب التعرف على الكلام، والتي تتطلب عادةً ما بين 1000 و2000 ساعة أو أكثر.

كان لدى كل فريق أقل من شهرين لإكمال عمله وتقديمه، ولكن في الواقع كان الوقت الفعلي الذي تم قضاؤه في البحث عن الحلول أقل بكثير بسبب نقص الموارد.

"هذا العام، خصصت شركة Viettel AI الكثير من موارد البنية التحتية للحوسبة لبحث التقنيات الجديدة بالإضافة إلى تطوير المنتجات، في حين أن التعرف على الكلام هو تقنية تتطلب موارد أجهزة كبيرة جدًا"، شارك السيد دانج دينه سون - مهندس الذكاء الاصطناعي، منصة المساعد الافتراضي، شركة Viettel AI.

الصورة 1.jpg
مجموعة هندسة الذكاء الاصطناعي، كتلة منصة المساعد الافتراضي، تمثل شركة Viettel AI المشاركة في فئة التعرف على الكلام والتعرف على عاطفة الكلام - VLSP 2023

في ظل قلة حجم البيانات وجودتها، قرر فريق البحث فورًا ضرورة الاستفادة من جميع البيانات، بغض النظر عن جودتها. ولتحقيق ذلك، من الضروري بناء دورة تدريب لمعالجة جميع البيانات، بالإضافة إلى نموذج واحد فقط لحل العديد من المشكلات المختلفة بدلًا من نماذج متعددة.

نتائج إتقان التكنولوجيا الرائدة

وفي سياق نقص البيانات ونقص الموارد، قرر فريق البحث بناء عملية معالجة بسيطة، وليست ضخمة، ولكن الأهم من ذلك، أنها دقيقة إلى أصغر التفاصيل.

قام مهندسو الذكاء الاصطناعي في شركة فيتيل بدراسة أحدث الأبحاث الصادرة عن المؤتمرات والمجلات العلمية الرائدة حول العالم بعناية لإيجاد نهج مناسب. وباستخدام أساليب معالجة البيانات لتدريب النموذج الفعّالة، طوّر فريق البحث دورة تدريبية لمعالجة جميع البيانات المتاحة. تتضمن الدورة ثلاث خطوات: بناء نموذج مُدرّب مسبقًا لوصف خصائص الصوت دون استخدام تسميات، وضبطه بدقة لمشكلتين: التعرف على الكلام والتعرف على المشاعر، والاستنتاج.

صرّح السيد بوي تيان دات، مهندس منصة المساعد الافتراضي في شركة فيتيل للذكاء الاصطناعي، قائلاً: "ساهمت الخبرة المكتسبة من حل مشاكل نقص البيانات خلال تطوير ونشر المنتجات السابقة بشكل كبير في مساعدة الفريق على إيجاد طريقة حاسمة. بل على العكس، يُمكن تطبيق المعرفة والنتائج المكتسبة من الاختبار فورًا على منتجات فيتيل للذكاء الاصطناعي، لذا سارت عملية العمل أثناء الاختبار بسلاسة تامة".

ونتيجة لذلك، لم يفز فريق Viettel AI بالجائزة الأولى في فئتي التعرف على الكلام والتعرف على المشاعر الكلامية فحسب، بل حقق أيضًا درجة رائعة بلغت 89.18% (كانت الفرق التالية 83.40% و78.45% على التوالي).

وقال السيد سون إن العامل الرئيسي يكمن في نموذج معالجة الكلام المخصص للغة الفيتنامية والذي طورته شركة Viettel AI لفترة طويلة.

بدلاً من استخدام النماذج والتعليمات من نتائج الأبحاث المتاحة، اختارت شركة Viettel AI بناء وتطوير نموذجها الخاص لمعالجة الكلام الفيتنامي. ويُحدّث هذا النموذج ويُحسّن باستمرار، ويزداد فعاليته باستمرار، كما قال السيد سون.

لا يقتصر هذا الحل من Viettel AI على المنافسة فحسب، بل سيُشكل أساسًا لتطوير منتجات لوحات التوزيع الافتراضية، ومساعد Viettel الافتراضي، مما يُساعد على تحديد مشاعر العملاء بدقة أكبر في المحادثات، مما يُتيح لهم تقديم ملاحظات أو اختيار ألفاظ مناسبة. وهكذا، ستصبح المحادثات بين البشر والذكاء الاصطناعي أكثر طبيعية، مما يُحسّن تجربة المستخدم. كما تُفتح آفاق جديدة في مجال خدمة العملاء، مثل بناء نظام لتحديد شكاوى العملاء والشكاوى المُقدمة إلى لوحة التوزيع تلقائيًا، لمعالجتها في الوقت المناسب أو للاستفادة من المعلومات.

الصورة 2.jpg
مثل السيد بوي تيان دات - مهندس منصة المساعد الافتراضي في شركة Viettel AI الفريق لتقديم نتائج البحث في ورشة العمل.

وقال ممثل الوحدة إن شركة Viettel AI ستواصل تطوير التكنولوجيا وتحديث المنتجات باستمرار لزيادة الدقة وتعزيز تجربة المستخدم وكفاءة المنتج.

كوك توان