การแข่งขันการประมวลผลภาษาและการพูดภาษาเวียดนาม (VLSP) เป็นส่วนหนึ่งของการประชุมนานาชาติประจำปีเกี่ยวกับการประมวลผลภาษาและการพูดภาษาเวียดนาม ซึ่งจัดโดย VLSP Club ซึ่งเป็นสาขาหนึ่งของสมาคมเทคโนโลยีสารสนเทศเวียดนาม VLSP 2023 จัดการแข่งขันเกี่ยวกับการประมวลผลคำพูดและข้อความ 10 รายการ โดยนำนักวิจัย ผู้เชี่ยวชาญ และหน่วยงานพัฒนาเทคโนโลยีชั้นนำมารวมกัน
แม้ว่านี่จะเป็นครั้งที่สี่ที่ Viettel AI เข้าร่วมการแข่งขันและเคยคว้าชัยชนะมาแล้วสามครั้ง แต่วิศวกรของ Viettel ยังคงพบกับความยากลำบากมากมายเนื่องจากโครงสร้างประเภทการแข่งขันที่เปลี่ยนแปลงไป
โดยเฉพาะอย่างยิ่งเมื่อเทียบกับปีที่แล้ว หมวดการจดจำเสียงพูดและการจดจำอารมณ์ในปีนี้ได้รวมเข้าเป็นหมวดเดียวกัน ทีมต่างๆ ต้องแก้ปัญหาสองข้อพร้อมกันเพื่อให้แน่ใจว่าสามารถจดจำข้อความและอารมณ์ของประโยคได้ ทั้งปริมาณงานและความยากเพิ่มขึ้นเป็นสองเท่า
ใช้ประโยชน์จากข้อมูลทุกประเภท ไม่ว่าจะคุณภาพต่ำหรือสูง
ไม่เพียงแต่การเปลี่ยนโครงสร้างของหมวดหมู่เท่านั้น การสอบในปีนี้ยังเน้นไปที่การสร้างแบบจำลองตั้งแต่ต้นด้วยเงื่อนไขข้อมูลที่จำกัด รวมถึงข้อมูลดิบ ข้อมูลที่ไม่มีการติดฉลาก และคุณภาพต่ำ การสอบมีข้อมูล 4 กลุ่มที่มีคุณภาพและรูปแบบที่แตกต่างกัน มีข้อมูลที่รวมเฉพาะเสียงที่ไม่มีการติดฉลาก ข้อมูลที่รวมเฉพาะเสียงและข้อความ ข้อมูลที่รวมอารมณ์และเสียง คุณภาพสูง ป้ายกำกับมาตรฐาน และชุดข้อมูลที่มีอารมณ์และเสียง คุณภาพต่ำ ชุดข้อมูลแต่ละชุดได้รับการกำหนดไว้อย่างชัดเจนเพื่อให้บริการแต่ละวัตถุประสงค์และหมวดหมู่การสอบ โดยมีเวลารวมทั้งหมดมากกว่า 300 ชั่วโมงสำหรับชุดข้อมูลทั้งหมด ซึ่งถือเป็นจำนวนที่น้อยเมื่อเทียบกับชุดข้อมูลมาตรฐานสำหรับการฝึก Speech Recognition ซึ่งปกติแล้วจะต้องใช้เวลาถึง 1,000-2,000 ชั่วโมงขึ้นไป
แต่ละทีมมีเวลาในการทำงานและส่งงานของตนเองไม่ถึง 2 เดือน แต่ในความเป็นจริงแล้ว เวลาที่ใช้สำหรับการค้นคว้าวิธีแก้ปัญหานั้นน้อยกว่านี้มากเนื่องจากขาดแคลนทรัพยากร
“ในปีนี้ Viettel AI ได้ทุ่มทรัพยากรโครงสร้างพื้นฐานคอมพิวเตอร์จำนวนมากเพื่อค้นคว้าเทคโนโลยีใหม่ ๆ เช่นเดียวกับการพัฒนาผลิตภัณฑ์ ขณะที่การจดจำเสียงพูดเป็นเทคโนโลยีที่ต้องใช้ทรัพยากรฮาร์ดแวร์จำนวนมาก” คุณ Dang Dinh Son วิศวกรปัญญาประดิษฐ์ แพลตฟอร์มผู้ช่วยเสมือน Viettel AI กล่าว
เมื่อเผชิญกับสภาวะที่มีปริมาณและคุณภาพของข้อมูลต่ำ ทีมวิจัยจึงตัดสินใจทันทีว่า "ต้องใช้ข้อมูลทั้งหมดไม่ว่าจะมีคุณภาพสูงหรือต่ำ" เพื่อทำเช่นนี้ จำเป็นต้องสร้างวงจรการฝึกอบรมเพื่อประมวลผลข้อมูลทั้งหมด รวมถึงสร้างโมเดลเพียงตัวเดียวเพื่อแก้ปัญหาต่างๆ มากมายแทนที่จะใช้โมเดลหลายตัว
ผลลัพธ์จากการเป็นผู้เชี่ยวชาญด้านเทคโนโลยีชั้นนำ
ในบริบทของการขาดข้อมูลและการขาดทรัพยากร ทีมวิจัยจึงตัดสินใจสร้างกระบวนการประมวลผลที่เรียบง่าย ไม่ซับซ้อน แต่สำคัญ คือ ต้องมีความละเอียดรอบคอบในทุกรายละเอียด
วิศวกร AI ของ Viettel ศึกษาวิจัยล่าสุดจากการประชุมและวารสารชั้นนำทั่วโลก อย่างรอบคอบเพื่อค้นหาแนวทาง เมื่อรวมกับวิธีการประมวลผลข้อมูลเพื่อฝึกโมเดลที่มีประสิทธิผล ทีมวิจัยได้สร้างวงจรการฝึกเพื่อประมวลผลข้อมูลที่มีอยู่ทั้งหมด วงจรนี้ประกอบด้วย 3 ขั้นตอน ได้แก่ การสร้างโมเดลที่ได้รับการฝึกอบรมล่วงหน้าเพื่ออธิบายคุณลักษณะเสียงโดยไม่มีป้ายกำกับ การปรับแต่งจากโมเดลที่ได้รับการฝึกอบรมล่วงหน้าสำหรับปัญหาสองประการ ได้แก่ การจดจำเสียงพูดและการจดจำอารมณ์ และการอนุมาน
“ประสบการณ์จากการแก้ปัญหาการขาดข้อมูลระหว่างการพัฒนาและการใช้งานผลิตภัณฑ์รุ่นก่อนๆ ยังช่วยให้ทีมงานสามารถค้นหาวิธีการตัดสินใจได้อย่างมีนัยสำคัญ ในทางกลับกัน ความรู้และผลลัพธ์ที่ได้รับจากการทดสอบยังมีศักยภาพที่จะนำไปใช้กับผลิตภัณฑ์ Viettel AI ได้ทันที ดังนั้นกระบวนการทำงานขณะทำการทดสอบจึงค่อนข้างราบรื่น” นายบุ้ย เตียน ดัต วิศวกรแพลตฟอร์มผู้ช่วยเสมือนจริงของ Viettel AI กล่าว
ผลลัพธ์ก็คือ Viettel AI ไม่เพียงแต่คว้ารางวัลชนะเลิศในประเภทการจดจำเสียงพูดและการจดจำอารมณ์คำพูดเท่านั้น แต่ยังได้รับคะแนนที่น่าประทับใจถึง 89.18% อีกด้วย (ทีมถัดมาได้คะแนน 83.40% และ 78.45% ตามลำดับ)
นายซอน กล่าวว่า ปัจจัยหลักอยู่ที่โมเดลการประมวลผลเสียงพูดสำหรับภาษาเวียดนามโดยเฉพาะ ซึ่ง Viettel AI ได้พัฒนามาเป็นเวลานาน
“แทนที่จะใช้โมเดลและคำสั่งจากผลการวิจัยที่มีอยู่ Viettel AI กลับเลือกที่จะสร้างและพัฒนาโมเดลของตัวเองสำหรับการประมวลผลคำพูดภาษาเวียดนาม โมเดลนี้ได้รับการอัปเดตและปรับปรุงอย่างต่อเนื่อง และมีประสิทธิภาพมากขึ้นเรื่อยๆ” นายซอนกล่าว
ไม่เพียงแต่หยุดอยู่แค่การแข่งขันเท่านั้น โซลูชันของ Viettel AI นี้ยังจะเป็นพื้นฐานในการอัปเกรดผลิตภัณฑ์สวิตช์บอร์ดเสมือนจริง ผู้ช่วยเสมือนของ Viettel ช่วยระบุอารมณ์ของลูกค้าได้แม่นยำยิ่งขึ้นในบทสนทนา จึงให้ข้อเสนอแนะหรือเลือกคำที่มีความละเอียดอ่อนได้อย่างเหมาะสม ดังนั้น บทสนทนาระหว่างมนุษย์กับ AI จึงกลายเป็นเรื่องธรรมชาติมากขึ้น และปรับปรุงประสบการณ์ของผู้ใช้ นอกจากนี้ ยังมีการเปิดตัวแอปพลิเคชันใหม่ๆ มากมายในการดูแลลูกค้า เช่น การสร้างระบบเพื่อระบุข้อร้องเรียนของลูกค้าโดยอัตโนมัติและข้อร้องเรียนที่สวิตช์บอร์ดเพื่อการจัดการอย่างทันท่วงทีหรือเพื่อใช้ประโยชน์จากข้อมูล
ตัวแทนหน่วยงานกล่าวว่า Viettel AI จะพัฒนาเทคโนโลยีอย่างต่อเนื่อง อัพเกรดผลิตภัณฑ์อย่างต่อเนื่องเพื่อเพิ่มความแม่นยำ ปรับปรุงประสบการณ์ผู้ใช้ และประสิทธิภาพของผลิตภัณฑ์
ก๊วกตวน
แหล่งที่มา
การแสดงความคิดเห็น (0)