Vietnam.vn - Nền tảng quảng bá Việt Nam

วิศวกร Human-Zen ของ Zalo AI แนะนำงานวิจัยในงานประชุมวิทยาศาสตร์ชั้นนำของโลก

Việt NamViệt Nam11/09/2024


งานวิจัยเพื่อช่วยเพิ่มความแม่นยำของโมเดลการจดจำเสียงพูดแบบเรียลไทม์ (Streaming Automatic Speech Recognition) โดย Le Duy Khanh วิศวกร "GenZ" ของ Zalo AI จะมีการประกาศเป็นครั้งแรกในงานประชุม วิทยาศาสตร์ นานาชาติ ที่จะจัดขึ้นที่ประเทศกรีซในเดือนกันยายน พ.ศ. 2567

งานวิจัยของวิศวกร AI ของ Zalo ซึ่งเกิดในปี 2000 มี หัวข้อว่า " การปรับปรุงการจดจำคำพูดแบบสตรีมมิ่งด้วย Time-Shifted Contextual Attention และ Dynamic Right Context Masking " ซึ่งได้คะแนนเกือบสมบูรณ์แบบที่ 11/12 คะแนน ผ่านรอบ การ ตรวจสอบอันเข้มงวดที่มีบทความที่เข้าร่วมกว่า 2,000 บทความ ซึ่งจะนำเสนอในงาน Interspeech Conference ในรูปแบบการพูด


ผมรู้สึกภูมิใจมากที่บทความทางวิทยาศาสตร์ชิ้นแรกของผมได้รับการยอมรับจากการประชุมทางวิทยาศาสตร์อันทรงเกียรติ และผมมีโอกาสแนะนำความสำเร็จด้านการวิจัยของเวียดนามให้กับบริษัทเทคโนโลยีขนาดใหญ่ ผู้เชี่ยวชาญ และชุมชนนานาชาติ ” เล ดุย ข่านห์ กล่าว

ภายใต้การแนะนำของดร. Chau Thanh Duc หัวหน้าแผนกวิจัยและพัฒนาที่ Zalo AI อาจารย์ที่มหาวิทยาลัยวิทยาศาสตร์ธรรมชาติ (มหาวิทยาลัยแห่งชาตินครโฮจิมินห์) คาดว่าโครงการวิจัยนี้จะมีผลงานสำคัญในการยกระดับโมเดลการจดจำเสียงพูด เพิ่มความแม่นยำของการบอกด้วยเสียงและการแปลงเสียงเป็นข้อความบนแอปพลิเคชัน Zalo

การสังเคราะห์งานวิจัยเชิงปฏิบัติอันล้ำค่าของ Zalo AI เข้ากับบทความทางวิทยาศาสตร์ และนำเสนอในการประชุมนานาชาติอันทรงเกียรตินั้นมีความหมายอย่างยิ่ง ไม่เพียงแต่แสดงให้เห็นถึงศักยภาพของวิศวกรชาวเวียดนามเท่านั้น แต่ยังแสดงให้เห็นถึงความปรารถนาที่จะแบ่งปันประสบการณ์และมีส่วนร่วมในการพัฒนาชุมชน AI ทั่วโลกอีกด้วย” ดร. เชา แถ่ง ดึ๊ก กล่าว

ก่อนหน้านี้ Zalo ได้ผนวกรวมงานวิจัยนี้เข้ากับแอปพลิเคชันส่งข้อความตั้งแต่ปลายปี 2566 ซึ่งช่วยปรับปรุงความแม่นยำของฟีเจอร์ "การเขียนข้อความเสียง" อย่างมีนัยสำคัญ ฟีเจอร์นี้ช่วยให้ผู้ใช้สามารถเขียนข้อความด้วยเสียงแทนการพิมพ์ด้วยมือ ช่วยประหยัดเวลาและสะดวกยิ่งขึ้นในหลายสถานการณ์การใช้งาน ขณะเดียวกัน ความแม่นยำของฟีเจอร์นี้ยังสูงถึง 95% ในทางปฏิบัติ โดยอัตราความจำเป็นในการแก้ไขข้อความหลังจากเขียนด้วยเสียงลดลงจาก 6.4% เหลือเพียง 4.8%


ตามสถิติของ Zalo แม้ว่าฟีเจอร์ดังกล่าวยังอยู่ในขั้นตอนการทดสอบ แต่ก็สามารถสร้างข้อความได้เกือบ 4.5 ล้านข้อความต่อวัน และดึงดูดผู้ใช้รายเดือนได้ประมาณ 3.2 ล้านราย (ข้อมูลอัปเดตถึงเดือนมิถุนายน 2024)

นับตั้งแต่เริ่มต้นเส้นทางบุกเบิกการวิจัย AI ในปี 2560 Zalo เชื่อมั่นเสมอในการ "เสริมพลัง" ให้กับคนรุ่นใหม่ ปัจจุบัน พนักงาน Zalo มากถึง 31% เป็นคนรุ่น GenZ ในปี 2564 หัวข้อวิจัยอีกสองหัวข้อของทีมวิศวกร AI ของ Zalo ที่เกี่ยวข้องกับเทคโนโลยีการประมวลผลเสียงก็ได้รับการยอมรับในการประชุมนานาชาติว่าด้วยปัญญาประดิษฐ์แห่งเอเชีย แปซิฟิก (PRICAI 2021) เช่นกัน โดยเฉพาะอย่างยิ่ง ผู้เขียนหัวข้อทั้งสองนี้เป็นนักวิจัยรุ่นใหม่ที่มีอายุต่ำกว่า 30 ปี

Interspeech เป็นการประชุมนานาชาติด้านการประมวลผลเสียงพูดที่จัดขึ้นอย่างยาวนาน ครอบคลุม และมีชื่อเสียง จัดโดยสมาคมการสื่อสารด้วยเสียงพูดนานาชาติ (International Speech Communication Association) ในปีนี้ การประชุมภายใต้หัวข้อ “Speech and beyond จะจัดขึ้นระหว่างวันที่ 1-5 กันยายน 2567 ณ เกาะคอส (ประเทศกรีซ)

ที่มา: https://www.vng.com.vn/news/people/ky-su-genz-cua-zalo-ai-gioi-thieu-nghien-cuu-tai-hoi-nghiem-khoa-hoc-hang-dau-the-gioi.html


การแสดงความคิดเห็น (0)

กรุณาแสดงความคิดเห็นเพื่อแบ่งปันความรู้สึกของคุณ!

หัวข้อเดียวกัน

หมวดหมู่เดียวกัน

ดอนเดน – ‘ระเบียงลอยฟ้า’ แห่งใหม่ของไทเหงียน ดึงดูดนักล่าเมฆรุ่นเยาว์
ศิลปินแห่งชาติ Xuan Bac เป็น "พิธีกร" ให้กับคู่รัก 80 คู่ที่เข้าพิธีแต่งงานบนถนนคนเดินทะเลสาบ Hoan Kiem
มหาวิหารนอเทรอดามในนครโฮจิมินห์ประดับไฟสว่างไสวต้อนรับคริสต์มาสปี 2025
สาวฮานอย “แต่งตัว” สวยรับเทศกาลคริสต์มาส

ผู้เขียนเดียวกัน

มรดก

รูป

ธุรกิจ

เมืองหลวงแอปริคอตเหลืองภาคกลางประสบความสูญเสียอย่างหนักหลังเกิดภัยพิบัติธรรมชาติถึงสองครั้ง

เหตุการณ์ปัจจุบัน

ระบบการเมือง

ท้องถิ่น

ผลิตภัณฑ์

Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC