เมื่อเดินเข้าไปในล็อบบี้สนามบิน ท่ามกลางผู้คนที่พลุกพล่านและวุ่นวายระหว่างเดินทางกลับจากทริปธุรกิจ โฮจิมินห์หยุดชะงักไปสองสามวินาทีเมื่อได้ยินเสียงผู้หญิงที่คุ้นเคยและอ่อนโยนอ่านประกาศบนระบบ
พนักงานของ Vbee กำลังทำงานอยู่ที่สำนักงานใหญ่ของบริษัทใน ฮานอย - ภาพ: NVCC
เขายิ้ม รู้สึกโล่งใจและมีความสุขราวกับได้พบญาติ “ญาติ” คนนั้นเป็นหนึ่งใน 20 เสียง AI ที่ดั๊กและทีม Vbee ได้ “กินนอน” ร่วมด้วยมาหลายวันหลายเดือน ทุ่มเทหัวใจทั้งหมดลงไปในทุกบรรทัดเสียง ใส่ใจทุกรายละเอียดในเสียง เพื่อให้เสียงนั้นเป็นธรรมชาติและเหมือนมนุษย์มากขึ้น
การเริ่มต้นที่ไม่ราบรื่น
ฉันไม่ทราบว่า CEO Ho Minh Duc และ CTO Nguyen Thi Thu Trang ซึ่งเป็นผู้ก่อตั้งบริษัท Vbee Data Solutions and Services Joint Stock Company สองท่าน ได้สัมผัสกับความรู้สึกยินดีและภาคภูมิใจเช่นนี้กี่ครั้งแล้ว
พวกเขาได้พบกับ "คนรู้จักพิเศษ" ในสถานการณ์ต่างๆ มากมาย เช่น เสียงที่ชัดเจนจากระบบลำโพงของโรงเรียน เสียงที่อบอุ่นในอาคาร หรือเสียงระดับมืออาชีพจากสวิตช์บอร์ดอัตโนมัติของธุรกิจต่างๆ มากมาย
ผลงานของ Vbee ไม่เพียงแต่เป็นผลลัพธ์ของอัลกอริทึมและโค้ดอีกต่อไป แต่ได้เข้ามามีบทบาทในชีวิตจริงและมีส่วนสนับสนุนอย่างเงียบๆ แต่ทรงพลังในหลายสาขา
จากการแนะนำหนังสือ การพากย์เสียง ไปจนถึงการประกาศทางศูนย์รับสายอัตโนมัติ Vbee ช่วยปลุกชีวิตใหม่ให้กับเทคโนโลยีเสียง
ในฐานะ "แม่" ของเทคโนโลยี TTS หลัก ดร. Nguyen Thi Thu Trang มุ่งหวังเสมอที่จะนำผลิตภัณฑ์จากเทคโนโลยีการสังเคราะห์เสียงพูดของเวียดนามมาสู่ผู้ใช้จริง ซึ่งเป็นเทคโนโลยีที่เธอทุ่มเทความพยายามอย่างมากนับตั้งแต่ทำวิทยานิพนธ์ระดับปริญญาเอกที่มหาวิทยาลัย Paris 11
ช่วงแรกๆ ของ Vbee นั้นค่อนข้างลำบาก แม้จะเปิดให้ใช้งานฟรีในช่วงสองปีแรก แต่เครื่องมือแปลงข้อความเป็นเสียง (TTS) กลับดึงดูดผู้ใช้ได้เพียงเล็กน้อย แต่แล้ว COVID-19 ก็กลายเป็นจุดเปลี่ยนที่ไม่คาดคิด
เมื่อต้องเผชิญกับกฎระเบียบที่เข้มงวดเกี่ยวกับการเว้นระยะห่างทางสังคม ธุรกิจต่างๆ เช่น FE Credit, Momo, Viet Credit, Sacombank ... จำเป็นต้องหาวิธีเข้าถึงลูกค้าหลายพันคน นั่นคือช่วงเวลาที่ Vbee ได้รับโอกาส ตั้งแต่การแจ้งเตือนหนี้ไปจนถึงการตอบกลับอัตโนมัติ ผลิตภัณฑ์ของพวกเขากลายเป็นโซลูชันที่เหมาะสมที่สุดทันที ในเวลานั้น ผู้ช่วยเสมือนและศูนย์บริการลูกค้าเสมือนสร้างรายได้ให้กับ Vbee สูงถึง 80%
เมื่อการระบาดใหญ่ผ่านพ้นไปและ เศรษฐกิจ โลกตกต่ำ Vbee ต้องเผชิญกับความท้าทายใหม่ กระแสของ AI เชิงสร้างสรรค์ (GenAI) และเทรนด์คอนเทนต์ดิจิทัลได้ฟื้นคืนชีพเครื่องมือ TTS ขึ้นมาอีกครั้ง ปัจจุบัน ตั้งแต่ TikTok ไปจนถึง YouTube และ Facebook เสียงของ AI ของ Vbee มีอยู่ทุกหนทุกแห่ง
“ปัจจุบันเรามีคอนเทนต์ TTS มากมาย” คุณโฮจิมินห์ ดึ๊ก กล่าวอย่างภาคภูมิใจ ปัจจุบันจำนวนผู้ใช้งาน Vbee จริงทะลุ 2 ล้านคนแล้ว และจำนวนนี้ยังคงเพิ่มขึ้นอย่างต่อเนื่อง 20% ในทุกเดือน
Vbee ได้ฝึกอบรมเสียงองค์กรคุณภาพสูงไปแล้วกว่า 20 เสียง และหากคุณนับเสียงที่กำหนดเอง พวกเขาได้สร้างเสียง AI ที่แตกต่างกันไปแล้วกว่า 200 เสียง
ด้วยเทคโนโลยีการถอดเสียงใหม่ที่ได้รับการวิจัยและทดสอบเมื่อไม่นานมานี้ ทำให้ปัจจุบันเสียงใหม่ต้องการข้อมูลที่บันทึกไว้เพียง 3 นาทีเท่านั้นในการฝึก แทนที่จะต้องใช้เวลาบันทึก 4 ถึงหลายสิบชั่วโมงเหมือนเมื่อสองปีก่อน
ซีอีโอ โฮจิมินห์ ดึ๊ก และประธานเจ้าหน้าที่ฝ่ายเทคโนโลยี เหงียน ถิ ทู จ่าง สองผู้ก่อตั้งบริษัท Vbee Data Solutions and Services Joint Stock Company - ภาพ: NVCC
“เราเข้าใจภาษาเวียดนามดีขึ้น”
ในการแข่งขันด้านเทคโนโลยีการสังเคราะห์เสียงพูด ซีอีโอ Ho Minh Duc มองเห็นถึงจุดที่ความพยายามด้านนวัตกรรมเทคโนโลยีจะค่อยๆ ถึงขีดจำกัดในที่สุด
ตามที่เขากล่าว Vbee ไม่เพียงแต่พัฒนาเทคโนโลยีหลักสำหรับการประมวลผลคำพูดภาษาเวียดนามเท่านั้น แต่ยังสร้างระบบเทคโนโลยีที่มีความสามารถในการเข้าใจภาษาเวียดนามอย่างลึกซึ้งอีกด้วย โดยมีความละเอียดอ่อน โทนเสียง และวัฒนธรรมอันเป็นเอกลักษณ์ที่เฉพาะชาวเวียดนามแท้ๆ เท่านั้นที่จะเข้าใจได้อย่างถ่องแท้
ในฐานะบริษัทชั้นนำในตลาด TTS ในเวียดนาม ผู้นำทั้งสองของ Vbee เชื่อมั่นว่าเครื่องมือของพวกเขาได้กลายเป็นมาตรฐานสำหรับการอ่านเสียง AI ในภาษาเวียดนาม ผู้ใช้ไม่เพียงแต่ประทับใจกับความแม่นยำเท่านั้น แต่ยังสัมผัสได้ถึง "อารมณ์" ในแต่ละเสียงที่พัฒนาโดย Vbee อีกด้วย
ในภาษาเวียดนาม ตัวอย่างเช่น คำว่า "alley" เพียงอย่างเดียวก็มีชื่อเรียกต่างๆ มากมาย ขึ้นอยู่กับภูมิภาค เช่น "hèm", "kiệt", "xếc" โดยแต่ละคำจะมีความหมายที่แตกต่างกันซึ่ง AI จำเป็นต้องเข้าใจ
เพื่อให้บรรลุเป้าหมายดังกล่าว Vbee ได้ลงทุนอย่างหนักในการรวบรวมชุดข้อมูลตัวอย่าง ตลอดจนลงทุนในระบบเซิร์ฟเวอร์อันทรงพลังสำหรับการฝึกอบรม AI
“เพื่อช่วยให้ AI เข้าใจและประมวลผลความแตกต่างในแต่ละภูมิภาคได้อย่างถูกต้อง เราจึงต้องสร้างชุดตัวอย่างจำนวนนับไม่ถ้วน และต้นทุนของเซิร์ฟเวอร์ประมวลผลก็สูงมากเช่นกัน” Ho Minh Duc ซีอีโอกล่าว
ดร. เหงียน ถิ ธู ตรัง ใช้เวลากว่า 15 ปีในการค้นคว้าเทคโนโลยี TTS หลักของ Vbee เพื่อถอดรหัสสำเนียงและไวยากรณ์ที่เป็นเอกลักษณ์ของภาษาเวียดนาม สำหรับเธอ ภาษาแม่ของเธอคือโลกอันละเอียดอ่อนที่เต็มไปด้วยความแตกต่างอันน่าสัมผัส
“ภาษาเวียดนามของฉันมีความซับซ้อนและน่าสนใจมาก เสียงพูดยากและแตกต่างจากภาษายอดนิยมอื่นๆ ในโลกมากที่สุด ยิ่งฉันเข้าใจภาษานี้มากเท่าไหร่ แบบจำลองของฉันก็จะแม่นยำมากขึ้นเท่านั้น” เธออธิบาย
Vbee ค่อยๆ ยืนยันแล้วว่าพวกเขาจะเป็นส่วนที่ขาดไม่ได้ของเครื่องมือและอุปกรณ์ที่มีซอฟต์แวร์ประมวลผลภาษาเวียดนามแบบบูรณาการในยุคเทคโนโลยี
ในทุกคำพูดและทุกเสียง ทีมงาน Vbee ไม่เพียงแต่ค้นคว้าและพัฒนาเทคโนโลยีเท่านั้น แต่ยังมุ่งมั่นที่จะสร้าง "อารมณ์แบบเวียดนาม" อย่างแท้จริงในเสียง AI ของพวกเขาอีกด้วย
ชื่อ Vbee ย่อมาจากวลี "Vietnamese BE your Eyes" ซึ่งมาจากความปรารถนาเริ่มแรกของผมที่จะสร้างเครื่องมือที่จะกลายเป็น "ดวงตา" สำหรับผู้พิการทางสายตา แต่ในกระแสการพัฒนาปัจจุบันที่หลายคนต้องการเปลี่ยนจากการฟังเป็นการมองเห็น เราเชื่อว่า Vbee จะกลายเป็น "ดวงตา" ของทุกคนด้วยเช่นกัน
ดร. เหงียน ถิ ทู ตรัง (อาจารย์ประจำคณะเทคโนโลยีสารสนเทศ มหาวิทยาลัยวิทยาศาสตร์และเทคโนโลยีฮานอย ผู้ก่อตั้งและผู้อำนวยการฝ่ายเทคโนโลยีของบริษัท Vbee)
การพบปะของคนรักหนังสือเสียง
Vbee เกิดขึ้นจากความสัมพันธ์ระหว่าง ดร.เหงียน ถิ ทู จาง และชุมชนคนตาบอด นับตั้งแต่สมัยเป็นนักศึกษา เธอได้มีส่วนร่วมในการบันทึกหนังสือเสียงและพัฒนาหนังสืออ่านภาษาเวียดนามเพื่อช่วยเหลือคนตาบอด
ประสบการณ์เหล่านี้สร้างแรงบันดาลใจให้เธอพัฒนาซอฟต์แวร์การอ่านภาษาเวียดนาม ซึ่งเป็นซอฟต์แวร์ต้นแบบของ Vbee ในปี 2561 เธอและคุณโฮจิมินห์ ดึ๊ก เพื่อนร่วมชั้นเรียนที่มหาวิทยาลัยวิทยาศาสตร์และเทคโนโลยีฮานอย ผู้มีประสบการณ์จากโครงการ Socbay.com และการแปลงหนังสือเสียงเป็นดิจิทัล ได้ก่อตั้ง Vbee ซึ่งเป็นผู้บุกเบิกด้านการแปลงข้อความเป็นเสียงพูดในเวียดนาม
ความสำเร็จที่โดดเด่นของ Vbee
- รางวัลชนะเลิศ Qualcomm Vietnam Innovation Challenge 2024
- รางวัลพิเศษ Tuoi Tre Start-up Award 2023
- สตาร์ทอัพที่ชนะการแข่งขันในโครงการ Grab Venture Ignite 2020 Accelerator
- รางวัลชนะเลิศการแข่งขัน Vietnamese Talent 2018 และรางวัลรองชนะเลิศการแข่งขัน Vietnamese Talent 2020
- ใบรับรองเทคโนโลยีหลักของเวียดนามในโครงการเปลี่ยนแปลงทางดิจิทัลแห่งชาติ 2025 - 2030 ของกระทรวงสารสนเทศและการสื่อสาร
- โครงการชนะเลิศรางวัล Vietnam Digital Media Award 2018 และ Vingroup Fund 2019
วิสัยทัศน์ระดับภูมิภาค
หลังจากยืนยันตำแหน่งของตนในตลาดเวียดนามแล้ว Vbee ตั้งเป้าที่จะขยายไปยังเอเชียตะวันออกเฉียงใต้ โดยมีแผนที่จะนำเทคโนโลยี TTS ไปสู่ประเทศต่างๆ เช่น ลาว ไทย กัมพูชา และฟิลิปปินส์ ภายในปี 2569
ตามที่ดร. Nguyen Thi Thu Trang กล่าว ความก้าวหน้าอย่างรวดเร็วของเทคโนโลยีในปัจจุบันพร้อมกับการเกิดขึ้นของโมเดลหลายภาษาจะทำให้การพัฒนาเครื่องมือ TTS สำหรับภาษาอื่นๆ ง่ายยิ่งขึ้น
ปัจจุบันเธอทำการวิจัยเทคโนโลยีการพูดสำหรับภาษาไทย จีน และอังกฤษ ซึ่งถือเป็นก้าวใหม่ให้กับ Vbee ในตลาดต่างประเทศ
ที่มา: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm
การแสดงความคิดเห็น (0)