هو مین دوک در میان شلوغی جمعیت که از سفرهای کاری بازمیگشتند، وارد سالن انتظار فرودگاه شد و با شنیدن صدای زنانهی ملایم و آشنایی که اطلاعیهای را روی سیستم میخواند، چند ثانیهای مکث کرد.
کارکنان Vbee در دفتر مرکزی شرکت در هانوی مشغول به کار هستند - عکس: ارائه شده توسط شرکت.
او لبخند زد، احساس آسودگی و شادی میکرد، انگار دوباره به عزیزی پیوسته بود. آن «عزیز» یکی از 20 صداپیشهی هوش مصنوعی بود که دوک و تیم Vbee روزها و ماههای بیشماری را صرف کار با آنها کرده بودند، قلبشان را در هر ظرافت صدا ریخته بودند و با دقت هر ظرافت را ساخته بودند تا آنها را به طور فزایندهای طبیعی و شبیه انسان کنند.
مسیر پر پیچ و خم استارتآپها
مدیرعامل هو مین دوک و مدیر ارشد فناوری نگوین تی تو ترانگ - دو بنیانگذار شرکت سهامی خدمات و راهکارهای داده Vbee - چنین شادی و غروری را بارها تجربه کردهاند.
آنها دوباره در شرایط مختلف با این «آشنایان ویژه» روبرو شدند: صداهای واضح از بلندگوهای مدرسه، لحن گرم در ساختمانها، یا صداهای حرفهای از سیستمهای تلفن خودکار بسیاری از مشاغل.
ساختههای Vbee دیگر صرفاً نتیجهی الگوریتمها و کدها نیستند؛ آنها واقعاً وارد زندگی واقعی میشوند و سهم آرام اما قدرتمندی در بسیاری از زمینهها دارند.
از نقد کتاب و دوبله فیلم گرفته تا اطلاعیههای خودکار مرکز تماس، Vbee جان تازهای به فناوری صدا بخشیده است.
دکتر نگوین تی تو ترانگ، به عنوان «مادر» فناوری اصلی TTS، همواره آرزو داشته است تا محصولاتی برگرفته از فناوری سنتز گفتار ویتنامی - فناوریای که از زمان رساله دکترایش در دانشگاه پاریس ۱۱ با اشتیاق فراوان به آن پرداخته است - را به کاربران واقعی ارائه دهد.
روزهای اولیه Vbee پر از چالش بود. با وجود رایگان بودن در دو سال اول، ابزار تبدیل متن به گفتار (TTS) آنها تنها گروه کوچکی از کاربران را جذب کرد. اما سپس کووید-۱۹ به طور غیرمنتظرهای به یک نقطه عطف تبدیل شد.
در مواجهه با مقررات سختگیرانه فاصلهگذاری اجتماعی، کسبوکارهایی مانند FE Credit، Momo، Viet Credit، Sacombank و غیره، مجبور شدند راههایی برای دسترسی به هزاران مشتری پیدا کنند. در این زمان بود که به Vbee فرصتی داده شد: از یادآوری بدهی گرفته تا پاسخهای خودکار، محصول آنها به سرعت به راهحل بهینه تبدیل شد. در آن زمان، دستیاران مجازی و نمایندگان مرکز تماس مجازی تا ۸۰٪ از درآمد Vbee را به خود اختصاص میدادند.
با فروکش کردن همهگیری و رکود اقتصاد جهانی، Vbee با چالش جدیدی روبرو شد. موج هوش مصنوعی مولد (GenAI) و روند محتوای دیجیتال، ابزار TTS را احیا کرد. امروزه، از تیکتاک گرفته تا یوتیوب و فیسبوک، صدای هوش مصنوعی Vbee همه جا به گوش میرسد.
هو مین دوک با افتخار به اشتراک گذاشت: «بخش زیادی از محتوای TTS فعلی توسط ما ارائه میشود.» در حال حاضر، پایگاه کاربر فعال Vbee از ۲ میلیون نفر فراتر رفته است و این تعداد هر ماه به طور پیوسته ۲۰ درصد افزایش مییابد.
Vbee بیش از ۲۰ صدای باکیفیت شرکتی را آموزش داده است، و اگر صداهای سفارشی را هم در نظر بگیرید، آنها بیش از ۲۰۰ صدای هوش مصنوعی مختلف ایجاد کردهاند.
با فناوری جدید رونویسی صدا که اخیراً مورد تحقیق و آزمایش قرار گرفته است، اکنون یک صدای جدید فقط به ۳ دقیقه ضبط داده برای آموزش نیاز دارد، به جای ۴ تا ۱۰ ساعت ضبط مانند دو سال پیش.
مدیرعامل هو مین دوک و مدیر ارشد فناوری نگوین تی تو ترانگ - دو بنیانگذار شرکت سهامی خدمات و راهکارهای داده Vbee - عکس: ارائه شده توسط شرکت.
ما در درک زبان ویتنامی از مزیت برخورداریم.
در رقابت برای فناوری سنتز گفتار، مدیرعامل هو مین دوک نقطهای را میبیند که در آن تلاشها برای نوآوری در فناوری به تدریج به محدودیتهای خود خواهد رسید.
به گفته وی، Vbee نه تنها در حال توسعه فناوری اصلی پردازش گفتار ویتنامی است، بلکه در حال ساخت یک سیستم فناوری است که قادر به درک عمیق زبان ویتنامی است - با تمام ظرافتها، لحنها و فرهنگ منحصر به فرد آن که فقط مردم واقعی ویتنامی میتوانند به طور کامل آن را درک کنند.
دو رهبر Vbee، به عنوان یک شرکت پیشرو در بازار TTS در ویتنام، معتقدند که ابزار آنها به معیاری برای صداگذاری هوش مصنوعی به زبان ویتنامی تبدیل شده است. کاربران نه تنها از دقت آن قدردانی میکنند، بلکه «احساس» را در هر صدایی که توسط Vbee توسعه داده شده است، حس میکنند.
برای مثال، در ویتنامی، حتی یک کلمه واحد مانند "ngõ" (کوچه) بسته به منطقه، نامهای مختلفی دارد، مانند "hẻm"، "kiệt" و "xẹc" - که هر کلمه دارای یک تفاوت ظریف است که هوش مصنوعی باید آن را درک کند.
برای دستیابی به این هدف، Vbee سرمایهگذاری هنگفتی در جمعآوری مجموعه دادههای نمونه و همچنین سرمایهگذاری در یک سیستم سرور قوی برای آموزش هوش مصنوعی انجام داده است.
هو مین دوک، مدیرعامل، به اشتراک گذاشت: «برای اینکه هوش مصنوعی بتواند اطلاعاتی با چنین تفاوتهای منطقهای را درک و به درستی پردازش کند، مجبور بودیم مجموعه نمونههای بیشماری بسازیم و هزینه سرورهای پردازش نیز بسیار بالا بود.»
دکتر نگوین تی تو ترانگ بیش از ۱۵ سال از عمر خود را صرف تحقیق در مورد فناوری اصلی TTS در Vbee کرده است تا لحنها و دستور زبان متمایز زبان ویتنامی را رمزگشایی کند. برای او، زبان مادریاش دنیایی لطیف و پر از ظرافتهای بیانی است.
او توضیح داد: «زبان ویتنامی زبانی بسیار پیچیده و جالب است؛ لحنها سختترین جنبه آن هستند و با بسیاری از زبانهای رایج دیگر در جهان متفاوتند. هرچه بیشتر این زبان را بفهمم، مدل من دقیقتر خواهد بود.»
Vbee به تدریج خود را به عنوان بخش جداییناپذیر ابزارها و دستگاههایی که نرمافزار پردازش زبان ویتنامی را در عصر فناوری ادغام میکنند، تثبیت میکند.
در هر کلمه و هر صدایی، تیم Vbee نه تنها فناوری را بررسی و توسعه میدهد، بلکه تلاش میکند تا یک «احساس ویتنامی» واقعی را در صداهای هوش مصنوعی خود ایجاد کند.
نام Vbee مخفف عبارت «ویتنامی BE your Eyes» است که از تمایل اولیه من برای ایجاد ابزاری که به عنوان «چشم» برای افراد کمبینا عمل کند، ناشی میشود. با این حال، در دنیای در حال توسعه امروز، که بسیاری از مردم شنوایی را بر بینایی اولویت میدهند، ما معتقدیم Vbee نیز به «چشم» برای همه تبدیل خواهد شد.
دکتر نگوین تی تو ترانگ (مدرس ارشد دانشکده فناوری اطلاعات و ارتباطات، دانشگاه علوم و فناوری هانوی، بنیانگذار و مدیر ارشد فناوری شرکت Vbee)
گردهمایی علاقهمندان به کتابهای صوتی
Vbee از ارتباط عمیق دکتر نگوین تی تو ترانگ با جامعهی نابینایان متولد شد. او از دوران دانشجویی خود در زمینهی ضبط کتابهای صوتی و توسعهی سیستمهای تبدیل متن به گفتار ویتنامی برای حمایت از نابینایان فعالیت داشته است.
این تجربیات او را به توسعه نرمافزار تبدیل متن به گفتار ویتنامی - که پیش درآمد Vbee بود - ترغیب کرد. در سال ۲۰۱۸، او و همکلاسیاش هو مین دوک - دانشجوی دانشگاه علوم و فناوری هانوی با تجربه از پروژه Socbay.com و دیجیتالی کردن کتابهای صوتی - Vbee را تأسیس کردند، که پیشگام در زمینه تبدیل متن به گفتار در ویتنام است.
دستاوردهای برجسته Vbee
- برنده جایزه اول چالش نوآوری کوالکام ویتنام ۲۰۲۴
- جایزه ویژه در جشنواره استارتآپ جوانان ۲۰۲۳
- یک استارتاپ برنده برنامه شتابدهی Grab Venture Ignite 2020 شد.
- جایزه برتر جوایز استعدادهای ویتنام ۲۰۱۸، جایزه دوم جوایز استعدادهای ویتنام ۲۰۲۰.
- به عنوان یک فناوری اصلی ویتنامی در برنامه ملی تحول دیجیتال 2025-2030 وزارت اطلاعات و ارتباطات تأیید شده است.
- این پروژه برنده جایزه رسانه دیجیتال ویتنام ۲۰۱۸ و جایزه تامین مالی وینگروپ ۲۰۱۹ شد.
چشمانداز منطقهای
Vbee که خود را در بازار ویتنام تثبیت کرده است، قصد دارد به آسیای جنوب شرقی گسترش یابد و قصد دارد فناوری TTS خود را تا سال 2026 به کشورهایی مانند لائوس، تایلند، کامبوج و فیلیپین ارائه دهد.
به گفته دکتر نگوین تی تو ترانگ، پیشرفت سریع فناوری امروزه، با ظهور مدلهای چندزبانه، توسعه ابزارهای TTS برای زبانهای دیگر را آسانتر خواهد کرد.
در حال حاضر، او در حال تحقیق در مورد فناوریهای صوتی برای زبانهای تایلندی، چینی و انگلیسی است و راههای جدیدی را برای Vbee در بازار بینالمللی باز میکند.
منبع: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm






نظر (0)