Vietnam.vn - Nền tảng quảng bá Việt Nam

Vbee و تلاش‌هایش برای توانمندسازی زبان ویتنامی.

Báo Tuổi TrẻBáo Tuổi Trẻ17/02/2025

هو مین دوک در میان شلوغی جمعیت که از سفرهای کاری بازمی‌گشتند، وارد سالن انتظار فرودگاه شد و با شنیدن صدای زنانه‌ی ملایم و آشنایی که اطلاعیه‌ای را روی سیستم می‌خواند، چند ثانیه‌ای مکث کرد.


Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 1.

کارکنان Vbee در دفتر مرکزی شرکت در هانوی مشغول به کار هستند - عکس: ارائه شده توسط شرکت.

او لبخند زد، احساس آسودگی و شادی می‌کرد، انگار دوباره به عزیزی پیوسته بود. آن «عزیز» یکی از 20 صداپیشه‌ی هوش مصنوعی بود که دوک و تیم Vbee روزها و ماه‌های بی‌شماری را صرف کار با آنها کرده بودند، قلبشان را در هر ظرافت صدا ریخته بودند و با دقت هر ظرافت را ساخته بودند تا آنها را به طور فزاینده‌ای طبیعی و شبیه انسان کنند.

مسیر پر پیچ و خم استارت‌آپ‌ها

مدیرعامل هو مین دوک و مدیر ارشد فناوری نگوین تی تو ترانگ - دو بنیانگذار شرکت سهامی خدمات و راهکارهای داده Vbee - چنین شادی و غروری را بارها تجربه کرده‌اند.

آنها دوباره در شرایط مختلف با این «آشنایان ویژه» روبرو شدند: صداهای واضح از بلندگوهای مدرسه، لحن گرم در ساختمان‌ها، یا صداهای حرفه‌ای از سیستم‌های تلفن خودکار بسیاری از مشاغل.

ساخته‌های Vbee دیگر صرفاً نتیجه‌ی الگوریتم‌ها و کدها نیستند؛ آن‌ها واقعاً وارد زندگی واقعی می‌شوند و سهم آرام اما قدرتمندی در بسیاری از زمینه‌ها دارند.

از نقد کتاب و دوبله فیلم گرفته تا اطلاعیه‌های خودکار مرکز تماس، Vbee جان تازه‌ای به فناوری صدا بخشیده است.

دکتر نگوین تی تو ترانگ، به عنوان «مادر» فناوری اصلی TTS، همواره آرزو داشته است تا محصولاتی برگرفته از فناوری سنتز گفتار ویتنامی - فناوری‌ای که از زمان رساله دکترایش در دانشگاه پاریس ۱۱ با اشتیاق فراوان به آن پرداخته است - را به کاربران واقعی ارائه دهد.

روزهای اولیه Vbee پر از چالش بود. با وجود رایگان بودن در دو سال اول، ابزار تبدیل متن به گفتار (TTS) آنها تنها گروه کوچکی از کاربران را جذب کرد. اما سپس کووید-۱۹ به طور غیرمنتظره‌ای به یک نقطه عطف تبدیل شد.

در مواجهه با مقررات سختگیرانه فاصله‌گذاری اجتماعی، کسب‌وکارهایی مانند FE Credit، Momo، Viet Credit، Sacombank و غیره، مجبور شدند راه‌هایی برای دسترسی به هزاران مشتری پیدا کنند. در این زمان بود که به Vbee فرصتی داده شد: از یادآوری بدهی گرفته تا پاسخ‌های خودکار، محصول آنها به سرعت به راه‌حل بهینه تبدیل شد. در آن زمان، دستیاران مجازی و نمایندگان مرکز تماس مجازی تا ۸۰٪ از درآمد Vbee را به خود اختصاص می‌دادند.

با فروکش کردن همه‌گیری و رکود اقتصاد جهانی، Vbee با چالش جدیدی روبرو شد. موج هوش مصنوعی مولد (GenAI) و روند محتوای دیجیتال، ابزار TTS را احیا کرد. امروزه، از تیک‌تاک گرفته تا یوتیوب و فیس‌بوک، صدای هوش مصنوعی Vbee همه جا به گوش می‌رسد.

هو مین دوک با افتخار به اشتراک گذاشت: «بخش زیادی از محتوای TTS فعلی توسط ما ارائه می‌شود.» در حال حاضر، پایگاه کاربر فعال Vbee از ۲ میلیون نفر فراتر رفته است و این تعداد هر ماه به طور پیوسته ۲۰ درصد افزایش می‌یابد.

Vbee بیش از ۲۰ صدای باکیفیت شرکتی را آموزش داده است، و اگر صداهای سفارشی را هم در نظر بگیرید، آنها بیش از ۲۰۰ صدای هوش مصنوعی مختلف ایجاد کرده‌اند.

با فناوری جدید رونویسی صدا که اخیراً مورد تحقیق و آزمایش قرار گرفته است، اکنون یک صدای جدید فقط به ۳ دقیقه ضبط داده برای آموزش نیاز دارد، به جای ۴ تا ۱۰ ساعت ضبط مانند دو سال پیش.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 2.

مدیرعامل هو مین دوک و مدیر ارشد فناوری نگوین تی تو ترانگ - دو بنیانگذار شرکت سهامی خدمات و راهکارهای داده Vbee - عکس: ارائه شده توسط شرکت.

ما در درک زبان ویتنامی از مزیت برخورداریم.

در رقابت برای فناوری سنتز گفتار، مدیرعامل هو مین دوک نقطه‌ای را می‌بیند که در آن تلاش‌ها برای نوآوری در فناوری به تدریج به محدودیت‌های خود خواهد رسید.

به گفته وی، Vbee نه تنها در حال توسعه فناوری اصلی پردازش گفتار ویتنامی است، بلکه در حال ساخت یک سیستم فناوری است که قادر به درک عمیق زبان ویتنامی است - با تمام ظرافت‌ها، لحن‌ها و فرهنگ منحصر به فرد آن که فقط مردم واقعی ویتنامی می‌توانند به طور کامل آن را درک کنند.

دو رهبر Vbee، به عنوان یک شرکت پیشرو در بازار TTS در ویتنام، معتقدند که ابزار آنها به معیاری برای صداگذاری هوش مصنوعی به زبان ویتنامی تبدیل شده است. کاربران نه تنها از دقت آن قدردانی می‌کنند، بلکه «احساس» را در هر صدایی که توسط Vbee توسعه داده شده است، حس می‌کنند.

برای مثال، در ویتنامی، حتی یک کلمه واحد مانند "ngõ" (کوچه) بسته به منطقه، نام‌های مختلفی دارد، مانند "hẻm"، "kiệt" و "xẹc" - که هر کلمه دارای یک تفاوت ظریف است که هوش مصنوعی باید آن را درک کند.

برای دستیابی به این هدف، Vbee سرمایه‌گذاری هنگفتی در جمع‌آوری مجموعه داده‌های نمونه و همچنین سرمایه‌گذاری در یک سیستم سرور قوی برای آموزش هوش مصنوعی انجام داده است.

هو مین دوک، مدیرعامل، به اشتراک گذاشت: «برای اینکه هوش مصنوعی بتواند اطلاعاتی با چنین تفاوت‌های منطقه‌ای را درک و به درستی پردازش کند، مجبور بودیم مجموعه نمونه‌های بی‌شماری بسازیم و هزینه سرورهای پردازش نیز بسیار بالا بود.»

دکتر نگوین تی تو ترانگ بیش از ۱۵ سال از عمر خود را صرف تحقیق در مورد فناوری اصلی TTS در Vbee کرده است تا لحن‌ها و دستور زبان متمایز زبان ویتنامی را رمزگشایی کند. برای او، زبان مادری‌اش دنیایی لطیف و پر از ظرافت‌های بیانی است.

او توضیح داد: «زبان ویتنامی زبانی بسیار پیچیده و جالب است؛ لحن‌ها سخت‌ترین جنبه آن هستند و با بسیاری از زبان‌های رایج دیگر در جهان متفاوتند. هرچه بیشتر این زبان را بفهمم، مدل من دقیق‌تر خواهد بود.»

Vbee به تدریج خود را به عنوان بخش جدایی‌ناپذیر ابزارها و دستگاه‌هایی که نرم‌افزار پردازش زبان ویتنامی را در عصر فناوری ادغام می‌کنند، تثبیت می‌کند.

در هر کلمه و هر صدایی، تیم Vbee نه تنها فناوری را بررسی و توسعه می‌دهد، بلکه تلاش می‌کند تا یک «احساس ویتنامی» واقعی را در صداهای هوش مصنوعی خود ایجاد کند.

نام Vbee مخفف عبارت «ویتنامی BE your Eyes» است که از تمایل اولیه من برای ایجاد ابزاری که به عنوان «چشم» برای افراد کم‌بینا عمل کند، ناشی می‌شود. با این حال، در دنیای در حال توسعه امروز، که بسیاری از مردم شنوایی را بر بینایی اولویت می‌دهند، ما معتقدیم Vbee نیز به «چشم» برای همه تبدیل خواهد شد.

دکتر نگوین تی تو ترانگ (مدرس ارشد دانشکده فناوری اطلاعات و ارتباطات، دانشگاه علوم و فناوری هانوی، بنیانگذار و مدیر ارشد فناوری شرکت Vbee)

گردهمایی علاقه‌مندان به کتاب‌های صوتی

Vbee از ارتباط عمیق دکتر نگوین تی تو ترانگ با جامعه‌ی نابینایان متولد شد. او از دوران دانشجویی خود در زمینه‌ی ضبط کتاب‌های صوتی و توسعه‌ی سیستم‌های تبدیل متن به گفتار ویتنامی برای حمایت از نابینایان فعالیت داشته است.

این تجربیات او را به توسعه نرم‌افزار تبدیل متن به گفتار ویتنامی - که پیش درآمد Vbee بود - ترغیب کرد. در سال ۲۰۱۸، او و همکلاسی‌اش هو مین دوک - دانشجوی دانشگاه علوم و فناوری هانوی با تجربه از پروژه Socbay.com و دیجیتالی کردن کتاب‌های صوتی - Vbee را تأسیس کردند، که پیشگام در زمینه تبدیل متن به گفتار در ویتنام است.

دستاوردهای برجسته Vbee

- برنده جایزه اول چالش نوآوری کوالکام ویتنام ۲۰۲۴

- جایزه ویژه در جشنواره استارت‌آپ جوانان ۲۰۲۳

- یک استارتاپ برنده برنامه شتاب‌دهی Grab Venture Ignite 2020 شد.

- جایزه برتر جوایز استعدادهای ویتنام ۲۰۱۸، جایزه دوم جوایز استعدادهای ویتنام ۲۰۲۰.

- به عنوان یک فناوری اصلی ویتنامی در برنامه ملی تحول دیجیتال 2025-2030 وزارت اطلاعات و ارتباطات تأیید شده است.

- این پروژه برنده جایزه رسانه دیجیتال ویتنام ۲۰۱۸ و جایزه تامین مالی وین‌گروپ ۲۰۱۹ شد.

چشم‌انداز منطقه‌ای

Vbee که خود را در بازار ویتنام تثبیت کرده است، قصد دارد به آسیای جنوب شرقی گسترش یابد و قصد دارد فناوری TTS خود را تا سال 2026 به کشورهایی مانند لائوس، تایلند، کامبوج و فیلیپین ارائه دهد.

به گفته دکتر نگوین تی تو ترانگ، پیشرفت سریع فناوری امروزه، با ظهور مدل‌های چندزبانه، توسعه ابزارهای TTS برای زبان‌های دیگر را آسان‌تر خواهد کرد.

در حال حاضر، او در حال تحقیق در مورد فناوری‌های صوتی برای زبان‌های تایلندی، چینی و انگلیسی است و راه‌های جدیدی را برای Vbee در بازار بین‌المللی باز می‌کند.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 3. یک استارت‌آپ ویتنامی در اجلاس هوش مصنوعی پاریس مورد تقدیر قرار گرفت

انفارم، یک استارتاپ ویتنامی در حوزه فناوری هوش مصنوعی برای کشاورزی، یکی از چهار نماینده آسیایی در میان ۵۰ پروژه ارائه شده در اجلاس اقدام هوش مصنوعی در پاریس، فرانسه، در تاریخ ۱۰ و ۱۱ فوریه است.



منبع: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm

نظر (0)

لطفاً نظر دهید تا احساسات خود را با ما به اشتراک بگذارید!

در همان موضوع

در همان دسته‌بندی

از همان نویسنده

میراث

شکل

کسب و کارها

امور جاری

نظام سیاسی

محلی

محصول

Happy Vietnam
فصل گل‌های سیمپسون

فصل گل‌های سیمپسون

خواندن روزنامه در روز استقلال

خواندن روزنامه در روز استقلال

f5 خوش رفتار باشید

f5 خوش رفتار باشید