Ao entrar na área de espera do aeroporto, em meio à multidão agitada de pessoas que retornavam de viagens de negócios, Ho Minh Duc parou por alguns segundos ao ouvir uma voz feminina suave e familiar lendo um anúncio no sistema.
Funcionários da Vbee trabalhando na sede da empresa em Hanói - Foto: Fornecida pela empresa.
Ele sorriu, sentindo-se aliviado e feliz, como se estivesse reencontrando um ente querido. Esse "ente querido" era um dos 20 dubladores de IA com os quais Duc e a equipe da Vbee trabalharam incontáveis dias e meses, dedicando-se de corpo e alma a cada nuance do som e aprimorando-a cuidadosamente para torná-la cada vez mais natural e humana.
A estrada acidentada das startups
O CEO Ho Minh Duc e a CTO Nguyen Thi Thu Trang – os dois fundadores da Vbee Data Services and Solutions Joint Stock Company – já experimentaram essa alegria e orgulho inúmeras vezes.
Eles reencontraram esses "conhecidos especiais" em diversas circunstâncias: as vozes claras nos alto-falantes das escolas, os tons acolhedores nos edifícios ou as vozes profissionais dos sistemas telefônicos automatizados de muitas empresas.
As criações da Vbee não são mais apenas o resultado de algoritmos e código; elas estão realmente entrando na vida real, fazendo contribuições discretas, porém poderosas, para diversas áreas.
Desde resenhas de livros e dublagem de filmes até anúncios automatizados de call center, a Vbee revitalizou a tecnologia de voz.
Como a "mãe" dessa tecnologia essencial de TTS (síntese de fala em vietnamita), a Dra. Nguyen Thi Thu Trang sempre aspirou a levar produtos derivados da tecnologia de síntese de fala vietnamita – uma tecnologia na qual ela investiu muita paixão desde sua tese de doutorado na Universidade Paris 11 – para usuários reais.
Os primeiros tempos do Vbee foram repletos de desafios. Apesar de ser gratuito durante os dois primeiros anos, sua ferramenta de conversão de texto em fala (TTS) atraiu apenas um pequeno grupo de usuários. Mas então, inesperadamente, a COVID-19 se tornou um ponto de virada.
Diante das rígidas normas de distanciamento social, empresas como FE Credit, Momo, Viet Credit, Sacombank , entre outras, precisaram encontrar maneiras de alcançar milhares de clientes. Foi nesse momento que a Vbee teve uma oportunidade: de lembretes de dívidas a respostas automatizadas, seu produto rapidamente se tornou a solução ideal. Naquela época, assistentes virtuais e agentes virtuais de call center representavam até 80% da receita da Vbee.
Com o arrefecimento da pandemia e a retração da economia global, a Vbee enfrentou um novo desafio. A onda da IA generativa (GenAI) e a tendência do conteúdo digital revitalizaram a ferramenta de síntese de voz. Hoje, do TikTok ao YouTube e ao Facebook, as vozes de IA da Vbee estão por toda parte.
"Grande parte do conteúdo de TTS atual é fornecido por nós", compartilhou Ho Minh Duc com orgulho. Atualmente, a base de usuários ativos da Vbee ultrapassou 2 milhões, e esse número continua a crescer de forma constante em 20% a cada mês.
A Vbee treinou mais de 20 vozes corporativas de alta qualidade e, se incluirmos as vozes personalizadas, criou mais de 200 vozes de IA diferentes.
Com a nova tecnologia de transcrição de voz recentemente pesquisada e lançada para testes, uma nova voz agora requer apenas 3 minutos de gravação de dados para treinamento, em vez das 4 a 10 horas de gravação necessárias há dois anos.
O CEO Ho Minh Duc e a CTO Nguyen Thi Thu Trang - os dois fundadores da Vbee Data Services and Solutions Joint Stock Company - Foto: Fornecida pela empresa.
"Temos uma vantagem no nosso domínio da língua vietnamita."
Na corrida pela tecnologia de síntese de voz, o CEO Ho Minh Duc prevê um ponto em que os esforços para inovar nessa tecnologia gradualmente atingirão seus limites.
Segundo ele, a Vbee não está apenas desenvolvendo tecnologia essencial de processamento de fala vietnamita, mas também construindo um sistema tecnológico capaz de compreender profundamente o idioma vietnamita – com todas as suas sutilezas, tons e cultura singular que somente os vietnamitas nativos conseguem entender plenamente.
Como empresa líder no mercado de TTS (síntese de voz em fala) no Vietnã, os dois diretores da Vbee acreditam que sua ferramenta se tornou a referência para dublagem por IA em vietnamita. Os usuários não apenas apreciam a precisão, mas também percebem a "emoção" em cada voz desenvolvida pela Vbee.
Em vietnamita, por exemplo, até mesmo uma única palavra como "ngõ" (beco) tem muitos nomes diferentes dependendo da região, como "hẻm", "kiệt" e "xẹc" — cada palavra carregando uma nuance distinta que a IA precisa entender.
Para alcançar esse objetivo, a Vbee investiu fortemente na coleta de conjuntos de dados de amostra, bem como em um sistema de servidor poderoso para o treinamento da IA.
"Para permitir que a IA compreenda e processe corretamente informações com tais nuances regionais, tivemos que construir inúmeros conjuntos de amostras, e o custo dos servidores de processamento também foi muito alto", compartilhou o CEO Ho Minh Duc.
A Dra. Nguyen Thi Thu Trang dedicou mais de 15 anos à pesquisa da tecnologia TTS (síntese de voz em fala) da Vbee para decifrar os tons e a gramática distintos da língua vietnamita. Para ela, sua língua materna é um mundo sutil, repleto de nuances expressivas.
"O vietnamita é uma língua muito complexa e interessante; os tons são o aspecto mais difícil e diferente de muitas outras línguas comuns no mundo. Quanto mais eu entender a língua, mais preciso será o meu modelo", explicou ela.
O Vbee está gradualmente se consolidando como parte indispensável das ferramentas e dispositivos que integram o software de processamento da língua vietnamita na era tecnológica.
Em cada palavra e em cada voz, a equipe da Vbee não apenas explora e desenvolve tecnologia, mas também se esforça para criar uma genuína "emoção vietnamita" em suas vozes de IA.
O nome Vbee é uma abreviação de "Vietnamese BE your Eyes" (Seja seus olhos em vietnamita), que surgiu do meu desejo inicial de criar uma ferramenta que servisse como "olhos" para pessoas com deficiência visual. No entanto, no mundo em desenvolvimento de hoje, onde muitas pessoas priorizam a audição em detrimento da visão, acreditamos que o Vbee também se tornará "olhos" para todos.
Dra. Nguyen Thi Thu Trang (Professora Sênior da Escola de Tecnologia da Informação e Comunicações da Universidade de Ciência e Tecnologia de Hanói, Fundadora e Diretora de Tecnologia da Empresa Vbee)
Um encontro de entusiastas de audiolivros
A Vbee nasceu da profunda ligação da Dra. Nguyen Thi Thu Trang com a comunidade de deficientes visuais. Desde os tempos de estudante, ela se dedica à gravação de audiolivros e ao desenvolvimento de sistemas de conversão de texto em fala em vietnamita para auxiliar pessoas com deficiência visual.
Essas experiências a inspiraram a desenvolver um software de conversão de texto em fala para vietnamita – o precursor do Vbee. Em 2018, ela e seu colega Ho Minh Duc – também estudante da Universidade de Ciência e Tecnologia de Hanói, com experiência no projeto Socbay.com e na digitalização de audiolivros – fundaram o Vbee, pioneiro na área de conversão de texto em fala no Vietnã.
As conquistas notáveis da Vbee
- Vencedor do primeiro prêmio do Qualcomm Vietnam Innovation Challenge 2024
- Prêmio Especial no Youth Start-up Award 2023
- Startup vence o programa de aceleração Grab Venture Ignite 2020.
- Primeiro lugar no Vietnam Talent Awards de 2018, segundo lugar no Vietnam Talent Awards de 2020.
- Certificada como tecnologia essencial vietnamita no Programa Nacional de Transformação Digital 2025-2030 do Ministério da Informação e Comunicações.
- O projeto ganhou o Prêmio de Mídia Digital do Vietnã de 2018 e o Prêmio de Financiamento Vingroup de 2019.
Visão regional
Após consolidar sua posição no mercado vietnamita, a Vbee pretende expandir-se para o Sudeste Asiático, com planos de levar sua tecnologia de síntese de voz (TTS) para países como Laos, Tailândia, Camboja e Filipinas até 2026.
Segundo a Dra. Nguyen Thi Thu Trang, o rápido avanço da tecnologia atual, com o surgimento de modelos multilíngues, facilitará o desenvolvimento de ferramentas de síntese de voz para outros idiomas.
Atualmente, ela está pesquisando tecnologias de voz para tailandês, chinês e inglês, abrindo novos caminhos para a Vbee no mercado internacional.
Fonte: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm






Comentário (0)