Ao entrar no saguão do aeroporto, em meio à agitação de pessoas retornando de uma viagem de negócios, Ho Minh Duc parou por alguns segundos quando ouviu uma voz feminina familiar e gentil lendo um anúncio no sistema.
Funcionários da Vbee trabalham na sede da empresa em Hanói - Foto: NVCC
Ele sorriu, sentindo-se aliviado e feliz como se tivesse encontrado um parente. Esse "parente" era uma das 20 vozes de IA com as quais Duc e a equipe da Vbee "comeram e dormiram" por muitos dias e meses, dedicando todo o seu coração a cada linha sonora, cuidando de cada nuance da voz para torná-la mais natural e humana.
Início instável
Não sei quantas vezes o CEO Ho Minh Duc e o CTO Nguyen Thi Thu Trang — os dois fundadores da Vbee Data Solutions and Services Joint Stock Company — experimentaram tal sentimento de alegria e orgulho.
Eles conheceram "conhecidos especiais" em muitas situações diferentes: vozes claras nos sistemas de alto-falantes das escolas, vozes calorosas nos prédios ou vozes profissionais nas centrais telefônicas automáticas de muitas empresas.
Os filhos da Vbee não são mais apenas o resultado de algoritmos e códigos, mas estão realmente ganhando vida, fazendo contribuições silenciosas, mas poderosas, para muitos campos.
De introduções de livros e dublagem de filmes a anúncios automatizados em call centers, a Vbee dá nova vida à tecnologia de voz.
Como a "mãe" da tecnologia principal do TTS, a Dra. Nguyen Thi Thu Trang sempre aspira levar produtos da tecnologia vietnamita de síntese de fala — a tecnologia à qual ela dedicou muito esforço desde sua tese de doutorado na Universidade Paris 11 — para usuários reais.
Os primeiros dias do Vbee foram conturbados. Apesar de ser gratuito nos dois primeiros anos, sua ferramenta de conversão de texto em voz (TTS) atraiu apenas um pequeno público. Mas então a COVID-19 se transformou em um ponto de virada inesperado.
Diante das rígidas regras de distanciamento social, empresas como FE Credit, Momo, Viet Credit, Sacombank ... tiveram que encontrar maneiras de alcançar milhares de clientes. Foi então que a Vbee teve a oportunidade: de lembretes de dívidas a respostas automáticas, seus produtos rapidamente se tornaram a solução ideal. Naquela época, assistentes virtuais e call centers virtuais representavam até 80% da receita da Vbee.
Com o fim da pandemia e a queda da economia mundial, a Vbee enfrentou um novo desafio. A onda da IA generativa (GenAI) e as tendências de conteúdo digital reacenderam a ferramenta TTS. Hoje, do TikTok ao YouTube e Facebook, as vozes da IA da Vbee estão por toda parte.
"Atualmente, fornecemos muito conteúdo TTS", compartilhou o Sr. Ho Minh Duc com orgulho. Atualmente, o número de usuários reais do Vbee ultrapassa 2 milhões, e esse número continua aumentando de forma constante em 20% a cada mês.
A Vbee treinou mais de 20 vozes corporativas de alta qualidade e, se você contar as vozes personalizadas, eles criaram mais de 200 vozes de IA diferentes.
Com a nova tecnologia de transcrição de voz que foi pesquisada e testada recentemente, uma nova voz agora precisa apenas de 3 minutos de dados gravados para ser treinada, em vez de 4 a dezenas de horas de gravação como há dois anos.
CEO Ho Minh Duc e diretor de tecnologia Nguyen Thi Thu Trang - dois fundadores da Vbee Data Solutions and Services Joint Stock Company - Foto: NVCC
“Somos melhores em entender o vietnamita”
Na corrida pela tecnologia de síntese de fala, o CEO Ho Minh Duc vê um momento em que os esforços de inovação tecnológica gradualmente atingirão seus limites.
Segundo ele, a Vbee não está apenas desenvolvendo tecnologia de ponta para processamento da fala vietnamita, mas também construindo um sistema de tecnologia capaz de compreender profundamente a língua vietnamita — com todas as sutilezas, tons e cultura única que somente os verdadeiros vietnamitas podem entender completamente.
Como empresa líder no mercado de TTS no Vietnã, os dois líderes da Vbee acreditam que sua ferramenta se tornou o padrão para leitura de voz por IA em vietnamitas. Os usuários não apenas apreciam a precisão, mas também sentem a "emoção" em cada voz desenvolvida pela Vbee.
Em vietnamita, por exemplo, apenas a palavra "alley" tem muitos nomes diferentes dependendo da região, como "hèm", "kiệt", "xếc" - cada palavra tem uma nuance diferente que a IA precisa entender.
Para conseguir isso, a Vbee investiu pesadamente na coleta de conjuntos de dados de amostra, bem como em sistemas de servidores poderosos para treinamento de IA.
"Para ajudar a IA a entender e processar cada nuance regional corretamente, tivemos que criar inúmeros conjuntos de amostras, e o custo do servidor de processamento também foi muito alto", compartilhou o CEO Ho Minh Duc.
A Dra. Nguyen Thi Thu Trang passou mais de 15 anos pesquisando a tecnologia TTS da Vbee para decodificar os tons e a gramática únicos do vietnamita. Para ela, sua língua materna é um mundo sutil, repleto de nuances expressivas.
"Meu idioma vietnamita é muito complexo e interessante, e os tons são os mais difíceis e diferentes de muitas outras línguas populares do mundo. Quanto mais eu entender o idioma, mais preciso será meu modelo", explicou ela.
A Vbee está gradualmente afirmando que será uma parte indispensável de ferramentas e dispositivos com software de processamento de idioma vietnamita integrado na era da tecnologia.
Em cada palavra, em cada voz, a equipe da Vbee não apenas pesquisa e desenvolve tecnologia, mas também se esforça para criar uma verdadeira "emoção vietnamita" em suas vozes de IA.
O nome Vbee é uma abreviação da frase "Vietnamese BE your Eyes" (Seja seus olhos vietnamitas), que surgiu do meu desejo inicial de construir uma ferramenta que se tornasse os "olhos" para deficientes visuais. Mas, com a tendência atual de desenvolvimento, em que muitas pessoas querem passar a ouvir mais do que ver, acreditamos que o Vbee também se tornará os "olhos" de todos.
Dr. Nguyen Thi Thu Trang (Professor, Escola de Tecnologia da Informação, Universidade de Ciência e Tecnologia de Hanói, Fundador e Diretor de Tecnologia da Vbee Company)
Encontro de amantes de audiolivros
A Vbee nasceu da relação entre a Dra. Nguyen Thi Thu Trang e a comunidade de cegos. Desde a época de estudante, ela participa da gravação de audiolivros e do desenvolvimento de um leitor vietnamita para apoiar os cegos.
Essas experiências a inspiraram a desenvolver um software de leitura em vietnamita – o antecessor do Vbee. Em 2018, ela e o Sr. Ho Minh Duc – um colega de classe na Universidade de Ciência e Tecnologia de Hanói com experiência no projeto Socbay.com e na digitalização de audiolivros – fundaram o Vbee, pioneiro na área de conversão de texto em fala no Vietnã.
Conquistas notáveis da Vbee
- Primeiro prêmio do Qualcomm Vietnam Innovation Challenge 2024
- Prêmio Especial Tuoi Tre Start-up Award 2023
- Startup vencedora no programa acelerador Grab Venture Ignite 2020
- Primeiro prêmio do Talento Vietnamita 2018, segundo prêmio do Talento Vietnamita 2020
- Certificado de Tecnologia Essencial Vietnamita no Programa Nacional de Transformação Digital 2025-2030 do Ministério da Informação e Comunicações
- Projeto vencedor no Vietnam Digital Media Award 2018 e no Vingroup Fund 2019.
Visão regional
Depois de afirmar sua posição no mercado vietnamita, a Vbee pretende se expandir para o Sudeste Asiático com planos de levar sua tecnologia TTS para países como Laos, Tailândia, Camboja e Filipinas até 2026.
De acordo com o Dr. Nguyen Thi Thu Trang, o rápido avanço da tecnologia hoje com o surgimento de modelos multilíngues facilitará o desenvolvimento de ferramentas TTS para outros idiomas.
Atualmente, ela está pesquisando tecnologias de fala para tailandês, chinês e inglês, abrindo novos passos para a Vbee no mercado internacional.
Fonte: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm
Comentário (0)