Interface do v7, teclado integrado com IA. Foto: NVCC . |
Em entrevista ao Znews , Tri Duc (nascido em 2003) falou sobre a ideia de aplicar inteligência artificial para mudar a forma como o vietnamita é digitado. A ferramenta de digitação v7, seu projeto de estudante, agora se tornou um artigo de pesquisa e foi aceito no IJCAI 2025, uma prestigiosa conferência sobre IA.
Apesar de popular há décadas, a digitação por Telex ou VNI ainda apresenta muitas limitações na experiência do usuário. Por isso, a v7 nasceu para se tornar uma ferramenta de previsão leve, ajudando a reduzir o tempo de digitação em vietnamita graças à integração com IA.
Paixão por línguas e tecnologia
Seu amor por línguas e tecnologia o levou a se formar em Inteligência Artificial Aplicada na Universidade de Tecnologia da Cidade de Ho Chi Minh.
Durante seus estudos, ele se envolveu em projetos como um modelo de linguagem de grande porte (LLM) para vietnamita, um software para tradução de línguas de minorias étnicas ou um chatbot para auxiliar no processo de admissão. "Essas experiências me ajudaram a acumular uma base sólida de conhecimento e a nutrir minha paixão e desejo de aplicar IA para criar produtos úteis para a comunidade", compartilhou.
Tri Duc quer agregar valor à aplicação da IA na vida. Foto: NVCC. |
Além disso, com formação em mandarim e cantonês, Duc percebeu a correlação entre pinyin/jyutping e a ortografia vietnamita. Esse fator também nos faz perceber que, em contraste com a complexidade dos hieróglifos, o sistema de digitação pinyin chinês precisa apenas digitar "yn" para obter o nome do nosso país em caracteres han. Já o Telex ou o VNI precisam de 10 teclas para obter a palavra "Vietnã".
Por meio de suas observações, Duc percebeu que, ao se comunicar rapidamente, os usuários frequentemente abreviam mantendo a primeira consoante, como "hs" para "estudante". "Se humanos conseguem entender facilmente esse estilo de escrita, a IA consegue entendê-lo completamente se treinada com os dados corretos", disse ele sobre as circunstâncias que deram origem à ideia.
Em vez de precisar escrever o caractere completo e depois adicionar acentos ao usar ferramentas de digitação tradicionais como Telex ou VNI, que seguem o mecanismo complementar, a versão 7 usa IA para sugerir a palavra que você deseja escrever. A tecnologia prevê com precisão a palavra completa com o menor número de teclas possível.
Na estrutura ortográfica vietnamita, uma palavra consiste em consoante inicial, rima e tom. Por exemplo, a palavra "Nguyen" é composta por "ng", "uyen" e um tom descendente. Com base nesse princípio, o mecanismo de digitação v7 foi desenvolvido para prever palavras completas com apenas consoante inicial e tom, o que ajuda a reduzir significativamente o número de pressionamentos de tecla, mantendo a precisão.
O desafio de ensinar vietnamita para IA
Segundo Duc, o maior desafio foi ensinar a IA a "entender" o vietnamita para servir como ferramenta de digitação. Ele testou diversos modelos antes de escolher o GPT-2 como base, com a arquitetura Transformers para uma boa compreensão do contexto e previsão precisa de palavras.
Após escolher a arquitetura subjacente, Duc substituiu completamente o Tokenizer (codificador de vocabulário) por um vocabulário vietnamita criado por ele mesmo. O engenheiro filtrou todas as palavras vietnamitas válidas e com grafia correta para garantir um processamento abrangente, prevendo qualquer palavra que o usuário queira escrever.
Outro desafio é equilibrar o desempenho preditivo e a velocidade de resposta, garantindo que o modelo possa ser executado em tempo real tanto em computadores quanto em celulares, mas ainda seja poderoso o suficiente para fazer as melhores previsões. Após dois meses de testes contínuos, a versão atual traz corretamente quase 70% das palavras digitadas pelos usuários para o topo, com uma latência de apenas 0,03 segundos.
Em relação ao método de entrada do teclado, de acordo com muitos estudos consultados por Duc, dos linguistas Cao Xuan Hao ou Henri Maspero, o vietnamita não possui apenas 6, mas 8 tons. Para aproveitar esse recurso, o v7 utiliza um sistema de 8 tons em vez dos 6 usuais (incluindo um tom bemol e 5 tons acentuados: sustenido, bemol, interrogativo, decrescente e pesado). Neste teclado, ao digitar "v7", o modelo sugerirá a palavra "Viet". Essa também é a ideia para o nome do produto.
Após compartilhar a versão 7 em suas redes sociais, Duc disse que ficou muito feliz e surpreso quando o modelo recebeu atenção, apoio e vontade de experimentar. "Isso me deu uma ideia clara da necessidade de uma ferramenta de digitação vietnamita mais inteligente e rápida", disse ele.
O grupo de autores do artigo de pesquisa científica . Da esquerda para a direita: Nhat Khang, Hieu Nghia e Tri Duc. Foto: NVCC. |
Atualmente, o teclado ainda está em fase de protótipo, com código-fonte aberto no GitHub para que programadores ou usuários de tecnologia testem e contribuam. Uma versão completa do aplicativo para Windows e macOS também está sendo desenvolvida para que usuários comuns possam instalá-lo e usá-lo facilmente.
No futuro, a principal prioridade da v7 é a versão com teclado para iPhone, para aprimorar a forma como o texto em vietnamita é inserido em smartphones. Além disso, a precisão do modelo será aprimorada com o treinamento intensivo em dados de conversas diárias, ajudando a IA a entender melhor contextos comuns.
A jornada de Duc contribuiu para um sopro de criatividade, acompanhando as tendências tecnológicas no contexto do Vietnã, que investe pesadamente em infraestrutura de IA. Um momento que o orgulha é quando o v7 criou pela primeira vez uma frase completa. "Foi quando um modelo pequeno, provavelmente com apenas 1/10.000 do tamanho do ChatGPT atual, ainda conseguia pensar como um humano", disse Duc.
Fonte: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
Comentário (0)