Vietnam.vn - Nền tảng quảng bá Việt Nam

Jovem engenheiro usa IA para mudar a forma como o vietnamita é digitado.

O teclado vietnamita com inteligência artificial integrada é um dos produtos que combina com sucesso criatividade e conhecimento especializado, visando trazer valor prático à comunidade.

ZNewsZNews14/05/2025


Interface do v7, teclado com inteligência artificial integrada. Foto: Fornecida pelo autor .

Em entrevista ao Tri Thức - Znews , Tri Duc (nascido em 2003) compartilhou sua ideia de aplicar inteligência artificial para mudar a forma como o vietnamita é digitado. Seu projeto de teclado v7 agora se transformou em um artigo científico e foi aceito na IJCAI 2025, uma prestigiosa conferência de IA.

Apesar de ser popular há décadas, o método de entrada Telex ou VNI ainda apresenta muitas limitações em termos de experiência do usuário. Portanto, o v7 foi criado para ser uma ferramenta de texto preditivo leve, que ajuda a reduzir o tempo de digitação em vietnamita graças à inteligência artificial integrada.

Uma paixão por línguas e tecnologia.

Sua paixão por idiomas e tecnologia levou Duc a se formar em Inteligência Artificial Aplicada na Universidade de Tecnologia da Cidade de Ho Chi Minh.

Durante seus estudos, ele trabalhou em projetos como modelagem de linguagem em larga escala (LLM) para vietnamita, software para tradução de línguas de minorias étnicas e chatbots para apoiar o recrutamento de estudantes. "Essas experiências me ajudaram a construir uma base sólida de conhecimento, nutrir minha paixão e alimentar meu desejo de aplicar IA para criar produtos que beneficiem a comunidade", compartilhou.

Imagem 1 de uma placa de madeira com IA integrada

A Tri Duc busca agregar valor à vida por meio da aplicação de IA. Foto: Fornecida pelo entrevistado.

Além disso, com sua formação em mandarim e cantonês, Duc reconheceu a correlação entre o pinyin/jyutping e a ortografia vietnamita. Isso também demonstra que, ao contrário da complexidade dos caracteres ideográficos, o método de entrada de pinyin chinês exige apenas a digitação de "yn" para produzir o nome do nosso país em caracteres chineses. Em contrapartida, o Telex ou o VNI exigem 10 teclas para produzir "Vietnã".

Por meio de suas observações, Duc percebeu que, em conversas rápidas, os usuários frequentemente abreviam, mantendo a consoante inicial, como "hs" para "estudante". "Se os humanos conseguem entender facilmente esse estilo de escrita, a IA certamente conseguirá entendê-lo se for treinada com os dados corretos", explicou ele sobre as circunstâncias que o levaram a ter essa ideia.

Em vez de digitar todos os caracteres e depois adicionar diacríticos, como nos métodos de entrada tradicionais como Telex ou VNI, que dependem de um mecanismo complementar, o v7 usa IA para sugerir as palavras que você deseja escrever. A tecnologia prevê com precisão a palavra completa com o mínimo de teclas possível.

Na ortografia vietnamita, uma palavra consiste em uma consoante inicial, uma vogal e um tom. Por exemplo, a palavra "Nguyễn" é composta por "ng", "uyên" e um tom descendente. Com base nesse princípio, o método de entrada v7 foi desenvolvido para prever a palavra completa usando apenas a consoante inicial e o tom, reduzindo significativamente o número de toques no teclado, mantendo a precisão.

O desafio de ensinar vietnamita para uma IA.

Segundo Duc, o maior desafio foi ensinar a IA a "entender" o vietnamita para usar esse método de entrada. Ele testou vários modelos antes de escolher o GPT-2 como base, cuja arquitetura Transformers oferece boa compreensão contextual e previsão de palavras precisa.

Após selecionar a arquitetura subjacente, Duc substituiu completamente o Tokenizador (codificador de vocabulário) por um conjunto de vocabulário vietnamita próprio. O engenheiro filtrou e incluiu todas as palavras vietnamitas válidas e com grafia correta para garantir recursos de processamento abrangentes e a capacidade de prever qualquer palavra que o usuário pretendesse escrever.

Outro desafio reside em equilibrar o desempenho preditivo e a velocidade de resposta, garantindo que o modelo possa ser executado em tempo real tanto em computadores quanto em celulares, mantendo-se suficientemente poderoso para fornecer as melhores previsões possíveis. Após dois meses de testes contínuos, a versão atual posiciona corretamente quase 70% das palavras digitadas pelos usuários no topo, com um atraso de apenas 0,03 segundos.

Em relação ao método de entrada do teclado, de acordo com diversos estudos consultados por Duc, dos linguistas Cao Xuan Hao e Henri Maspero, o vietnamita não possui apenas 6, mas até 8 tons. Para aproveitar essa característica, o v7 utiliza um sistema de 8 tons em vez dos usuais 6 (incluindo um tom neutro e 5 tons com acentos: agudo, grave, interrogativo, til e ponto baixo). Nesse teclado, ao digitar "v7", o modelo sugerirá a palavra "Viet". Essa é também a ideia por trás do nome do produto.

Após compartilhar a versão 7 em suas redes sociais, Duc disse estar muito feliz e surpreso com a atenção, o apoio e o desejo de experimentar o modelo. "Isso me deu uma clara noção da necessidade de um método de entrada de texto em vietnamita mais inteligente e rápido", afirmou.

Placa de madeira com IA integrada (imagem 2)

Os autores do artigo científico . Da esquerda para a direita: Nhat Khang, Hieu Nghia e Tri Duc. Foto: Fornecida pelo autor.

Atualmente, o método de entrada ainda está em fase de protótipo, com código aberto no GitHub para que programadores e usuários de tecnologia possam testar e contribuir. Uma versão completa do aplicativo para Windows e macOS também está sendo desenvolvida para usuários em geral, facilitando a instalação e o uso.

No futuro, a principal prioridade da versão 7 será a versão para teclado do iPhone, visando aprimorar a forma como o texto em vietnamita é digitado em smartphones. Além disso, a precisão do modelo será aprimorada por meio de treinamento adicional com dados de conversas do dia a dia, ajudando a IA a compreender melhor os contextos comuns.

A trajetória de Duc contribuiu para injetar uma onda de inovação, acompanhando as tendências tecnológicas no contexto do forte investimento do Vietnã em infraestrutura de IA. Um momento que o orgulha é quando a v7 criou sua primeira frase completa. "Foi quando um modelo pequeno, provavelmente apenas 1/10.000 do tamanho do ChatGPT atual, conseguiu pensar como um humano", disse Duc.

Fonte: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


Comentário (0)

Deixe um comentário para compartilhar seus sentimentos!

No mesmo tópico

Na mesma categoria

Do mesmo autor

Herança

Figura

Empresas

Atualidades

Sistema político

Local

Produto

Happy Vietnam
Capture imagens vibrantes.

Capture imagens vibrantes.

Pela segurança da pátria

Pela segurança da pátria

Dia da Paz

Dia da Paz