A explosão da inteligência artificial generativa (IA generativa) mudou completamente o panorama tecnológico global.
Desde que a OpenAI lançou o ChatGPT no final de 2022, uma série de modelos LLM semelhantes têm surgido continuamente, aplicados em diversas áreas como saúde, educação , finanças, direito... A corrida tornou-se acirrada, não apenas em escala empresarial, mas também em escala nacional em termos de capacidade de treinamento, infraestrutura computacional e dados.
Grandes empresas como OpenAI, Google, Meta ou Microsoft, com potencial financeiro e condições favoráveis, investiram "rapidamente" bilhões de dólares para adquirir milhares de GPUs de ponta, como a Nvidia H100 — o fator essencial para o treinamento de modelos LLM. O preço das ações da Nvidia disparou nesse período, refletindo a demanda mundial por infraestrutura.
Enquanto isso, as empresas de tecnologia em países em desenvolvimento, além das questões de custo, também enfrentam restrições à importação e exportação de equipamentos de chips de IA dos EUA. Isso leva à falta de equipamentos de treinamento e a um desempenho "mais lento" em comparação com as gigantes da tecnologia. Com aspirações voltadas para o mercado interno, a Zalo não é exceção.
Em termos de dados, os problemas anteriores de aprendizado de máquina exigiam grandes quantidades de dados de treinamento, mas para grandes modelos de linguagem, essa quantidade é enorme. Para se ter um modelo suficientemente bom, o sistema LLM requer dezenas ou mesmo centenas de bilhões de tokens de texto de entrada. Enquanto isso, em termos de popularidade, o vietnamita não está no mesmo nível que o inglês e o chinês. Isso multiplicou a dificuldade para os desenvolvedores de LLM vietnamitas.
Em 2023, os grandes modelos de linguagem (LLM, na sigla em inglês), como o GPT-3.5 e o GPT-4, revolucionaram o mundo da tecnologia, e muitas empresas vietnamitas também optaram por modelos estrangeiros otimizados para agilizar e sair na frente no processo de treinamento de LLM.
A Zalo escolheu um caminho diferente – mais árduo, porém mais autônomo: o autotreinamento do modelo do zero (modelo criado do zero). Um caminho que exige que tudo seja construído do zero – dos dados à arquitetura do modelo, passando por todo o processo de treinamento. Essa decisão não visava competir com os gigantes, mas sim realizar a aspiração do povo vietnamita: dominar o modelo LLM em sua língua materna.
“Previmos as dificuldades e mesmo assim decidimos entrar no jogo cedo. Não competimos diretamente com os grandes, mas escolhemos um nicho de mercado onde poderíamos ter um desempenho melhor. Nossa aspiração é construir um modelo que os vietnamitas controlem completamente – dos dados aos algoritmos”, compartilhou o Dr. Nguyen Truong Son, Diretor de Ciência da Zalo AI.
Apesar de enfrentarem muitos obstáculos em três fatores principais – infraestrutura, dados e nível de treinamento –, os engenheiros vietnamitas encontraram soluções proativas para superar as dificuldades. Isso demonstra o espírito e a força de vontade do povo vietnamita em circunstâncias adversas, especialmente neste caso, ao vencer os desafios no processo de desenvolvimento do mestrado em Direito (LLM) para os vietnamitas.
Para treinar engenheiros de nível básico (LLM), era necessária a infraestrutura adequada. Mas, naquela época, GPUs como a H100 da Nvidia eram quase "raridades globais". Enquanto isso, grandes empresas as encomendavam com um ano de antecedência e pagavam milhões de dólares para adquiri-las. No Vietnã, a Zalo também tentou comprar 8 servidores DGX H100, mas não foi fácil, pois era preciso esperar por cada lote de entregas do fabricante.
Na ausência de GPUs da Nvidia, os engenheiros vietnamitas tiveram que usar GPUs de consumo de forma flexível para experimentar em cada linha de código e executar cada pequeno modelo. Em vez de esperar, os engenheiros se prepararam proativamente para que, quando tivessem equipamentos modernos, tudo estivesse pronto.
Em termos de dados, em vez de depender dos recursos disponíveis, a Zalo investiu na construção de um banco de dados de alta qualidade específico para o idioma vietnamita, para compensar a grave escassez em comparação com o inglês e o chinês.
Graças à sua estratégia de desenvolvimento flexível, a Zalo conseguiu reduzir o tempo de desenvolvimento do seu modelo de linguagem de grande escala de 18 meses para 6 meses. No final de 2023, o modelo de linguagem de grande escala para vietnamita da Zalo foi lançado oficialmente em um evento que reuniu a principal comunidade de tecnologia e IA do Vietnã: o Zalo AI Summit. Nesse evento, o modelo da Zalo fez sua estreia no desafio Kahoot proposto pela Tinhte.vn e, surpreendentemente, superou o GPT 3.5, ficando atrás apenas do GPT4, o modelo de linguagem de grande escala considerado o mais poderoso do mundo na época.
Com base na plataforma de avaliação VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models), o modelo da Zalo é 1,5 vezes mais poderoso que o GPT-3.5 da OpenAI. Até o final de 2024, este modelo ultrapassará grandes nomes como GPT-4 (OpenAI), Gemma-2-9B (Google) ou Phi-3-small (Microsoft), ficando atrás apenas do LLaMA-3-70B da Meta em termos de capacidade de processamento de vietnamita no ranking do VMLU.
A Zalo não se limita à pesquisa; ela está gradualmente levando a tecnologia do laboratório à vida, comercializando e popularizando produtos de aplicação da LLM.
No início de 2025, o assistente geral de perguntas e respostas Kiki Info — que funcionava como uma conta oficial na plataforma Zalo — atraiu mais de 1 milhão de usuários em menos de 2 meses. Outro aplicativo, o Thiep AI, também alcançou o número impressionante de 15 milhões de cartões criados e enviados em apenas 2 meses.
A trajetória da Zalo não se resume a uma empresa que deseja desenvolver tecnologia. Ela faz parte de um contexto maior, no qual o Vietnã promove agressivamente a inovação, impulsionada por políticas da Resolução 57-NQ/TW sobre desenvolvimento científico e tecnológico e transformação digital nacional. Em particular, a área de inteligência artificial recebe ênfase.
O surgimento e o rápido desenvolvimento do LLM vietnamita da Zalo não são apenas um avanço tecnológico para a empresa, mas também uma prova da capacidade inerente e da perseverança da equipe de tecnologia vietnamita.
Com a técnica "do zero" — treinando modelos a partir do zero —, a Zalo escolheu o caminho mais longo, mas ajudou o Vietnã a dominar verdadeiramente a IA. Não apenas em termos de resultados, mas também em todo o processo, desde a arquitetura do modelo, dados e algoritmos até os produtos de aplicação. O sucesso da Zalo também ajudou o Vietnã a se tornar um dos poucos países do Sudeste Asiático a possuir um modelo de aprendizado de máquina nacional — um marco estratégico no contexto da crescente competição tecnológica global.
Na longa jornada que se avizinha, a Zalo não se limitará a um único modelo ou a alguns poucos produtos, mas continuará a aperfeiçoar o modelo para servir os usuários e criar uma plataforma de IA vietnamita com qualidade competitiva: “A jornada de desenvolvimento de IA da Zalo ainda é longa. Continuaremos a otimizar o modelo em amplitude e profundidade, promovendo a aplicação prática. O objetivo final é criar produtos de IA de qualidade que atendam de forma prática ao povo vietnamita”, acrescentou o Sr. Son.
O desenvolvimento bem-sucedido do LLM vietnamita pela Zalo não é apenas um marco para os negócios, mas também abre um futuro promissor para a inteligência artificial no Vietnã. A perseverança e a aspiração do povo vietnamita conduziram a essa jornada rumo a resultados tão expressivos. O futuro da IA no Vietnã não terá apenas uma "Zalo", mas também uma geração de engenheiros corajosos que seguirão seus passos, herdarão conhecimento e conquistarão o mundo da tecnologia.
Fonte: https://znews.vn/zalo-va-hanh-trinh-lam-chu-llm-tieng-viet-post1561765.html






Comentário (0)