Ao deixar os EUA para retornar ao país, Nguyen Hoang Quan e seus colegas da VILM desenvolveram um sistema gratuito de inteligência artificial (IA) para uso do povo vietnamita em áreas de atendimento ao cliente, com mais de centenas de milhares de downloads por mês.
Em junho de 2023, Nguyen Hoang Quan, 25 anos, e seus colegas Pham Nhut Huy, 23 anos, engenheiro de inteligência artificial na ZaloAI, e Dao Minh Dung, 24 anos, estudante de doutorado na Universidade de Cork, Irlanda, cofundaram a organização sem fins lucrativos VILM, com o desejo de ajudar os vietnamitas a experimentar a tecnologia de IA mais avançada da maneira mais otimizada.
Após quase 6 meses de pesquisa e aplicação, a equipe desenvolveu com sucesso três modelos de IA gratuitos, incluindo OpenHermes, VinaLlama e Vistral. Estes são os estudos fundamentais para o desenvolvimento de sistemas de IA que podem compreender e agir de acordo com as intenções do usuário (Modelo de Ação Ampla). Esses modelos são aplicados em áreas tecnológicas como controle de máquinas, robôs para ajudar a apoiar melhor pessoas com deficiência sem cuidadores, ou ajudar programadores a corrigir erros, assistentes virtuais para cuidar de clientes ou fazer perguntas gratuitamente.
O OpenHermes atinge 85.000 downloads por mês, ficando entre os 10 modelos de linguagem mais baixados no HuggingFace ( o maior site de compartilhamento de modelos de IA do mundo ). Captura de tela
O modelo OpenHermes é um modelo de linguagem abrangente que suporta inglês, assim como o ChatGPT, mas com pontuações superiores. Ele permite que os usuários baixem o modelo para seus computadores pessoais para uso sem internet. Notavelmente, a quantidade de dados de treinamento do OpenHermes é de apenas 1/100 dos dados de treinamento do ChatGPT da OpenAI. Atualmente, este aplicativo recebe mais de 50.000 downloads por mês. O OpenHermes-2.5 e o OpenHermes-2.5-Vision estão sendo usados por mais de 40 startups no Vale do Silício (EUA).
VinaLlama e Vistral são dois modelos de linguagem focados em atender o mercado vietnamita, com o objetivo de ajudar usuários domésticos a experimentar a tecnologia de IA mais avançada com mais facilidade.
Hoang Quan passou 7 anos estudando nos EUA e trabalhou na OpenAI como engenheiro de pesquisa para o modelo de inteligência artificial ChatGPT, apesar de não ter se formado na universidade. Em 2022, trabalhou como engenheiro de dados para a Microsoft e para o produto Bing Chat da OpenAI, ganhando milhares de dólares. Em 2023, diante de uma onda de demissões no setor de tecnologia nos EUA, Quan percebeu que o mercado de trabalho pós-graduação era muito desanimador, mas, ao ver oportunidades no Vietnã, decidiu voltar para casa.
Nguyen Hoang Quan. Foto: NVCC
Na VILM, Quan é o engenheiro-chefe responsável pela pesquisa de técnicas de aprimoramento de dados e treinamento em IA. Enquanto Nhut Huy assume a função de pesquisa técnica em treinamento em IA, Minh Dung propõe novos métodos em pesquisa teórica.
Quan explicou que os atuais modelos de linguagem de grande porte, como o ChatGPT (Large Language Model), só conseguem fornecer saída de texto, enquanto os humanos têm muitas maneiras de se comunicar e adquirir conhecimento. É por isso que a equipe pretende criar um sistema que possa operar de forma flexível entre diferentes tipos de entrada e saída (que possa receber e enviar diferentes tipos de dados, como linguagem, imagens, vídeos e sons), e não se limitar apenas ao nível da linguagem.
Para atingir o objetivo de criar Modelos de Ação de Grande Porte, a equipe teve que superar dois problemas: segurança e velocidade. Os aplicativos de IA atuais utilizam principalmente dados do usuário e os enviam para servidores de empresas como a OpenAI para processamento, o que levanta preocupações com a segurança. A equipe se concentrou em criar modelos de IA que fossem pequenos e rápidos o suficiente para serem processados diretamente em dispositivos móveis, equilibrando desempenho e velocidade para não afetar a experiência do usuário.
A equipe experimental utilizou dados gerados pela IA para treinar a própria IA, em vez de optar por usar dados de fontes reais. Inicialmente, eles tiveram dificuldade em encontrar recursos computacionais (computadores para treinar a IA), mas posteriormente convenceram grandes empresas e laboratórios ao redor do mundo a patrocinarem.
Quan afirmou que o principal objetivo da criação desses produtos é ajudar as pessoas a acessar aplicativos de IA de forma rápida e com qualidade não inferior à do ChatGPT ou do Bing Chat, além de simplificar a pesquisa e a criação de modelos de IA no futuro. Em vez de usar o ChatGPT, que é limitado na língua e cultura vietnamitas, as empresas vietnamitas podem baixar o VinaLlama em vietnamita.
O modelo de linguagem VinaLlama resolve facilmente um problema matemático em vietnamita. Na imagem, uma demonstração do produto VinaLlama na resolução de problemas matemáticos. Captura de tela.
O Sr. Dang Hai Loc, fundador da plataforma de construção de chatbots de IA Mindmaid, afirmou que, da perspectiva de um desenvolvedor de aplicativos de IA, percebeu que custo e privacidade de dados são as duas questões com as quais as empresas mais se preocupam ao implementar aplicativos de IA. A solução mais satisfatória para esse problema são os modelos de LLM de código aberto, que podem ser executados na infraestrutura da empresa e podem aprender (ajustar) mais dados da própria empresa. Portanto, modelos de LLM de código aberto vietnamitas, como VinaLlama, Vistral..., são muito valiosos para promover aplicativos de IA no Vietnã.
"Esses modelos de código aberto também permitem que mais programadores e entusiastas de tecnologia acessem a área de Engenharia de IA com apenas um MacBook, em vez de precisar investir em uma infraestrutura cara de GPU (placa de vídeo). Isso também impulsionará a força de trabalho de Engenharia de IA no Vietnã, uma função com alta demanda no futuro próximo", disse o Sr. Loc.
Segundo Quan, os vietnamitas têm uma base muito boa em teoria científica , são bons em IA e o ChatGPT também conta com recursos humanos envolvidos em pesquisas, mas têm mais dificuldade em acompanhar rapidamente a onda tecnológica em constante mudança. "O que os vietnamitas precisam é de experiência na criação de produtos para que os usuários finais entendam verdadeiramente os problemas que enfrentam, a fim de orientar adequadamente suas pesquisas", disse Quan sobre o motivo da pesquisa de modelos de IA gratuitos para apoiar os vietnamitas em tecnologia. Ele afirmou ter cooperado com diversos grupos internacionais e estar sempre pronto para cooperar com grupos de pesquisa no Vietnã.
Nhu Quynh
Link da fonte
Comentário (0)