Ao sair dos EUA para voltar para casa, Nguyen Hoang Quan e seus colegas da VILM desenvolveram um sistema de inteligência artificial (IA) gratuito para uso dos vietnamitas na área de atendimento ao cliente, com mais de 100.000 downloads por mês.
Em junho de 2023, Nguyen Hoang Quan, de 25 anos, e seus colegas Pham Nhut Huy, de 23 anos, engenheiro de inteligência artificial da ZaloAI, e Dao Minh Dung, de 24 anos, estudante de doutorado na Universidade de Cork, na Irlanda, cofundaram a organização sem fins lucrativos VILM, com o objetivo de ajudar os vietnamitas a experimentar a tecnologia de IA mais avançada da maneira mais otimizada possível.
Após quase seis meses de pesquisa e aplicação, a equipe desenvolveu com sucesso três modelos de IA gratuitos: OpenHermes, VinaLlama e Vistral. Esses modelos são fundamentais para o desenvolvimento de sistemas de IA capazes de compreender e agir de acordo com os desejos do usuário (Modelo de Ação Ampla). Eles podem ser aplicados em áreas tecnológicas como controle de máquinas, robôs para auxiliar pessoas com deficiência a melhorarem seu suporte sem a necessidade de cuidadores, ou para ajudar programadores a corrigir erros, além de assistentes virtuais para atender clientes ou responder a perguntas gratuitamente.
O OpenHermes alcança 85.000 downloads por mês, figurando entre os 10 modelos de linguagem mais baixados no HuggingFace ( o maior site de compartilhamento de modelos de IA do mundo ). Captura de tela
O modelo OpenHermes é um modelo de linguagem abrangente que suporta inglês, assim como o ChatGPT, mas com pontuações superiores. Ele permite que os usuários baixem o modelo para seus computadores pessoais e o utilizem offline. Notavelmente, os dados de treinamento do OpenHermes representam apenas 1/100 dos dados de treinamento do ChatGPT da OpenAI. Atualmente, este aplicativo recebe mais de 50.000 downloads por mês. O OpenHermes-2.5 e o OpenHermes-2.5-Vision estão sendo utilizados por mais de 40 startups no Vale do Silício (EUA).
VinaLlama e Vistral são dois modelos de linguagem focados em atender o mercado vietnamita, com o objetivo de ajudar os usuários locais a experimentar a tecnologia de IA mais avançada com mais facilidade.
Hoang Quan passou 7 anos estudando nos EUA e trabalhou na OpenAI como engenheiro de pesquisa no modelo de inteligência artificial ChatGPT, mesmo sem ter se formado na universidade. Em 2022, trabalhou como engenheiro de dados para o produto Bing Chat da Microsoft e da OpenAI, ganhando milhares de dólares. Em 2023, diante de uma onda de demissões no setor de tecnologia nos EUA, Quan percebeu que o mercado de trabalho para recém-formados era muito desanimador, mas, ao enxergar oportunidades no Vietnã, decidiu voltar para casa.
Nguyen Hoang Quan. Foto: NVCC
Na VILM, Quan é o engenheiro-chefe responsável pela pesquisa de técnicas de aprimoramento de dados, bem como pelo treinamento de IA. Já Nhut Huy assume o papel de pesquisador técnico em treinamento de IA, enquanto Minh Dung propõe novos métodos em pesquisa teórica.
Quan explicou que os atuais modelos de linguagem de grande porte, como o ChatGPT (Large Language Model), só conseguem fornecer saída de texto, enquanto os humanos têm muitas maneiras de se comunicar e adquirir conhecimento. É por isso que a equipe pretende criar um sistema que possa operar de forma flexível entre diferentes tipos de entrada e saída (que possa receber e gerar dados como linguagem, imagens, vídeos e sons), e não se limitar ao nível da linguagem.
Para atingir o objetivo de criar Modelos de Ação de Grande Porte, a equipe teve que superar dois problemas: segurança e velocidade. Os aplicativos de IA atuais geralmente usam dados do usuário e os enviam para servidores de empresas como a OpenAI para processamento, o que levanta preocupações de segurança. A equipe se concentrou em criar modelos de IA pequenos e rápidos o suficiente para serem processados diretamente em dispositivos móveis, equilibrando desempenho e velocidade para não afetar a experiência do usuário.
A equipe experimental utilizou dados gerados por IA para treinar a própria IA, em vez de usar dados de fontes reais. Inicialmente, tiveram dificuldade em encontrar recursos computacionais (computadores para treinar a IA), mas posteriormente convenceram grandes empresas e laboratórios do mundo todo a patrocinar o projeto.
Quan afirmou que o principal objetivo da criação desses produtos é ajudar as pessoas a acessar aplicativos de IA de forma rápida e com qualidade equivalente à do ChatGPT ou do Bing Chat, além de simplificar a pesquisa e a criação de modelos de IA no futuro. Em vez de usar o ChatGPT, que é limitado ao idioma e à cultura vietnamita, as empresas vietnamitas podem baixar o VinaLlama em vietnamita.
O modelo de linguagem VinaLlama resolve facilmente um problema matemático em vietnamita. A imagem mostra uma demonstração do produto VinaLlama resolvendo um problema matemático. Captura de tela.
O Sr. Dang Hai Loc, fundador da plataforma de criação de chatbots de IA Mindmaid, afirmou que, da perspectiva de um desenvolvedor de aplicações de IA, percebeu que o custo e a privacidade dos dados são as duas questões que mais preocupam as empresas ao implementar aplicações de IA. A solução mais satisfatória para esse problema são os modelos LLM de código aberto, que podem ser executados na infraestrutura da empresa e aprender (ajustar) mais com os dados próprios da empresa. Portanto, modelos LLM de código aberto vietnamitas, como VinaLlama e Vistral, são muito valiosos para promover aplicações de IA no Vietnã.
"Esses modelos de código aberto também permitem que mais programadores e entusiastas de tecnologia acessem a área de Engenharia de IA com apenas um MacBook, em vez de terem que investir em infraestrutura cara de GPU (placa gráfica). Isso também promoverá a força de trabalho de Engenheiros de IA no Vietnã, uma função que terá alta demanda em um futuro próximo", disse o Sr. Loc.
Segundo Quan, os vietnamitas possuem uma base sólida em teoria científica , são proficientes em IA e a ChatGPT também conta com recursos humanos dedicados à pesquisa, porém, encontram dificuldades para acompanhar rapidamente o ritmo acelerado das mudanças tecnológicas. "O que os vietnamitas precisam é de experiência na criação de produtos para usuários finais, para que possam realmente compreender os problemas que enfrentam e, assim, direcionar suas pesquisas adequadamente", afirmou Quan sobre a razão de pesquisar modelos de IA gratuitos para apoiar a comunidade tecnológica vietnamita. Ele acrescentou que já colaborou com diversos grupos internacionais e está sempre disposto a colaborar com grupos de pesquisa no Vietnã.
Nhu Quynh
Link da fonte










Comentário (0)