A VinBigdata anunciou em 21 de agosto o desenvolvimento bem-sucedido de um modelo de linguagem inclusiva para vietnamita, criando uma base para o domínio da tecnologia generativa de IA.
Os Modelos de Linguagem de Grande Porte (LLMs, na sigla em inglês) são modelos treinados usando técnicas de aprendizado profundo em conjuntos de dados massivos de texto ou imagens. Esses modelos são capazes de compreender conhecimento, gerar texto de forma independente e executar diversas tarefas de processamento de linguagem natural. Eles são considerados essenciais para o desenvolvimento da tecnologia de IA generativa – capaz de criar novos conteúdos e ideias em várias formas (texto, imagens, áudio, etc.).
Com o desenvolvimento bem-sucedido de um modelo de linguagem vietnamita em larga escala, a VinBigdata integrará tecnologia para tornar o VinBase (uma plataforma abrangente de inteligência artificial multicognitiva) a principal plataforma de geração de IA no Vietnã, além de fornecer soluções desenvolvidas com essa tecnologia, como chatbots de IA generativa, callbots e o assistente virtual ViVi de última geração. Essa tecnologia aprimora a naturalidade da comunicação com máquinas e ajuda os usuários a pesquisar e sintetizar informações com mais rapidez e facilidade do que antes.
Professor Vu Ha Van - Diretor Científico da empresa VinBigdata. Foto: VinBigdata
O professor Vu Ha Van, diretor científico da VinBigdata, afirmou que diversas grandes corporações ao redor do mundo já pesquisaram e lançaram com sucesso produtos baseados em modelos de linguagem de grande escala, como o ChatGPT da OpenAI e o Bard do Google. No Vietnã, a VinBigdata está sendo desenvolvida pela Vingroup para criar um modelo de linguagem de grande escala para o vietnamita. Segundo o professor Van, esse modelo tem como foco a solução de três problemas principais: melhorar a precisão, reduzir os custos de infraestrutura e garantir a segurança.
"Em vez de precisar de cerca de 175 bilhões de parâmetros como o ChatGPT, o VinBigdata pode criar um modelo de linguagem em larga escala com alguns bilhões de parâmetros, sendo capaz de gerar textos altamente autênticos, com foco em dados e conhecimento vietnamitas", disse o líder da unidade.
Dominar a tecnologia, desenvolver do zero e construir um modelo de língua vietnamita em larga escala são considerados passos cruciais para a VinBigdata na integração da tecnologia de geração de IA em seu ecossistema de produtos e serviços no mercado. Atualmente, a empresa está aplicando essa nova tecnologia à sua linha de produtos VinBase KB (Portal de Base de Conhecimento VinBase). Este produto é capaz de recuperar informações e gerar respostas automaticamente com base em dados coletados de conjuntos de dados massivos em sua base de conhecimento.
Representantes da VinBigdata compartilharam essas informações no evento de lançamento da geração de IA. Foto: VinBigdata
A Vingroup deverá lançar duas linhas de produtos principais em dezembro: o VinBase 2.0 e o aplicativo ViGPT. O VinBase 2.0 é uma plataforma de IA que gera respostas multicognitivas com soluções para empresas e órgãos governamentais . Já o aplicativo ViGPT, apresentado pela empresa como "a versão vietnamita do ChatGPT", estará disponível para acesso e testes pela comunidade. Com o ViGPT, os usuários poderão fazer e responder perguntas sobre informações específicas do Vietnã (regulamentos, documentos legais) ou informações locais (história, literatura, pontos turísticos, especialidades locais).
A VinBigdata Joint Stock Company possui um sistema de banco de dados com capacidade de até 3.500 terabytes. O sistema contém centenas de milhares de horas de dados de voz, imagens e informações que foram limpas, processadas, classificadas e utilizadas para treinamento de IA e infraestrutura de P&D. Essa infraestrutura inclui dezenas de clusters de servidores Nvidia DGX A100. A empresa também conta com uma equipe de professores, cientistas e especialistas em tecnologia vietnamitas de todo o mundo.
Hoai Phuong
Link da fonte






