A VinBigdata anunciou a construção bem-sucedida de um grande modelo de idioma vietnamita em 21 de agosto, criando uma base para o domínio da tecnologia de IA generativa.
Grandes Modelos de Linguagem (LLMs) são modelos treinados usando técnicas de aprendizado profundo em grandes conjuntos de dados de texto ou imagem. Esses modelos são capazes de compreender conhecimento, gerar texto e executar diversas tarefas de processamento de linguagem natural. Eles são considerados a chave para o desenvolvimento da tecnologia de IA Generativa – capaz de gerar novos conteúdos e ideias em diversos formatos (texto, imagens, áudio, etc.).
Com a construção bem-sucedida de um grande modelo de idioma vietnamita, a VinBigdata integrará tecnologia para tornar a VinBase (uma plataforma abrangente de inteligência artificial multicognitiva) uma plataforma de IA generativa no Vietnã, ao mesmo tempo em que fornece soluções de desenvolvimento baseadas nessa tecnologia, como chatbot de IA generativa, callbot ou assistente virtual ViVi de nova geração... Essa tecnologia ajuda a aumentar a naturalidade da comunicação da máquina, ao mesmo tempo em que oferece suporte aos usuários para pesquisar e sintetizar informações de forma mais rápida e simples do que antes.
Professor Vu Ha Van - Diretor Científico da VinBigdata. Foto: VinBigdata
O Professor Vu Ha Van, Diretor de Ciência da VinBigdata, afirmou que, no mundo, diversas grandes corporações pesquisaram e lançaram com sucesso produtos baseados em grandes modelos de linguagem, como o OpenAI com ChatGPT ou o Google com Bard. No Vietnã, a VinBigdata recebeu investimentos do Vingroup para desenvolver um grande modelo de linguagem vietnamita. Segundo o Sr. Van, esse modelo se concentra na solução de três problemas principais: melhorar a precisão, reduzir os custos de infraestrutura e garantir a segurança.
"Em vez de precisar de cerca de 175 bilhões de parâmetros como o ChatGPT, o VinBigdata pode criar um grande modelo de linguagem com vários bilhões de parâmetros, mas ainda tem a capacidade de gerar documentos altamente autênticos, com foco em dados e conhecimento vietnamitas", disse o líder da unidade.
O domínio da tecnologia, o autodesenvolvimento desde os primeiros passos e a construção de um amplo modelo de língua vietnamita são considerados um passo à frente para ajudar a VinBigdata a incorporar a tecnologia de IA generativa ao ecossistema de produtos e serviços do mercado. Atualmente, a empresa aplicou inicialmente a nova tecnologia na linha de produtos VinBase KB (Portal da Base de Conhecimento VinBase). O produto tem a capacidade de recuperar informações e gerar respostas automaticamente com base em informações coletadas de conjuntos de dados extremamente grandes no sistema de conhecimento.
Representante da VinBigdata compartilhou no evento o anúncio da IA Generativa. Foto: VinBigdata
A previsão é que, em dezembro deste ano, os membros do Vingroup lancem duas linhas principais de produtos: VinBase 2.0 e o aplicativo ViGPT. O VinBase 2.0 é uma plataforma de IA que cria múltiplas percepções com soluções para empresas e órgãos governamentais . O aplicativo ViGPT é apresentado pela empresa como a "versão vietnamita do ChatGPT", aberto para acesso e teste pela comunidade. Com o ViGPT, os usuários podem fazer e responder perguntas sobre informações específicas sobre o Vietnã (regulamentos, documentos legais) ou informações locais (história, literatura, pontos turísticos, especialidades locais).
A VinBigdata Joint Stock Company possui um sistema de banco de dados de até 3.500 terabytes. O sistema possui centenas de milhares de horas de dados de voz, imagens e informações que são limpos, processados, classificados e utilizados para treinamento em IA, juntamente com uma infraestrutura de P&D. Essa infraestrutura inclui dezenas de clusters de servidores NvidiaDGX A100. A empresa também conta com uma equipe de professores, cientistas e especialistas em tecnologia vietnamitas de todo o mundo.
Hoai Phuong
Link da fonte
Comentário (0)