O produto rapidamente causou sensação na comunidade científica e tecnológica vietnamita.
Escolha o caminho mais difícil para resolver o problema vietnamita.
No final de 2022, o ChatGPT causou um grande impacto, dando início a uma corrida pela conquista da inteligência artificial entre países e gigantes do setor tecnológico. Naquela época, a comunidade tecnológica vietnamita também estava ansiosa para desenvolver produtos nacionais que se tornassem autossuficientes em tecnologia, reduzindo a dependência de produtos internacionais. No entanto, nem todas as empresas têm a capacidade e a determinação para concretizar esse desejo como a VinBigdata.
“A IA generativa é um problema complexo. Grandes empresas como a OpenAI ou o Google também precisam investir muitos recursos e tempo em pesquisa para conseguir criar produtos como os que vemos hoje. Esses produtos são excelentes, mas, na verdade, os cientistas ainda não compreendem completamente seu mecanismo de funcionamento. Quando ocorrem erros, e quais serão esses erros, poucos conseguem prever. Desenvolver um produto semelhante ao ChatGPT para o público vietnamita, em um curto período de menos de um ano, apresenta muitos desafios. Mas optamos por 'arriscar', porque se uma versão vietnamita do ChatGPT não for feita por vietnamitas, quem a fará?”, compartilhou o Professor Vu Ha Van, Diretor de Ciência da VinBigdata.
Na verdade, pouquíssimas empresas optam por construir seus próprios Modelos de Linguagem de Grande Porte do zero. Por exemplo, o GPT-3 da OpenAI possui 175 bilhões de parâmetros, foi treinado em um conjunto de dados de 45 terabytes e custou US$ 4,6 milhões. Segundo cálculos, o investimento para desenvolver o GPT-4 pode chegar a US$ 100 milhões. "Com números tão expressivos, é muito difícil encontrar uma empresa que possa arcar com o investimento nessa tecnologia", afirmou o Dr. Nguyen Kim Anh, Diretor de Produto da VinBigdata.
Para que as empresas vietnamitas tenham acesso à tecnologia de IA de nova geração, com custos e infraestrutura otimizados, a VinBigdata optou por uma abordagem completamente diferente: criar um modelo de linguagem com apenas 1,6 bilhão de parâmetros, mas com capacidades equivalentes a grandes modelos de linguagem com bilhões de parâmetros. "Os resultados mostram que, com a arquitetura desenvolvida pela própria VinBigdata, é totalmente possível otimizar e acelerar o processo de treinamento do modelo de linguagem, reduzir os custos de infraestrutura (incluindo custos de treinamento e de uso), e ainda garantir a qualidade do modelo", acrescentou o Dr. Nguyen Kim Anh.
Após resolver o problema do grande tamanho dos modelos de linguagem, durante o processo de "concepção" do ViGPT, e após pesquisar modelos externos, a equipe do VinBigdata também percebeu outro desafio, que é a "ilusão", proveniente da natureza inerente dos modelos de probabilidade estatística.
Consequentemente, os maiores modelos de linguagem do mundo são frequentemente treinados com dados em inglês. Portanto, esses modelos não compreendem e respondem corretamente ao contexto e à cultura do povo vietnamita. Isso leva a alucinações que fazem com que os grandes modelos de linguagem "fabricem" respostas incorretas.
Para encontrar a solução ideal no menor tempo possível, a equipe de Processamento de Linguagem Natural (PLN) da VinBigdata se divide em pequenos grupos, que analisam e discutem diferentes ideias para encontrar a direção final mais adequada.
“Finalmente, decidimos desenvolver uma arquitetura diferente da maioria dos grandes modelos de linguagem atuais e realizar o treinamento em um conjunto de dados vietnamitas refinado de 600 GB, para criar um “assistente virtual inteligente” que possa entender e dar respostas de acordo com o contexto do povo vietnamita”, acrescentou o Dr. Nguyen Kim Anh.
Aspiração por um ecossistema tecnológico vietnamita
De acordo com os resultados da avaliação dos Padrões de Proficiência em Língua Vietnamita (VMLU), o ViGPT alcançou uma pontuação média de 42,24%, ficando em segundo lugar, atrás apenas do ChatGPT (48,54%). Esse resultado permite que o ViGPT pesquise informações rapidamente e responda a perguntas sobre tópicos específicos do Vietnã.
Além das funcionalidades do assistente virtual, o objetivo da equipe de desenvolvimento é integrar o ViGPT a produtos familiares do dia a dia, gerando mudanças positivas na vida dos vietnamitas. Essa é a força motriz que motiva a equipe da VinBigdata a construir um ecossistema de produtos de linguagem e voz que utilizam o ViGPT — o ecossistema "Vi" inclui: ViChat, ViVoice e o assistente virtual ViVi. Esses produtos podem ser utilizados em diversos setores, desde a indústria automotiva, passando por bancos e finanças, seguros e transporte, entre muitos outros.
“Ao trabalhar com tecnologia, especialmente IA, não queremos apenas dominar sistemas interessantes, complexos e difíceis de visualizar. Queremos criar produtos tangíveis e altamente aplicáveis, onde a IA seja o agente direto que gera mudanças na vida das pessoas”, afirmou o Diretor de Produtos da VinBigdata.
Portanto, o desenvolvimento bem-sucedido do ViGPT é apenas o primeiro passo na jornada para levar tecnologia e dados "puramente vietnamitas" a serviço da vida de milhões de vietnamitas. Um representante da VinBigdata afirmou que essa unidade visa integrar o ViGPT à plataforma de inteligência artificial multicognitiva VinBase 2.0, a fim de fornecer soluções excepcionais para organizações e empresas de diversos portes e setores.
Antes do ViGPT, a equipe de especialistas e engenheiros da VinBigdata, especializada em tecnologia de processamento de linguagem e fala, deixou sua marca ao lançar o ViVi – o primeiro assistente virtual vietnamita completo (aplicado e implementado nos carros elétricos VinFast , nos aplicativos Vinhomes Resident e na plataforma de e-commerce Vinhomes Online), dominando, ao mesmo tempo, as tecnologias mais avançadas do mundo, como biometria de voz e clonagem de voz.
Todas essas tecnologias são desenvolvidas com base em um banco de dados de 3.500 terabytes, focado principalmente em dados específicos do Vietnã, coletados, analisados e aprimorados pela VinBigdata. O objetivo final é trazer a tecnologia global para a vida vietnamita, utilizando dados e sistemas de conhecimento locais.
| O ViGPT é a primeira "versão vietnamita do ChatGPT" para usuários finais, construída com base no modelo de linguagem abrangente (LLM) vietnamita desenvolvido pela VinBigdata. O ViGPT possui recursos excepcionais e foi projetado para atender da melhor forma às necessidades dos vietnamitas, como criação de conteúdo, busca de informações e respostas a perguntas frequentes com características do idioma vietnamita. Cadastre-se e experimente o ViGPT em: vigpt.vinbigdata.com |
Thanh Ha
Fonte






Comentário (0)