No evento Artificial Intelligence Day 2023 com o tema "IA - redesenhando a realidade", que acontecerá nos dias 5 e 6 de dezembro, a VinAI Artificial Intelligence Research and Application Company ( Vingroup Corporation) anunciou um projeto de pesquisa de código aberto sobre um grande modelo de linguagem para o vietnamita, o PhoGPT.
O PhoGPT é um projeto de código aberto, em vez de um software proprietário como o ChatGPT da OpenAI. Por ser de código aberto, não há restrições comerciais; todas as partes podem usar o PhoGPT para desenvolver seus próprios aplicativos, incluindo unidades de aplicativos para fins comerciais. Isso significa que se trata de uma plataforma que fornece à comunidade aplicativos relacionados à tecnologia de IA no país.
De acordo com o Dr. Bui Hai Hung, Diretor Geral da VinAI Artificial Intelligence Research and Application Company, as limitações dos modelos vietnamitas demonstram que eles não alcançaram o desempenho ideal e carecem de código-fonte aberto. Portanto, uma das tarefas urgentes para a comunidade de IA em geral, e para a comunidade de processamento de linguagem natural (PLN) em particular, é construir um modelo novo e mais poderoso, capaz de processar a linguagem vietnamita com alta precisão e desempenho.
Especialistas em IA dizem que, com um modelo de linguagem de big data com 7,5 bilhões de parâmetros, construído na plataforma de decodificação Transformer, esse modelo é treinado do zero, usando as técnicas mais avançadas disponíveis, como o mecanismo Flash Attention, extrapolação de comprimento de contexto AliBi...
Essas técnicas não apenas ajudam o modelo a obter uma compreensão mais profunda do contexto, como também aprimoram as capacidades naturais de diálogo e interação do PhoGPT. Isso torna o modelo uma ferramenta versátil e multitarefa, capaz de atender a uma ampla gama de necessidades linguísticas dos usuários.
O Dr. Bui Hai Hung acrescentou que o PhoGPT foi desenvolvido pela empresa desde o início, independentemente de todos os outros modelos no mundo . Com o modelo de código aberto, a comunidade vietnamita pode utilizá-lo e aprimorá-lo ainda mais. Tornar o código-fonte do PhoGPT público e disponível aos usuários ajuda a criar um ambiente onde a comunidade de usuários pode desenvolver aplicativos personalizados e exclusivos.
Um dos objetivos do código aberto é estabelecer uma base para que as pessoas não precisem perder tempo refazendo, e as unidades possam desenvolver mais modelos de linguagem de grande porte, como o PhoGPT. Isso ajudará a sociedade a ter uma comunidade de código aberto de qualidade para modelos de linguagem de grande porte em vietnamita, criando um bom impacto para que muitas empresas possam participar e aplicá-los em determinadas áreas. Com o PhoGPT, a VinAI Artificial Intelligence Research and Application Company afirmou que terá um plano para pesquisar e desenvolver aplicativos para usuários individuais e um pacote de soluções de suporte especializado para empresas em vietnamita em áreas como saúde, educação, etc.
O PhoGPT lançou as primeiras bases para o desenvolvimento de modelos de idioma vietnamita de alto desempenho, como base para o desenvolvimento de aplicações práticas e eficazes, em linha com a estratégia de desenvolvimento de IA do governo até 2030.
BA TAN
Fonte
Comentário (0)