Tendo trabalhado para uma grande organização de inteligência artificial nos EUA, por que você decidiu retornar ao Vietnã para se juntar à VinBigdata?
Durante meu trabalho nos EUA, embora tenha participado de muitos grandes projetos governamentais , os resultados que obtive frequentemente representavam apenas algumas etapas de um processo muito maior. Muitas vezes, devido ao rigoroso sigilo dos projetos, eu sequer sabia como as soluções que desenvolvi estavam sendo utilizadas.
Em 2017, quando retornei ao Vietnã, o país estava em fase de desenvolvimento e havia muitos problemas relacionados a big data e inteligência artificial que precisavam ser resolvidos. Aceitei o convite do Professor Vu Ha Van para, em conjunto, desenvolvermos soluções tecnológicas vietnamitas que melhorassem a vida da população. Considero meu retorno ao Vietnã muito mais significativo, pois me permitiria trabalhar em problemas de maior impacto.
Dr. Dao Duc Minh em um workshop
Na estratégia de desenvolvimento da inteligência artificial, qual o papel e a influência que o big data desempenha, senhor?
Os dados desempenham um papel fundamental e valioso no treinamento da inteligência artificial. O treinamento de um modelo de inteligência artificial de alta qualidade geralmente começa com o treinamento de um grande banco de dados. Portanto, para termos inteligência artificial de qualidade, precisamos primeiro de bons dados.
Dados de qualidade devem atender a padrões de quantidade e escala, qualidade, variedade e universalidade. O processo de coleta e processamento de milhares de horas de dados, desde a limpeza dos dados brutos até a criação de dados da mais alta qualidade para alimentar modelos de inteligência artificial, é muito caro e complexo. Em contrapartida, para analisar big data, precisamos usar inteligência artificial para garantir a capacidade de processar dados com precisão em larga escala, gerando assim melhores resultados decisórios ou preditivos.
Por exemplo, no processo de desenvolvimento de um produto de assistente virtual para vietnamitas (ViVi), tivemos que coletar e processar dezenas de milhares de horas de dados de áudio de alta qualidade, provenientes de centenas de milhares de vozes de diferentes regiões, idades e gêneros, com conteúdo abrangendo centenas de áreas...
Ou, mais recentemente, o lançamento do ViGPT – "A primeira versão vietnamita do ChatGPT para usuários finais", desenvolvido a partir de um Modelo de Linguagem Amplo totalmente pertencente à VinBigdata. Este modelo foi treinado com base em 600 GB de dados vietnamitas refinados, provenientes de diversas áreas. Com nosso conhecimento de dados e da língua vietnamita, encontramos uma nova abordagem para reduzir o tempo de lançamento do ViGPT para apenas 9 meses após o surgimento do ChatGPT.
Essa é a sinergia entre big data e inteligência artificial.
Qual a sua opinião sobre como vincular a pesquisa ao valor prático para servir à comunidade?
Acredito que a pesquisa tecnológica só é verdadeiramente bem-sucedida quando de fato entra na vida das pessoas, resolve problemas sociais e melhora a vida delas.
Para criar produtos comerciais práticos que resolvam problemas empresariais e sociais, devemos sempre estar atentos e questionar: que valor os dados trarão para a vida real?
Até o momento, pesquisamos e desenvolvemos uma variedade de produtos e soluções para diversos setores e áreas, como o ViGPT, o VinDr (que oferece soluções de IA para diagnóstico por imagem médica ), o VinBase (uma plataforma de inteligência artificial biológica) e o Vizone (um conjunto de soluções inteligentes para análise de imagens).
Com membros importantes da equipe da VinBigdata em um evento da Vingroup Corporation.
A quarta revolução industrial está ocorrendo fortemente em escala global. Quais vantagens você acha que o Vietnã possui?
Em comparação com revoluções anteriores, acredito que o Vietnã possui atualmente muitas vantagens para se destacar nesta revolução industrial 4.0, contribuindo para melhorar a posição do país no cenário mundial. As duas chaves para alcançar esse objetivo são dados e pessoas.
O Vietnã tem atualmente quase 100 milhões de habitantes, dos quais uma alta proporção de jovens utiliza telefones celulares e computadores pessoais. Além disso, contamos com especialistas renomados em inteligência artificial e jovens profissionais qualificados na área de tecnologia da informação, bem como uma sólida formação em matemática.
Quais são, então, as limitações?
A primeira limitação óbvia é que, apesar de termos uma população grande, ainda estamos tendo dificuldades para dominar os dados, especificamente para padronizar e sincronizar os dados em instalações, unidades comerciais e administrativas.
Além disso, também enfrentamos outras limitações, como recursos de investimento restritos, especialmente em infraestrutura de computação de alto desempenho.
Na sua opinião, qual a importância do domínio dos dados vietnamitas no processo de criação e domínio de tecnologias que visam melhorar a vida do povo vietnamita?
Atualmente, existem muitos produtos de IA líderes no mundo, geralmente aplicações de IA baseadas em grandes modelos de linguagem, como o ChatGPT da OpenAI ou o Bard do Google. No entanto, o vietnamita não é o principal grupo linguístico para o desenvolvimento desses produtos.
Portanto, a qualidade do conteúdo específico em vietnamita retornado aos usuários é mais ou menos afetada e apresenta uma alta probabilidade de erros, sendo o mais perigoso deles erros em conhecimentos básicos.
Como vietnamitas, temos a vantagem de acessar nossas próprias fontes de dados. Somente nós temos a capacidade de compreender as características dos dados vietnamitas, as necessidades e as peculiaridades do povo vietnamita. Portanto, dominar os dados vietnamitas é fundamental para dominar as tecnologias essenciais, que são as tecnologias que servirão ao povo vietnamita.
Treinamento interno para membros da VinBigdata
Como acessar fontes de dados específicas, especialmente quando a maioria dos vietnamitas hoje em dia usa redes sociais do exterior?
Na verdade, a maior fonte de dados humanos hoje (não apenas de vietnamitas) está na internet e nas redes sociais. No entanto, ainda podemos acessar e coletar dados de diferentes fontes, com base na compreensão das características dos dados vietnamitas, dependendo das características definidas por cada projeto.
Por exemplo, os modelos GPT da OpenAI possuem centenas, até mesmo trilhões de parâmetros, são treinados com enormes quantidades de dados e custam bilhões de dólares. Em comparação, optamos por um caminho completamente diferente, baseado em nossa pesquisa, capacidades e recursos: criar um modelo de linguagem vietnamita com uma arquitetura de apenas alguns bilhões de parâmetros, treinado em um conjunto de dados de 600 GB em vietnamita que coletamos e refinamos internamente, mas com capacidades equivalentes no processamento da língua. Os resultados demonstram que nossa arquitetura, desenvolvida internamente, consegue se auto-otimizar, reduzir o tempo de treinamento do modelo de linguagem, diminuir os custos e ainda garantir a qualidade do modelo.
Quais são os desafios que você e sua equipe encontraram no processo de pesquisa e desenvolvimento de produtos de inteligência artificial?
O primeiro desafio é, sem dúvida, o tempo. A onda da tecnologia de inteligência artificial está chegando muito rapidamente e se encontra em um período de explosão. No mundo, as principais empresas de tecnologia lançaram rapidamente produtos altamente completos, constantemente atualizados e aprimorados. Se formos lentos e não lançarmos produtos no prazo, certamente ficaremos para trás.
Por outro lado, se quisermos criar produtos que possam ser aplicados e que resolvam problemas sociais práticos, também devemos considerar a identificação e o desenvolvimento de características excepcionais, especiais e únicas do produto.
Apresentação no Dia da Inteligência Artificial do Vietname (AI4VN 2023)
De fato, muitas pessoas e organizações no Vietnã e em todo o mundo sofreram grandes perdas devido a vazamentos de dados. Qual a sua opinião sobre a questão da segurança de dados?
Pode-se afirmar que qualquer aplicação atual deriva de dados. Ao trabalhar com dados, por um lado, devemos garantir o objetivo de aplicá-los para criar a melhor tecnologia para a vida e, por outro, assegurar a segurança dos dados para indivíduos e organizações.
O fator humano é um elo muito importante no processo de garantia da segurança de dados. Isso inclui desenvolvedores, usuários do produto e usuários finais. Para os desenvolvedores, a conscientização sobre segurança de dados deve estar presente desde o início da coleta e do processamento de dados.
Muitas vezes, quando nenhum problema ocorre, não nos damos conta da importância da segurança de dados. Mas, se um vazamento de dados acontecer, o prejuízo pode ser enorme. Vazamentos de dados podem ocorrer devido a problemas técnicos ou ataques intencionais para roubar dados. Quando ocorrem vazamentos de dados, indivíduos ou organizações podem ter suas informações usadas por pessoas mal-intencionadas para fins ilegais, e as empresas podem sofrer perdas financeiras para corrigir os problemas relacionados, além de danos à sua marca.
Dr. Dao Duc Minh e a equipe da VinBigdata em um evento
Após a aspiração de dominar a tecnologia para servir o povo vietnamita, haverá passos a serem dados para avançar em direção ao mundo?
Qualquer organização ou empresa que deseje levar seus produtos ao mercado internacional deve cumprir as normas internacionais. A VinBigdata possui pontos fortes em soluções e tecnologia, portanto, definir uma visão para conquistar o mundo é algo natural.
Naturalmente, para implementar soluções para diversos produtos e aplicações, é necessário contar com o apoio de unidades internacionais com muitos anos de experiência e conhecimento dos usuários em todo o mundo.
Obrigado!
Fonte: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm






Comentário (0)