Vietnam.vn - Nền tảng quảng bá Việt Nam

Dr. Dao Duc Minh: 'Dominar os dados vietnamitas é o primeiro passo para desenvolver e dominar a tecnologia vietnamita'

Báo Thanh niênBáo Thanh niên27/05/2024

imagem Tendo trabalhado para uma grande organização de inteligência artificial nos EUA, por que você decidiu retornar ao Vietnã para se juntar à VinBigdata? Enquanto trabalhava nos EUA, embora tenha participado de muitos grandes projetos governamentais , os resultados que eu alcançava frequentemente representavam apenas algumas etapas em um grande processo de processamento. Muitas vezes, devido aos procedimentos de confidencialidade muito rigorosos dos projetos, eu nem sabia como as soluções que havia desenvolvido estavam sendo utilizadas. Em 2017, retornei ao Vietnã quando o país estava em fase de desenvolvimento e havia muitos problemas relacionados a big data e inteligência artificial que precisavam ser resolvidos. Aceitei o convite do Professor Vu Ha Van para, em conjunto, concretizar o objetivo de desenvolver soluções tecnológicas vietnamitas que melhorassem a vida do povo vietnamita. Considero meu retorno ao Vietnã muito mais significativo, pois poderei trabalhar em problemas com maior impacto.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Dr. Dao Duc Minh em um workshop

NVCC

Na estratégia de desenvolvimento de inteligência artificial, qual o papel e a influência do Big Data? Os dados desempenham um papel muito importante e valioso no treinamento de inteligência artificial. Para treinar um modelo de inteligência artificial de alta qualidade, geralmente começamos treinando um grande banco de dados. Portanto, para termos inteligência artificial de qualidade, precisamos primeiro de bons dados. Bons dados devem atender a padrões de quantidade e escala, qualidade, diversidade e universalidade. O processo de coleta e processamento de milhares de horas de dados, desde a limpeza dos dados brutos até a criação de dados da mais alta qualidade para alimentar o modelo de inteligência artificial, é muito caro e complexo. Por outro lado, para analisar Big Data, precisamos usar inteligência artificial para garantir a capacidade de processar dados com precisão em grande escala, criando assim resultados mais decisivos ou preditivos. Por exemplo, no processo de desenvolvimento de um assistente virtual para vietnamitas (ViVi), tivemos que coletar e processar dezenas de milhares de horas de dados de áudio de alta qualidade, provenientes de centenas de milhares de vozes de diferentes regiões, idades e gêneros, com conteúdo abrangendo centenas de áreas... Ou, mais recentemente, o lançamento do ViGPT – "A primeira versão vietnamita do ChatGPT para usuários finais" – desenvolvido a partir de um Modelo de Linguagem Big Data totalmente pertencente à VinBigdata. Este modelo foi treinado com base em 600 GB de dados vietnamitas refinados de diversas áreas. Com nosso conhecimento de dados e da língua vietnamita, encontramos uma nova abordagem para reduzir o tempo de lançamento do ViGPT para apenas 9 meses após o surgimento do ChatGPT. Esta é a ressonância entre big data e inteligência artificial.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.
Qual a sua opinião sobre a vinculação da pesquisa com valor prático para servir à comunidade? - Acredito que a pesquisa tecnológica só é verdadeiramente bem-sucedida quando de fato entra na vida real, resolve problemas sociais e melhora a vida das pessoas. Para criar produtos comerciais práticos e solucionar problemas empresariais e sociais, devemos sempre prestar atenção e questionar: que valor os dados trarão para a vida real? Até o momento, pesquisamos uma variedade de produtos e soluções em diversos campos e profissões, como o ViGPT, o VinDr (que fornece soluções de IA para diagnóstico por imagem médica) , o VinBase (uma plataforma de inteligência artificial) e o Vizone (um conjunto de soluções inteligentes para análise de imagens).
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Com membros importantes da equipe da VinBigdata em um evento da Vingroup Corporation.

NVCC

A 4ª Revolução Industrial está se consolidando fortemente em escala global. Quais vantagens você acha que o Vietnã possui? Comparado às revoluções anteriores, acredito que o Vietnã atualmente possui muitas vantagens para se destacar nesta Revolução Industrial 4.0, contribuindo para melhorar a posição do país no cenário mundial . As duas chaves para alcançar esse objetivo são dados e pessoas. O Vietnã tem atualmente quase 100 milhões de habitantes, dos quais uma alta proporção de jovens utiliza telefones celulares e computadores pessoais. Além disso, contamos com especialistas renomados em inteligência artificial e jovens profissionais altamente qualificados em tecnologia da informação, além de uma sólida base em matemática. Quais são, então, as limitações? A primeira limitação que podemos observar é que, apesar da grande população, ainda temos dificuldades em lidar com dados, especificamente na padronização e sincronização de dados em instalações, empresas e unidades administrativas. Além disso, também enfrentamos outras restrições, como recursos limitados para investimentos, principalmente em infraestrutura de computação de alto desempenho.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.
Na sua opinião, qual a importância do domínio dos dados em vietnamita na jornada de criação e aprimoramento de tecnologias que atendam às necessidades do povo vietnamita? Atualmente, existem muitos produtos pioneiros em inteligência artificial no mundo, principalmente aplicativos de IA criados com base em grandes modelos de linguagem, como o ChatGPT da OpenAI ou o Bard do Google. No entanto, o vietnamita não é o idioma principal para o desenvolvimento desses produtos. Portanto, a qualidade do conteúdo em vietnamita retornado aos usuários é afetada e apresenta alta probabilidade de erros, principalmente erros de conhecimento básico. Como vietnamitas, temos a vantagem de acessar nossas próprias fontes de dados. Somente nós temos a capacidade de compreender as características dos dados em vietnamita, as necessidades e as peculiaridades do povo vietnamita. Portanto, dominar os dados em vietnamita é fundamental para dominar as tecnologias essenciais, que são as tecnologias que atenderão às necessidades do povo vietnamita.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Treinamento interno para membros da VinBigdata

NVCC

Como acessar fontes de dados específicas, especialmente quando a maioria dos vietnamitas hoje em dia usa redes sociais estrangeiras? De fato, a maior fonte de dados humanos atualmente (não apenas de vietnamitas) está na internet e nas redes sociais. No entanto, ainda podemos acessar e coletar dados de diferentes fontes, com base na compreensão das características dos dados vietnamitas, dependendo das características definidas por cada projeto. Por exemplo, os modelos GPT da OpenAI têm até centenas, até trilhões de parâmetros, treinados com enormes quantidades de dados e custam bilhões de dólares. Em comparação, escolhemos uma direção completamente diferente com base em nossa pesquisa, capacidades e recursos: ou seja, criar um modelo de linguagem vietnamita com uma arquitetura de apenas alguns bilhões de parâmetros, treinado em um conjunto de dados vietnamita de 600 GB que coletamos e refinamos nós mesmos, mas com capacidades equivalentes em termos de processamento do idioma vietnamita. Os resultados mostram que nossa arquitetura desenvolvida internamente pode se auto-otimizar, reduzir o tempo de treinamento do modelo de linguagem, diminuir os custos e ainda garantir a qualidade do modelo. Quais são os desafios que você e sua equipe encontraram no processo de pesquisa e desenvolvimento de produtos de inteligência artificial? O primeiro desafio é certamente o tempo. A onda da tecnologia de inteligência artificial está chegando muito rápido e se encontra em um período de grande expansão. No mundo todo, as principais empresas de tecnologia lançaram rapidamente produtos altamente completos, que são constantemente atualizados e aprimorados. Se formos lentos e não lançarmos produtos a tempo, certamente ficaremos para trás. Por outro lado, se quisermos criar produtos que possam ser aplicados e que resolvam problemas sociais práticos, também devemos considerar a busca e o desenvolvimento de características excepcionais, especiais e únicas para o produto.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Apresentação no Dia da Inteligência Artificial do Vietname (AI4VN 2023)

NVCC

Na realidade, muitas pessoas e organizações no Vietnã e no mundo sofreram grandes prejuízos com vazamentos de dados. Qual a sua opinião sobre a questão da segurança de dados? Pode-se dizer que qualquer aplicação atual depende de dados. Ao trabalhar com dados, por um lado, devemos garantir o objetivo de aplicá-los para criar a melhor tecnologia para a vida e, por outro, devemos garantir a segurança dos dados para indivíduos e organizações. O fator humano é um elo muito importante no processo de garantia da segurança de dados. Isso inclui desenvolvedores, usuários do produto e usuários finais. Para os desenvolvedores, a conscientização sobre segurança de dados deve estar presente desde o início da coleta e do processamento de dados. Muitas vezes, quando nenhum problema ocorre, não nos damos conta da importância da segurança de dados. Mas, se ocorrer um vazamento de dados, o prejuízo pode ser enorme. Violações de dados podem ocorrer devido a problemas técnicos ou ataques intencionais de roubo de dados. Quando os dados são violados, as informações de indivíduos ou organizações podem ser usadas para fins ilegais por criminosos, enquanto as empresas podem sofrer perdas financeiras para corrigir os problemas relacionados e até mesmo danos à sua marca.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Dr. Dao Duc Minh e a equipe da VinBigdata em um evento

NVCC

Após a aspiração de dominar a tecnologia para servir o povo vietnamita, certamente haverá passos a serem dados para avançar rumo ao mundo. Qualquer organização ou empresa que deseje levar seus produtos ao mercado internacional deve cumprir os padrões internacionais. A VinBigdata possui pontos fortes em soluções e tecnologia, portanto, definir uma visão de conquistar o mundo é natural. É claro que, para implementar diversos produtos e aplicações, é necessário contar com a parceria de unidades internacionais com muitos anos de experiência e conhecimento dos usuários ao redor do mundo. Obrigado!

Thanhnien.vn

Fonte: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Comentário (0)

Deixe um comentário para compartilhar seus sentimentos!

No mesmo tópico

Na mesma categoria

A Catedral de Notre Dame, na cidade de Ho Chi Minh, está brilhantemente iluminada para dar as boas-vindas ao Natal de 2025.
As jovens de Hanói se vestem lindamente para a época natalina.
Após a tempestade e a inundação, a vila de crisântemos de Tet, em Gia Lai, se recuperou e espera que não haja mais cortes de energia para salvar as plantas.
A capital do damasco amarelo, na região central, sofreu grandes perdas após dois desastres naturais.

Do mesmo autor

Herança

Figura

Negócios

O preço de 100.000 VND por tigela do Pho "voador" causa polêmica, mas o restaurante continua lotado de clientes.

Acontecimentos atuais

Sistema político

Local

Produto