Após a febre do DeepSeek, grandes empresas de tecnologia chinesas rapidamente correram para lançar grandes modelos de linguagem (LLMs) para competir e ganhar participação de mercado.
A tecnologia global está acelerando
Em 29 de janeiro, primeiro dia do Ano Novo Lunar de 2025, o Alibaba Group lançou uma nova versão do modelo de inteligência artificial (IA) Qwen 2.5 e anunciou que este modelo é mais poderoso que o DeepSeek. De acordo com o Alibaba, o Qwen 2.5 "supera em quase todos os aspectos" os modelos de IA mais avançados da OpenAI e da Meta (EUA), como o GPT-4o e o Llama-3.1-405B.
Anteriormente, a DeepSeek lançou assistentes de IA usando os modelos DeepSeek-V3 e DeepSeek-R1 a um custo apenas uma fração do dos produtos de empresas americanas.
Dois "terremotos": DeepSeek e Alibaba desencadearam uma corrida para aprimorar a IA na China. Notavelmente, o chatbot de IA de baixo custo ChatGLM foi desenvolvido por uma equipe de pesquisa da Universidade Tsinghua e da Zhipu AI Company. O ChatGLM é um chatbot de IA de código aberto capaz de gerar texto, traduzir e responder a perguntas.
O Ernie Bot, da gigante da tecnologia Baidu, também lançou uma versão atualizada, o Ernie 4.0 Turbo, capaz de executar várias tarefas, incluindo geração de texto, tradução, resposta a perguntas, criação de imagens, etc. Enquanto isso, a ByteDance, empresa controladora do TikTok, atualizou seu principal modelo de IA e anunciou que passou no teste AIME, o o1 da OpenAI, um padrão que mede a capacidade da IA de processar e responder a instruções complexas.
O DeepSeek também ameaça o mercado global, forçando gigantes da tecnologia como OpenAI, Meta, Google, Microsoft... a ajustar suas estratégias de investimento. Empresas americanas de tecnologia já investiram em fábricas de IA e fábricas de dados, mas, a partir de agora, precisarão se concentrar em aprimorar algoritmos para reduzir custos e operar com mais rapidez e eficiência. Recentemente, a OpenAI introduziu o recurso Deep Research, que ajuda o ChatGPT a sintetizar e pesquisar informações. O destaque desse recurso é a capacidade de exibir detalhes do processo de pesquisa, incluindo citações e resumos dos métodos utilizados, facilitando o rastreamento e a verificação das informações pelos usuários.
Outros países, como Índia e Coreia do Sul, também participam do desenvolvimento de chatbots de IA de baixo custo. Por exemplo, na Índia, a Reliance Jio Company, do bilionário Mukesh Ambani, lançou o primeiro chatbot de IA compatível com idiomas locais, chamado BharatGPT. Este é um avanço significativo no campo da IA na Índia, ajudando a tecnologia a alcançar a população que não fala inglês com mais facilidade.
Interface do DeepSeek e do Qwen 2.5 Foto: Future/Qwen/Shutterstock
Quais oportunidades para o Vietnã?
O Sr. Lu Vincent The Hung, fundador e CEO da EduX Global Institute Joint Stock Company, afirmou que, no passado, a indústria de tecnologia frequentemente anunciava custos de construção de modelos de IA de até bilhões de dólares. No entanto, o lançamento do R1 pela startup de tecnologia DeepSeek, com um custo de apenas 6 milhões de dólares, se for verdade, pode ser o motor para que países e startups desenvolvam sua própria IA com alto desempenho e baixo custo. A partir daí, empresas, especialmente pequenas e médias empresas, podem acessar e aplicar IA sem precisar investir muito dinheiro inicial; promover a transformação digital nas áreas de produção, comércio, serviços, educação ...
No entanto, o recém-lançado modelo R1 da DeepSeek tem enfrentado muitas controvérsias relacionadas à segurança de dados e à cópia de modelos de IA de outras empresas de tecnologia. Portanto, para criar seus próprios modelos de IA a baixo custo, países e empresas precisam entender cuidadosamente os princípios operacionais, algoritmos, código-fonte, etc., em vez de copiar ou roubar. "Um modelo de IA bem-sucedido não se resume apenas à capacidade de processamento, mas também ao custo. As empresas vietnamitas devem seguir a direção de construir soluções que possam ser expandidas e personalizadas de acordo com as necessidades de diversos setores", sugeriu o Sr. Hung.
De acordo com o Sr. Phan Tan Quoc, Diretor Adjunto do Programa de Inovação da KPMG no Vietnã, a concorrência acirrada no mercado de IA exercerá pressão e motivação para que as empresas vietnamitas criem rapidamente modelos úteis e prestigiados para atender usuários e clientes nacionais. O Sr. Quoc recomendou que o governo estabeleça políticas para incentivar empresas e indivíduos a participarem do desenvolvimento de IA, construir bancos de dados e, ao mesmo tempo, apoiar o investimento em centros de pesquisa em IA.
"A tendência de compartilhamento de código aberto na comunidade de IA pode ajudar os desenvolvedores a aproveitar e aprimorar o modelo. No futuro próximo, muitas startups e indivíduos acessarão e aplicarão facilmente a IA em suas operações, à medida que novos modelos de IA surgirem, atendendo a necessidades específicas", disse o Sr. Quoc.
Segundo especialistas, ao desenvolver IA, as empresas devem determinar claramente se o modelo pode resolver um problema específico, agregar valor real aos usuários e apresentar diferenças em recursos ou destaques excepcionais. O modelo da DeepSeek é uma lição para empresas globais de tecnologia com custos autodeclarados extremamente baixos, mas com desempenho superior ao do ChatGPT. Em seguida, é necessário entender claramente a demanda por IA no mercado para garantir que ela seja competitiva o suficiente e possa ser lucrativa.
O DeepSeek é realmente barato?
Em seu relatório, a DeepSeek afirmou que o custo total do treinamento do modelo de IA foi inferior a US$ 6 milhões, principalmente devido ao aluguel de unidades de processamento gráfico da NVIDIA. No entanto, recentemente, a empresa de pesquisa e consultoria em semicondutores SemiAnalysis calculou que o custo de desenvolvimento do DeepSeek foi muito maior do que o declarado.
Estima-se que a DeepSeek opere um sistema de computação massivo com cerca de 50.000 GPUs Hopper, 10.000 GPUs H800 e 10.000 GPUs H100 mais potentes, além de GPUs H20 adicionais. O investimento total de capital para os servidores é estimado em cerca de US$ 1,6 bilhão, e os custos operacionais giram em torno de US$ 944 milhões.
Fonte: https://nld.com.vn/co-hoi-tu-nhung-con-dia-chan-ai-196250204200528423.htm
Comentário (0)