As gigantes da tecnologia Alibaba, Baidu e ByteDance estão numa corrida para reduzir o custo da IA de "inferência", oferecendo preços 90% menores do que os oferecidos por suas concorrentes americanas.
Empresas da China continental reduzem custos construindo modelos treinados com quantidades menores de dados, exigindo menos poder computacional, mas com hardware otimizado, disse Lee Kai-Fu, fundador da 01.ai e ex-diretor do Google China.
De acordo com o ranking recentemente divulgado pelo UC Berkeley SkyLab e pela LMSYS, o modelo Yi-Lingtning da startup 01.ai ficou em terceiro lugar, empatado com o Grok-2 da x.AI, atrás da OpenAI e do Google. Esse ranking é baseado nas pontuações dos usuários para as respostas às consultas.

A 01.ai e a DeepSeek são empresas de IA da China continental que estão adotando uma estratégia de focar em conjuntos de dados menores para treinar modelos, ao mesmo tempo que contratam mão de obra barata e altamente qualificada.
Segundo o Financial Times, o custo de inferência do Yi-Lightning é de 14 centavos de dólar por milhão de tokens, comparado a 26 centavos de dólar para o GPT o1-mini da OpenAI. Enquanto isso, o GPT 4o custa até US$ 4,40 por milhão de tokens. O número de tokens usados para gerar uma resposta depende da complexidade de cada consulta.
Os fundadores da Yi-Lightning revelaram que a empresa gastou US$ 3 milhões em "treinamento inicial", antes de aprimorá-lo para diferentes casos de uso. Lee afirmou que o objetivo deles "não era criar o melhor modelo", mas sim construir um modelo concorrente que fosse "de 5 a 10 vezes mais barato".
O método aplicado pela 01.ai, DeepSeek, MiniMax e Stepfun é chamado de "modelagem especializada" – que significa simplesmente combinar várias redes neurais treinadas em conjuntos de dados específicos do domínio.
Os pesquisadores consideram essa abordagem fundamental para alcançar o mesmo nível de inteligência dos modelos de big data, mas com menor poder computacional. No entanto, a dificuldade reside no fato de que os engenheiros precisam orquestrar o processo de treinamento com "múltiplos especialistas", em vez de apenas um modelo geral.
Devido às dificuldades de acesso a chips de IA de ponta, as empresas chinesas têm se dedicado ao desenvolvimento de conjuntos de dados de alta qualidade, que podem ser usados para treinar modelos especializados, competindo assim com rivais ocidentais.
Lee afirmou que a 01.ai utiliza métodos não tradicionais para coletar dados, como digitalizar livros ou coletar artigos no aplicativo de mensagens WeChat, que não estão acessíveis no site público.
O fundador acredita que a China está em melhor posição do que os EUA, com sua enorme reserva de mão de obra técnica qualificada e barata.
(Segundo o Financial Times e a Bloomberg)
Fonte: https://vietnamnet.vn/trung-quoc-giam-90-chi-phi-ai-suy-luan-so-voi-my-2334520.html






Comentário (0)