Qwen3, uma nova tecnologia lançada pela Alibaba. Foto: SCMP . |
De acordo com os mais recentes testes de benchmark de IA, o modelo de inteligência artificial Qwen3, recém-lançado pela Alibaba, superou o R1 do DeepSeek e se tornou o modelo de código aberto com a melhor classificação do mundo .
Especificamente, os dados do LiveBench, uma plataforma independente que avalia grandes modelos de linguagem (LLMs), a tecnologia fundamental para serviços de IA generativa como o ChatGPT, mostram que o Qwen3 superou o R1 nos testes.
A avaliação das capacidades dos modelos de IA de código aberto inclui programação, matemática, análise de dados e ensino de idiomas.
A Alibaba lançou sua série de modelos de IA Qwen3 em 28 de abril. A empresa afirma que esse chatbot pode rivalizar, ou até mesmo superar, os melhores modelos atuais da OpenAI ou do Google em alguns casos.
Com um tamanho de até 235 bilhões de parâmetros, o Qwen3 tem desempenho comparável ao DeepSeek-V2 e ao OpenAI GPT-4, que possuem aproximadamente 236 bilhões e 175 bilhões de parâmetros, respectivamente. Os usuários poderão baixá-lo em breve sob licença aberta na plataforma de desenvolvimento de IA Hugging Face e no GitHub, assim que esta série de modelos for lançada.
A empresa afirmou que a coleção Qwen3 inclui modelos híbridos, o que significa que eles podem alocar tempo de forma flexível para o raciocínio, seja para resolver problemas complexos ou para responder rapidamente a solicitações simples. Nesse modelo, a capacidade de raciocínio permite a autoverificação da precisão das informações, mas isso acarreta uma defasagem de tempo significativa.
Esse design facilita aos usuários a alocação adequada de orçamento para cada tarefa específica. Além disso, esse modelo também aprende com diversos concorrentes ao redor do mundo.
Utilizando uma arquitetura de "mistura de especialistas" (MoE) semelhante à do DeepSeek, o Qwen3 consegue otimizar o desempenho computacional com apenas uma fração do custo de treinamento. Esse método divide as tarefas em várias partes separadas e requer apenas uma quantidade suficiente de dados com uso intensivo de recursos para executá-las.
Segundo a equipe de desenvolvimento, o Qwen3 suporta até 119 idiomas e foi treinado em um conjunto de dados de quase 36 trilhões de tokens, o equivalente a 27 trilhões de palavras. Os dados de treinamento são provenientes de diversas fontes, como livros didáticos, conjuntos de perguntas e respostas, código de programação e até mesmo dados gerados por IA, etc.
Apesar de liderar o ranking de código aberto, o teste de benchmark estendido do LiveBench mostra que o Qwen3 ainda fica atrás dos principais modelos de IA proprietários do mundo. Os mais proeminentes entre eles são o o3 da OpenAI, o Gemini Pro 2.5 do Google e o Claude 3.7 da Anthropic.
Atualmente, o modelo OpenAI mais avançado com suporte da Microsoft, o o3-mini high, lidera o ranking geral de modelos de IA em todo o mundo.
Fonte: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html






Comentário (0)