DeepSeek ha sido destronado.

Qwen3, una nueva tecnología lanzada por Alibaba. Foto: SCMP .

Según las últimas pruebas de rendimiento de IA, el modelo de inteligencia artificial Qwen3, recientemente lanzado por Alibaba, ha superado al R1 de DeepSeek para convertirse en el modelo de código abierto mejor valorado del mundo .

En concreto, los datos de LiveBench, una plataforma independiente que evalúa los grandes modelos de lenguaje (LLM, por sus siglas en inglés), la tecnología fundamental para los servicios de IA generativa como ChatGPT, muestran que Qwen3 ha superado a R1 en las pruebas.

La evaluación de las capacidades de los modelos de IA de código abierto incluye programación, matemáticas, análisis de datos e instrucción lingüística.

Alibaba lanzó su serie de modelos de IA Qwen3 el 28 de abril. La compañía afirma que este chatbot puede rivalizar, e incluso superar, a los mejores modelos actuales de OpenAI o Google en algunos casos.

Con un tamaño de hasta 235 mil millones de parámetros, Qwen3 ofrece un rendimiento comparable al de DeepSeek-V2 y OpenAI GPT-4, que cuentan con aproximadamente 236 mil millones y 175 mil millones de parámetros respectivamente. Próximamente, los usuarios podrán descargarlo bajo licencia abierta en la plataforma de desarrollo de IA Hugging Face y en GitHub una vez que se publique esta serie de modelos.

La compañía afirmó que la colección Qwen3 incluye modelos híbridos, lo que significa que pueden asignar tiempo de forma flexible para el razonamiento, ya sea para resolver problemas complejos o para responder rápidamente a solicitudes sencillas. En este modelo, la capacidad de razonamiento permite la autoverificación de la precisión de la información, pero esto conlleva un retraso considerable.

Este diseño facilita a los usuarios la asignación adecuada del presupuesto a cada tarea específica. Además, este modelo aprende de numerosos competidores en todo el mundo.

Mediante una arquitectura de "mezcla de expertos" (MoE, por sus siglas en inglés) similar a la de DeepSeek, Qwen3 puede optimizar el rendimiento computacional utilizando solo una fracción del costo de entrenamiento. Este método divide las tareas en muchas partes separadas y solo requiere una cantidad suficiente de datos intensivos para realizarlas.

Según el equipo de desarrollo, Qwen3 admite hasta 119 idiomas y se entrena con un conjunto de datos de casi 36 billones de tokens, equivalentes a 27 billones de palabras. Los datos de entrenamiento provienen de diversas fuentes, como libros de texto, conjuntos de preguntas y respuestas, código de programación o incluso datos generados por IA, entre otros.

A pesar de liderar la clasificación de código abierto, la prueba de rendimiento extendida de LiveBench demuestra que Qwen3 aún se queda atrás de los principales modelos de IA de código cerrado del mundo. Entre ellos destacan o3 de OpenAI, Gemini Pro 2.5 de Google y Claude 3.7 de Anthropic.

Actualmente, el modelo OpenAI más avanzado compatible con Microsoft, o3-mini high, encabeza la clasificación general de modelos de IA a nivel mundial.