Qwen3, una nueva tecnología lanzada por Alibaba. Foto: Reuters . |
El 28 de abril, el gigante tecnológico chino Alibaba lanzó una serie de modelos de IA llamados Qwen3. La compañía afirma que este chatbot puede igualar o incluso superar en algunos casos a los mejores modelos actuales de OpenAI o Google.
Con un tamaño de hasta 235 mil millones de parámetros, Qwen3 está a la par de DeepSeek-V2 y OpenAI GPT-4, que tienen aproximadamente 236 mil millones y 175 mil millones de parámetros, respectivamente. Los usuarios podrán descargarlo próximamente bajo licencia abierta en la plataforma de desarrollo de IA Hugging Face y Github, una vez que se publique la serie de modelos.
La compañía afirma que la colección Qwen3 incluye modelos híbridos, lo que significa que pueden razonar con flexibilidad para resolver problemas complejos o responder rápidamente a solicitudes sencillas. En este caso, la capacidad de razonamiento permite al modelo autocomprobar la precisión de la información, pero a costa de una alta latencia.
Este diseño facilita a los usuarios la asignación del presupuesto adecuado para cada tarea específica. Además, este modelo se basa en el ejemplo de muchos competidores a nivel mundial .
Utilizando una arquitectura de "mezcla de expertos" (MoE) similar a DeepSeek, Qwen3 puede maximizar la eficiencia computacional a una fracción del costo de entrenamiento. Este método consiste en dividir una tarea en partes separadas y recomendar solo la cantidad de datos profundos necesaria para realizarla.
Según el equipo de desarrollo, Qwen3 admite hasta 119 idiomas y se entrena con un conjunto de datos de casi 36 billones de tokens, equivalentes a 27 billones de palabras. Los datos de entrenamiento provienen de diversas fuentes, como libros de texto, conjuntos de preguntas y respuestas, código de programación o IA autogenerada.
Estas mejoras, junto con muchas otras, han optimizado significativamente las capacidades del chatbot en comparación con su predecesor, Qwen2. Techcrunch señala que, si bien Qwen 3 aún no supera por completo a modelos de gama alta recientes como el o3 o el o4-mini de OpenAI, sigue mostrando un rendimiento impresionante.
![]() |
Comparación de puntuaciones de pruebas de evaluación. Foto: Qwen/X. |
Qwen-3-235B-A22B, el modelo más grande de la colección, superó a o3-mini de OpenAI y a Gemini 2.5 Pro de Google en Codeforces , una popular plataforma de competencias de programación. También superó a o3-mini en los problemas matemáticos AIME y BFCL, que miden la capacidad de razonamiento de un modelo.
El Qwen-3-235B-A22B aún no se ha lanzado oficialmente al público. Mientras tanto, los usuarios pueden descargar el Qwen3-32B. Este modelo ha superado al o1 de OpenAI en varias evaluaciones, incluyendo la prueba de programación LiveCodeBench.
Alibaba afirma que Qwen3 destaca en la llamada a herramientas, el seguimiento de instrucciones y la copia precisa de formatos de datos, características de las que carecen muchas otras herramientas. Investigaciones de la Universidad Carnegie Mellon han demostrado que muchas IA fabrican información y modifican formatos a pesar de las instrucciones específicas.
Además de descargar en las plataformas mencionadas, los usuarios pueden encontrar Qwen3 a través de proveedores de servicios en la nube como Fireworks AI e Hyperbolic. Esto permite a grandes y pequeñas empresas, así como a programadores individuales, acceder y experimentar sin barreras.
La aparición de IA chinas como Qwen ha aumentado la presión sobre los laboratorios de investigación estadounidenses para que desarrollen tecnologías más potentes, lo que ha llevado a los responsables políticos estadounidenses a imponer restricciones al acceso de China a los chips.
Tuhin Srivastava, director ejecutivo de Baseten, empresa de alojamiento de inteligencia artificial en la nube, dijo que Qwen3 es otro ejemplo del modelo de código abierto que se pone al día con sistemas de código cerrado como OpenAI.
Es seguro que Qwen3 seguirá siendo ampliamente utilizado en el país a pesar de las restricciones del gobierno estadounidense. «Esto demuestra que, además de confiar en modelos existentes como Anthropic y OpenAI, las empresas tecnológicas chinas aún pueden desarrollar su propio software», afirmó.
Fuente: https://znews.vn/them-loat-ai-manh-me-tu-trung-quoc-post1549756.html
Kommentar (0)