Vietnam.vn - Nền tảng quảng bá Việt Nam

Serie de IA más potente de China

El modelo puede competir con competidores fuertes alrededor del mundo, lo que indica el creciente potencial tecnológico del país de mil millones de personas.

Zing NewsZing News29/04/2025

Qwen3, nueva tecnología lanzada por Alibaba. Foto: Reuters .

El 28 de abril, el gigante tecnológico chino Alibaba lanzó una serie de modelos de IA llamados Qwen3. La empresa afirma que este chatbot puede igualar o incluso superar a los mejores modelos actuales de OpenAI o Google en algunos casos.

Con un tamaño de hasta 235 mil millones de parámetros, Qwen3 tiene un rendimiento equivalente al de DeepSeek-V2 y OpenAI GPT-4, que tienen alrededor de 236 mil millones y 175 mil millones de parámetros, respectivamente. Los usuarios pronto podrán descargarlo bajo una licencia abierta en la plataforma de desarrollo Hugging Face AI y Github una vez que se lance esta serie de modelos.

La empresa dice que la colección Qwen3 incluye modelos híbridos, lo que significa que pueden flexibilizar su tiempo para razonar sobre problemas complejos o responder rápidamente a solicitudes simples. En este caso, la capacidad de inferencia ayuda al modelo a autocomprobar la precisión de la información, pero recibe una alta latencia.

Este diseño facilita a los usuarios asignar el presupuesto adecuado para cada tarea específica. Además, este modelo también aprende de muchos competidores de todo el mundo .

Al utilizar la misma arquitectura de "mezcla de expertos" (MoE) que DeepSeek, Qwen3 puede optimizar la eficiencia computacional pero solo utiliza una fracción del costo de entrenamiento. Se trata de un método que consiste en dividir una tarea en partes separadas y sugerir únicamente datos detallados suficientes para realizarla.

Según el equipo de desarrollo, Qwen3 admite hasta 119 idiomas y está entrenado en un conjunto de datos de casi 36 billones de tokens, equivalente a 27 billones de palabras. Los datos de entrenamiento se toman de muchas fuentes, como libros de texto, conjuntos de preguntas y respuestas, código de programación o son generados por IA.

Estas mejoras, junto con muchas otras, han aumentado significativamente las capacidades del chatbot en comparación con su predecesor, Qwen2. Techcrunch señala que si bien el Qwen 3 no supera a los modelos top recientes como el o3 o el o4-mini de OpenAI, aun así muestra un rendimiento impresionante.

Alibaba ra mat AI moi anh 1

Comparar puntuaciones de pruebas de evaluación. Foto: Qwen/X.

Qwen-3-235B-A22B, el modelo más grande de la colección, superó al o3-mini de OpenAI y al Gemini 2.5 Pro de Google en Codeforces , la popular plataforma de competencia de programación. El software también superó a o3-mini en las pruebas de dificultad AIME y BFCL, que evalúan la capacidad de razonamiento de un modelo.

El Qwen-3-235B-A22B aún no se ha lanzado oficialmente al público. Mientras tanto, los usuarios pueden descargar Qwen3-32B. El modelo supera al o1 de OpenAI en varios puntos de referencia, incluida la prueba de programación LiveCodeBench.

Alibaba afirma que Qwen3 se destaca en la llamada de herramientas, el cumplimiento de instrucciones y la replicación precisa de formatos de datos. Este es un elemento del que carecen muchas otras herramientas. Una investigación de la Universidad Carnegie Mellon descubrió que muchas IA fabrican información y cambian formatos a pesar de que se les pide específicamente.

Además de descargar en las plataformas mencionadas anteriormente, los usuarios pueden encontrar Qwen3 a través de proveedores de servicios en la nube como Fireworks AI y Hyperbolic. Esto permite que empresas grandes y pequeñas, así como desarrolladores individuales, accedan y experimenten más allá de las barreras.

La aparición de algunas IA chinas como Qwen ha aumentado la presión sobre los laboratorios de investigación estadounidenses, empujándolos a desarrollar tecnología más potente. Como resultado, los responsables políticos del país han promulgado restricciones para limitar el acceso de China a los chips.

Tuhin Srivastava, director ejecutivo de Baseten, empresa de alojamiento de inteligencia artificial en la nube, dijo que Qwen3 es otro ejemplo del modelo de código abierto que se pone al día con sistemas de código cerrado como OpenAI.

Seguramente Qwen3 seguirá utilizándose ampliamente en el país a pesar de las restricciones del gobierno de Estados Unidos. “Esto demuestra que, además de confiar en modelos existentes como Anthropic y OpenAI, las empresas tecnológicas chinas aún pueden desarrollar su propio software”, afirmó.

Fuente: https://znews.vn/them-loat-ai-manh-me-tu-trung-quoc-post1549756.html


Kommentar (0)

No data
No data

Herencia

Cifra

Negocio

No videos available

Noticias

Sistema político

Local

Producto