Vietnam.vn - Nền tảng quảng bá Việt Nam

Serie de IA más potente de China

El modelo puede competir con competidores fuertes alrededor del mundo, lo que indica el creciente potencial tecnológico del país de mil millones de personas.

ZNewsZNews29/04/2025

Qwen3, una nueva tecnología lanzada por Alibaba. Foto: Reuters .

El 28 de abril, el gigante tecnológico chino Alibaba lanzó una serie de modelos de IA llamados Qwen3. La compañía afirma que este chatbot puede igualar o incluso superar en algunos casos a los mejores modelos actuales de OpenAI o Google.

Con un tamaño de hasta 235 mil millones de parámetros, Qwen3 está a la par de DeepSeek-V2 y OpenAI GPT-4, que tienen aproximadamente 236 mil millones y 175 mil millones de parámetros, respectivamente. Los usuarios podrán descargarlo próximamente bajo licencia abierta en la plataforma de desarrollo de IA Hugging Face y Github, una vez que se publique la serie de modelos.

La compañía afirma que la colección Qwen3 incluye modelos híbridos, lo que significa que pueden razonar con flexibilidad para resolver problemas complejos o responder rápidamente a solicitudes sencillas. En este caso, la capacidad de razonamiento permite al modelo autocomprobar la precisión de la información, pero a costa de una alta latencia.

Este diseño facilita a los usuarios la asignación del presupuesto adecuado para cada tarea específica. Además, este modelo se basa en el ejemplo de muchos competidores a nivel mundial .

Utilizando una arquitectura de "mezcla de expertos" (MoE) similar a DeepSeek, Qwen3 puede maximizar la eficiencia computacional a una fracción del costo de entrenamiento. Este método consiste en dividir una tarea en partes separadas y recomendar solo la cantidad de datos profundos necesaria para realizarla.

Según el equipo de desarrollo, Qwen3 admite hasta 119 idiomas y se entrena con un conjunto de datos de casi 36 billones de tokens, equivalentes a 27 billones de palabras. Los datos de entrenamiento provienen de diversas fuentes, como libros de texto, conjuntos de preguntas y respuestas, código de programación o IA autogenerada.

Estas mejoras, junto con muchas otras, han optimizado significativamente las capacidades del chatbot en comparación con su predecesor, Qwen2. Techcrunch señala que, si bien Qwen 3 aún no supera por completo a modelos de gama alta recientes como el o3 o el o4-mini de OpenAI, sigue mostrando un rendimiento impresionante.

Alibaba ra mat AI moi anh 1

Comparación de puntuaciones de pruebas de evaluación. Foto: Qwen/X.

Qwen-3-235B-A22B, el modelo más grande de la colección, superó a o3-mini de OpenAI y a Gemini 2.5 Pro de Google en Codeforces , una popular plataforma de competencias de programación. También superó a o3-mini en los problemas matemáticos AIME y BFCL, que miden la capacidad de razonamiento de un modelo.

El Qwen-3-235B-A22B aún no se ha lanzado oficialmente al público. Mientras tanto, los usuarios pueden descargar el Qwen3-32B. Este modelo ha superado al o1 de OpenAI en varias evaluaciones, incluyendo la prueba de programación LiveCodeBench.

Alibaba afirma que Qwen3 destaca en la llamada a herramientas, el seguimiento de instrucciones y la copia precisa de formatos de datos, características de las que carecen muchas otras herramientas. Investigaciones de la Universidad Carnegie Mellon han demostrado que muchas IA fabrican información y modifican formatos a pesar de las instrucciones específicas.

Además de descargar en las plataformas mencionadas, los usuarios pueden encontrar Qwen3 a través de proveedores de servicios en la nube como Fireworks AI e Hyperbolic. Esto permite a grandes y pequeñas empresas, así como a programadores individuales, acceder y experimentar sin barreras.

La aparición de IA chinas como Qwen ha aumentado la presión sobre los laboratorios de investigación estadounidenses para que desarrollen tecnologías más potentes, lo que ha llevado a los responsables políticos estadounidenses a imponer restricciones al acceso de China a los chips.

Tuhin Srivastava, director ejecutivo de Baseten, empresa de alojamiento de inteligencia artificial en la nube, dijo que Qwen3 es otro ejemplo del modelo de código abierto que se pone al día con sistemas de código cerrado como OpenAI.

Es seguro que Qwen3 seguirá siendo ampliamente utilizado en el país a pesar de las restricciones del gobierno estadounidense. «Esto demuestra que, además de confiar en modelos existentes como Anthropic y OpenAI, las empresas tecnológicas chinas aún pueden desarrollar su propio software», afirmó.

Fuente: https://znews.vn/them-loat-ai-manh-me-tu-trung-quoc-post1549756.html


Kommentar (0)

No data
No data
Escena mágica en la colina del té "cuenco al revés" en Phu Tho
Tres islas de la región central se asemejan a las Maldivas y atraen turistas en verano.
Contemple la brillante ciudad costera de Quy Nhon, Gia Lai, por la noche.
Imagen de campos en terrazas en Phu Tho, con suave pendiente, brillantes y hermosos como espejos antes de la temporada de siembra.
La fábrica Z121 está lista para la Noche Final Internacional de Fuegos Artificiales
La famosa revista de viajes elogia la cueva Son Doong como "la más magnífica del planeta"
Una cueva misteriosa atrae a turistas occidentales, comparada con la "cueva Phong Nha" en Thanh Hoa
Descubra la belleza poética de la bahía de Vinh Hy
¿Cómo se procesa el té más caro de Hanoi, cuyo precio supera los 10 millones de VND/kg?
Sabor de la región del río

Herencia

Cifra

Negocio

No videos available

Noticias

Sistema político

Local

Producto