Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek ha sido destronado.

El modelo de IA de Alibaba, Qwen3, ha superado la fase R1 en las pruebas de LiveBench, que evalúan las capacidades de los modelos de código abierto en programación, matemáticas y análisis de datos.

ZNewsZNews06/05/2025

Qwen3, una nueva tecnología lanzada por Alibaba. Foto: SCMP .

Según las últimas pruebas de rendimiento de IA, el modelo de inteligencia artificial Qwen3, recientemente lanzado por Alibaba, ha superado al R1 de DeepSeek para convertirse en el modelo de código abierto mejor valorado del mundo .

En concreto, los datos de LiveBench, una plataforma independiente que evalúa los grandes modelos de lenguaje (LLM, por sus siglas en inglés), la tecnología fundamental para los servicios de IA generativa como ChatGPT, muestran que Qwen3 ha superado a R1 en las pruebas.

La evaluación de las capacidades de los modelos de IA de código abierto incluye programación, matemáticas, análisis de datos e instrucción lingüística.

Alibaba lanzó su serie de modelos de IA Qwen3 el 28 de abril. La compañía afirma que este chatbot puede rivalizar, e incluso superar, a los mejores modelos actuales de OpenAI o Google en algunos casos.

Con un tamaño de hasta 235 mil millones de parámetros, Qwen3 ofrece un rendimiento comparable al de DeepSeek-V2 y OpenAI GPT-4, que cuentan con aproximadamente 236 mil millones y 175 mil millones de parámetros respectivamente. Próximamente, los usuarios podrán descargarlo bajo licencia abierta en la plataforma de desarrollo de IA Hugging Face y en GitHub una vez que se publique esta serie de modelos.

La compañía afirmó que la colección Qwen3 incluye modelos híbridos, lo que significa que pueden asignar tiempo de forma flexible para el razonamiento, ya sea para resolver problemas complejos o para responder rápidamente a solicitudes sencillas. En este modelo, la capacidad de razonamiento permite la autoverificación de la precisión de la información, pero esto conlleva un retraso considerable.

Este diseño facilita a los usuarios la asignación adecuada del presupuesto a cada tarea específica. Además, este modelo aprende de numerosos competidores en todo el mundo.

Mediante una arquitectura de "mezcla de expertos" (MoE, por sus siglas en inglés) similar a la de DeepSeek, Qwen3 puede optimizar el rendimiento computacional utilizando solo una fracción del costo de entrenamiento. Este método divide las tareas en muchas partes separadas y solo requiere una cantidad suficiente de datos intensivos para realizarlas.

Según el equipo de desarrollo, Qwen3 admite hasta 119 idiomas y se entrena con un conjunto de datos de casi 36 billones de tokens, equivalentes a 27 billones de palabras. Los datos de entrenamiento provienen de diversas fuentes, como libros de texto, conjuntos de preguntas y respuestas, código de programación o incluso datos generados por IA, entre otros.

A pesar de liderar la clasificación de código abierto, la prueba de rendimiento extendida de LiveBench demuestra que Qwen3 aún se queda atrás de los principales modelos de IA de código cerrado del mundo. Entre ellos destacan o3 de OpenAI, Gemini Pro 2.5 de Google y Claude 3.7 de Anthropic.

Actualmente, el modelo OpenAI más avanzado compatible con Microsoft, o3-mini high, encabeza la clasificación general de modelos de IA a nivel mundial.

Fuente: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html


Kommentar (0)

¡Deja un comentario para compartir tus sentimientos!

Misma categoría

Mismo autor

Herencia

Cifra

Empresas

Actualidad

Sistema político

Local

Producto

Happy Vietnam
Despegar

Despegar

El sol se pone.

El sol se pone.

Nuestro tío

Nuestro tío