Este modelo de IA de Alibaba se basa en la arquitectura Mixture-of-Experts (MoE) y se ha entrenado con más de 20 billones de tokens. Según sus desarrolladores, Qwen2.5-Max ha demostrado un progreso significativo en sus capacidades de inteligencia y ya está listo para su uso.
Los resultados iniciales muestran que Qwen2.5-Max es más potente que sus competidores.
Qwen2.5-Max no solo mejora el rendimiento y la precisión, sino que también es más capaz de gestionar tareas que requieren un profundo conocimiento del contexto, como el análisis de texto, la traducción y la creación de contenido. «Qwen2.5-Max demuestra un progreso significativo en la gestión de consultas complejas y la provisión de respuestas relevantes», declaró Alibaba en una entrada de blog.
Cifras impresionantes del nuevo modelo de Alibaba
El modelo Qwen2.5-Max se ha probado en numerosos benchmarks importantes, como MMLU-Pro, LiveCodeBench y Arena-Hard. Los resultados muestran que Qwen2.5-Max supera a DeepSeek V3 en pruebas como Arena-Hard, LiveBench y LiveCodeBench, y presenta resultados competitivos en MMLU-Pro. En comparación con otros modelos líderes como GPT-4o y Claude-3.5-Sonnet, Qwen2.5-Max también mantiene su liderazgo.
Alibaba Cloud planea integrar Qwen2.5-Max en sus servicios en la nube para ayudar a los clientes a resolver diversos problemas, desde la automatización del procesamiento de datos hasta la mejora de las interacciones con los clientes mediante chatbots y la optimización de los procesos comerciales. El modelo de IA ya está disponible a través del servicio Qwen Chat, lo que permite a los usuarios interactuar, probar sus capacidades y experimentar con diversas funciones. Además, la API también está disponible para desarrolladores. Para acceder a ella, los usuarios deben registrarse en Alibaba Cloud, activar el servicio Model Studio y crear una clave API.
[anuncio_2]
Fuente: https://thanhnien.vn/alibaba-ra-mat-mo-hinh-ngon-ngu-canh-tranh-voi-gpt-4o-va-deepseek-v3-185250129152256505.htm
Kommentar (0)