Dieses Alibaba-KI-Modell basiert auf der Mixture-of-Experts (MoE)-Architektur und wurde mit über 20 Billionen Token trainiert. Laut den Entwicklern hat Qwen2.5-Max „erhebliche Fortschritte bei den Intelligenzfähigkeiten“ gezeigt und ist nun einsatzbereit.
Erste Ergebnisse zeigen, dass Qwen2.5-Max leistungsstärker ist als seine Konkurrenten.
Qwen2.5-Max verbessert nicht nur Leistung und Genauigkeit, sondern ist auch besser in der Lage, Aufgaben zu bewältigen, die ein tiefes Kontextverständnis erfordern, wie Textanalyse, Übersetzung und Inhaltserstellung. „Qwen2.5-Max zeigt deutliche Fortschritte bei der Bearbeitung komplexer Anfragen und der Bereitstellung relevanter Antworten“, erklärte Alibaba in einem Blogbeitrag.
Beeindruckende Zahlen von Alibabas neuem Modell
Das Qwen2.5-Max-Modell wurde anhand vieler wichtiger Benchmarks getestet, darunter MMLU-Pro, LiveCodeBench, LiveBench und Arena-Hard. Die Ergebnisse zeigen, dass Qwen2.5-Max DeepSeek V3 in Tests wie Arena-Hard, LiveBench und LiveCodeBench übertrifft und in MMLU-Pro konkurrenzfähige Ergebnisse erzielt. Auch im Vergleich zu anderen führenden Modellen wie GPT-4o und Claude-3.5-Sonnet behauptet Qwen2.5-Max seine führende Position.
Alibaba Cloud plant die Integration von Qwen2.5-Max in seine Cloud-Dienste, um Kunden bei der Lösung vielfältiger Probleme zu unterstützen – von der Automatisierung der Datenverarbeitung über die Verbesserung der Kundeninteraktion durch Chatbots bis hin zur Optimierung von Geschäftsprozessen. Das KI-Modell ist ab sofort über den Qwen-Chat-Dienst verfügbar und ermöglicht Nutzern die Interaktion, das Testen seiner Fähigkeiten und das Experimentieren mit verschiedenen Funktionen. Die API steht Entwicklern offen. Um darauf zuzugreifen, müssen sich Nutzer bei Alibaba Cloud registrieren, den Model Studio-Dienst aktivieren und einen API-Schlüssel erstellen.
[Anzeige_2]
Quelle: https://thanhnien.vn/alibaba-ra-mat-mo-hinh-ngon-ngu-canh-tranh-voi-gpt-4o-va-deepseek-v3-185250129152256505.htm
Kommentar (0)