Qwen3, eine neue Technologie von Alibaba. Foto: SCMP . |
Laut den neuesten KI-Benchmark-Tests hat Alibabas neu veröffentlichtes künstliches Intelligenzmodell Qwen3 DeepSeek's R1 übertroffen und ist damit das weltweit am besten bewertete Open-Source-Modell.
Konkret zeigen Daten von LiveBench, einer unabhängigen Plattform, die große Sprachmodelle (LLMs) bewertet, die grundlegende Technologie für generative KI-Dienste wie ChatGPT, dass Qwen3 R1 in den Tests übertroffen hat.
Die Bewertung der Leistungsfähigkeit von Open-Source-KI-Modellen umfasst Programmierung, Mathematik, Datenanalyse und Sprachunterricht.
Alibaba hat am 28. April seine KI-Modellreihe Qwen3 veröffentlicht. Das Unternehmen behauptet, dass dieser Chatbot mit den besten aktuellen Modellen von OpenAI oder Google mithalten oder diese in einigen Fällen sogar übertreffen kann.
Mit bis zu 235 Milliarden Parametern bietet Qwen3 eine vergleichbare Leistung wie DeepSeek-V2 und OpenAI GPT-4, die jeweils etwa 236 Milliarden bzw. 175 Milliarden Parameter umfassen. Nutzer können Qwen3 nach Veröffentlichung der Modellreihe bald unter einer Open-Source-Lizenz auf der KI-Entwicklungsplattform Hugging Face und auf GitHub herunterladen.
Das Unternehmen erklärte, die Qwen3-Produktreihe umfasse Hybridmodelle, die flexibel Zeit für logisches Denken zur Lösung komplexer Probleme oder zur schnellen Beantwortung einfacher Anfragen aufwenden können. Bei diesem Modell ermöglicht die logische Funktion die Selbstprüfung der Informationsgenauigkeit, allerdings mit einer deutlichen Zeitverzögerung.
Dieses Design ermöglicht es Nutzern, das Budget jeder einzelnen Aufgabe angemessen zuzuordnen. Darüber hinaus profitiert dieses Modell von den Erfahrungen zahlreicher Wettbewerber weltweit.
Durch die Verwendung einer „Mixture of Experts“-Architektur (MoE), ähnlich wie bei DeepSeek, optimiert Qwen3 die Rechenleistung bei deutlich geringerem Trainingsaufwand. Diese Methode zerlegt Aufgaben in viele separate Teilaufgaben und benötigt nur eine ausreichende Menge an datenintensiven Daten, um diese zu lösen.
Laut dem Entwicklerteam unterstützt Qwen3 bis zu 119 Sprachen und wurde mit einem Datensatz von fast 36 Billionen Tokens trainiert, was 27 Billionen Wörtern entspricht. Die Trainingsdaten stammen aus verschiedenen Quellen wie Lehrbüchern, Fragen-Antworten-Sammlungen, Programmcode oder auch KI-generierten Daten.
Obwohl Qwen3 die Open-Source-Rangliste anführt, zeigt der erweiterte Benchmark-Test von LiveBench, dass es weiterhin hinter den weltweit führenden proprietären KI-Modellen zurückbleibt. Zu den bekanntesten zählen OpenAIs o3, Googles Gemini Pro 2.5 und Anthropics Claude 3.7.
Aktuell führt das fortschrittlichste von Microsoft unterstützte OpenAI-Modell o3-mini high die Gesamtrangliste der KI-Modelle weltweit an.
Quelle: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html







Kommentar (0)