DeepSeek entthront

Qwen3, neue Technologie von Alibaba. Foto: SCMP .

Den neuesten Benchmarktests der KI-Welt zufolge hat Alibabas neu veröffentlichtes künstliches Intelligenzmodell Qwen3 DeepSeeks R1 übertroffen und ist nun das weltweit am höchsten bewertete Open-Source-Modell.

Insbesondere Daten von LiveBench, einer unabhängigen Plattform, die große Sprachmodelle (LLMs), die zugrunde liegende Technologie für generative KI-Dienste wie ChatGPT, vergleicht, zeigen, dass Qwen3 in seinen Tests besser abschnitt als R1.

Der Bericht bewertet die Fähigkeiten von Open-Source-KI-Modellen, einschließlich Programmierung, Mathematik, Datenanalyse und Sprachunterricht.

Die KI-Modellreihe mit dem Namen Qwen3 wurde am 28. April von Alibaba veröffentlicht. Das Unternehmen behauptet, dass dieser Chatbot mit den besten aktuellen Modellen von OpenAI oder Google mithalten oder sie teilweise sogar übertreffen kann.

Mit einer Größe von bis zu 235 Milliarden Parametern weist Qwen3 eine Leistung auf, die mit DeepSeek-V2 und OpenAI GPT-4 vergleichbar ist, die über etwa 236 Milliarden bzw. 175 Milliarden Parameter verfügen. Sobald diese Modellreihe veröffentlicht ist, können Benutzer es bald unter einer offenen Lizenz auf der Hugging Face AI-Entwicklungsplattform und auf Github herunterladen.

Das Unternehmen gibt an, dass die Qwen3-Kollektion Hybridmodelle umfasst, was bedeutet, dass sie ihre Zeit flexibel nutzen können, um komplexe Probleme zu durchdenken oder schnell auf einfache Anfragen zu reagieren. Dabei hilft die Inferenzfähigkeit dem Modell, die Genauigkeit der Informationen selbst zu überprüfen, weist jedoch eine hohe Latenz auf.

Dieses Design erleichtert Benutzern die Zuweisung des entsprechenden Budgets für jede spezifische Aufgabe. Darüber hinaus lernt dieses Modell auch von vielen Konkurrenten auf der ganzen Welt.

Durch die Verwendung derselben „Mixture of Experts“-Architektur (MoE) wie DeepSeek kann Qwen3 die Rechenleistung optimieren, verbraucht dabei aber nur einen Bruchteil der Trainingskosten. Dabei handelt es sich um eine Methode, eine Aufgabe in einzelne Teile aufzuteilen und nur so viele detaillierte Daten vorzuschlagen, wie für die Durchführung erforderlich sind.

Laut dem Entwicklungsteam unterstützt Qwen3 bis zu 119 Sprachen und wird auf einem Datensatz von fast 36.000 Milliarden Token trainiert, was 27.000 Milliarden Wörtern entspricht. Trainingsdaten stammen aus vielen Quellen, beispielsweise Lehrbüchern, Frage-Antwort-Sets, Programmcode oder werden von KI generiert, …

Obwohl Qwen3 die Open-Source-Charts anführt, zeigen umfangreiche Tests von LiveBench, dass es immer noch hinter den weltweit führenden Closed-Source-KI-Modellen zurückbleibt. Die bekanntesten davon sind OpenAIs o3, Googles Gemini Pro 2.5 und Anthropics Claude 3.7.

Derzeit steht das von Microsoft unterstützte Spitzenmodell von OpenAI, o3-mini high, an der Spitze der weltweiten Rangliste der KI-Modelle.

Quelle: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html