Qwen3, eine neue Technologie von Alibaba. Foto: SCMP . |
Laut den neuesten Benchmark-Tests der KI-Welt hat Alibabas neu veröffentlichtes künstliches Intelligenzmodell Qwen3 DeepSeeks R1 übertroffen und ist damit das weltweit am höchsten bewertete Open-Source-Modell.
Konkret zeigen Daten von LiveBench, einer unabhängigen Plattform, die große Sprachmodelle (LLMs) testet – die Technologie, die generativen KI-Diensten wie ChatGPT zugrunde liegt –, dass Qwen3 in den Tests besser abschnitt als R1.
Die Überprüfung der Fähigkeiten von Open-Source-KI-Modellen umfasst Programmierung, Mathematik, Datenanalyse und Sprachunterricht.
Die KI-Modellreihe Qwen3 wurde am 28. April von Alibaba veröffentlicht. Das Unternehmen behauptet, dass dieser Chatbot mit den besten derzeit verfügbaren Modellen von OpenAI oder Google vergleichbar sei und diese in einigen Fällen sogar übertreffe.
Mit bis zu 235 Milliarden Parametern ist Qwen3 vergleichbar mit DeepSeek-V2 und OpenAI GPT-4, die etwa 236 Milliarden bzw. 175 Milliarden Parameter umfassen. Nutzer können es nach Veröffentlichung der Modellreihe bald unter einer Open-Source-Lizenz auf der KI-Entwicklungsplattform Hugging Face und auf GitHub herunterladen.
Das Unternehmen gibt an, dass die Qwen3-Kollektion Hybridmodelle umfasst, die ihre Reaktionszeit flexibel anpassen können, um komplexe Probleme zu lösen oder schnell auf einfache Anfragen zu reagieren. In diesem Fall ermöglicht die Inferenz dem Modell die Selbstprüfung der Informationsgenauigkeit, führt aber zu einer hohen Latenz.
Dieses Design ermöglicht es Nutzern, jedem einzelnen Projekt das passende Budget zuzuweisen. Darüber hinaus profitiert dieses Modell von den Erfahrungen zahlreicher Wettbewerber weltweit.
Durch die Verwendung einer „Mixture of Experts“-Architektur (MoE), ähnlich wie bei DeepSeek, kann Qwen3 die Recheneffizienz bei einem Bruchteil der Trainingskosten maximieren. Dieser Ansatz zerlegt eine Aufgabe in separate Teilaufgaben und empfiehlt nur so viele Deep-Learning-Daten, wie für deren Ausführung erforderlich sind.
Laut dem Entwicklerteam unterstützt Qwen3 bis zu 119 Sprachen und wurde mit einem Datensatz von fast 36 Billionen Tokens trainiert, was 27 Billionen Wörtern entspricht. Die Trainingsdaten stammen aus verschiedenen Quellen wie Lehrbüchern, Frage-Antwort-Sammlungen, Programmcode oder selbstgenerierter KI.
Obwohl Qwen3 die Open-Source-Rangliste anführt, zeigen umfangreiche Tests von LiveBench, dass es hinter den weltweit führenden proprietären KI-Modellen zurückbleibt, insbesondere hinter OpenAIs o3, Googles Gemini Pro 2.5 und Anthropics Claude 3.7.
Aktuell steht das Spitzenmodell von OpenAI, das von Microsoft unterstützt wird, o3-mini high, an der Spitze der weltweiten Rangliste der KI-Modelle.
Quelle: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










Kommentar (0)