Qwen3, eine neue Technologie von Alibaba. Foto: Reuters . |
Am 28. April stellte der chinesische Technologieriese Alibaba eine Reihe von KI-Modellen namens Qwen3 vor. Das Unternehmen behauptet, dieser Chatbot könne mit den besten aktuellen Modellen von OpenAI oder Google mithalten oder sie in einigen Fällen sogar übertreffen.
Mit einer Größe von bis zu 235 Milliarden Parametern liegt Qwen3 auf Augenhöhe mit DeepSeek-V2 und OpenAI GPT-4, die jeweils etwa 236 Milliarden bzw. 175 Milliarden Parameter umfassen. Nutzer können Qwen3 bald unter einer offenen Lizenz auf der KI-Entwicklungsplattform Hugging Face und Github herunterladen, sobald die Modellreihe veröffentlicht ist.
Das Unternehmen gibt an, dass die Qwen3-Kollektion hybride Modelle umfasst. Das bedeutet, dass sie flexibel komplexe Probleme lösen oder schnell auf einfache Anfragen reagieren können. In diesem Fall ermöglicht die Denkfähigkeit dem Modell, die Genauigkeit der Informationen selbst zu überprüfen, allerdings auf Kosten einer hohen Latenz.
Dieses Design erleichtert es Benutzern, jeder spezifischen Aufgabe das entsprechende Budget zuzuweisen. Darüber hinaus lernt dieses Modell auch von vielen Wettbewerbern auf der ganzen Welt .
Mithilfe einer „Mixture of Experts“-Architektur (MoE), ähnlich wie DeepSeek, kann Qwen3 die Rechenleistung zu einem Bruchteil der Trainingskosten maximieren. Dabei wird eine Aufgabe in einzelne Teile zerlegt und nur die Menge an Deep Data empfohlen, die für die Ausführung benötigt wird.
Laut dem Entwicklerteam unterstützt Qwen3 bis zu 119 Sprachen und wird anhand eines Datensatzes von fast 36 Billionen Token trainiert, was 27 Billionen Wörtern entspricht. Die Trainingsdaten stammen aus verschiedenen Quellen wie Lehrbüchern, Frage-Antwort-Sets, Programmcode oder selbst generierter KI.
Diese und viele weitere Verbesserungen haben die Fähigkeiten des Chatbots im Vergleich zu seinem Vorgänger Qwen2 deutlich verbessert. Techcrunch weist darauf hin, dass Qwen 3 aktuelle Topmodelle wie OpenAIs o3 oder o4-mini zwar noch nicht vollständig übertrifft, aber dennoch eine beeindruckende Leistung zeigt.
![]() |
Vergleich der Ergebnisse von Einstufungstests. Foto: Qwen/X. |
Qwen-3-235B-A22B, das größte Modell der Sammlung, schlug OpenAIs o3-mini und Googles Gemini 2.5 Pro auf Codeforces , einer beliebten Plattform für Programmierwettbewerbe. Auch bei den mathematischen Aufgaben AIME und BFCL, die die Denkfähigkeit eines Modells messen, übertraf es o3-mini.
Qwen-3-235B-A22B wurde noch nicht offiziell veröffentlicht. Nutzer können Qwen3-32B jedoch herunterladen. Dieses Modell hat OpenAIs o1 in mehreren Tests, darunter auch im LiveCodeBench-Programmiertest, übertroffen.
Laut Alibaba zeichnet sich Qwen3 durch hervorragende Tool-Aufrufe, das Befolgen von Anweisungen und das präzise Kopieren von Datenformaten aus, was vielen anderen Tools fehlt. Untersuchungen der Carnegie Mellon University haben gezeigt, dass viele KIs trotz spezifischer Anweisungen Informationen erfinden und Formate ändern.
Neben dem Download auf den oben genannten Plattformen können Nutzer Qwen3 auch über Cloud-Dienstanbieter wie Fireworks AI und Hyperbolic finden. Dies ermöglicht großen und kleinen Unternehmen sowie einzelnen Programmierern den Zugriff und das Experimentieren über alle Grenzen hinweg.
Das Aufkommen chinesischer KIs wie Qwen hat den Druck auf US-Forschungslabore erhöht, leistungsfähigere Technologien zu entwickeln, und die US-Politik dazu veranlasst, Chinas Zugang zu Chips einzuschränken.
Tuhin Srivastava, CEO des Cloud-KI-Hosting-Unternehmens Baseten, sagte, Qwen3 sei ein weiteres Beispiel dafür, dass das Open-Source-Modell gegenüber Closed-Source-Systemen wie OpenAI aufschließe.
Qwen3 wird trotz der Einschränkungen der US- Regierung im Inland sicherlich weiterhin breite Anwendung finden. „Das zeigt, dass chinesische Technologieunternehmen nicht nur auf bestehende Modelle wie Anthropic und OpenAI zurückgreifen, sondern auch ihre eigene Software entwickeln können“, sagte er.
Quelle: https://znews.vn/them-loat-ai-manh-me-tu-trung-quoc-post1549756.html
Kommentar (0)