Vietnam.vn - Nền tảng quảng bá Việt Nam

Stärkere KI-Serie aus China

Das Modell kann mit starken Konkurrenten auf der ganzen Welt konkurrieren und signalisiert das wachsende technologische Potenzial des Landes mit einer Milliarde Einwohnern.

Zing NewsZing News29/04/2025

Qwen3, neue Technologie von Alibaba. Foto: Reuters .

Am 28. April brachte der chinesische Technologieriese Alibaba eine Reihe von KI-Modellen namens Qwen3 auf den Markt. Das Unternehmen behauptet, dass dieser Chatbot mit den besten aktuellen Modellen von OpenAI oder Google mithalten oder sie in einigen Fällen sogar übertreffen kann.

Mit einer Größe von bis zu 235 Milliarden Parametern weist Qwen3 eine Leistung auf, die mit DeepSeek-V2 und OpenAI GPT-4 vergleichbar ist, die über etwa 236 Milliarden bzw. 175 Milliarden Parameter verfügen. Sobald diese Modellreihe veröffentlicht ist, können Benutzer es bald unter einer offenen Lizenz auf der Hugging Face AI-Entwicklungsplattform und auf Github herunterladen.

Das Unternehmen gibt an, dass die Qwen3-Kollektion Hybridmodelle umfasst, was bedeutet, dass sie ihre Zeit flexibel nutzen können, um komplexe Probleme zu durchdenken oder schnell auf einfache Anfragen zu reagieren. Dabei hilft die Inferenzfähigkeit dem Modell, die Genauigkeit der Informationen selbst zu überprüfen, weist jedoch eine hohe Latenz auf.

Dieses Design erleichtert Benutzern die Zuweisung des entsprechenden Budgets für jede spezifische Aufgabe. Darüber hinaus lernt dieses Modell auch von vielen Konkurrenten auf der ganzen Welt .

Durch die Verwendung derselben „Mixture of Experts“-Architektur (MoE) wie DeepSeek kann Qwen3 die Rechenleistung optimieren, verbraucht dabei aber nur einen Bruchteil der Trainingskosten. Dabei handelt es sich um eine Methode, eine Aufgabe in einzelne Teile aufzuteilen und nur so viele detaillierte Daten vorzuschlagen, wie für die Durchführung erforderlich sind.

Laut dem Entwicklungsteam unterstützt Qwen3 bis zu 119 Sprachen und wird auf einem Datensatz von fast 36 Billionen Token trainiert, was 27 Billionen Wörtern entspricht. Trainingsdaten stammen aus vielen Quellen, beispielsweise Lehrbüchern, Frage-Antwort-Sets, Programmcode oder werden von KI generiert, …

Diese und viele andere Verbesserungen haben die Fähigkeiten des Chatbots im Vergleich zu seinem Vorgänger Qwen2 deutlich erweitert. Techcrunch weist darauf hin, dass die Leistung des Qwen 3 zwar nicht ganz denen der aktuellen Topmodelle wie OpenAIs o3 oder o4-mini überlegen ist, aber dennoch eine beeindruckende Leistung zeigt.

Alibaba ra mat AI moi anh 1

Vergleichen Sie die Ergebnisse von Einstufungstests. Foto: Qwen/X.

Qwen-3-235B-A22B, das größte Modell der Sammlung, schlug OpenAIs o3-mini und Googles Gemini 2.5 Pro auf Codeforces , der beliebten Programmierwettbewerbsplattform. Auch in den AIME- und BFCL-Schwierigkeitstests, die die Denkfähigkeit eines Modells bewerten, schnitt die Software besser ab als o3-mini.

Der Qwen-3-235B-A22B muss noch offiziell der Öffentlichkeit vorgestellt werden. In der Zwischenzeit können Benutzer Qwen3-32B herunterladen. Das Modell übertrifft OpenAIs o1 in mehreren Benchmarks, einschließlich des LiveCodeBench-Programmiertests.

Alibaba sagt, dass Qwen3 sich durch Tool-Aufrufe, Anweisungskonformität und genaue Replikation von Datenformaten auszeichnet. Dies ist ein Element, das vielen anderen Tools fehlt. Untersuchungen der Carnegie Mellon University haben ergeben, dass viele KIs Informationen erfinden und Formate ändern, obwohl sie ausdrücklich darum gebeten wurden.

Zusätzlich zum Herunterladen auf den oben genannten Plattformen können Benutzer Qwen3 über Cloud-Dienstanbieter wie Fireworks AI und Hyperbolic finden. Dies ermöglicht großen und kleinen Unternehmen sowie einzelnen Entwicklern den Zugriff und das Experimentieren über Grenzen hinweg.

Das Aufkommen einiger chinesischer KIs wie Qwen hat den Druck auf US-Forschungslabore erhöht und sie dazu gedrängt, leistungsfähigere Technologien zu entwickeln. Infolgedessen haben die politischen Entscheidungsträger des Landes Beschränkungen erlassen, um Chinas Zugang zu Chips einzuschränken.

Tuhin Srivastava, CEO des Cloud-KI-Hosting-Unternehmens Baseten, sagte, Qwen3 sei ein weiteres Beispiel dafür, dass das Open-Source-Modell gegenüber Closed-Source-Systemen wie OpenAI aufschließe.

Qwen3 wird trotz der Beschränkungen durch die US- Regierung im Inland sicherlich weiterhin weit verbreitet sein. „Das zeigt, dass chinesische Technologieunternehmen nicht nur auf bestehende Modelle wie Anthropic und OpenAI zurückgreifen, sondern auch weiterhin ihre eigene Software entwickeln können“, sagte er.

Quelle: https://znews.vn/them-loat-ai-manh-me-tu-trung-quoc-post1549756.html


Kommentar (0)

No data
No data

Erbe

Figur

Geschäft

No videos available

Nachricht

Politisches System

Lokal

Produkt