Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek wurde entthront.

Das KI-Modell Qwen3 von Alibaba hat die erste Stufe der LiveBench-Tests bestanden, die die Fähigkeiten von Open-Source-Modellen in den Bereichen Programmierung, Mathematik und Datenanalyse bewerten.

ZNewsZNews06/05/2025

Qwen3, eine neue Technologie von Alibaba. Foto: SCMP .

Laut den neuesten KI-Benchmark-Tests hat Alibabas neu veröffentlichtes künstliches Intelligenzmodell Qwen3 DeepSeek's R1 übertroffen und ist damit das weltweit am besten bewertete Open-Source-Modell.

Konkret zeigen Daten von LiveBench, einer unabhängigen Plattform, die große Sprachmodelle (LLMs) bewertet, die grundlegende Technologie für generative KI-Dienste wie ChatGPT, dass Qwen3 R1 in den Tests übertroffen hat.

Die Bewertung der Leistungsfähigkeit von Open-Source-KI-Modellen umfasst Programmierung, Mathematik, Datenanalyse und Sprachunterricht.

Alibaba hat am 28. April seine KI-Modellreihe Qwen3 veröffentlicht. Das Unternehmen behauptet, dass dieser Chatbot mit den besten aktuellen Modellen von OpenAI oder Google mithalten oder diese in einigen Fällen sogar übertreffen kann.

Mit bis zu 235 Milliarden Parametern bietet Qwen3 eine vergleichbare Leistung wie DeepSeek-V2 und OpenAI GPT-4, die jeweils etwa 236 Milliarden bzw. 175 Milliarden Parameter umfassen. Nutzer können Qwen3 nach Veröffentlichung der Modellreihe bald unter einer Open-Source-Lizenz auf der KI-Entwicklungsplattform Hugging Face und auf GitHub herunterladen.

Das Unternehmen erklärte, die Qwen3-Produktreihe umfasse Hybridmodelle, die flexibel Zeit für logisches Denken zur Lösung komplexer Probleme oder zur schnellen Beantwortung einfacher Anfragen aufwenden können. Bei diesem Modell ermöglicht die logische Funktion die Selbstprüfung der Informationsgenauigkeit, allerdings mit einer deutlichen Zeitverzögerung.

Dieses Design ermöglicht es Nutzern, das Budget jeder einzelnen Aufgabe angemessen zuzuordnen. Darüber hinaus profitiert dieses Modell von den Erfahrungen zahlreicher Wettbewerber weltweit.

Durch die Verwendung einer „Mixture of Experts“-Architektur (MoE), ähnlich wie bei DeepSeek, optimiert Qwen3 die Rechenleistung bei deutlich geringerem Trainingsaufwand. Diese Methode zerlegt Aufgaben in viele separate Teilaufgaben und benötigt nur eine ausreichende Menge an datenintensiven Daten, um diese zu lösen.

Laut dem Entwicklerteam unterstützt Qwen3 bis zu 119 Sprachen und wurde mit einem Datensatz von fast 36 Billionen Tokens trainiert, was 27 Billionen Wörtern entspricht. Die Trainingsdaten stammen aus verschiedenen Quellen wie Lehrbüchern, Fragen-Antworten-Sammlungen, Programmcode oder auch KI-generierten Daten.

Obwohl Qwen3 die Open-Source-Rangliste anführt, zeigt der erweiterte Benchmark-Test von LiveBench, dass es weiterhin hinter den weltweit führenden proprietären KI-Modellen zurückbleibt. Zu den bekanntesten zählen OpenAIs o3, Googles Gemini Pro 2.5 und Anthropics Claude 3.7.

Aktuell führt das fortschrittlichste von Microsoft unterstützte OpenAI-Modell o3-mini high die Gesamtrangliste der KI-Modelle weltweit an.

Quelle: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html


Kommentar (0)

Hinterlasse einen Kommentar, um deine Gefühle zu teilen!

Gleiche Kategorie

Bewundern Sie die zarte Schönheit der Karottenblüten – eine „seltene Entdeckung“ im Herzen von Da Lat.
Ein frohes neues Jahr 2026 auf dem Dach von Nha Trang!
Die Ausstellung „Tausend Jahre Philosophie“ im historischen Ausstellungsraum des Literaturtempels.
Bewundern Sie die einzigartigen Kumquatbaumgärten mit ihren charakteristischen Wurzelsystemen in einem Dorf am Flussufer in Hanoi.

Gleicher Autor

Erbe

Figur

Unternehmen

Internationale Touristen strömen nach Da Nang, um das neue Jahr 2026 zu feiern.

Aktuelles

Politisches System

Lokal

Produkt