DeepSeek is van de troon gestoten.

Qwen3, een nieuwe technologie van Alibaba. Foto: SCMP .

Volgens de nieuwste AI-benchmarktests heeft Alibaba's onlangs gelanceerde Qwen3-model voor kunstmatige intelligentie DeepSeek's R1 overtroffen en is daarmee het best beoordeelde open-source model ter wereld geworden.

Concreet laten gegevens van LiveBench, een onafhankelijk platform dat grote taalmodellen (LLM's) beoordeelt – de basistechnologie voor generatieve AI-diensten zoals ChatGPT – zien dat Qwen3 R1 in de tests heeft overtroffen.

De beoordeling van de mogelijkheden van open-source AI-modellen omvat programmeren, wiskunde, data-analyse en taalonderwijs.

Alibaba heeft op 28 april zijn Qwen3 AI-modelserie uitgebracht. Het bedrijf beweert dat deze chatbot kan wedijveren met, of in sommige gevallen zelfs beter kan presteren dan, de beste huidige modellen van OpenAI of Google.

Met een omvang van maximaal 235 miljard parameters heeft Qwen3 prestaties die vergelijkbaar zijn met DeepSeek-V2 en OpenAI GPT-4, die respectievelijk ongeveer 236 miljard en 175 miljard parameters hebben. Gebruikers kunnen het binnenkort downloaden onder een open licentie op het AI-ontwikkelingsplatform Hugging Face en Github zodra deze reeks modellen is uitgebracht.

Het bedrijf verklaarde dat de Qwen3-collectie hybride modellen omvat, wat betekent dat ze flexibel tijd kunnen toewijzen aan redeneren om complexe problemen op te lossen of snel te reageren op eenvoudige verzoeken. In dit model maakt de redeneerfunctie zelfverificatie van de juistheid van informatie mogelijk, maar dit gaat gepaard met een aanzienlijke vertraging.

Dit ontwerp maakt het voor gebruikers eenvoudig om budget op de juiste manier toe te wijzen aan elke specifieke taak. Bovendien leert dit model ook van vele concurrenten wereldwijd.

Door gebruik te maken van een "mixture of experts" (MoE)-architectuur, vergelijkbaar met DeepSeek, kan Qwen3 de rekenprestaties optimaliseren met slechts een fractie van de trainingskosten. Deze methode verdeelt taken in vele afzonderlijke onderdelen en vereist slechts een voldoende hoeveelheid data-intensieve gegevens om deze uit te voeren.

Volgens het ontwikkelingsteam ondersteunt Qwen3 tot 119 talen en is het getraind op een dataset van bijna 36 biljoen tokens, wat overeenkomt met 27 biljoen woorden. De trainingsdata is afkomstig uit diverse bronnen, zoals leerboeken, vraag-antwoordsets, programmeercode en zelfs door AI gegenereerde data.

Ondanks dat Qwen3 bovenaan de open-source ranglijst staat, laat de uitgebreide benchmarktest van LiveBench zien dat het nog steeds achterblijft bij 's werelds toonaangevende closed-source AI-modellen. De meest prominente hiervan zijn OpenAI's o3, Google's Gemini Pro 2.5 en Anthropic's Claude 3.7.

Het meest geavanceerde OpenAI-model dat momenteel door Microsoft wordt ondersteund, o3-mini high, staat bovenaan de wereldwijde ranglijst van AI-modellen.

Bron: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html