Qwen3, een nieuwe technologie gelanceerd door Alibaba. Foto: SCMP . |
Volgens de laatste benchmarktests in de AI-wereld heeft Alibaba's onlangs gelanceerde model voor kunstmatige intelligentie, Qwen3, DeepSeek's R1 ingehaald en is daarmee het hoogst genoteerde open-sourcemodel ter wereld geworden.
Gegevens van LiveBench, een onafhankelijk platform dat grote taalmodellen (LLM's) benchmarkt, de technologie die ten grondslag ligt aan generatieve AI-services zoals ChatGPT, laten zien dat Qwen3 beter presteerde dan R1 in de tests.
Het overzicht van de mogelijkheden van open source AI-modellen omvat programmeren, wiskunde, data-analyse en taalonderwijs.
De AI-modelserie met de naam Qwen3 werd op 28 april door Alibaba uitgebracht. Het bedrijf beweert dat deze chatbot vergelijkbaar kan zijn met, en in sommige gevallen zelfs kan overtreffen, de beste modellen die momenteel beschikbaar zijn van OpenAI of Google.
Met een omvang van maximaal 235 miljard parameters is Qwen3 vergelijkbaar met DeepSeek-V2 en OpenAI GPT-4, die respectievelijk ongeveer 236 miljard en 175 miljard parameters hebben. Gebruikers kunnen het binnenkort downloaden onder een open licentie op het AI-ontwikkelplatform Hugging Face en Github zodra de reeks modellen is uitgebracht.
Het bedrijf zegt dat de Qwen3-collectie hybride modellen bevat, wat betekent dat ze hun tijd flexibel kunnen besteden aan het afleiden van complexe problemen of het snel reageren op eenvoudige verzoeken. In dit geval stelt inferentie het model in staat om de nauwkeurigheid van informatie zelf te controleren, maar dit brengt een hoge latentie met zich mee.
Dit ontwerp maakt het voor gebruikers eenvoudig om het juiste budget voor elke specifieke taak toe te wijzen. Bovendien leert dit model van vele concurrenten over de hele wereld.
Met een 'mixture of experts'-architectuur (MoE) vergelijkbaar met DeepSeek, kan Qwen3 de rekenefficiëntie maximaliseren tegen een fractie van de trainingskosten. Deze aanpak splitst een taak op in afzonderlijke onderdelen en beveelt alleen voldoende diepgaande data aan om uit te voeren.
Volgens het ontwikkelteam ondersteunt Qwen3 tot 119 talen en is het getraind op een dataset van bijna 36.000 miljard tokens, wat overeenkomt met 27.000 miljard woorden. De trainingsgegevens zijn afkomstig uit vele bronnen, zoals leerboeken, vraag-antwoordsets, programmeercode of zelfgegenereerde AI.
Ondanks dat Qwen3 bovenaan de open source-ranglijst staat, blijkt uit uitgebreide tests door LiveBench dat het achterblijft bij 's werelds toonaangevende closed-source AI-modellen, met name OpenAI's o3, Google's Gemini Pro 2.5 en Anthropic's Claude 3.7.
Momenteel staat het topmodel van OpenAI, o3-mini high, dat door Microsoft wordt ondersteund, bovenaan de ranglijst van beste AI-modellen ter wereld.
Bron: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










Reactie (0)