DeepSeek har blitt avsatt.

Qwen3, en ny teknologi lansert av Alibaba. Foto: SCMP .

Ifølge de nyeste AI-benchmarktestene har Alibabas nylig utgitte kunstige intelligensmodell Qwen3 overgått DeepSeeks R1 og blitt verdens høyest rangerte åpen kildekode-modell.

Spesielt viser data fra LiveBench, en uavhengig plattform som scorer store språkmodeller (LLM-er), den grunnleggende teknologien for generative AI-tjenester som ChatGPT, at Qwen3 har overgått R1 i testene.

Vurderingen av egenskapene til åpen kildekode-KI-modeller inkluderer programmering, matematikk, dataanalyse og språkopplæring.

Alibaba lanserte sin Qwen3 AI-modellserie 28. april. Selskapet hevder at denne chatboten kan konkurrere med, eller til og med overgå, de beste nåværende modellene fra OpenAI eller Google i noen tilfeller.

Med en størrelse på opptil 235 milliarder parametere har Qwen3 ytelse som kan sammenlignes med DeepSeek-V2 og OpenAI GPT-4, som har henholdsvis omtrent 236 milliarder og 175 milliarder parametere. Brukere vil snart kunne laste den ned under åpen lisens på AI-utviklingsplattformen Hugging Face og Github når denne modellserien er utgitt.

Selskapet opplyste at Qwen3-kolleksjonen inkluderer hybridmodeller, som betyr at de fleksibelt kan tildele tid til resonnement for å løse komplekse problemer eller raskt svare på enkle forespørsler. I denne modellen tillater resonnementskapasiteten selvverifisering av informasjonens nøyaktighet, men dette kommer med en betydelig tidsforsinkelse.

Denne designen gjør det enkelt for brukere å fordele budsjettet på riktig måte til hver spesifikke oppgave. I tillegg lærer denne modellen også av mange konkurrenter rundt om i verden.

Ved å bruke en «blanding av eksperter»-arkitektur (MoE) som ligner på DeepSeek, kan Qwen3 optimalisere beregningsytelsen samtidig som den bare bruker en brøkdel av opplæringskostnadene. Denne metoden deler opp oppgaver i mange separate deler og krever bare en tilstrekkelig mengde dataintensive data for å utføre dem.

Ifølge utviklingsteamet støtter Qwen3 opptil 119 språk og er trent på et datasett med nesten 36 billioner tokens, tilsvarende 27 billioner ord. Treningsdata hentes fra ulike kilder som lærebøker, spørsmål-svar-sett, programmeringskode eller til og med AI-genererte data, osv.

Til tross for at Qwen3 topper rangeringen av åpen kildekode, viser LiveBenchs utvidede benchmarktest at Qwen3 fortsatt henger etter verdens ledende AI-modeller med lukket kildekode. De mest fremtredende blant disse er OpenAIs o3, Googles Gemini Pro 2.5 og Anthropics Claude 3.7.

For tiden topper den mest avanserte OpenAI-modellen som støttes av Microsoft, o3-mini high, den samlede rangeringen av AI-modeller over hele verden.