DeepSeek har avsatts.

Qwen3, en ny teknik lanserad av Alibaba. Foto: SCMP .

Enligt de senaste AI-benchmarktesterna har Alibabas nyligen släppta artificiella intelligensmodell Qwen3 överträffat DeepSeeks R1 och blivit världens högst rankade modell med öppen källkod.

Mer specifikt visar data från LiveBench, en oberoende plattform som poängsätter stora språkmodeller (LLM), den grundläggande tekniken för generativa AI-tjänster som ChatGPT, att Qwen3 har överträffat R1 i testerna.

Bedömningen av kapaciteten hos AI-modeller med öppen källkod omfattar programmering, matematik, dataanalys och språkundervisning.

Alibaba släppte sin AI-modellserie Qwen3 den 28 april. Företaget hävdar att denna chatbot kan konkurrera med, eller till och med överträffa, de bästa nuvarande modellerna från OpenAI eller Google i vissa fall.

Med en storlek på upp till 235 miljarder parametrar har Qwen3 prestanda jämförbar med DeepSeek-V2 och OpenAI GPT-4, som har cirka 236 miljarder respektive 175 miljarder parametrar. Användare kommer snart att kunna ladda ner den under öppen licens på AI-utvecklingsplattformen Hugging Face och Github när denna modellserie släpps.

Företaget uppgav att Qwen3-kollektionen inkluderar hybridmodeller, vilket innebär att de flexibelt kan allokera tid för resonemang för att lösa komplexa problem eller snabbt svara på enkla förfrågningar. I den här modellen möjliggör resonemangsförmågan självverifiering av informationens noggrannhet, men detta kommer med en betydande tidsfördröjning.

Denna design gör det enkelt för användare att fördela budgeten på lämpligt sätt för varje specifik uppgift. Dessutom lär sig modellen av många konkurrenter runt om i världen.

Med hjälp av en "mix of experts"-arkitektur (MoE) liknande DeepSeek kan Qwen3 optimera beräkningsprestanda samtidigt som den bara använder en bråkdel av utbildningskostnaden. Denna metod bryter ner uppgifter i många separata delar och kräver endast en tillräcklig mängd dataintensiv data för att utföra dem.

Enligt utvecklingsteamet stöder Qwen3 upp till 119 språk och tränas på en datauppsättning med nästan 36 biljoner tokens, motsvarande 27 biljoner ord. Träningsdata hämtas från olika källor, såsom läroböcker, fråge- och svarsuppsättningar, programmeringskod eller till och med AI-genererad data etc.

Trots att Qwen3 toppar rankningen av öppen källkod visar LiveBenchs utökade benchmarktest att den fortfarande ligger efter världens ledande AI-modeller med sluten källkod. De mest framträdande bland dessa är OpenAI:s o3, Googles Gemini Pro 2.5 och Anthropics Claude 3.7.

För närvarande toppar den mest avancerade OpenAI-modellen som stöds av Microsoft, o3-mini high, den totala rankningen av AI-modeller världen över.