Qwen3, en ny teknik lanserad av Alibaba. Foto: SCMP . |
Enligt de senaste benchmarktesterna av AI-världen har Alibabas nyligen släppta artificiella intelligensmodell Qwen3 överträffat DeepSeeks R1 och blivit världens högst rankade öppen källkodsmodell.
Mer specifikt visar data från LiveBench, en oberoende plattform som jämför stora språkmodeller (LLM), tekniken som ligger till grund för generativa AI-tjänster som ChatGPT, att Qwen3 överträffade R1 i testerna.
Granskningen av AI-modellers kapacitet med öppen källkod omfattar programmering, matematik, dataanalys och språkundervisning.
AI-modellserien Qwen3 släpptes av Alibaba den 28 april. Företaget hävdar att denna chatbot kan jämföras med, och till och med överträffa, de bästa modellerna som för närvarande finns tillgängliga från OpenAI eller Google i vissa fall.
Med en storlek på upp till 235 miljarder parametrar är Qwen3 i nivå med DeepSeek-V2 och OpenAI GPT-4, som har cirka 236 miljarder respektive 175 miljarder parametrar. Användare kommer snart att kunna ladda ner den under en öppen licens på AI-utvecklingsplattformen Hugging Face och Github när modellserien släpps.
Företaget säger att Qwen3-kollektionen inkluderar hybridmodeller, vilket innebär att de kan anpassa sin tid för att lösa komplexa problem eller snabbt svara på enkla förfrågningar. I det här fallet tillåter inferens modellen att självkontrollera informationens riktighet, men det medför hög latens.
Denna design gör det enkelt för användare att avsätta lämplig budget för varje specifik uppgift. Dessutom lär sig modellen av många konkurrenter runt om i världen.
Med hjälp av en "mix of experts"-arkitektur (MoE) liknande DeepSeek kan Qwen3 maximera beräkningseffektiviteten till en bråkdel av träningskostnaden. Detta är en metod som bryter ner en uppgift i separata delar och bara rekommenderar tillräckligt med djupgående data för att utföra.
Enligt utvecklingsteamet stöder Qwen3 upp till 119 språk och tränas på en datamängd med nästan 36 000 miljarder tokens, motsvarande 27 000 miljarder ord. Träningsdata hämtas från många källor, såsom läroböcker, fråge- och svarsuppsättningar, programmeringskod eller egengenererad AI,...
Trots att Qwen3 toppar rankningen av öppen källkod visar omfattande tester av LiveBench att de ligger efter världens ledande AI-modeller med sluten källkod, särskilt OpenAI:s o3, Googles Gemini Pro 2.5 och Anthropics Claude 3.7.
För närvarande ligger OpenAI:s toppmodell, o3-mini high, som stöds av Microsoft, högst upp på den totala rankingen av AI-modeller i världen.
Källa: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










Kommentar (0)