Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek avsatt

Alibabas AI-modell, kallad Qwen3, klarade R1 i LiveBench-tester som utvärderar kapaciteten hos modeller med öppen källkod, inklusive programmering, matematik och dataanalys.

ZNewsZNews06/05/2025

Qwen3, en ny teknik lanserad av Alibaba. Foto: SCMP .

Enligt de senaste benchmarktesterna av AI-världen har Alibabas nyligen släppta artificiella intelligensmodell Qwen3 överträffat DeepSeeks R1 och blivit världens högst rankade öppen källkodsmodell.

Mer specifikt visar data från LiveBench, en oberoende plattform som jämför stora språkmodeller (LLM), tekniken som ligger till grund för generativa AI-tjänster som ChatGPT, att Qwen3 överträffade R1 i testerna.

Granskningen av AI-modellers kapacitet med öppen källkod omfattar programmering, matematik, dataanalys och språkundervisning.

AI-modellserien Qwen3 släpptes av Alibaba den 28 april. Företaget hävdar att denna chatbot kan jämföras med, och till och med överträffa, de bästa modellerna som för närvarande finns tillgängliga från OpenAI eller Google i vissa fall.

Med en storlek på upp till 235 miljarder parametrar är Qwen3 i nivå med DeepSeek-V2 och OpenAI GPT-4, som har cirka 236 miljarder respektive 175 miljarder parametrar. Användare kommer snart att kunna ladda ner den under en öppen licens på AI-utvecklingsplattformen Hugging Face och Github när modellserien släpps.

Företaget säger att Qwen3-kollektionen inkluderar hybridmodeller, vilket innebär att de kan anpassa sin tid för att lösa komplexa problem eller snabbt svara på enkla förfrågningar. I det här fallet tillåter inferens modellen att självkontrollera informationens riktighet, men det medför hög latens.

Denna design gör det enkelt för användare att avsätta lämplig budget för varje specifik uppgift. Dessutom lär sig modellen av många konkurrenter runt om i världen.

Med hjälp av en "mix of experts"-arkitektur (MoE) liknande DeepSeek kan Qwen3 maximera beräkningseffektiviteten till en bråkdel av träningskostnaden. Detta är en metod som bryter ner en uppgift i separata delar och bara rekommenderar tillräckligt med djupgående data för att utföra.

Enligt utvecklingsteamet stöder Qwen3 upp till 119 språk och tränas på en datamängd med nästan 36 000 miljarder tokens, motsvarande 27 000 miljarder ord. Träningsdata hämtas från många källor, såsom läroböcker, fråge- och svarsuppsättningar, programmeringskod eller egengenererad AI,...

Trots att Qwen3 toppar rankningen av öppen källkod visar omfattande tester av LiveBench att de ligger efter världens ledande AI-modeller med sluten källkod, särskilt OpenAI:s o3, Googles Gemini Pro 2.5 och Anthropics Claude 3.7.

För närvarande ligger OpenAI:s toppmodell, o3-mini high, som stöds av Microsoft, högst upp på den totala rankingen av AI-modeller i världen.

Källa: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html


Kommentar (0)

Lämna en kommentar för att dela dina känslor!

I samma kategori

Notre Dame-katedralen i Ho Chi Minh-staden är starkt upplyst för att välkomna julen 2025
Hanoi-flickor "klär upp sig" vackert inför julen
Ljusare efter stormen och översvämningen hoppas Tet-krysantemumbyn i Gia Lai att det inte blir några strömavbrott för att rädda växterna.
Huvudstaden för gul aprikos i den centrala regionen drabbades av stora förluster efter dubbla naturkatastrofer

Av samma författare

Arv

Figur

Företag

Dalat kafé ser 300% ökning av kunder tack vare att ägaren spelar roll i "kampsportsfilm"

Aktuella händelser

Politiskt system

Lokal

Produkt

Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC