Qwen3, en ny teknologi lansert av Alibaba. Foto: SCMP . |
Ifølge de siste benchmark-testene av AI-verdenen har Alibabas nylig utgitte kunstige intelligens-modell Qwen3 overgått DeepSeeks R1 og blitt verdens høyest rangerte åpen kildekode-modell.
Spesielt viser data fra LiveBench, en uavhengig plattform som sammenligner store språkmodeller (LLM-er), teknologien som ligger til grunn for generative AI-tjenester som ChatGPT, at Qwen3 overgikk R1 i testene.
Gjennomgangen av muligheter for åpen kildekode-KI-modeller inkluderer programmering, matematikk, dataanalyse og språkopplæring.
AI-modellserien kalt Qwen3 ble lansert av Alibaba 28. april. Selskapet hevder at denne chatboten kan sammenlignes med, og til og med overgå, de beste modellene som for øyeblikket er tilgjengelige fra OpenAI eller Google i noen tilfeller.
Med en størrelse på opptil 235 milliarder parametere er Qwen3 på nivå med DeepSeek-V2 og OpenAI GPT-4, som har henholdsvis rundt 236 milliarder og 175 milliarder parametere. Brukere vil snart kunne laste den ned under en åpen lisens på AI-utviklingsplattformen Hugging Face og Github når modellserien er utgitt.
Selskapet sier at Qwen3-kolleksjonen inkluderer hybridmodeller, som betyr at de kan bruke tiden sin på å utlede slutninger for å løse komplekse problemer eller raskt svare på enkle forespørsler. I dette tilfellet lar inferens modellen selvsjekke nøyaktigheten av informasjonen, men det medfører høy latens.
Denne designen gjør det enkelt for brukere å fordele riktig budsjett for hver spesifikke oppgave. I tillegg lærer denne modellen også av mange konkurrenter rundt om i verden.
Ved å bruke en «blanding av eksperter»-arkitektur (MoE) som ligner på DeepSeek, kan Qwen3 maksimere beregningseffektiviteten til en brøkdel av opplæringskostnaden. Dette er en tilnærming som deler opp en oppgave i separate deler og bare anbefaler nok dypdata til å utføre den.
Ifølge utviklingsteamet støtter Qwen3 opptil 119 språk og er trent på et datasett med nesten 36 000 milliarder tokens, tilsvarende 27 000 milliarder ord. Treningsdata er hentet fra mange kilder, som lærebøker, spørsmål-svar-sett, programmeringskode eller egengenerert AI,...
Til tross for at Qwen3 topper rangeringen av åpen kildekode, viser omfattende tester fra LiveBench at Qwen3 henger bak verdens ledende AI-modeller med lukket kildekode, særlig OpenAIs o3, Googles Gemini Pro 2.5 og Anthropics Claude 3.7.
For øyeblikket er OpenAIs toppmodell støttet av Microsoft, o3-mini high, på toppen av den samlede rangeringen av AI-modeller i verden.
Kilde: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










Kommentar (0)