A DeepSeeket megfosztották trónjától.

Qwen3, az Alibaba által bevezetett új technológia. Fotó: SCMP .

A legfrissebb AI benchmark tesztek szerint az Alibaba újonnan kiadott Qwen3 mesterséges intelligencia modellje megelőzte a DeepSeek R1-et, és a világ legmagasabbra értékelt nyílt forráskódú modellje lett.

Konkrétan a LiveBench, egy független platform, amely nagy nyelvi modelleket (LLM-eket) értékel – ezek az alapvető technológiák a generatív mesterséges intelligencia szolgáltatásokhoz, mint például a ChatGPT –, adatai azt mutatják, hogy a Qwen3 felülmúlta az R1-et a tesztekben.

A nyílt forráskódú mesterséges intelligencia modellek képességeinek értékelése magában foglalja a programozást, a matematikát, az adatelemzést és a nyelvi oktatást.

Az Alibaba április 28-án mutatta be Qwen3 mesterséges intelligencia modellsorozatát. A vállalat azt állítja, hogy ez a chatbot bizonyos esetekben versenyezhet, vagy akár felül is múlhatja az OpenAI vagy a Google jelenlegi legjobb modelljeit.

A Qwen3 akár 235 milliárd paraméterrel is felvértezhető teljesítményt nyújt a DeepSeek-V2-höz és az OpenAI GPT-4-hez, amelyek körülbelül 236, illetve 175 milliárd paraméterrel rendelkeznek. A felhasználók hamarosan letölthetik nyílt licenc alatt a Hugging Face mesterséges intelligencia fejlesztő platformról és a Githubról, amint ez a modellsorozat megjelenik.

A vállalat kijelentette, hogy a Qwen3 kollekció hibrid modelleket tartalmaz, ami azt jelenti, hogy rugalmasan tudnak időt osztani az érvelésre az összetett problémák megoldása vagy az egyszerű kérések gyors megválaszolása érdekében. Ebben a modellben az érvelési képesség lehetővé teszi az információk pontosságának önellenőrzését, de ez jelentős időeltolódással jár.

Ez a kialakítás megkönnyíti a felhasználók számára, hogy megfelelően elosztják a költségvetést az egyes feladatokhoz. Továbbá ez a modell a világ számos versenytársától is tanul.

A DeepSeekhez hasonló „szakértők keveréke” (MoE) architektúra használatával a Qwen3 optimalizálhatja a számítási teljesítményt, miközben a betanítási költségeknek csak töredékét használja fel. Ez a módszer a feladatokat sok különálló részre bontja, és csak elegendő mennyiségű adatintenzív adatra van szükség a végrehajtásukhoz.

A fejlesztőcsapat szerint a Qwen3 akár 119 nyelvet is támogat, és közel 36 billió tokenből álló adathalmazon képzik, ami 27 billió szónak felel meg. A betanítási adatok különböző forrásokból származnak, például tankönyvekből, kérdés-válasz készletekből, programozási kódból, vagy akár mesterséges intelligencia által generált adatokból stb.

Annak ellenére, hogy a nyílt forráskódú rangsor élén áll, a LiveBench kibővített benchmark tesztje azt mutatja, hogy a Qwen3 továbbra is lemarad a világ vezető zárt forráskódú MI-modelljei mögött. Ezek közül a legkiemelkedőbbek az OpenAI o3-a, a Google Gemini Pro 2.5-e és az Anthropic Claude 3.7-e.

Jelenleg a Microsoft által támogatott legfejlettebb OpenAI-modell, az o3-mini high vezeti a mesterséges intelligencia modellek összesített rangsorát világszerte.

Forrás: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html