DeepSeek byl sesazen z trůnu.

Qwen3, nová technologie, kterou uvedla na trh společnost Alibaba. Foto: SCMP .

Podle nejnovějších benchmarkových testů umělé inteligence nově vydaný model umělé inteligence Qwen3 od společnosti Alibaba překonal model R1 od společnosti DeepSeek a stal se nejlépe hodnoceným modelem s otevřeným zdrojovým kódem na světě .

Konkrétně data z LiveBench, nezávislé platformy, která hodnotí modely velkých jazyků (LLM), základní technologii pro generativní služby umělé inteligence, jako je ChatGPT, ukazují, že Qwen3 v testech překonal R1.

Posouzení schopností modelů umělé inteligence s otevřeným zdrojovým kódem zahrnuje programování, matematiku, analýzu dat a výuku jazyků.

Společnost Alibaba 28. dubna uvedla na trh řadu modelů Qwen3 s umělou inteligencí. Společnost tvrdí, že tento chatbot může konkurovat, nebo v některých případech dokonce předčit, nejlepší současné modely od OpenAI nebo Googlu.

S velikostí až 235 miliard parametrů má Qwen3 výkon srovnatelný s DeepSeek-V2 a OpenAI GPT-4, které mají přibližně 236 miliard, respektive 175 miliard parametrů. Uživatelé si jej budou moci brzy stáhnout pod otevřenou licencí na platformě pro vývoj umělé inteligence Hugging Face a Githubu, jakmile bude tato série modelů vydána.

Společnost uvedla, že kolekce Qwen3 obsahuje hybridní modely, což znamená, že mohou flexibilně alokovat čas na uvažování pro řešení složitých problémů nebo rychle reagovat na jednoduché požadavky. V tomto modelu umožňuje schopnost uvažování sebeověřovat přesnost informací, ale to je doprovázeno značným časovým zpožděním.

Díky tomuto designu mohou uživatelé snadno alokovat rozpočet na každý konkrétní úkol. Navíc se tento model učí od mnoha konkurentů po celém světě.

Díky architektuře „směsi expertů“ (MoE) podobné DeepSeek dokáže Qwen3 optimalizovat výpočetní výkon a zároveň využít pouze zlomek nákladů na trénování. Tato metoda rozděluje úkoly na mnoho samostatných částí a k jejich provedení vyžaduje pouze dostatečné množství datově náročných.

Podle vývojového týmu Qwen3 podporuje až 119 jazyků a je trénován na datové sadě téměř 36 bilionů tokenů, což odpovídá 27 bilionům slov. Trénovací data pocházejí z různých zdrojů, jako jsou učebnice, sady otázek a odpovědí, programový kód nebo dokonce data generovaná umělou inteligencí atd.

Přestože Qwen3 obsadil první místo v žebříčku open-source produktů, rozšířený benchmarkový test LiveBench ukazuje, že stále zaostává za předními světovými modely umělé inteligence s uzavřeným zdrojovým kódem. Mezi nejvýznamnější z nich patří o3 od OpenAI, Gemini Pro 2.5 od Googlu a Claude 3.7 od Anthropic.

V současné době je nejpokročilejší model OpenAI podporovaný společností Microsoft, o3-mini high, na čele celkového žebříčku modelů umělé inteligence po celém světě.

Zdroj: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html