Qwen3, nová technologie, kterou uvedla na trh společnost Alibaba. Foto: SCMP . |
Podle nejnovějších benchmarkových testů ve světě umělé inteligence překonal nově vydaný model umělé inteligence Qwen3 od společnosti Alibaba model R1 od společnosti DeepSeek a stal se nejvýše hodnoceným modelem s otevřeným zdrojovým kódem na světě .
Konkrétně data z LiveBench, nezávislé platformy, která porovnává modely velkých jazyků (LLM), technologii, která je základem generativních služeb umělé inteligence, jako je ChatGPT, ukazují, že Qwen3 v testech překonal R1.
Přehled možností modelů umělé inteligence s otevřeným zdrojovým kódem zahrnuje programování, matematiku, analýzu dat a výuku jazyků.
Řadu modelů s umělou inteligencí s názvem Qwen3 uvedla společnost Alibaba na trh 28. dubna. Společnost tvrdí, že tento chatbot může být srovnatelný s nejlepšími modely, které jsou v současnosti k dispozici od OpenAI nebo Googlu, a v některých případech je dokonce předčí.
S velikostí až 235 miliard parametrů se Qwen3 vyrovná DeepSeek-V2 a OpenAI GPT-4, které mají přibližně 236 miliard, respektive 175 miliard parametrů. Uživatelé si jej budou moci brzy stáhnout pod otevřenou licencí na platformě pro vývoj umělé inteligence Hugging Face a Githubu, jakmile bude série modelů vydána.
Společnost uvádí, že kolekce Qwen3 obsahuje hybridní modely, což znamená, že si mohou flexibilně vyhradit čas na odvozování informací k řešení složitých problémů nebo k rychlé reakci na jednoduché požadavky. V tomto případě inference umožňuje modelu samokontrolu přesnosti informací, ale je spojena s vysokou latencí.
Díky tomuto designu si uživatelé snadno přidělí vhodný rozpočet pro každý konkrétní úkol. Navíc se tento model učí od mnoha konkurentů po celém světě.
Díky architektuře „směsi expertů“ (MoE), podobné DeepSeeku, dokáže Qwen3 maximalizovat výpočetní efektivitu za zlomek nákladů na trénování. Jedná se o přístup, který rozděluje úkol na samostatné části a doporučuje k provedení pouze dostatek hloubkových dat.
Podle vývojového týmu Qwen3 podporuje až 119 jazyků a je trénován na datové sadě o téměř 36 000 miliardách tokenů, což odpovídá 27 000 miliardám slov. Trénovací data jsou přebírána z mnoha zdrojů, jako jsou učebnice, sady otázek a odpovědí, programový kód nebo samogenerovaná umělá inteligence...
Přestože Qwen3 obsazuje první místo v žebříčku open-source technologií, rozsáhlé testování LiveBench ukazuje, že zaostává za předními světovými modely umělé inteligence s uzavřeným zdrojovým kódem, zejména za o3 od OpenAI, Gemini Pro 2.5 od Googlu a Claude 3.7 od Anthropic.
V současné době je špičkový model OpenAI podporovaný společností Microsoft, o3-mini high, na vrcholu celkového žebříčku modelů umělé inteligence na světě.
Zdroj: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










Komentář (0)