Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek byl sesazen z trůnu.

Model umělé inteligence Qwen3 od společnosti Alibaba prošel v testech LiveBench R1, které hodnotí schopnosti modelů s otevřeným zdrojovým kódem v programování, matematice a analýze dat.

ZNewsZNews06/05/2025

Qwen3, nová technologie, kterou uvedla na trh společnost Alibaba. Foto: SCMP .

Podle nejnovějších benchmarkových testů umělé inteligence nově vydaný model umělé inteligence Qwen3 od společnosti Alibaba překonal model R1 od společnosti DeepSeek a stal se nejlépe hodnoceným modelem s otevřeným zdrojovým kódem na světě .

Konkrétně data z LiveBench, nezávislé platformy, která hodnotí modely velkých jazyků (LLM), základní technologii pro generativní služby umělé inteligence, jako je ChatGPT, ukazují, že Qwen3 v testech překonal R1.

Posouzení schopností modelů umělé inteligence s otevřeným zdrojovým kódem zahrnuje programování, matematiku, analýzu dat a výuku jazyků.

Společnost Alibaba 28. dubna uvedla na trh řadu modelů Qwen3 s umělou inteligencí. Společnost tvrdí, že tento chatbot může konkurovat, nebo v některých případech dokonce předčit, nejlepší současné modely od OpenAI nebo Googlu.

S velikostí až 235 miliard parametrů má Qwen3 výkon srovnatelný s DeepSeek-V2 a OpenAI GPT-4, které mají přibližně 236 miliard, respektive 175 miliard parametrů. Uživatelé si jej budou moci brzy stáhnout pod otevřenou licencí na platformě pro vývoj umělé inteligence Hugging Face a Githubu, jakmile bude tato série modelů vydána.

Společnost uvedla, že kolekce Qwen3 obsahuje hybridní modely, což znamená, že mohou flexibilně alokovat čas na uvažování pro řešení složitých problémů nebo rychle reagovat na jednoduché požadavky. V tomto modelu umožňuje schopnost uvažování sebeověřovat přesnost informací, ale to je doprovázeno značným časovým zpožděním.

Díky tomuto designu mohou uživatelé snadno alokovat rozpočet na každý konkrétní úkol. Navíc se tento model učí od mnoha konkurentů po celém světě.

Díky architektuře „směsi expertů“ (MoE) podobné DeepSeek dokáže Qwen3 optimalizovat výpočetní výkon a zároveň využít pouze zlomek nákladů na trénování. Tato metoda rozděluje úkoly na mnoho samostatných částí a k jejich provedení vyžaduje pouze dostatečné množství datově náročných.

Podle vývojového týmu Qwen3 podporuje až 119 jazyků a je trénován na datové sadě téměř 36 bilionů tokenů, což odpovídá 27 bilionům slov. Trénovací data pocházejí z různých zdrojů, jako jsou učebnice, sady otázek a odpovědí, programový kód nebo dokonce data generovaná umělou inteligencí atd.

Přestože Qwen3 obsadil první místo v žebříčku open-source produktů, rozšířený benchmarkový test LiveBench ukazuje, že stále zaostává za předními světovými modely umělé inteligence s uzavřeným zdrojovým kódem. Mezi nejvýznamnější z nich patří o3 od OpenAI, Gemini Pro 2.5 od Googlu a Claude 3.7 od Anthropic.

V současné době je nejpokročilejší model OpenAI podporovaný společností Microsoft, o3-mini high, na čele celkového žebříčku modelů umělé inteligence po celém světě.

Zdroj: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html


Komentář (0)

Zanechte komentář a podělte se o své pocity!

Ve stejné kategorii

Od stejného autora

Dědictví

Postava

Firmy

Aktuální události

Politický systém

Místní

Produkt

Happy Vietnam
PŘÍSAHA

PŘÍSAHA

Mladí diváci s fotkami Šťastný Vietnam

Mladí diváci s fotkami Šťastný Vietnam

Všechno nejlepší k narozeninám mrakům a slunci!

Všechno nejlepší k narozeninám mrakům a slunci!