Společnost DeepSeek se zaměřuje spíše na výzkum a vývoj nových modelů než na časté objevování se v médiích. Foto: SCMP . |
Ve spolupráci s výzkumníky z Univerzity Tsinghua představila společnost DeepSeek novou metodu pro zlepšení inferenčních schopností modelů velkých jazyků (LLM). Metoda, publikovaná ve výzkumném článku večer 4. dubna, pomáhá LLM produkovat lepší a rychlejší výsledky pro běžné dotazy.
Tato technika kombinuje dvě dříve úspěšné metody od DeepSeek. Jednou je generativní modelování odměn (GRM), které umožňuje modelu umělé inteligence samovyhodnocovat a zdokonalovat své reakce na základě předchozích výsledků, a druhou je samoregulace kritiky.
Obě metody se spoléhají na aspekt „samoučení“ umělé inteligence, čímž snižují závislost na přímé lidské zpětné vazbě nebo vedení, ale s cílem dosáhnout výsledků, které se blíží lidským očekáváním.
Podle výzkumníků dosahuje DeepSeek-GRM, přestože se jedná o novou metodu, vynikajících výsledků a konkuruje nejznámějším a nejúčinnějším modelům umělé inteligence, které jsou v současnosti k dispozici. DeepSeek plánuje zveřejnit modely GRM jako open-source, ale zatím nebyl stanoven žádný konkrétní časový rámec.
Poté, co společnost DeepSeek dosáhla globálního dopadu se svým modelem platformy V3 a inferenčním modelem R1, publikovala tento akademický článek v online vědeckém archivu arXiv, což vyvolalo zvědavost ohledně dalšího postupu společnosti.
Agentura Reuters předpovídá, že DeepSeek-R2, nástupce R1, by mohl být uveden na trh v dubnu, vzhledem k pokračující popularitě svého předchůdce. DeepSeek-R1 již dříve způsobil v technologickém světě globální senzaci díky svému vynikajícímu výkonu v poměru k ceně, což ho učinilo konkurenceschopným se současnými předními modely.
Společnost DeepSeek k těmto fámám mlčí. Podle místních zdrojů však účet zákaznické podpory DeepSeeku tuto informaci popřel ve skupinovém chatu s podnikovými klienty.
Společnost DeepSeek, založená v roce 2023 v Chang-čou podnikatelem Liangem Wenfengem, si v posledních několika měsících rychle získala celosvětovou pozornost. Místo toho, aby však společnost využila své veřejné slávy, zaměřuje své zdroje na výzkum a vývoj.
Společnost DeepSeek dříve aktualizovala svůj model V3 vydáním verze DeepSeek-V3-0324. Podle oznámení tato aktualizace obsahuje vylepšené možnosti uvažování, optimalizaci pro vývoj webových uživatelských rozhraní a vylepšené dovednosti psaní v čínštině.
V únoru startup také open-source pět repozitářů kódu, čímž potvrdil svůj závazek k „pokroku s plnou transparentností“. Také v témže měsíci společnost oznámila technickou studii o „nativní řídké pozornosti“, která pomáhá zlepšit výkon LLM při zpracování obrovského množství dat.
DeepSeek je vnímán jako symbol dynamiky čínského průmyslu umělé inteligence v době, kdy se USA snaží omezit technologický rozvoj země.
Zdroj: https://znews.vn/deepseek-gay-to-mo-post1543900.html






Komentář (0)