Model umělé inteligence R1 od čínského startupu DeepSeek, který při svém lednovém spuštění šokoval americký akciový trh, byl publikován v první recenzované studii, která ukazuje, jak vyvinul výkonný LLM za pouhých 300 000 dolarů.
R1 je navržen tak, aby vynikal v úlohách uvažování, jako je matematika a programování, což z něj činí levného rivala nástrojů vyvinutých americkými technologickými giganty.
Jedná se o model s „otevřenou váhou“, který je ke stažení zdarma a v současné době je nejoblíbenějším modelem na platformě Hugging Face s více než 10,9 miliony stažení.
Studie časopisu Nature, aktualizace lednového rukopisu, poprvé odhalila, že trénink R1 stál pouhých 294 000 dolarů, kromě zhruba 6 milionů dolarů vynaložených na stavbu základního modelu.
Toto číslo je mnohem nižší než desítky milionů dolarů, které údajně utratili konkurenti.
DeepSeek uvedl, že R1 byl trénován primárně s využitím čipů Nvidia H800, jejichž vývoz do Číny je v USA zakázán od roku 2023.
Průlomem R1 bylo použití „čistého posilovacího učení“, kde je model trénován metodou pokus-omyl a odměňován za správné odpovědi, spíše než aby se učil z příkladů vybraných lidmi. Také hodnotí své vlastní úsilí pomocí interních odhadů, techniky zvané „relativní optimalizace skupinových politik“, která pomáhá zvýšit výkon.
„Přísný proces vzájemného hodnocení pomáhá ověřit hodnotu a spolehlivost modelu,“ říká výzkumník Huan Sun (Ohio State University). „Ostatní firmy by měly udělat totéž.“
Lewis Tunstall, inženýr strojového učení ve společnosti Hugging Face, uvedl, že se jedná o důležitý precedent, protože transparentnost ve vývoji umělé inteligence pomáhá přesněji posoudit rizika.
DeepSeek tvrdí, že R1 nebyl trénován s využitím dat z modelů OpenAI, ačkoli připouští, že základní model byl trénován na webových datech – která by mohla zahrnovat obsah generovaný umělou inteligencí.
Odborníci tvrdí, že i když je obtížné to absolutně ověřit, současné důkazy naznačují, že pouhé vylepšení je dostatečné k dosažení vysokého výkonu.
V testu ScienceAgentBench se R1 sice nedostal na první místo v žebříčku přesnosti, ale dosáhl dobré rovnováhy mezi efektivitou a náklady. Vědci se nyní snaží aplikovat metodu DeepSeek k vylepšení schopností uvažování stávajících LLM a také ji rozšířit do oblastí nad rámec matematiky a programování.
Podle pana Tunstalla R1 „zahájila revoluci“ ve vývoji umělé inteligence.
Zdroj: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp
Komentář (0)