Vietnam.vn - Nền tảng quảng bá Việt Nam

Nový výzkum odhaluje tajemství úspěchu DeepSeeku

Podle DeepSeeku nebyl model umělé inteligence R1 trénován s využitím dat z modelu OpenAI, ačkoli společnost uznala, že základní model byl trénován na webových datech – která by mohla zahrnovat obsah generovaný umělou inteligencí.

VietnamPlusVietnamPlus17/09/2025

Model umělé inteligence R1 od čínského startupu DeepSeek, který při svém lednovém spuštění šokoval americký akciový trh, byl publikován v první recenzované studii, která ukazuje, jak vyvinul výkonný LLM za pouhých 300 000 dolarů.

R1 je navržen tak, aby vynikal v úlohách uvažování, jako je matematika a programování, což z něj činí levného rivala nástrojů vyvinutých americkými technologickými giganty.

Jedná se o model s „otevřenou váhou“, který je ke stažení zdarma a v současné době je nejoblíbenějším modelem na platformě Hugging Face s více než 10,9 miliony stažení.

Studie časopisu Nature, aktualizace lednového rukopisu, poprvé odhalila, že trénink R1 stál pouhých 294 000 dolarů, kromě zhruba 6 milionů dolarů vynaložených na stavbu základního modelu.

Toto číslo je mnohem nižší než desítky milionů dolarů, které údajně utratili konkurenti.

DeepSeek uvedl, že R1 byl trénován primárně s využitím čipů Nvidia H800, jejichž vývoz do Číny je v USA zakázán od roku 2023.

Průlomem R1 bylo použití „čistého posilovacího učení“, kde je model trénován metodou pokus-omyl a odměňován za správné odpovědi, spíše než aby se učil z příkladů vybraných lidmi. Také hodnotí své vlastní úsilí pomocí interních odhadů, techniky zvané „relativní optimalizace skupinových politik“, která pomáhá zvýšit výkon.

„Přísný proces vzájemného hodnocení pomáhá ověřit hodnotu a spolehlivost modelu,“ říká výzkumník Huan Sun (Ohio State University). „Ostatní firmy by měly udělat totéž.“

Lewis Tunstall, inženýr strojového učení ve společnosti Hugging Face, uvedl, že se jedná o důležitý precedent, protože transparentnost ve vývoji umělé inteligence pomáhá přesněji posoudit rizika.

DeepSeek tvrdí, že R1 nebyl trénován s využitím dat z modelů OpenAI, ačkoli připouští, že základní model byl trénován na webových datech – která by mohla zahrnovat obsah generovaný umělou inteligencí.

Odborníci tvrdí, že i když je obtížné to absolutně ověřit, současné důkazy naznačují, že pouhé vylepšení je dostatečné k dosažení vysokého výkonu.

V testu ScienceAgentBench se R1 sice nedostal na první místo v žebříčku přesnosti, ale dosáhl dobré rovnováhy mezi efektivitou a náklady. Vědci se nyní snaží aplikovat metodu DeepSeek k vylepšení schopností uvažování stávajících LLM a také ji rozšířit do oblastí nad rámec matematiky a programování.

Podle pana Tunstalla R1 „zahájila revoluci“ ve vývoji umělé inteligence.

(TTXVN/Vietnam+)

Zdroj: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp


Komentář (0)

No data
No data

Ve stejném tématu

Ve stejné kategorii

Zachování ducha svátků středu podzimu prostřednictvím barev figurek
Objevte jedinou vesnici ve Vietnamu, která se nachází v žebříčku 50 nejkrásnějších vesnic světa
Proč jsou letos populární červené vlajkové lucerny se žlutými hvězdami?
Vietnam vyhrál hudební soutěž Intervize 2025

Od stejného autora

Dědictví

Postava

Obchod

No videos available

Zprávy

Politický systém

Místní

Produkt