Vietnam.vn - Nền tảng quảng bá Việt Nam

Nový výzkum odhaluje tajemství úspěchu DeepSeeku

Podle DeepSeeku nebyl model umělé inteligence R1 trénován s využitím dat z modelu OpenAI, ačkoli společnost uznala, že základní model byl trénován na webových datech – která by mohla zahrnovat obsah generovaný umělou inteligencí.

VietnamPlusVietnamPlus17/09/2025

Model umělé inteligence R1 od čínského startupu DeepSeek, který při svém lednovém spuštění šokoval americký akciový trh, byl publikován v první recenzované studii, která ukazuje, jak vyvinul výkonný LLM za pouhých 300 000 dolarů.

R1 je navržen tak, aby vynikal v úlohách uvažování, jako je matematika a programování, což z něj činí levného rivala nástrojů vyvinutých americkými technologickými giganty.

Jedná se o model s „otevřenou váhou“, který je ke stažení zdarma a v současné době je nejoblíbenějším modelem na platformě Hugging Face s více než 10,9 miliony stažení.

Studie časopisu Nature, aktualizace lednového rukopisu, poprvé odhalila, že trénink R1 stál pouhých 294 000 dolarů, kromě zhruba 6 milionů dolarů vynaložených na stavbu základního modelu.

Toto číslo je mnohem nižší než desítky milionů dolarů, které údajně utratili konkurenti.

DeepSeek uvedl, že R1 byl trénován primárně s využitím čipů Nvidia H800, jejichž vývoz do Číny je v USA zakázán od roku 2023.

Průlomem R1 bylo použití „čistého posilovacího učení“, kde je model trénován metodou pokus-omyl a odměňován za správné odpovědi, spíše než aby se učil z příkladů vybraných lidmi. Také hodnotí své vlastní úsilí pomocí interních odhadů, techniky zvané „relativní optimalizace skupinových politik“, která pomáhá zvýšit výkon.

„Přísný proces vzájemného hodnocení pomáhá ověřit hodnotu a spolehlivost modelu,“ říká výzkumník Huan Sun (Ohio State University). „Ostatní firmy by měly udělat totéž.“

Lewis Tunstall, inženýr strojového učení ve společnosti Hugging Face, uvedl, že se jedná o důležitý precedent, protože transparentnost ve vývoji umělé inteligence pomáhá přesněji posoudit rizika.

DeepSeek tvrdí, že R1 nebyl trénován s využitím dat z modelů OpenAI, ačkoli připouští, že základní model byl trénován na webových datech – která by mohla zahrnovat obsah generovaný umělou inteligencí.

Odborníci tvrdí, že i když je obtížné to absolutně ověřit, současné důkazy naznačují, že pouhé vylepšení je dostatečné k dosažení vysokého výkonu.

V testu ScienceAgentBench se R1 sice nedostal na první místo v žebříčku přesnosti, ale dosáhl dobré rovnováhy mezi efektivitou a náklady. Výzkumníci se nyní snaží aplikovat metodu DeepSeek k vylepšení schopností uvažování stávajících LLM a také ji rozšířit do oblastí nad rámec matematiky a programování.

Podle pana Tunstalla R1 „zahájila revoluci“ ve vývoji umělé inteligence.

(TTXVN/Vietnam+)

Zdroj: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp


Komentář (0)

No data
No data

Ve stejném tématu

Ve stejné kategorii

Dnes ráno se Quy Nhon probudil v zdrcení.
Hrdina práce Thai Huong byl v Kremlu přímo vyznamenán Medailí přátelství ruským prezidentem Vladimirem Putinem.
Ztraceni v lese pohádkového mechu na cestě k dobytí Phu Sa Phin
Dnes ráno je plážové město Quy Nhon v mlze „snové“

Od stejného autora

Dědictví

Postava

Obchod

Dnes ráno je plážové město Quy Nhon v mlze „snové“

Aktuální události

Politický systém

Místní

Produkt