Vietnam.vn - Nền tảng quảng bá Việt Nam

Nowe badania ujawniają sekret sukcesu DeepSeek

Według DeepSeek model sztucznej inteligencji R1 nie został przeszkolony z wykorzystaniem danych z modelu OpenAI, choć firma przyznała, że ​​model bazowy został przeszkolony na danych internetowych, które mogą obejmować treści generowane przez sztuczną inteligencję.

VietnamPlusVietnamPlus17/09/2025

Model sztucznej inteligencji R1 chińskiego startupu DeepSeek – który zszokował amerykański rynek akcji po swoim debiucie w styczniu – został opublikowany w pierwszym recenzowanym badaniu, pokazującym, jak udało się opracować potężny program LLM za zaledwie około 300 000 dolarów.

R1 zaprojektowano tak, aby doskonale radził sobie z zadaniami wymagającymi logicznego myślenia, takimi jak obliczenia matematyczne i programowanie. Dzięki temu może być tanim konkurentem dla narzędzi opracowywanych przez amerykańskich gigantów technologicznych.

To model o „otwartej wadze”, który można pobrać bezpłatnie i który jest obecnie najpopularniejszym modelem na platformie Hugging Face – liczba pobrań przekroczyła 10,9 miliona.

Badanie opublikowane w czasopiśmie Nature, będące aktualizacją rękopisu ze stycznia, ujawniło po raz pierwszy, że koszt szkolenia R1 wyniósł zaledwie 294 000 dolarów, oprócz około 6 milionów dolarów wydanych na zbudowanie modelu bazowego.

Jest to kwota znacznie niższa od dziesiątek milionów dolarów, jakie rzekomo wydali konkurenci.

DeepSeek poinformował, że R1 został wytrenowany głównie przy użyciu układów Nvidia H800, których eksport do Chin został w USA zakazany w 2023 r.

Przełomem w R1 było zastosowanie „czystego uczenia się przez wzmacnianie”, w którym model jest trenowany metodą prób i błędów oraz nagradzany za poprawne odpowiedzi, zamiast uczyć się na przykładach wybranych przez ludzi. Ocenia również własne wysiłki za pomocą wewnętrznych szacunków, techniki zwanej „względną optymalizacją zasad grupy”, co pomaga zwiększyć wydajność.

„Rygorystyczny proces recenzji eksperckiej pomaga potwierdzić wartość i wiarygodność modelu” – mówi badaczka Huan Sun (Ohio State University). „Inne firmy powinny zrobić to samo”.

Lewis Tunstall, inżynier uczenia maszynowego w Hugging Face, powiedział, że jest to ważny precedens, ponieważ przejrzystość w rozwoju sztucznej inteligencji pozwala na dokładniejszą ocenę ryzyka.

DeepSeek twierdzi, że R1 nie został przeszkolony z wykorzystaniem danych z modeli OpenAI, choć przyznaje, że model bazowy został przeszkolony na danych internetowych, które mogą obejmować treści generowane przez sztuczną inteligencję.

Eksperci twierdzą, że choć trudno to jednoznacznie potwierdzić, obecne dowody wskazują, że samo udoskonalenie wystarczy, aby osiągnąć wysoką wydajność.

W teście ScienceAgentBench, R1 nie osiągnął szczytu w kategorii dokładności, ale osiągnął dobry balans między wydajnością a kosztami. Naukowcy chcą teraz zastosować metodę DeepSeek do wzmocnienia możliwości wnioskowania istniejących programów LLM, a także rozszerzyć ją na obszary wykraczające poza matematykę i programowanie.

Według pana Tunstalla R1 „rozpoczął rewolucję” w rozwoju sztucznej inteligencji./.

(TTXVN/Wietnam+)

Źródło: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp


Komentarz (0)

No data
No data

W tym samym temacie

W tej samej kategorii

Dziś rano miasteczko plażowe Quy Nhon było „marzycielskie” w mgle
Urzekające piękno Sa Pa w sezonie „polowania na chmury”
Każda rzeka – podróż
Ho Chi Minh City przyciąga inwestycje od przedsiębiorstw z bezpośrednimi inwestycjami zagranicznymi (FDI) w nowe możliwości

Od tego samego autora

Dziedzictwo

Postać

Biznes

Płaskowyż Dong Van Stone – rzadkie na świecie „żywe muzeum geologiczne”

Aktualne wydarzenia

System polityczny

Lokalny

Produkt