Nowe badania ujawniają sekret sukcesu DeepSeek

Model sztucznej inteligencji R1 chińskiego startupu DeepSeek – który zszokował amerykański rynek akcji po swoim debiucie w styczniu – został opublikowany w pierwszym recenzowanym badaniu, pokazującym, jak udało się opracować potężny program LLM za zaledwie około 300 000 dolarów.

R1 zaprojektowano tak, aby doskonale radził sobie z zadaniami wymagającymi logicznego myślenia, takimi jak obliczenia matematyczne i programowanie. Dzięki temu może być tanim konkurentem dla narzędzi opracowywanych przez amerykańskich gigantów technologicznych.

To model o „otwartej wadze”, który można pobrać bezpłatnie i który jest obecnie najpopularniejszym modelem na platformie Hugging Face – liczba pobrań przekroczyła 10,9 miliona.

Badanie opublikowane w czasopiśmie Nature, będące aktualizacją rękopisu ze stycznia, ujawniło po raz pierwszy, że koszt szkolenia R1 wyniósł zaledwie 294 000 dolarów, oprócz około 6 milionów dolarów wydanych na zbudowanie modelu bazowego.

Jest to kwota znacznie niższa od dziesiątek milionów dolarów, jakie rzekomo wydali konkurenci.

DeepSeek poinformował, że R1 został wytrenowany głównie przy użyciu układów Nvidia H800, których eksport do Chin został w USA zakazany w 2023 r.

Przełomem w R1 było zastosowanie „czystego uczenia się przez wzmacnianie”, w którym model jest trenowany metodą prób i błędów oraz nagradzany za poprawne odpowiedzi, zamiast uczyć się na przykładach wybranych przez ludzi. Ocenia również własne wysiłki za pomocą wewnętrznych szacunków, techniki zwanej „względną optymalizacją zasad grupy”, co pomaga zwiększyć wydajność.

„Rygorystyczny proces recenzji eksperckiej pomaga potwierdzić wartość i wiarygodność modelu” – mówi badaczka Huan Sun (Ohio State University). „Inne firmy powinny zrobić to samo”.

Lewis Tunstall, inżynier uczenia maszynowego w Hugging Face, powiedział, że jest to ważny precedens, ponieważ przejrzystość w rozwoju sztucznej inteligencji pozwala na dokładniejszą ocenę ryzyka.

DeepSeek twierdzi, że R1 nie został przeszkolony z wykorzystaniem danych z modeli OpenAI, choć przyznaje, że model bazowy został przeszkolony na danych internetowych, które mogą obejmować treści generowane przez sztuczną inteligencję.

Eksperci twierdzą, że choć trudno to jednoznacznie potwierdzić, obecne dowody wskazują, że samo udoskonalenie wystarczy, aby osiągnąć wysoką wydajność.

W teście ScienceAgentBench, R1 nie osiągnął szczytu w kategorii dokładności, ale osiągnął dobry balans między wydajnością a kosztami. Naukowcy chcą teraz zastosować metodę DeepSeek do wzmocnienia możliwości wnioskowania istniejących programów LLM, a także rozszerzyć ją na obszary wykraczające poza matematykę i programowanie.

Według pana Tunstalla R1 „rozpoczął rewolucję” w rozwoju sztucznej inteligencji./.

(TTXVN/Wietnam+)

Źródło: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp