DeepSeek rozbudza ciekawość.

DeepSeek skupia się na badaniach i rozwoju nowych modeli, zamiast pojawiać się często w mediach. Zdjęcie: SCMP .

We współpracy z naukowcami z Uniwersytetu Tsinghua, DeepSeek wprowadził nową metodę usprawniającą wnioskowanie w dużych modelach językowych (LLM). Metoda ta, opublikowana w artykule naukowym wieczorem 4 kwietnia, pomaga modelom LLM uzyskiwać lepsze i szybsze wyniki dla typowych zapytań.

Ta technika łączy dwie poprzednio skuteczne metody DeepSeek. Pierwsza to generatywne modelowanie nagród (GRM), które pozwala modelowi sztucznej inteligencji na samoocenę i udoskonalanie swoich odpowiedzi w oparciu o wcześniejsze wyniki, a druga to samoregulujące się dostrajanie krytyki.

Obie metody bazują na „samouczeniu się” sztucznej inteligencji, ograniczając potrzebę bezpośredniej informacji zwrotnej lub wskazówek od człowieka, a jednocześnie dążąc do uzyskania wyników bliższych ludzkim oczekiwaniom.

Zdaniem badaczy, pomimo swojej nowatorskiej metody, DeepSeek-GRM osiąga znakomite rezultaty i konkuruje z najpopularniejszymi i najskuteczniejszymi modelami sztucznej inteligencji (AI) dostępnymi obecnie na rynku. DeepSeek planuje udostępnić modele GRM jako oprogramowanie open source, ale nie podano jeszcze konkretnego terminu.

Po osiągnięciu globalnego sukcesu dzięki modelowi platformy V3 i modelowi wnioskowania R1, firma DeepSeek opublikowała niniejszy artykuł naukowy w internetowym archiwum naukowym arXiv, rozbudzając ciekawość dotyczącą kolejnych działań firmy.

Agencja Reuters przewiduje, że DeepSeek-R2, następca R1, może pojawić się na rynku w kwietniu, biorąc pod uwagę niesłabnącą popularność swojego poprzednika. DeepSeek-R1 wzbudził już wcześniej globalną sensację w świecie technologii dzięki swojej wyższej wydajności w stosunku do ceny, co czyni go konkurencyjnym w stosunku do obecnych wiodących modeli.

Firma DeepSeek milczała na temat tych plotek. Jednak według lokalnych źródeł, obsługa klienta DeepSeek zdementowała te informacje w czacie grupowym z klientami korporacyjnymi.

Założona w Hangzhou w 2023 roku przez przedsiębiorcę Liang Wenfenga, firma DeepSeek szybko zyskała globalną uwagę w ciągu ostatnich kilku miesięcy. Jednak zamiast czerpać korzyści ze swojej publicznej sławy, firma koncentruje swoje zasoby na badaniach i rozwoju.

Wcześniej DeepSeek zaktualizował swój model V3, wprowadzając wersję DeepSeek-V3-0324. Zgodnie z zapowiedzią, aktualizacja ta oferuje ulepszone funkcje wnioskowania, optymalizację pod kątem tworzenia interfejsów użytkownika w interfejsie internetowym oraz ulepszone umiejętności pisania po chińsku.

W lutym startup udostępnił również pięć repozytoriów kodu źródłowego, potwierdzając w ten sposób swoje zaangażowanie w „postęp z zachowaniem pełnej transparentności”. W tym samym miesiącu firma ogłosiła również badanie techniczne dotyczące „wrodzonej, rzadkiej uwagi”, która pomaga poprawić wydajność LLM w przetwarzaniu ogromnych ilości danych.

DeepSeek jest uważany za symbol dynamiki chińskiego przemysłu sztucznej inteligencji w czasie, gdy Stany Zjednoczone starają się ograniczyć rozwój technologiczny tego kraju.

Źródło: https://znews.vn/deepseek-gay-to-mo-post1543900.html