Vietnam.vn - Nền tảng quảng bá Việt Nam

Koszty rozwoju DeepSeek zostały „zawyżone”.

Báo Thanh niênBáo Thanh niên03/02/2025

[reklama_1]

W swoim raporcie DeepSeek podał, że całkowity koszt szkoleń wyniósł 5,576 mln dolarów, głównie ze względu na cenę wynajmu procesorów graficznych Nvidii. Firma zastrzegła również, że kwota ta odzwierciedla jedynie „formalne szkolenie” i nie uwzględnia kosztów związanych z wcześniejszymi badaniami lub eksperymentami nad architekturą, algorytmami i danymi. To natychmiast przyciągnęło uwagę inwestorów i spowodowało gwałtowny spadek akcji globalnych firm technologicznych o 1 bilion dolarów tylko 27 stycznia.

Chi phí phát triển DeepSeek bị 'tâng bốc'- Ảnh 1.

Koszty operacyjne DeepSeek są znacznie wyższe niż twierdzą?

Raport firmy SemiAnalysis, zajmującej się badaniami i doradztwem w zakresie półprzewodników, przedstawia inną perspektywę kosztów rozwoju DeepSeek. Firma szacuje, że wydatki DeepSeek na sprzęt są znacznie wyższe niż wcześniej podawano, podkreślając jednocześnie znaczne koszty badań i rozwoju (R&D) oraz całkowity koszt posiadania (CCO).

SemiAnalysis twierdzi, że stworzenie „syntetycznych danych” do modeli szkoleniowych będzie wymagało „znacznego nakładu obliczeniowego”. Co więcej, firmy będą musiały również testować i rozwijać nowe architektury, gromadzić i oczyszczać dane oraz wypłacać pensje swoim pracownikom.

Czy DeepSeek potrzebuje 50 000 procesorów GPU zamiast nieco ponad 2000?

Według obliczeń ekspertów, DeepSeek korzysta z wielkoskalowego systemu obliczeniowego, obejmującego około 50 000 procesorów graficznych Hopper, 10 000 procesorów graficznych H800 i 10 000 bardziej wydajnych procesorów graficznych H100, a także dodatkowe procesory graficzne H20. Przeczy to wcześniejszemu stwierdzeniu DeepSeek, że korzysta on jedynie z 2048 procesorów graficznych Nvidia. Całkowity koszt inwestycyjny serwerów szacuje się na około 1,6 miliarda dolarów, a koszty operacyjne na 944 miliony dolarów.

Chi phí phát triển DeepSeek bị 'tâng bốc'- Ảnh 2.

SemiAnalysis uważa, że ​​DeepSeek wykorzystał 50 000 procesorów graficznych Nvidia.

Firma DeepSeek została założona w 2023 roku przez Lianga Wenfenga, współzałożyciela High-Flyer, chińskiego funduszu hedgingowego specjalizującego się w sztucznej inteligencji. Startup rozwinął się z jednostki badawczej ds. sztucznej inteligencji funduszu w kwietniu 2023 roku, dążąc do opracowania modeli językowych na dużą skalę i osiągnięcia ogólnej sztucznej inteligencji (AGI).

Zainteresowanie DeepSeek wzrosło, gdy firma wydała R1, model wnioskowania, który konkuruje z o1 firmy OpenAI, ale jest oferowany jako oprogramowanie open source, co pozwala każdemu programiście AI na korzystanie z niego. Jednak, podobnie jak wiele innych chińskich chatbotów, DeepSeek ma również ograniczenia dotyczące niektórych tematów.

Dyrektor generalny OpenAI, Sam Altman, pochwalił model DeepSeek, podkreślając, że jest to „bez wątpienia świetny model”. Stwierdził jednak również, że istnieją dowody sugerujące, że DeepSeek gromadził dane OpenAI metodą „destylacji” w celu ich wykorzystania.



Źródło: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm

Tag: udział

Komentarz (0)

Zostaw komentarz, aby podzielić się swoimi odczuciami!

W tym samym temacie

W tej samej kategorii

Od tego samego autora

Dziedzictwo

Postać

Firmy

Sprawy bieżące

System polityczny

Lokalny

Produkt

Happy Vietnam
Robienie zdjęć z idolami (2)

Robienie zdjęć z idolami (2)

Ulice Sajgonu w dzień powszedni

Ulice Sajgonu w dzień powszedni

Żyrafa

Żyrafa