Ve své zprávě společnost DeepSeek uvedla, že celkové náklady na školení dosáhly 5,576 milionu dolarů, a to především kvůli ceně pronájmu grafických procesorů Nvidia. Společnost rovněž upozornila, že toto číslo odráží pouze „formální školení“ a nezahrnuje náklady související s předchozím výzkumem nebo experimenty s architekturou, algoritmy a daty. To okamžitě přilákalo pozornost investorů a způsobilo, že akcie globálních technologických společností jen 27. ledna propadly o 1 bilion dolarů.
Provozní náklady DeepSeeku jsou mnohem vyšší, než tvrdí?
Zpráva výzkumné a konzultační firmy SemiAnalysis v oblasti polovodičů nyní nabízí jiný pohled na náklady na vývoj DeepSeeku. Společnost odhaduje, že výdaje DeepSeeku na hardware jsou výrazně vyšší, než bylo dříve uváděno, a zároveň zdůrazňuje značné náklady na výzkum a vývoj (VaV) a celkové náklady na vlastnictví.
SemiAnalysis uvádí, že vytváření „syntetických dat“ pro trénovací modely bude vyžadovat „značné výpočetní úsilí“. Kromě toho budou společnosti muset také testovat a vyvíjet nové architektury, shromažďovat a čistit data a vyplácet mzdy zaměstnancům.
Potřebuje DeepSeek 50 000 GPU místo jen něco málo přes 2 000?
Podle výpočtů experti uvádějí, že DeepSeek provozuje rozsáhlý výpočetní systém, který zahrnuje přibližně 50 000 grafických procesorů Hopper, 10 000 grafických procesorů H800 a 10 000 výkonnějších grafických procesorů H100 a další grafické procesory H20. To je v rozporu s předchozím tvrzením společnosti DeepSeek o použití pouze 2 048 grafických procesorů Nvidia. Celkové kapitálové náklady na servery se odhadují na přibližně 1,6 miliardy dolarů, zatímco provozní náklady dosahují 944 milionů dolarů.
SemiAnalysis se domnívá, že DeepSeek použil 50 000 grafických karet Nvidia.
Společnost DeepSeek založil v roce 2023 Liang Wenfeng, spoluzakladatel High-Flyer, hedgeového fondu zaměřeného na umělou inteligenci v Číně. Startup se vyvinul z výzkumné jednotky fondu pro umělou inteligenci v dubnu 2023 s cílem vyvíjet rozsáhlé jazykové modely a dosáhnout obecné umělé inteligence (AGI).
Zájem o DeepSeek vzrostl, když společnost vydala R1, model uvažování, který konkuruje OpenAI o1, ale je nabízen jako open source, což umožňuje jeho používání jakémukoli vývojáři umělé inteligence. Stejně jako mnoho jiných čínských chatbotů má však i DeepSeek omezení v určitých tématech.
Generální ředitel společnosti OpenAI Sam Altman pochválil model DeepSeek a zdůraznil, že se jedná o „jednoznačně skvělý model“. Uvedl však také, že existují důkazy naznačující, že DeepSeek shromažďoval data OpenAI za účelem jejich provozu metodou „destilace“.
Zdroj: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm






Komentář (0)