I sin rapport uppgav DeepSeek att den totala utbildningskostnaden uppgick till 5,576 miljoner dollar, främst på grund av hyran för Nvidias grafikprocessorer. Företaget varnade också för att denna siffra endast återspeglar "formell utbildning" och inte inkluderar kostnader relaterade till tidigare forskning eller experiment kring arkitektur, algoritmer och data. Detta väckte omedelbart investerares uppmärksamhet och fick globala teknikföretags aktier att rasa med 1 biljon dollar enbart den 27 januari.
DeepSeeks driftskostnader är mycket högre än de påstår?
Nu erbjuder en rapport från halvledarforsknings- och konsultföretaget SemiAnalysis ett annat perspektiv på DeepSeeks utvecklingskostnader. Företaget uppskattar att DeepSeeks hårdvaruutgifter är betydligt högre än tidigare angetts, samtidigt som de lyfter fram betydande forsknings- och utvecklingskostnader (FoU) och total ägandekostnad.
SemiAnalysis uppger att skapandet av "syntetiska data" för träningsmodeller kommer att kräva "betydande beräkningsinsatser". Dessutom kommer företag också att behöva testa och utveckla nya arkitekturer, samla in och rensa data och betala ut löner till anställda.
Behöver DeepSeek 50 000 GPU:er istället för drygt 2 000?
Enligt beräkningar säger experter att DeepSeek driver ett storskaligt datorsystem som består av cirka 50 000 Hopper-GPU:er, med 10 000 H800-GPU:er och 10 000 kraftfullare H100-GPU:er, tillsammans med ytterligare H20-GPU:er. Detta motsäger DeepSeeks tidigare påstående om att endast använda 2 048 Nvidia-GPU:er. Den totala kapitalkostnaden för servrarna uppskattas till cirka 1,6 miljarder dollar, medan driftskostnaderna uppgår till 944 miljoner dollar.
SemiAnalysis tror att DeepSeek har använt 50 000 Nvidia GPU:er.
DeepSeek grundades 2023 av Liang Wenfeng, medgrundare av High-Flyer, en AI-fokuserad hedgefond i Kina. Startupföretaget utvecklades från fondens AI-forskningsenhet i april 2023, med målet att utveckla storskaliga språkmodeller och uppnå generell artificiell intelligens (AGI).
Intresset för DeepSeek ökade när företaget släppte R1, en resonemangsmodell som konkurrerar med OpenAIs o1, men erbjuds som öppen källkod, vilket gör att alla AI-utvecklare kan använda den. Men liksom många andra kinesiska chatbotar har DeepSeek också begränsningar inom vissa ämnen.
OpenAIs VD Sam Altman berömde DeepSeeks modell och betonade att det "helt klart är en utmärkt modell". Han uppgav dock också att det finns bevis som tyder på att DeepSeek samlade in OpenAIs data för att använda en "destillationsmetod".
[annons_2]
Källa: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm






Kommentar (0)