I sin rapport opplyste DeepSeek at de totale opplæringskostnadene utgjorde 5,576 millioner dollar, hovedsakelig på grunn av leieprisen for Nvidias grafikkprosessorer. Selskapet advarte også om at dette tallet kun gjenspeiler «formell opplæring» og ikke inkluderer kostnader knyttet til tidligere forskning eller eksperimenter på arkitektur, algoritmer og data. Dette tiltrakk seg umiddelbart investorenes oppmerksomhet og førte til at globale teknologiselskapsaksjer stupte med 1 billion dollar bare 27. januar.
DeepSeeks driftskostnader er mye høyere enn de påstår?
Nå tilbyr en rapport fra halvlederforsknings- og konsulentfirmaet SemiAnalysis et annet perspektiv på DeepSeeks utviklingskostnader. Selskapet anslår at DeepSeeks maskinvareutgifter er betydelig høyere enn tidligere oppgitt, samtidig som de fremhever betydelige forsknings- og utviklingskostnader (FoU) og totale eierkostnader.
SemiAnalysis hevder at det å lage «syntetiske data» for treningsmodeller vil kreve «betydelig beregningsinnsats». Videre må bedrifter også teste og utvikle nye arkitekturer, samle inn og rense data og betale lønn til ansatte.
Trenger DeepSeek 50 000 GPU-er i stedet for litt over 2000?
Ifølge beregninger sier eksperter at DeepSeek driver et storskala datasystem som består av omtrent 50 000 Hopper GPU-er, med 10 000 H800 GPU-er og 10 000 kraftigere H100 GPU-er, sammen med ytterligere H20 GPU-er. Dette motsier DeepSeeks tidligere påstand om at de bare bruker 2048 Nvidia GPU-er. Den totale kapitalkostnaden for serverne er anslått til rundt 1,6 milliarder dollar, mens driftskostnadene beløper seg til 944 millioner dollar.
SemiAnalysis mener at DeepSeek har brukt 50 000 Nvidia GPU-er.
DeepSeek ble grunnlagt i 2023 av Liang Wenfeng, medgründer av High-Flyer, et AI-fokusert hedgefond i Kina. Oppstartsbedriften utviklet seg fra fondets AI-forskningsenhet i april 2023, med mål om å utvikle storskala språkmodeller og oppnå generell kunstig intelligens (AGI).
Interessen for DeepSeek økte da selskapet lanserte R1, en resonneringsmodell som konkurrerer med OpenAIs o1, men tilbys som åpen kildekode, slik at enhver AI-utvikler kan bruke den. I likhet med mange andre kinesiske chatboter har DeepSeek imidlertid også begrensninger på visse emner.
OpenAI-sjef Sam Altman roste DeepSeeks modell og understreket at den «helt klart er en flott modell». Han uttalte imidlertid også at det finnes bevis som tyder på at DeepSeek samlet inn OpenAIs data for å operere ved hjelp av en «destillasjonsmetode».
[annonse_2]
Kilde: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm






Kommentar (0)