In haar rapport stelde DeepSeek dat de totale trainingskosten $5,576 miljoen bedroegen, voornamelijk vanwege de huurkosten van Nvidia's grafische processoren. Het bedrijf waarschuwde echter ook dat dit bedrag alleen betrekking heeft op "formele training" en geen kosten omvat die verband houden met voorafgaand onderzoek of experimenten met architectuur, algoritmen en data. Dit trok onmiddellijk de aandacht van investeerders en zorgde ervoor dat de aandelen van wereldwijde technologiebedrijven op 27 januari alleen al met $1 biljoen kelderden.
Zijn de operationele kosten van DeepSeek veel hoger dan ze beweren?
Een rapport van SemiAnalysis, een onderzoeks- en adviesbureau voor halfgeleiders, biedt nu een ander perspectief op de ontwikkelingskosten van DeepSeek. Het bedrijf schat dat de hardware-uitgaven van DeepSeek aanzienlijk hoger liggen dan eerder werd aangegeven, en wijst tevens op substantiële onderzoeks- en ontwikkelingskosten (R&D) en totale eigendomskosten.
Volgens SemiAnalysis zal het creëren van "synthetische data" voor het trainen van modellen "aanzienlijke rekenkracht" vergen. Bovendien zullen bedrijven nieuwe architecturen moeten testen en ontwikkelen, data moeten verzamelen en opschonen, en salarissen aan werknemers moeten uitbetalen.
Heeft DeepSeek 50.000 GPU's nodig in plaats van iets meer dan 2.000?
Volgens berekeningen van experts beschikt DeepSeek over een grootschalig computersysteem met ongeveer 50.000 Hopper GPU's, 10.000 H800 GPU's en 10.000 krachtigere H100 GPU's, plus nog eens H20 GPU's. Dit spreekt DeepSeeks eerdere bewering tegen dat het bedrijf slechts 2.048 Nvidia GPU's gebruikt. De totale investeringskosten voor de servers worden geschat op ongeveer 1,6 miljard dollar, terwijl de operationele kosten 944 miljoen dollar bedragen.
SemiAnalysis is van mening dat DeepSeek 50.000 Nvidia GPU's heeft gebruikt.
DeepSeek werd in 2023 opgericht door Liang Wenfeng, medeoprichter van High-Flyer, een op AI gericht hedgefonds in China. De startup is in april 2023 voortgekomen uit de AI-onderzoekseenheid van het fonds, met als doel grootschalige taalmodellen te ontwikkelen en algemene kunstmatige intelligentie (AGI) te realiseren.
De belangstelling voor DeepSeek nam toe toen het bedrijf R1 uitbracht, een redeneermodel dat concurreert met OpenAI's o1, maar als open source wordt aangeboden, waardoor elke AI-ontwikkelaar het kan gebruiken. Net als veel andere Chinese chatbots heeft DeepSeek echter ook beperkingen op bepaalde onderwerpen.
Sam Altman, CEO van OpenAI, prees het model van DeepSeek en benadrukte dat het "duidelijk een geweldig model" is. Hij gaf echter ook aan dat er aanwijzingen zijn dat DeepSeek de data van OpenAI heeft verzameld om te opereren met behulp van een "destillatie"-methode.
Bron: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm






Reactie (0)