DeepSeekは報告書の中で、トレーニングの総コストは557万6000ドルで、その大半はNvidiaのグラフィック処理装置のレンタル価格によるものだと述べた。同社はまた、この数字は「正式なトレーニング」のみを反映しており、アーキテクチャ、アルゴリズム、データに関する事前の研究や実験に関連するコストは含まれていないことに注意を促している。これは即座に投資家を引きつけ、1月27日のたった1日で世界のテクノロジー企業の株価が1兆ドルも「蒸発」する事態を引き起こした。
DeepSeek の運用コストは主張されているよりもはるかに高いのでしょうか?
現在、半導体研究・コンサルティング会社 SemiAnalysis のレポートでは、DeepSeek の開発コストについて新たな見方が示されています。同社は、DeepSeek のハードウェア支出は主張しているよりもはるかに高いと見積もっており、研究開発 (R&D) コストと総所有コストがかなり大きいことを強調している。
SemiAnalysisは、モデルをトレーニングするための「合成データ」を生成するには「かなりの量の計算」が必要になると述べた。さらに、企業は実験を行い、新しいアーキテクチャを開発し、データを収集して整理し、従業員に給与を支払う必要もあります。
DeepSeek には 2,000 個強の GPU ではなく 50,000 個の GPU が必要ですか?
専門家の計算によると、DeepSeek は約 50,000 個の Hopper GPU、10,000 個の H800 GPU、10,000 個のより強力な H100 GPU、および追加の H20 GPU からなる大規模なコンピューティング システムを運用しているとのことです。この数字は、DeepSeek が以前に 2,048 個の Nvidia GPU のみを使用していると主張していたことと矛盾しています。サーバーの総設備投資額は16億ドルと見積もられており、営業費用は9億4,400万ドルに上る。
SemiAnalysisは、DeepSeekが5万個のNvidia GPUを使用したと考えている
DeepSeekは、中国のAIに特化したヘッジファンドであるHigh-Flyerの共同創設者であるLuong Van Phongによって2023年に設立されました。このスタートアップは、大規模な言語モデルの開発と人工汎用知能(AGI)の実現を目標に、2023年4月に同ファンドのAI研究部門から誕生した。
DeepSeekへの関心は、同社がR1をリリースしたときに高まりました。R1はOpenAIのo1と競合する推論モデルですが、オープンソースとして提供されており、あらゆるAI開発者が使用できます。ただし、他の多くの中国のチャットボットと同様に、DeepSeek にも特定のトピックに関する制限があります。
OpenAIのCEO、サム・アルトマン氏はDeepSeekのモデルを称賛し、DeepSeekは「明らかに素晴らしいモデルだ」と述べた。しかし、彼はまた、ディープシークが「精製された」方法で作業するためにオープンAIのデータを収集していたという証拠もあると述べた。
[広告2]
出典: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm
コメント (0)