DeepSeekはレポートの中で、総トレーニング費用は557万6000ドルで、主にNVIDIAのグラフィックプロセッサユニットのレンタル費用によるものだと述べています。同社はまた、この数字は「正式なトレーニング」のみを反映したものであり、アーキテクチャ、アルゴリズム、データに関する事前の研究や実験に関連する費用は含まれていないと警告しています。この動きは瞬く間に投資家の注目を集め、1月27日のわずか1日で世界のテクノロジー株の価値が1兆ドルも「蒸発」する事態を引き起こしました。
DeepSeek の運用コストは主張されているよりもはるかに高いのでしょうか?
半導体調査・コンサルティング会社SemiAnalysisのレポートは、DeepSeekの開発コストについて異なる見解を示しています。同社は、DeepSeekのハードウェア支出は公表されているよりもはるかに高いと推定しており、研究開発費と総所有コストが相当なものであったと指摘しています。
SemiAnalysisは、モデルの訓練用の「合成データ」を生成するには「膨大な計算能力」が必要になると述べた。さらに、企業は実験を行い、新しいアーキテクチャを開発し、データを収集・整理し、従業員に給与を支払う必要もある。
DeepSeek には 2,000 個強の GPU ではなく 50,000 個の GPU が必要ですか?
専門家の計算によると、DeepSeekは約5万台のHopper GPU、1万台のH800 GPU、1万台のより高性能なH100 GPU、そして追加のH20 GPUで構成される大規模なコンピューティングシステムを運用しているという。この数字は、DeepSeekが以前主張していたNVIDIA GPUをわずか2,048台しか使用していないという主張と矛盾している。サーバーの総設備投資額は約16億ドルと推定され、運用コストは最大9億4,400万ドルに上る。
SemiAnalysisは、DeepSeekが5万個のNvidia GPUを使用したと推定している。
DeepSeekは、中国のAI特化型ヘッジファンドHigh-Flyerの共同創業者である梁文鋒氏によって2023年に設立されました。同社は2023年4月に同ファンドのAI研究部門から誕生し、大規模言語モデルの開発と汎用人工知能(AGI)の実現を目指しています。
DeepSeekへの関心は、同社がR1をリリースしたことで高まった。R1はOpenAIのo1と競合する推論モデルだが、オープンソースであるため、あらゆるAI開発者が利用できる。しかし、他の多くの中国製チャットボットと同様に、DeepSeekにも特定のトピックに関する制限がある。
OpenAIのCEO、サム・アルトマン氏はDeepSeekのモデルを称賛し、「明らかに優れたモデルだ」と述べた。しかし同時に、DeepSeekがOpenAIのデータを「精製」した形で収集していたという証拠もあると述べた。
[広告2]
出典: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm
コメント (0)