中国の新興企業が2つの最先端AIモデルを発表した後、OpenAIのCEOサム・アルトマン氏からGoogleの科学者アンドリュー・ン氏まで、世界で最も優秀なAIの専門家たちはDeepSeekのオープンソースアプローチを高く評価した。

杭州に拠点を置く同社は、オープンソースの推論モデルR1で世界のAI業界を驚かせた。

1月20日にリリースされたこのモデルは、ChatGPTの開発元であるOpenAIのクローズドソースモデルに匹敵するパフォーマンスを示していますが、トレーニングコストははるかに低いと言われています。

ディープシーク WSJ
DeepSeekが開発したAIチャットボットは、世界中で数百万回ダウンロードされている。写真:WSJ

DeepSeek によれば、基礎となる大規模言語モデルである DeepSeek V3 は数週間前にリリースされ、トレーニングにかかるコストはわずか 550 万ドルでした。

同社の発表により、テクノロジー企業がAIトレーニング用のグラフィックチップ(GPU)に過剰に投資しているのではないかという疑問が生じ、関連テクノロジー株の売りにつながった。

先週、Redditの「Ask Me Anything」で、アルトマン氏はOpenAIは間違っており、オープンソースに対して別のアプローチを見つける必要があると主張した。

同社は常に非公開のアプローチを採用しており、具体的なトレーニング方法やモデルのエネルギーコストなどの詳細は秘密にしてきた。

「しかし、OpenAIの全員がこの見解を共有しているわけではない」し、「現時点ではこれが当社の最優先事項ではない」とOpenAIのCEOは認めた。

グーグル・ブレインの創設者で、百度の元主任科学者アンドリュー・ン氏は、ディープシークとその同業他社の製品は中国がAI分野で急速に米国に追いついていることを示していると述べた。

「ChatGPTが2022年11月にローンチされた当時、米国は生成AIにおいて中国を大きくリードしていた…しかし実際には、その差は過去2年間で急速に縮まっている」と彼はXに記した。「Qwen、Kimi、InternVL、DeepSeekといった中国のモデルによって、中国は明らかに差を縮めており、動画生成などの分野では中国がリードしているように見える時期もあった」

Qwenモデルはアリババ社によって開発され、KimiとInterVLはスタートアップ企業のMoonshot AIと上海AIラボの製品である。

ン氏によると、米国がオープンソースをブロックし続ければ、中国がサプライチェーンのこの部分を支配することになり、多くの企業が最終的に米国の価値観よりも中国の価値観を反映したモデルを採用することになるだろう。

多くの米国企業がDeepSeekのモデルを自社製品に導入することを検討しています。例えば、NVIDIAのNIMサービスのユーザーは先週からR1モデルにアクセスできるようになり、MicrosoftもAzureクラウドとGitHubでR1をサポートしています。Amazonは、顧客がAWSを通じてR1を使用したアプリケーションを構築できるようにしています。

しかし、DeepSeekの成功を誇張すべきではないと考える専門家もいる。MetaのチーフAIサイエンティスト、ヤン・ルカン氏は、DeepSeekのおかげで「中国がAI分野で米国を追い抜く」という考えは誤りだと述べた。

むしろ、「オープンソース モデルはプロプライエタリ モデルを上回りつつある」と彼は Threads に書いています。

2023年5月に創業者リャン・ウェンフェン氏のヘッジファンドHigh-Flyerからスピンアウトしたスタートアップ企業DeepSeekは、実際のコストやAIモデルのトレーニング方法について依然として懐疑的な見方に直面している。

スタートアップ企業の技術報告書によると、復旦大学のコンピュータサイエンス教授である鄭暁青氏は、DeepSeek V3のトレーニング費用にはテストや研究に関連する費用が含まれていないと指摘した。

ディープシークの成功は「技術的な最適化」によるものであり、チップの調達や出荷に大きな影響を与えないと彼は述べた。

(サウスカロライナ州立大学モーニングサーカスによると)