アメリカの研究者によって開発されたAI(人工知能)モデル「S1」は、ランニングコストがわずか50ドルでありながら、OpenAIのはるかに高価な「O1」モデルと同等の推論能力を備えていると言われています。S1の登場は、ここ数日シリコンバレーで話題を呼んでいるDeepSeekの目覚ましい成功を受けてのものです。
DeepSeekの登場以来、「安価なAI」をめぐる争いは激化している
チームはs1のソースコードを、モデル構築に使用されたコードとデータとともにGitHubで公開しています。先週発表された論文では、モデル開発のプロセスと、使用された巧妙な手法について解説されています。チームは新しい推論モデルをゼロから構築するのではなく、既存の言語モデルを活用し、GoogleのGemini 2.0 Flash Thinking Experimentalモデルの推論機能を抽出することで「微調整」プロセスを実施しました。
AIの運用コストは「50ドル以下」
s1モデルの学習には、16基のNvidia H100 GPUを使用し、わずか30分しかかかりませんでした。GPU1基あたりのコストは約25,000ドルですが、クラウドコンピューティングサービスのおかげで、プロセスのレンタル費用は50ドル未満でした。特に、チームは有用なトリックを発見しました。それは、最終的な答えを出す前にモデルに「待機」するように指示することで、推論能力が向上し、より優れた解が生成されるというものです。
S1は低コストで目覚ましい成果を上げていますが、モデルのスケーラビリティには懸念があります。Googleのモデルを「教師」として使用することは、S1が今日の主要なAIモデルと競合できるかどうかという疑問を投げかけます。特にOpenAIとDeepSeekの間で係争中の訴訟を踏まえると、Googleはこの状況を注視していくでしょう。
[広告2]
出典: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
コメント (0)