米国の研究者らが作成したAI(人工知能)モデルs1は、運用コストがわずか50ドルであるにもかかわらず、OpenAIのはるかに高価なo1モデルと同等の推論機能を提供すると言われています。 s1 の登場は、ここ数日シリコンバレーで話題を呼んでいる DeepSeek の目覚ましい成功を受けてのものである。
DeepSeekの登場以来、「安価なAI」をめぐる争いは激化している
チームは、モデルの構築に使用されたコードとデータとともに、s1 のソースコードを GitHub で公開しました。先週発表された論文では、このモデルの開発プロセスが説明され、採用された巧妙な技術が強調されている。チームは、新しい推論モデルをゼロから開発するのではなく、既存の言語モデルを使用し、Google の Gemini 2.0 Flash Thinking Experimental モデルから推論機能を抽出して「微調整」プロセスを実行しました。
AIの運用コストは「50ドル以下」
s1 モデルのトレーニングには、16 個の Nvidia H100 GPU を使用して 30 分しかかかりませんでした。これらの GPU は 1 台あたり約 25,000 ドルかかりますが、クラウド コンピューティング サービスのおかげで、このプロセス用に GPU をレンタルするコストは 50 ドル未満になります。特に、研究チームは、最終的な答えを出す前にモデルに「待つ」ように指示するという便利なトリックを発見しました。これにより、推論能力が向上し、より良い解決策が生まれました。
s1 は低コストで大きな成果を上げていますが、このモデルのスケーラビリティについては依然として懸念が残ります。 Google のモデルを「教師」として使用すると、S1 が今日の主要な AI モデルと競合できるかどうか疑問が生じます。特にOpenAIとDeepSeekの間で訴訟が続いていることを考えると、Googleは状況を注視していくと思われる。
[広告2]
出典: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
コメント (0)