米国の研究者によって開発されたAI(人工知能)モデル「S1」は、運用コストがわずか50ドルでありながら、はるかに高価なOpenAIの「O1」モデルと同等の推論能力を備えていると言われています。S1の登場は、ここ数日シリコンバレーで話題を呼んでいるDeepSeekの目覚ましい成功を受けてのものです。
DeepSeekの登場以来、「安価なAI」をめぐる戦争は激化している
チームは、s1のソースコードと、モデル構築に使用されたコードおよびデータをGitHubで公開しました。先週発表された論文では、モデル開発のプロセスについて説明されており、使用された巧妙な手法が強調されています。チームは、新しい推論モデルをゼロから構築するのではなく、既存の言語モデルを使用し、GoogleのGemini 2.0 Flash Thinking Experimentalモデルの推論機能を抽出して「微調整」プロセスを実施しました。
AIの運用コストはわずか「50ドル未満」
s1モデルの学習には、16基のNvidia H100 GPUを使用し、わずか30分しかかかりませんでした。GPU1基あたりのコストは約25,000ドルですが、クラウドコンピューティングサービスのおかげで、プロセスのレンタル費用は50ドル未満でした。特に、チームは有用なトリックを発見しました。それは、最終的な答えを出す前にモデルに「待機」するように指示することで、推論能力が向上し、より良い解が得られるというものです。
S1は低コストで大きな進歩を遂げていますが、そのスケーラビリティには懸念があります。Googleのモデルを「教師」として使用することは、今日の主要なAIモデルと競合できるかどうかという疑問を投げかけます。特にOpenAIとDeepSeekの間で係争中の訴訟を考慮すると、Googleはこの状況を注視していくでしょう。
[広告2]
出典: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
コメント (0)