アメリカの研究者によって開発されたAIモデル「s1」は、運用コストがわずか50ドルと報じられているものの、はるかに高価なOpenAIの「o1」モデルに匹敵する推論能力を備えています。「s1」の登場は、ここ数日シリコンバレーを揺るがしている「DeepSeek」の驚異的な成功に続くものです。
DeepSeek の出現以来、「安価な AI」をめぐる戦いは激化しています。
研究チームは、s1のソースコードと、モデル構築に使用されたコードおよびデータをGitHubで公開しました。先週発表された論文では、開発プロセスについて説明されており、採用された巧妙な手法が強調されています。チームは、新しい推論モデルをゼロから構築するのではなく、既存の言語モデルを使用し、GoogleのGemini 2.0 Flash Thinking Experimentalモデルの推論機能を抽出して改良しました。
AIの運用コストは「50ドル以下」です。
s1モデルの学習プロセスは、16基のNvidia H100 GPUを使用してわずか30分で完了しました。GPUは1基あたり約25,000ドルの費用がかかりますが、クラウドコンピューティングサービスのおかげで、このプロセスのレンタル費用は50ドル未満でした。注目すべきは、研究チームが有用なトリックを発見したことです。最終的な答えを出す前にモデルに「待機」を指示することで、推論能力が向上し、より優れた解が得られるというものです。
S1は低コストで大きな成功を収めていますが、スケーラビリティに関する懸念は依然として残っています。Googleのモデルを「教師」として利用していることから、S1が現在利用可能な主要なAIモデルと競合できるかどうか疑問が生じます。特にOpenAIとDeepSeekの間で係争中の訴訟を踏まえ、Googleは状況を注視していくと思われます。
[広告2]
出典: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm






コメント (0)