この新しいモデルは、アメリカの巨大企業の支配に挑戦するだけでなく、オープンソースによってゲーム全体を再構築します(イメージ画像:DS)。
このモデルは6850億個のパラメータを持ち、オープンソースライセンスで公開されています。初期のテスト結果では、OpenAIやAnthropicの独自システムに匹敵する性能を示しており、高度なAIモデルの開発と配布における新たなアプローチを切り開くものです。
性能とコスト
DeepSeek V3.1は、Hugging Faceプラットフォームでのリリース直後、Aiderプログラミングテストで71.6%のスコアを獲得しました。技術的には、このモデルは最大128,000トークン(400ページの本に相当)のコンテキストを処理できます。その構造は、チャット、推論、プログラミング機能を統合した「ハイブリッド」として提示されています。
AI研究者のアンドリュー・クリスチャンソン氏は、ソーシャルメディアプラットフォームXで、「DeepSeek V3.1はAiderで71.6%の精度を達成し、Claude Opus 4よりも約1%高い精度でありながら、コストは大幅に低い」と述べた。
計算によると、V3.1を使用してプログラミング作業を完了するための平均コストは約1.01ドルであるのに対し、同等のシステムでは70ドル近くかかる場合がある。
一部のコミュニティ開発者は、このアーキテクチャに4つの「特別なトークン」が存在することを指摘しており、これによりモデルはリアルタイムのウェブ検索を統合し、複雑な推論プロセスを処理できるようになっている。
この差は、毎日何千ものAIとのやり取りを処理する企業にとって、数百万ドルものコスト削減につながる。
ゲームの流れを変えるアドバンテージ
V3.1のリリースは、OpenAIとAnthropicが新たなモデルを発表した時期と重なった。DeepSeekはオープンソースのアプローチを選択することで、有料APIを通じてAIモデルを商用化する多くのアメリカ企業とは異なる戦略を追求した。
高度な機能が広く利用可能になることで、組織や企業による導入が迅速化される一方で、技術独占に基づくビジネスモデルにとっては脅威となる、と主張する人もいる。
DeepSeek V3.1の登場は、高度なAIは大手企業だけのものではなく、小規模な研究グループも参加できることを示している。
この分野における競争は、もはや最も強力なシステムを構築することだけにとどまらず、技術を誰もが利用しやすく、手頃な価格で提供できる能力にも焦点が当てられている。
こうした状況において、テクノロジー企業にとっての課題は、性能とコストの両面で競争力のあるオープンソースモデルが次々と登場する中で、いかにして商業的価値を維持していくかということである。
出典:https://dantri.com.vn/cong-nghe/deepseek-am-tham-ra-phien-ban-ai-moi-20250820121017977.htm






コメント (0)