01.aiの創業者でグーグル中国の元責任者であるリー・カイフー氏は、中国本土の企業は、より少ないデータ量で訓練したモデルを構築することでコストを削減し、より少ない計算能力で、より最適化されたハードウェアでトレーニングしたと述べた。

カリフォルニア大学バークレー校スカイラボとLMSYSが最近発表したランキングによると、スタートアップ企業01.aiのYi-Lingtningモデルは、OpenAIとGoogleに次いで、x.AIのGrok-2と並んで3位にランクインしました。このランキングは、クエリ回答に対するユーザーのスコアに基づいています。

2d82e5b153faa85bf01e3f82affa4e298ec4f24e.avif.jpg
AI運用コストの削減は、中国が米国に対抗するための手段だ。写真:FT

01.ai と DeepSeek は中国本土の AI 企業であり、安価で高度なスキルを持つ人材を雇用しながら、モデルのトレーニングに小規模なデータセットに重点を置く戦略を採用しています。

FTによると、Yi-Lightningの推論コストは100万トークンあたり14セントであるのに対し、OpenAIのGPT o1-miniは26セントである。一方、GPT 4oは100万トークンあたり最大4.40ドルかかる。レスポンスを生成するために使用されるトークンの数は、各クエリの複雑さによって異なる。

Yi-Lightningの創業者たちは、様々なユースケースに合わせて微調整を行う前に、「初期トレーニング」に300万ドルを費やしたと明かした。リー氏は、彼らの目標は「最高のモデルを作ること」ではなく、「5~10倍安い」競合モデルを構築することだったと述べた。

01.ai、DeepSeek、MiniMax、Stepfun が適用した手法は「エキスパート モデリング」と呼ばれ、ドメイン固有のデータセットでトレーニングされた複数のニューラル ネットワークを組み合わせることを意味します。

研究者たちは、このアプローチがビッグデータモデルと同等の知能を、より少ない計算能力で実現するための重要な方法だと考えています。しかし、このアプローチの難しさは、エンジニアが単一の汎用モデルではなく「複数の専門家」を用いてトレーニングプロセスを調整する必要があることです。

ハイエンドのAIチップの入手が困難なため、中国企業は専門家モデルのトレーニングに使用できる高品質のデータセットの開発に目を向け、西側のライバル企業と競争している。

リー氏は、01.aiは書籍をスキャンしたり、オープンウェブサイトではアクセスできないWeChatメッセージアプリの記事を収集するなど、非伝統的な方法でデータを収集していると述べた。

創業者は、中国は安価で優秀な技術者を大量に抱えており、米国よりも有利な立場にあると考えている。

(FT、ブルームバーグによると)

Metaが「自己学習型」AIモデルを発表ソーシャルメディア大手のMetaは、AI開発プロセスにおける人間の介入を絞り込むことができる自己学習評価(STE)機能を備えた新しいAIモデルを発表しました。