01.aiの創業者でグーグル中国の元責任者であるリー・カイフー氏は、中国本土の企業は、より少ないデータ量で訓練したモデルを構築することでコストを削減し、より少ない計算能力で、より最適化されたハードウェアでトレーニングしたと述べた。

カリフォルニア大学バークレー校スカイラボとLMSYSが最近発表したランキングによると、スタートアップ企業01.aiのYi-Lingtningモデルは、OpenAIとGoogleに次いで、x.AIのGrok-2と同順位で3位にランクインしました。このランキングは、クエリ回答に対するユーザーのスコアに基づいています。

2d82e5b153faa85bf01e3f82affa4e298ec4f24e.avif.jpg
AIのコスト削減は、中国が米国と競争するための手段だ。写真:FT

01.ai と DeepSeek は、安価で高度なスキルを持つ人材を雇用しながら、モデルのトレーニングに小規模なデータセットに重点を置く戦略を採用している中国本土の AI 企業です。

FTによると、Yi-Lightningの推論コストは100万トークンあたり14セントであるのに対し、OpenAIのGPT o1-miniは26セントである。一方、GPT 4oは100万トークンあたり最大4.40ドルかかる。レスポンス生成に使用されるトークンの数は、各クエリの複雑さに応じて異なる。

Yi-Lightningの創設者は、様々なユースケースに合わせて微調整を行う前に、初期トレーニングに300万ドルを費やしたと明かした。リー氏は、目標は「最高のモデルを作ること」ではなく、「5~10倍安い」競合モデルを構築することだったと述べた。

01.ai、DeepSeek、MiniMax、Stepfun が適用した手法は「エキスパート モデリング」と呼ばれ、ドメイン固有のデータセットでトレーニングされた複数のニューラル ネットワークを単純に組み合わせるものです。

研究者たちは、このアプローチがビッグデータモデルと同等の知能を、より少ない計算能力で実現するための重要な方法であると考えています。しかし、このアプローチの難しさは、エンジニアが単一の汎用モデルではなく「複数の専門家」を用いて学習プロセスを調整しなければならないことです。

中国企業は、高性能AIチップの入手が困難なため、専門家モデルのトレーニングに使用する高品質のデータセットの開発に目を向け、西側諸国のライバル企業と競争している。

リー氏は、01.aiは書籍をスキャンしたり、オープンウェブではアクセスできないWeChatメッセージアプリの記事を収集するなど、従来とは異なる方法でデータを収集していると述べた。

創業者は、中国は安価で優秀な技術者が大量におり、米国よりも有利な立場にあると考えている。

(FT、ブルームバーグによると)

Metaが「自己評価学習」AIモデルを発表ソーシャルメディア大手のMetaは、AI開発プロセスにおける人間の介入を絞り込むことができる自己評価学習(STE)機能を備えた新しいAIモデルを発表しました。