OpenAIのチャットボットは新しい技術によってさらに進化している。写真:ニューヨーク・タイムズ |
2024年9月、OpenAIは、数学、科学、コンピュータープログラミングに関連するタスクについて推論できるo1モデルを統合したChatGPTのバージョンをリリースしました。
ChatGPTの以前のバージョンとは異なり、新しいテクノロジーでは、応答する前に複雑な問題の解決策について「考える」時間がかかります。
OpenAIに続き、Google、Anthropic、DeepSeekといった多くの競合他社も同様の推論モデルを導入しました。完璧ではありませんが、これは多くの開発者が信頼するチャットボットのアップグレード技術です。
AIの推論方法
基本的に、推論とは、チャットボットがユーザーから提示された問題の解決に多くの時間を費やすことができることを意味します。
「推論とは、システムが質問を受けてからさらに作業を進める仕組みです」とカリフォルニア大学バークレー校のコンピューターサイエンス教授ダン・クライン氏はニューヨーク・タイムズ紙に語った。
推論システムは、問題を個々のステップに分解したり、試行錯誤を通じて解決したりすることができます。
ChatGPTはリリース当初、情報を抽出・統合することで質問に即座に回答できました。一方、推論システムでは、問題を解決して回答するまでに数秒(場合によっては数分)もかかりました。
![]() |
カスタマーケアチャットボットにおけるO1モデルの推論プロセスの例。写真: OpenAI 。 |
場合によっては、推論システムは問題へのアプローチを変え、解決策を継続的に改善します。あるいは、最適な選択肢に落ち着くまで複数の解決策を試したり、以前の回答の精度をテストしたりすることもあります。
一般的に、推論システムは質問に対するあらゆる可能な答えを考慮します。これは、小学生が数学の問題を解く際に、最も適切な方法を選ぶ前に紙に多くの選択肢を書き出すのと似ています。
ニューヨーク・タイムズによると、AIは今やあらゆるトピックについて推論することが可能です。しかし、このタスクが最も効果を発揮するのは、数学、科学、そしてコンピュータープログラミングに関する質問です。
理論システムはどのように訓練されるのでしょうか?
通常のチャットボットでも、ユーザーはプロセスの説明を求めたり、応答の正確性を確認したりできます。実際、多くのChatGPTトレーニングデータセットには、問題解決プロセスが既に含まれています。
推論システムは、ユーザーからの指示なしにアクションを実行できる場合、さらに高度な機能を持ちます。このプロセスはより複雑で広範囲にわたります。企業が「推論」という用語を使用するのは、このシステムが人間の思考に似た仕組みで機能するためです。
OpenAIをはじめとする多くの企業は、推論システムが今日のチャットボットを改善する最良の方法であると考えています。長年にわたり、彼らはチャットボットはインターネットから得られるできるだけ多くの情報で訓練すれば最も効果的に機能すると信じてきました。
2024年までに、AIシステムはインターネット上のほぼすべてのテキストを消費するでしょう。つまり、企業は推論システムを含むチャットボットをアップグレードするための新たなソリューションを見つける必要があるということです。
![]() |
スタートアップ企業のDeepSeekはかつて、OpenAIよりも低コストの推論モデルで「騒ぎを起こした」。写真:ブルームバーグ |
昨年以来、OpenAIなどの企業は強化学習と呼ばれる技術に注力してきた。これは通常数か月かかり、試行錯誤を通じてAIが行動を学習するプロセスである。
例えば、何千もの問題を解くことで、システムは正しい答えを得るための最適な方法を学習できます。そこから研究者たちは、システムが正しい解と間違った解を学習するのに役立つ複雑なフィードバック機構を構築しました。
「犬の訓練に似ています。うまくいけばご褒美をあげ、うまくいかなければ『あの犬は悪い子だ』と言うのです」と、OpenAIの研究者であるジェリー・トゥオレク氏は語った。
AIは未来か?
New York Timesによると、強化学習は、正解や不正解が明確に定義されている数学、科学、コンピュータプログラミングの問題に適しています。
対照的に、強化学習は文章、哲学、倫理学といった善悪の区別が難しい分野ではうまく機能しない。しかし研究者たちは、この技術は数学以外の問題でもAIの性能を向上させることができると述べている。
「システムは、肯定的な結果と否定的な結果につながる道筋を学習するだろう」とアントロピックの最高科学責任者、ジャレッド・カプラン氏は語った。
![]() |
AIモデル「クロード」を所有するスタートアップ企業、アントロピックのウェブサイト。写真:ブルームバーグ |
強化学習と推論システムは異なる概念であることに注意することが重要です。具体的には、強化学習は推論システムを構築する手法です。これは、チャットボットに推論能力を身につけさせるための最終段階のトレーニングです。
推論型チャットボットや強化学習はまだ比較的新しいため、科学者たちはAIが人間のように思考するのに役立つかどうか確信を持てていません。現在のAIトレーニングのトレンドの多くは、初期には非常に急速に発展し、その後は減速するという点に注目すべきです。
さらに、推論型チャットボットは依然として間違いを犯す可能性があります。システムは確率に基づいて、インターネットから取得したデータであれ強化学習によって取得したデータであれ、学習したデータに最も類似したプロセスを選択します。そのため、チャットボットは依然として誤った、あるいは不合理な解決策を選択する可能性があります。
出典: https://znews.vn/ai-ly-luan-nhu-the-nao-post1541477.html
コメント (0)