GPT-4 は「マルチモーダル」であるため、画像やテキストを含む質問に答えることができます。

写真:GI
GPT-3.5 はテキストの質問からのみ結果を出力しますが、この大規模言語モデルの最新バージョンでは、画像を入力データとして使用して、画像内のオブジェクトを認識し、分析することができます。
GPT-3.5 は約 3,000 語の応答に制限されていますが、GPT-4 は 25,000 語を超える応答を生成できます。
GPT-4 は、前身に比べて不正なコンテンツの要求に応答する可能性が 82% 低く、一部のリアリズム テストで 40% 高いスコアを獲得しています。
また、開発者は AI の口調や詳細レベルを決定することも可能になります。
OpenAIによれば、ChatGPTユーザーはまもなくチャットボットの口調や応答スタイルを変更できるようになるという。
最新版は、米国の司法試験と大学院入学資格試験(GRE)において前版を上回った。
OpenAIによると、GPT-4には前身と同じ制限があり、「現実世界の多くの状況において人間よりも能力が劣る」とのこと。
「幻覚」と呼ばれる不正確なフィードバックは、GPT-4 を含む多くの AI プログラムにとって課題です。
GPT-4 には 2021 年 9 月以降に発生したイベントに関する知識がありません。
GPT-4 は、Microsoft の Bing AI チャットボットや人気の言語学習プラットフォーム Duolingo に統合されています。
マイ・アン(ロイター通信による)
[広告2]
ソース
コメント (0)