GPT-4 は「マルチモーダル」であるため、画像とテキストの両方を含む質問に答えることができます。

写真:GI
GPT-3.5 は記述されたクエリからの結果のみを提供しますが、この大規模言語モデルの最新バージョンでは、画像を入力データとして使用して、画像内のオブジェクトを識別および分析できます。
GPT-3.5 では応答が約 3,000 語に制限されていますが、GPT-4 では 25,000 語を超える応答が許可されます。
GPT-4 は、前身に比べて不適切なコンテンツの要求に対する応答性が 82% 向上し、いくつかの実践的なテストで 40% 高いスコアを獲得しました。
また、開発者は AI のトーンスタイルや詳細レベルを決定することもできます。
OpenAIによれば、ChatGPTユーザーはまもなくチャットボットの口調や応答スタイルを変更できるようになるという。
最新版は、米国司法試験と大学院履歴書試験(GRE)の両方で前バージョンを上回りました。
OpenAI によれば、GPT-4 は前身と同様の制限があり、「現実世界の多くの状況で人間より劣っている」とのことです。
「幻覚」として知られる不正確な応答は、GPT-4 を含む多くの AI プログラムにとって課題となります。
GPT-4 には 2021 年 9 月以降に発生したイベントに関する知識がありません。
GPT-4 は、Microsoft の Bing AI チャットボットや人気の言語学習プラットフォーム Duolingo に統合されています。
マイ・アン(ロイター通信による)
[広告2]
ソース






コメント (0)