ChatGPTの20ドルの有料版からアクセスできるこの新しいモデルはマルチモーダルで、テキストと画像(テスト問題のスクリーンショットなど)の両方の入力を受け付けます。そして、これらのクエリをテキストで解析し、回答することができます。

OpenAIの新しいモデルGPT-4。ChatGPTチャットボットの20ドルの有料版からアクセスできる。写真:AFP
OpenAIは、新しいソフトウェアをさまざまなアプリケーションに組み込んでいると述べている。その中には、会話型言語ボットの構築に使用している言語学習アプリDuolingo、オンライン家庭教師を設計している教育会社Khan Academy、従業員向けの情報を取得して要約するためにGPT-4を使用する社内チャットボットをテストしているMorgan Stanley Wealth Managementなどがある。
モデルへの入力として画像とテキストを受け入れる機能により、写真の内容に基づいて詳細な説明を生成し、質問に答えることができるようになりました。
同社は、視覚障害者とボランティアを結びつけるデンマークのスタートアップ企業Be My Eyesと提携し、GPT-4をベースに視覚障害者を案内したり支援したりできる仮想ボランティアを構築したと発表した。
GPT-4の前身であるGPT-3.5は、昨年末に数百万人の注目を集めました。OpenAIはGPT-4を「これまでで最も先進的なシステム」と称し、前身よりも信頼性が高く、微妙なクエリをはるかにうまく処理できると主張しています。
しかし、同社はいくつかの問題点を指摘している。「GPT-4は優れた性能を備えているものの、従来のGPTモデルと同じ限界があり、完全に信頼できるわけではない…」。さらに同社は、「GPT-4の出力を使用する際は、特に信頼性が重要な状況では注意が必要です」と付け加えた。
マイクロソフトは今年初め、汎用AIの未来に賭け、OpenAIへの「数十億ドル規模の投資」を発表しました。GPT-4は、今年初めにベータ版がリリースされたマイクロソフトのBingチャットボットに搭載されます。マイクロソフトは近日中に、自社のコンシューマー向け製品への統合も発表する予定です。
一方、Google は、自社の会話型チャットボット「Bard」を限られたテスターグループに公開し、Google Cloud の顧客が初めて大規模言語モデル PaLM にアクセスしてアプリケーションを構築できるようにすると発表した。
OpenAIは、この技術の潜在的な危害を検証するため、GPT-4に厳しいテストを実施し、誤情報、プライバシー、サイバーセキュリティへの潜在的なリスクを検証しました。その結果、GPT-4は「攻撃計画に関するアドバイスやヘイトスピーチなど、潜在的に有害なコンテンツを生成する可能性がある。様々な偏見や世界観を表現する可能性がある…」と明らかにしました。
OpenAIは、GPT-4が人間なしで自律的な行動をとることができるかどうかをテストするために外部組織とも協力し、GPT-4には「おそらく」まだその能力がないとの結論に達したと述べた。
マイ・アン(AFP、FT、CNA)
[広告2]
ソース
コメント (0)