CNNによると、 5月14日早朝(ベトナム時間)、アメリカの諜報企業OpenAIは、テキストや画像による対話や音声による会話が可能なGPT-4oという新しい人工知能(AI)モデルを発表した。
GPT-4oのハイライトは、GPT-4モデルと比較して、より自然でユーザーフレンドリーなインタラクティブインターフェースです。新しいChatGPTバージョンは、会話のコンテキストを記憶し、ユーザーとの過去のやり取りから学習し、リアルタイムの多言語翻訳を提供する機能を備えています。
テクノロジー専門家によると、GoogleやMetaなどの競合他社もチャットボットやその他の製品で使用するための「ビッグ言語」モデルを積極的に開発しているため、今回のOpenAIのアップデートはAI戦争における戦略的なリードを示すものとなる。
市場では、Google の Gemini も GPT-4o と同様に、テキスト、画像、音声を処理および生成できるマルチモーダル モデルです。
プレゼンテーションでは、OpenAIの幹部がChatGPTの音声ベースの会話機能を実演しました。ユーザーはリアルタイムの数学の解答、就寝時の読み聞かせ、プログラミングのアドバイスをリクエストできます。
GPT-40 モデルに基づく ChatGPT インターフェース (無料)
ChatGPTは、自然な人間の声やロボットの声を使ってコミュニケーションをとることができ、応答の一部を歌で表現することもできます。さらに、画像やグラフを分析し、その情報に基づいて議論を進めることもできます。
OpenAIは、ユーザーの感情を認識する機能も導入しました。例えば、ChatGPTの新バージョンでは、従業員の呼吸を聞き取り、落ち着くよう提案することができます。
さらに、GPT-4oは翻訳機能と自動返信機能により多言語チャットをサポートしています。現在、このツールは50以上の言語をサポートしています。
OpenAIは、そのリーチを拡大するために、GPT-4oの機能を統合し、ユーザーに同社の技術と対話するための別のプラットフォームを提供するChatGPTデスクトップアプリケーションをリリースすると発表しました。
現在、無料ユーザーは、ツールが自動的に古い GPT-3.5 バージョンに戻る前に、新しい GPT-40 モデルとのやり取りを限られた回数しか行えません。
ユーザーが料金を支払えば、最新モデルでさらに多くのメッセージにアクセスできるようになります。
OpenAIによれば、1億人以上がChatGPTを使用しているとのこと。
[広告2]
出典: https://nld.com.vn/chatgpt-phien-moi-co-the-lang-nghe-nhip-tho-tro-chuyen-nhu-con-nguoi-196240514100151265.htm






コメント (0)