![]() |
携帯電話の画面にGPT-4oが表示される |
ChatGPT-4o は今後数週間以内にテスターに展開される予定です。
ChatGPTの新バージョンは、表情を読み取り、人間の話し方のパターンを模倣し、ほぼリアルタイムの会話を行うことができると開発者らが明らかにした。
OpenAIは、同社の人工知能(AI)チャットボット「GPT-4o」の次期バージョンをリアルタイムプレゼンテーションで披露しました。プレゼンターと電話で会話するこのチャットボットは、人間の会話とその微妙な感情表現を驚くほど巧みに操っているように見えました。指示に従ってロボットの声と音声を切り替え、会話の中断に適応し、顔の表情や周囲の状況を直感的に処理するなど、その実力は明らかでした。
デモンストレーションでは、AI音声アシスタントがリアルタイムで言語を翻訳したり、紙に書かれた数式を解いたり、視覚障碍者をロンドンの街中で案内したりするなどのタスクをこなし、そのスキルを披露した。
OpenAIのCEO、サム・アルトマン氏は、プレゼンテーション終了後、ソーシャルメディアプラットフォームXに一言投稿した。この投稿は、孤独な男性がAIアシスタントに恋に落ちる2013年の同名映画への言及だった。
視覚的な手がかりを読み取る能力を実証するために、チャットボットは携帯電話のカメラレンズを使用して OpenAI エンジニアの表情を読み取り、感情を説明しました。
これらの新しい機能は、中断に対処したり視覚情報に応答したりできなかった以前のモデルの限られた音声機能に比べて大幅に改善されています。
「私たちは人間と機械のインタラクションの未来を見据えています」と、OpenAIの最高技術責任者であるミラ・ムラティ氏は記者会見で述べた。「GPT-4oはまさにそのパラダイムを変えると考えています。」
新しい音声アシスタントは、今後数週間以内にアルファテスター向けに限定的にリリースされ、その後、ChatGPT Plusの有料加入者からより広範囲に展開される予定です。
この発表は、同社がChatGPTをiPhoneに統合するための契約をAppleと締結間近であるというブルームバーグの報道を受けてのものでもある。これにより、GPT-4oがiPhoneの音声アシスタントであるSiriのアップグレードに使用される可能性が出てきた。
しかし、この新しい技術は安全性や詐欺電話の発信に関する懸念も引き起こしています。
コメント (0)