ChatGPTは無料の音声および画像コマンド入力をサポートします

[広告1]

GoogleはすでにGmail、YouTube、Googleマップ、フライトなど多くのアプリにBardを統合しており、ChatGPTに対して大きな優位性を持っています。そこでOpenAIは最近、ChatGPTの無料版で音声と画像入力がまもなく可能になると発表しました。

これにより、ユーザーはiPhoneやAndroidで入力するよりも自然な方法でChatGPTに質問したり、画像を使ってより良い回答を得たりできるようになります。重要な点は、ChatGPT Plusのアップデートを受けるために料金を支払う必要がないことです。ただし、有料アカウントには最初にトライアル版が提供されます。

PlusおよびEnterpriseアカウントのユーザーは、今後2週間以内にこのアップデートを受け取り、その後、開発者を含む他のユーザーグループにも提供されます。ChatGPTへの入力に画像を使用するのは、マルチモーダルAIモデルの仕組みです。これは、検索大手がAIでGoogle Lensを使用する方法に似ています。

ChatGPT hỗ trợ nhập lệnh bằng giọng nói và hình ảnh miễn phí - Ảnh 1. — ChatGPTの2つの新機能は、Google Bardよりも多くのユーザーを引き付けると予想されています

一方、音声サポート機能はiPhoneとAndroid向けのChatGPTアプリでのみ利用可能です。この機能を有効化した後、ユーザーはアプリの設定でこの機能を有効にするだけです。OpenAIによると、ChatGPTはテキストから人間のような音声を生成するために数秒のサンプル音声のみを必要とし、そのために新しいテキスト読み上げモデルを使用しているとのことです。

実際の音声から数秒でリアルな合成音声を生成できるこの技術は、アクセシビリティを重視した革新的なアプリケーションへの道を開くものです。しかし同時に、著名人のなりすましや詐欺行為といった新たなリスクも生じます。OpenAIはまた、Spotifyと共同でポッドキャスト向けの音声翻訳機能をテストしており、クリエイターが自分の声を使ってコンテンツを他言語に翻訳できるようになると発表しました。

[広告2]
ソースリンク