Google が Bard を Gmail、YouTube、Google マップ、フライトなどの多くのアプリに組み込んでいるという事実は、ChatGPT に対する大きな利点です。そこでOpenAIは最近、ChatGPTの無料版で音声と画像の入力がまもなく可能になると発表しました。
つまり、ユーザーは iPhone や Android で入力するよりも自然な方法で ChatGPT に質問したり、画像を使用してより良い回答を得たりすることができます。重要な点は、ChatGPT Plus のアップデートを受け取るために料金を支払う必要がないことですが、有料アカウントが最初に試用版を利用できるようになります。
Plus および Enterprise アカウントのユーザーは、今後 2 週間以内にこのアップデートを受け取り、その後、開発者を含む他のユーザー グループにも提供されます。画像を使用して ChatGPT に入力するのが、マルチモーダル AI モデルの動作方法です。これは、検索大手が AI を搭載した Google Lens を使用する方法に似ています。
ChatGPTの2つの新機能は、Google Bardよりも多くのユーザーを引き付けると予想されています
一方、音声サポート機能は、iPhone および Android 用の ChatGPT アプリでのみ利用できます。ユーザーは、この機能を開いた後、アプリの設定でそれを有効にするだけです。 OpenAIによれば、ChatGPTはテキストから人間のような音声を生成するために数秒のサンプル音声のみを必要とし、そのために新しいテキスト読み上げモデルを使用しているという。
この技術は、実際の音声から数秒でリアルな合成音声を生成することができ、多くの革新的でアクセシビリティに重点を置いたアプリケーションへの扉を開きます。しかし、これによって、有名人になりすましたり、詐欺行為が行われたりする可能性があるなど、新たなリスクも生じます。 OpenAIはまた、Spotifyと提携してポッドキャストの音声翻訳機能をテストし、クリエイターが自分の声を使ってコンテンツを他の言語に翻訳できるようにすると述べた。
[広告2]
ソースリンク
コメント (0)