Google が Bard を Gmail、YouTube、Google マップ、フライトなどの多くのアプリに統合しているという事実は ChatGPT に対する大きな利点であり、OpenAI は最近、ChatGPT の無料バージョンで音声と画像の入力が間もなく可能になると発表しました。
これにより、ユーザーはiPhoneやAndroidで入力するよりも自然な方法でChatGPTに質問したり、画像を使ってより良い回答を得たりできるようになります。重要な点は、ChatGPT Plusのアップデートを受けるために料金を支払う必要がないことです。ただし、有料アカウントには最初にトライアル版が提供されます。
PlusおよびEnterpriseユーザーは今後2週間以内にこのアップデートを受け取り、その後、開発者を含む他のユーザーグループにも提供されます。ChatGPTへの入力に画像を使用するのは、マルチモーダルAIモデルの仕組みです。これは、検索大手がAIでGoogle Lensを使用する方法に似ています。
ChatGPTの2つの新機能は、Google Bardよりも多くのユーザーを引き付けると予想されています
一方、音声サポート機能はiPhoneとAndroid向けのChatGPTアプリでのみ利用可能です。この機能を有効化した後、ユーザーはアプリの設定でこの機能を有効にするだけです。OpenAIによると、ChatGPTはテキストから人間のような音声を生成するために数秒のサンプル音声のみを必要とし、そのために新しいテキスト読み上げモデルを使用しているとのことです。
実際の音声から数秒でリアルな合成音声を生成できるこの技術は、アクセシビリティを重視した様々な革新的アプリケーションへの道を開くものです。しかし同時に、著名人のなりすましや詐欺の可能性など、新たなリスクも生じています。OpenAIはまた、Spotifyと共同でポッドキャスト向けの音声翻訳機能をテストしており、クリエイターが自分の声を使ってコンテンツを他言語に翻訳できるようになると発表しました。
[広告2]
ソースリンク
コメント (0)