L'intégration de Bard par Google dans de nombreuses applications telles que Gmail, YouTube, Google Maps et Flights constitue un avantage considérable par rapport à ChatGPT. C'est pourquoi OpenAI a récemment annoncé que la version gratuite de ChatGPT permettra bientôt la saisie vocale et visuelle.
Cela signifie que les utilisateurs peuvent interroger ChatGPT de manière plus naturelle qu'en saisissant du texte sur iPhone et Android, ou même utiliser des images pour obtenir des réponses plus pertinentes. L'important est que les utilisateurs n'auront pas besoin de payer pour ChatGPT Plus afin de recevoir les mises à jour, même si les comptes payants seront parmi les premiers à les tester.
Les utilisateurs des comptes Plus et Entreprise recevront cette mise à jour dans les deux prochaines semaines, suivis par les autres groupes d'utilisateurs, notamment les développeurs. ChatGPT utilise des images comme données d'entrée pour ses modèles d'IA multimodaux. C'est comparable à la façon dont le géant de la recherche utilise Google Lens avec l'IA.
Deux nouvelles fonctionnalités de ChatGPT devraient attirer plus d'utilisateurs que Google Bard.
Par ailleurs, la fonctionnalité de reconnaissance vocale sera uniquement disponible sur l'application ChatGPT pour iPhone et Android. Il suffira aux utilisateurs de l'activer dans les paramètres de l'application une fois la fonctionnalité activée. OpenAI indique que ChatGPT n'a besoin que de quelques secondes d'enregistrement vocal pour générer des sons naturels à partir de texte, grâce à un nouveau modèle de synthèse vocale conçu à cet effet.
Cette technologie, capable de créer une synthèse vocale réaliste à partir de la parole réelle en quelques secondes, ouvre la voie à de nombreuses applications innovantes et accessibles. Cependant, elle présente également de nouveaux risques, comme la possibilité d'usurper l'identité de célébrités ou de se livrer à des activités frauduleuses. OpenAI a également annoncé collaborer avec Spotify pour tester une fonctionnalité de traduction vocale pour les podcasts, permettant aux créateurs de traduire leur contenu dans d'autres langues en utilisant leur propre voix.
Lien source






Comment (0)