Google a déjà intégré Bard à de nombreuses applications comme Gmail, YouTube, Google Maps et Flights, ce qui lui confère un avantage considérable sur ChatGPT. OpenAI a donc récemment annoncé que la version gratuite de ChatGPT permettra bientôt la saisie vocale et visuelle.
Cela signifie que les utilisateurs peuvent poser des questions à ChatGPT plus naturellement qu'en tapant sur iPhone et Android, ou même utiliser des images pour obtenir de meilleures réponses. L'avantage principal est que les utilisateurs n'auront pas à payer pour ChatGPT Plus pour obtenir les mises à jour, même si les comptes payants seront les premiers à bénéficier d'une période d'essai.
Les utilisateurs des comptes Plus et Entreprise recevront cette mise à jour dans les deux prochaines semaines, suivis par d'autres groupes d'utilisateurs, dont les développeurs. L'utilisation d'images pour la saisie dans ChatGPT est le fonctionnement des modèles d'IA multimodaux. Ce fonctionnement est similaire à celui du géant de la recherche utilisant Google Lens avec l'IA.
Deux nouvelles fonctionnalités sur ChatGPT devraient attirer plus d'utilisateurs que Google Bard
En attendant, la fonctionnalité d'assistance vocale sera disponible uniquement sur l'application ChatGPT pour iPhone et Android. Il suffit de l'activer dans les paramètres de l'application après l'activation. Selon OpenAI, ChatGPT n'a besoin que de quelques secondes d'échantillon vocal pour générer un son de type humain à partir d'un texte, et utilise pour cela un nouveau modèle de synthèse vocale.
Cette technologie, capable de générer des voix synthétiques réalistes à partir de paroles réelles en quelques secondes, ouvre la voie à de nombreuses applications innovantes et axées sur l'accessibilité. Cependant, elle présente également de nouveaux risques, comme la possibilité d'usurper l'identité de célébrités ou de commettre des fraudes. OpenAI a également indiqué collaborer avec Spotify pour tester une fonctionnalité de traduction vocale pour les podcasts, permettant aux créateurs de traduire leur contenu dans d'autres langues en utilisant leur propre voix.
Lien source
Comment (0)