O Google já integrou o Bard a muitos aplicativos como Gmail, YouTube, Google Maps e Flights, o que lhe confere uma grande vantagem sobre o ChatGPT. Por isso, a OpenAI anunciou recentemente que a versão gratuita do ChatGPT em breve permitirá entrada de voz e imagem.
Isso significa que os usuários podem fazer perguntas no ChatGPT de uma forma mais natural do que digitar no iPhone e Android, ou até mesmo usar imagens para obter respostas melhores. O ponto principal é que os usuários não precisarão pagar pelo ChatGPT Plus para receber atualizações, embora as contas pagas sejam as primeiras a receber um teste gratuito.
Usuários das contas Plus e Enterprise receberão esta atualização nas próximas duas semanas, seguidos por outros grupos de usuários, incluindo desenvolvedores. O uso de imagens para inserir dados no ChatGPT é a forma como os modelos de IA multimodal funcionam. É semelhante à forma como o gigante das buscas usa o Google Lens com IA.
Dois novos recursos no ChatGPT devem atrair mais usuários do que o Google Bard
Enquanto isso, o recurso de suporte por voz estará disponível apenas no aplicativo ChatGPT para iPhone e Android. Os usuários só precisam habilitá-lo nas configurações do aplicativo após a ativação do recurso. A OpenAI afirma que o ChatGPT precisa apenas de alguns segundos de amostra de fala para gerar áudio semelhante ao humano a partir de texto, e está usando um novo modelo de conversão de texto em fala para isso.
A tecnologia, que pode gerar vozes sintéticas realistas a partir de falas reais em segundos, abre caminho para muitas aplicações inovadoras e focadas em acessibilidade. No entanto, também apresenta novos riscos, como a possibilidade de personificação de celebridades ou fraudes. A OpenAI também afirmou estar trabalhando com o Spotify para testar um recurso de tradução de voz para podcasts, permitindo que os criadores traduzam seu conteúdo para outros idiomas usando suas próprias vozes.
[anúncio_2]
Link da fonte
Comentário (0)