O Google já integrou o Bard em diversos aplicativos, como Gmail, YouTube, Google Maps e Flights, o que lhe confere uma grande vantagem sobre o ChatGPT. Por isso, a OpenAI anunciou recentemente que a versão gratuita do ChatGPT em breve permitirá entrada de voz e imagem.
Isso significa que os usuários podem fazer perguntas ao ChatGPT de uma forma mais natural do que digitando no iPhone e no Android, ou até mesmo usar imagens para obter melhores respostas. O ponto principal é que os usuários não precisarão pagar pelo ChatGPT Plus para receber atualizações, embora as contas pagas sejam as primeiras a receber um período de teste.
Os usuários das contas Plus e Enterprise receberão essa atualização nas próximas duas semanas, seguidos por outros grupos de usuários, incluindo desenvolvedores. O uso de imagens como entrada no ChatGPT é o princípio de funcionamento dos modelos de IA multimodal. É semelhante à forma como a gigante das buscas utiliza o Google Lens com IA.
Espera-se que duas novas funcionalidades do ChatGPT atraiam mais usuários do que o Google Bard.
Entretanto, o recurso de suporte por voz estará disponível apenas no aplicativo ChatGPT para iPhone e Android. Os usuários só precisam ativá-lo nas configurações do aplicativo após a ativação do recurso. A OpenAI afirma que o ChatGPT precisa apenas de alguns segundos de amostra de fala para gerar áudio com sonoridade humana a partir de texto, e utiliza um novo modelo de conversão de texto em fala para isso.
A tecnologia, capaz de gerar vozes sintéticas realistas a partir da fala real em segundos, abre portas para diversas aplicações inovadoras e focadas em acessibilidade. No entanto, também apresenta novos riscos, como a possibilidade de falsificação de identidade de celebridades ou fraudes. A OpenAI também afirmou estar trabalhando com o Spotify para testar um recurso de tradução de voz para podcasts, permitindo que os criadores traduzam seu conteúdo para outros idiomas usando suas próprias vozes.
Link da fonte






Comentário (0)