La integración de Bard por parte de Google en numerosas aplicaciones como Gmail, YouTube, Google Maps y Vuelos supone una ventaja significativa sobre ChatGPT. Por ello, OpenAI anunció recientemente que la versión gratuita de ChatGPT pronto permitirá la entrada de voz e imágenes.
Esto significa que los usuarios pueden solicitar ChatGPT de forma más natural que escribiendo en iPhones y Androids, o incluso usar imágenes para obtener mejores respuestas. Lo más importante es que no tendrán que pagar por ChatGPT Plus para recibir actualizaciones, aunque las cuentas de pago estarán entre las primeras en probarlo.
Los usuarios de las cuentas Plus y Enterprise recibirán esta actualización en las próximas dos semanas, seguidos por otros grupos de usuarios, incluyendo desarrolladores. El uso de imágenes como entrada en ChatGPT es la forma en que funcionan los modelos de IA multimodal. Es similar a cómo el gigante de las búsquedas usa Google Lens con IA.
Se espera que dos nuevas funciones de ChatGPT atraigan a más usuarios que Google Bard.
Mientras tanto, la función de soporte de voz solo estará disponible en la app ChatGPT para iPhone y Android. Los usuarios solo tienen que habilitarla en la configuración de la app una vez activada. OpenAI afirma que ChatGPT solo necesita unos segundos de muestra de voz para crear sonidos similares a los humanos a partir del texto, utilizando un nuevo modelo de texto a voz para este propósito.
Esta tecnología, capaz de crear voz sintetizada realista a partir de voz real en segundos, abre la puerta a muchas aplicaciones innovadoras y accesibles. Sin embargo, también presenta nuevos riesgos, como la posibilidad de suplantar la identidad de famosos o participar en actividades fraudulentas. OpenAI también declaró que está colaborando con Spotify para probar una función de traducción de voz para podcasts, que permite a los creadores traducir su contenido a otros idiomas utilizando su propia voz.
[anuncio_2]
Enlace de origen






Kommentar (0)