Google уже интегрировала Bard во многие приложения, такие как Gmail, YouTube, Google Maps и Flights, что даёт ему значительное преимущество перед ChatGPT. OpenAI недавно объявила, что бесплатная версия ChatGPT вскоре будет поддерживать голосовой ввод и ввод изображений.
Это означает, что пользователи могут задавать вопросы ChatGPT более естественным образом, чем при наборе текста на iPhone и Android, и даже использовать изображения для получения более точных ответов. Важно отметить, что пользователям не придётся платить за обновления ChatGPT Plus, хотя платные аккаунты первыми получат пробную версию.
Пользователи аккаунтов Plus и Enterprise получат это обновление в течение следующих двух недель, а затем и другие группы пользователей, включая разработчиков. Использование изображений для ввода данных в ChatGPT — это принцип работы мультимодальных моделей ИИ. Это похоже на то, как поисковый гигант использует Google Lens с ИИ.
Ожидается, что две новые функции ChatGPT привлекут больше пользователей, чем Google Bard
Между тем, функция голосовой поддержки будет доступна только в приложении ChatGPT для iPhone и Android. Пользователям нужно будет просто включить её в настройках приложения после активации функции. OpenAI заявляет, что ChatGPT достаточно всего нескольких секунд речевого фрагмента для создания звука, похожего на человеческий, из текста, и для этого используется новая модель преобразования текста в речь.
Эта технология, способная генерировать реалистичные синтетические голоса из реальной речи за считанные секунды, открывает путь для множества инновационных и ориентированных на доступность приложений. Однако она также создаёт новые риски, такие как возможность выдавать себя за знаменитостей или совершать мошенничество. OpenAI также заявила, что сотрудничает со Spotify в тестировании функции голосового перевода для подкастов, которая позволит создателям переводить свой контент на другие языки, используя собственный голос.
Ссылка на источник
Комментарий (0)