Google zintegrowało już Bard z wieloma aplikacjami, takimi jak Gmail, YouTube, Mapy Google i Loty, co daje mu dużą przewagę nad ChatGPT. Dlatego firma OpenAI ogłosiła niedawno, że darmowa wersja ChatGPT wkrótce umożliwi wprowadzanie głosu i obrazu.
Oznacza to, że użytkownicy mogą zadawać pytania w ChatGPT w bardziej naturalny sposób niż wpisując je na iPhonie i Androidzie, a nawet korzystać z obrazów, aby uzyskać lepsze odpowiedzi. Kluczem jest to, że użytkownicy nie będą musieli płacić za ChatGPT Plus, aby otrzymywać aktualizacje, chociaż konta płatne będą pierwszymi, które otrzymają okres próbny.
Użytkownicy kont Plus i Enterprise otrzymają tę aktualizację w ciągu najbliższych dwóch tygodni, a następnie inne grupy użytkowników, w tym deweloperzy. Wykorzystanie obrazów do wprowadzania danych do ChatGPT to sposób działania multimodalnych modeli sztucznej inteligencji. Działa to podobnie do tego, jak gigant wyszukiwania korzysta z Google Lens ze sztuczną inteligencją.
Oczekuje się, że dwie nowe funkcje w ChatGPT przyciągną więcej użytkowników niż Google Bard
Funkcja obsługi głosowej będzie dostępna tylko w aplikacji ChatGPT na iPhone'a i Androida. Użytkownicy muszą ją jedynie włączyć w ustawieniach aplikacji po jej aktywacji. OpenAI twierdzi, że ChatGPT potrzebuje zaledwie kilku sekund przykładowej mowy, aby wygenerować dźwięk przypominający głos człowieka z tekstu, i wykorzystuje w tym celu nowy model przetwarzania tekstu na mowę.
Technologia, która w ciągu kilku sekund generuje realistyczne, syntetyczne głosy z prawdziwej mowy, otwiera drzwi wielu innowacyjnym aplikacjom zorientowanym na dostępność. Wiąże się ona jednak również z nowymi zagrożeniami, takimi jak możliwość podszywania się pod celebrytów czy popełniania oszustw. Firma OpenAI poinformowała również, że współpracuje ze Spotify w celu przetestowania funkcji tłumaczenia głosu dla podcastów, umożliwiając twórcom tłumaczenie treści na inne języki za pomocą własnego głosu.
Link źródłowy
Komentarz (0)