A Google már számos alkalmazásba integrálta a Bardot, például a Gmailbe, a YouTube-ba, a Google Térképbe és a Repülőjegyekbe, ami nagy előnyt jelentett neki a ChatGPT-vel szemben. Az OpenAI ezért nemrégiben bejelentette, hogy a ChatGPT ingyenes verziója hamarosan hang- és képbevitelt is lehetővé tesz.
Ez azt jelenti, hogy a felhasználók természetesebb módon tehetnek fel kérdéseket a ChatGPT-nek, mint gépeléssel iPhone-on vagy Androidon, vagy akár képeket is használhatnak a jobb válaszok érdekében. A lényeg, hogy a felhasználóknak nem kell fizetniük a ChatGPT Plus frissítéseiért, bár a fizetős fiókok tagjai lesznek az elsők, akik próbaverziót kapnak.
A Plus és Enterprise fiókok felhasználói a következő két hétben kapják meg ezt a frissítést, majd ezt követik más felhasználói csoportok, beleértve a fejlesztőket is. A multimodális MI-modellek képek segítségével működnek a ChatGPT-ben. Ez hasonló ahhoz, ahogyan a keresőóriás a Google Lenst használja mesterséges intelligenciával.
A ChatGPT két új funkciója várhatóan több felhasználót vonz majd, mint a Google Bard.
Eközben a hangtámogatási funkció csak a ChatGPT alkalmazásban lesz elérhető iPhone-on és Androidon. A felhasználóknak csak engedélyezniük kell az alkalmazás beállításaiban a funkció engedélyezése után. Az OpenAI szerint a ChatGPT-nek mindössze néhány másodpercnyi mintabeszédre van szüksége ahhoz, hogy emberi hangot generáljon a szövegből, és ehhez egy új szövegfelolvasó modellt használ.
A technológia, amely másodpercek alatt képes valósághű szintetikus hangokat generálni valódi beszédből, számos innovatív és akadálymentesítésre összpontosító alkalmazás előtt nyitja meg az utat. Ugyanakkor új kockázatokat is jelent, például hírességek megszemélyesítésének vagy csalás elkövetésének lehetőségét. Az OpenAI azt is közölte, hogy a Spotify-jal együttműködve tesztel egy podcastok hangfordító funkcióját, amely lehetővé teszi az alkotók számára, hogy saját hangjukkal más nyelvekre fordítsák tartalmukat.
[hirdetés_2]
Forráslink
Hozzászólás (0)