Google har allerede integrert Bard i mange apper som Gmail, YouTube, Google Maps og Flights, noe som gir dem en stor fordel i forhold til ChatGPT. Så OpenAI annonserte nylig at gratisversjonen av ChatGPT snart vil tillate tale- og bildeinndata.
Dette betyr at brukere kan stille ChatGPT-spørsmål på en mer naturlig måte enn å skrive på iPhone og Android, eller til og med bruke bilder for å få bedre svar. Hovedpoenget er at brukere ikke trenger å betale for ChatGPT Plus for å få oppdateringer, selv om betalte kontoer vil være de første som får en prøveperiode.
Plus- og Enterprise-kontobrukere vil få denne oppdateringen i løpet av de neste to ukene, etterfulgt av andre brukergrupper, inkludert utviklere. Bruk av bilder til å legge inn i ChatGPT er hvordan multimodale AI-modeller fungerer. Det ligner på hvordan søkegiganten bruker Google Lens med AI.
To nye funksjoner på ChatGPT forventes å tiltrekke seg flere brukere enn Google Bard
I mellomtiden vil stemmestøttefunksjonen bare være tilgjengelig i ChatGPT-appen for iPhone og Android. Brukere trenger bare å aktivere den i appens innstillinger etter at funksjonen er aktivert. OpenAI sier at ChatGPT bare trenger noen få sekunder med eksempeltale for å generere menneskelignende lyd fra tekst, og at de bruker en ny tekst-til-tale-modell for å gjøre det.
Teknologien, som kan generere realistiske syntetiske stemmer fra ekte tale på sekunder, åpner døren for mange innovative og tilgjengelighetsfokuserte applikasjoner. Den medfører imidlertid også nye risikoer, som muligheten for å utgi seg for å være kjendiser eller begå svindel. OpenAI sa også at de samarbeider med Spotify for å teste en stemmeoversettelsesfunksjon for podkaster, slik at skapere kan oversette innholdet sitt til andre språk ved hjelp av sine egne stemmer.
[annonse_2]
Kildekobling
Kommentar (0)