Google har redan integrerat Bard i många appar som Gmail, YouTube, Google Maps och Flights, vilket ger dem en stor fördel jämfört med ChatGPT. Så OpenAI meddelade nyligen att gratisversionen av ChatGPT snart kommer att tillåta röst- och bildinmatning.
Det här innebär att användare kan ställa frågor från ChatGPT på ett mer naturligt sätt än att skriva på iPhone och Android, eller till och med använda bilder för att få bättre svar. Den viktigaste poängen är att användare inte behöver betala för ChatGPT Plus för att få uppdateringar, även om betalda konton kommer att vara de första som får en provperiod.
Plus- och Enterprise-kontoanvändare kommer att få den här uppdateringen under de kommande två veckorna, följt av andra användargrupper, inklusive utvecklare. Att använda bilder för att mata in i ChatGPT är hur multimodala AI-modeller fungerar. Det liknar hur sökjätten använder Google Lens med AI.
Två nya funktioner på ChatGPT förväntas locka fler användare än Google Bard
Samtidigt kommer röststödsfunktionen endast att vara tillgänglig i ChatGPT-appen för iPhone och Android. Användare behöver bara aktivera den i appens inställningar efter att funktionen har aktiverats. OpenAI säger att ChatGPT bara behöver några sekunders exempeltal för att generera människoliknande ljud från text, och att de använder en ny text-till-tal-modell för att göra det.
Tekniken, som kan generera realistiska syntetiska röster från verkligt tal på några sekunder, öppnar dörren för många innovativa och tillgänglighetsfokuserade tillämpningar. Den medför dock också nya risker, såsom möjligheten att utge sig för att vara kändisar eller begå bedrägerier. OpenAI sa också att de samarbetar med Spotify för att testa en röstöversättningsfunktion för poddsändningar, vilket gör det möjligt för skapare att översätta sitt innehåll till andra språk med hjälp av sina egna röster.
[annons_2]
Källänk
Kommentar (0)