Googles integration av Bard i ett flertal applikationer som Gmail, YouTube, Google Maps och Flights är en betydande fördel jämfört med ChatGPT. Därför meddelade OpenAI nyligen att gratisversionen av ChatGPT snart kommer att tillåta röst- och bildinmatning.
Det här innebär att användare kan begära ChatGPT på ett mer naturligt sätt än att skriva på iPhones och Android-enheter, eller till och med använda bilder för att få bättre svar. Huvudpoängen är att användare inte behöver betala för ChatGPT Plus för att få uppdateringar, även om betalda konton kommer att vara bland de första att prova det.
Plus- och Enterprise-kontoanvändare kommer att få den här uppdateringen under de kommande två veckorna, följt av andra användargrupper, inklusive utvecklare. Att använda bilder för inmatning i ChatGPT är hur multimodala AI-modeller fungerar. Det liknar hur sökjätten använder Google Lens med AI.
Två nya funktioner på ChatGPT förväntas locka fler användare än Google Bard.
Samtidigt kommer röststödsfunktionen endast att vara tillgänglig i ChatGPT-appen för iPhone och Android. Användare behöver bara aktivera den i appens inställningar efter att funktionen är aktiverad. OpenAI säger att ChatGPT bara behöver några sekunders exempeltal för att skapa människoliknande ljud från text, med hjälp av en ny text-till-tal-modell för detta ändamål.
Denna teknik, som kan skapa realistiskt syntetiskt tal från verkligt tal på några sekunder, öppnar dörren för många innovativa och tillgängliga tillämpningar. Den medför dock också nya risker, såsom möjligheten att utge sig för att vara kändisar eller delta i bedrägerier. OpenAI uppgav också att de samarbetar med Spotify för att testa en röstöversättningsfunktion för poddsändningar, vilket gör det möjligt för skapare att översätta sitt innehåll till andra språk med hjälp av sin egen röst.
[annons_2]
Källänk







Kommentar (0)