Med 10 timmars konversationsdata och en timmes inspelning kommer Saltlux att återskapa en konferencier och AI-assistent som kan förstå och kommunicera flytande på vietnamesiska.
Saltlux AI-assistent och Metahuman (återskapande av verkliga människor i virtuellt utrymme) är bland de modeller som har väckt stor uppmärksamhet från besökare på AI Expo-utställningen inom ramen för Vietnam Artificial Intelligence Festival ( AI4VN 2023 ), som äger rum i Ho Chi Minh-staden.
AI-assistenter kan fungera på liknande sätt som populära chatbotar som ChatGPT men kan kommunicera flexibelt och korrekt på vietnamesiska i många sammanhang. Samtidigt gör Metahuman många människor entusiastiska när de skapar en kopia av vilken person som helst i den digitala miljön.
Dessa två modeller kan kombineras för att skapa en intressant MC AI-version som kan kommunicera på vietnamesiska med information uppdaterad i realtid.

Besökare får uppleva modellerna AI-assistent och metahuman på AI4VN-utställningen som hölls den 21 september i Ho Chi Minh-staden. Foto: Khuong Nha
Saltlux teknik gör det möjligt för en person att skapa en kopia av sig själv efter en timmes inspelning och cirka 10 timmars samtal. Efter att ha samlat in tillräckligt med bilddata kommer AI:n automatiskt att kopiera bilder, uttryck, rörelser och intonation från en verklig person, simulera som en virtuell MC och använda den i många sammanhang.
För att korrekt beskriva varje persons ansiktsdrag och uttryck har utvecklaren integrerat många tekniker för kunskapsgrafigenkänning, vilket möjliggör semantisk segmentering, poseuppskattning, ansiktsigenkänning, handgester, åldersgruppsklassificering, kön... så att den virtuella MC-versionen nästan ser ut som den riktiga, och vanliga användare knappt kan se skillnaden.
Därefter kommer röstanalystekniken att bearbeta det naturliga språket för att korrekt återge den verkliga personens röst och intonation innan det infogas i den virtuella MC-modellen. Saltlux använder Hybrid-Tacotrons djupinlärningsmodell, vilket gör det möjligt för AI:n att återskapa både mellan- och diskantröster från verkliga människor, vilket säkerställer maximal stabilitet och anpassning.
Sedan kommer talsyntesmotorn, som gör att text-till-tal och vice versa – tal-till-text – att låta AI-konsulten och personen interagera direkt och smidigt på vietnamesiska.
I verkliga situationer och bullriga förhållanden uppfattar Saltlux MC AI fortfarande replikerna som sägs direkt på scenen och omvandlar dem till skriven text innan de tilldelade kommandona utförs. AI känner igen accenter från olika regioner väl och reagerar snabbt på innehåll när användare plötsligt byter ämne. Användare kan interagera med AI via röst, dra-och-släpp-kommandon eller skriva innehåll i chattrutan.
En av fördelarna med denna vietnamesisktalande AI-konsult är hur noggranna svaren är. Istället för att tänka på svar som ChatGPT har Saltlux maximal kontroll över svaren genom att dela upp varje fält. Till exempel, med aktuella nyheter kommer AI bara att hämta nyheter från välrenommerade tidningar. Efter att ha syntetiserat och gett resultat kommer AI att citera artiklarna så att användare kan komma åt länken direkt om de vill läsa på djupet.
När utvecklaren ställer frågor relaterade till ett turistmål förbereder de innehållet i förväg och placerar det i många olika sammanhang för att förutsäga användarens fråga, vilket ger lämpliga svar med hög noggrannhet. Att dela upp varje innehållsområde och vara flexibel i att skapa in- och utmatningsfilter hjälper till att avsevärt minska "illusionen" av AI-chattrobotars självkomponerade svar.
I Korea har denna AI-modell skapat "Goodpy National Assistant", som används av regeringen för att tillhandahålla offentliga administrativa tjänster till 20 miljoner människor. I Vietnam undersöktes och drevs AI-modellen och virtuell MC av Saltlux för två år sedan. En av de framträdande applikationerna är den virtuella guiden vid Tam Chuc Pagoda-komplexet. Systemet hjälper inte bara besökare att svara på frågor, guida, ge vägbeskrivningar och förklara om varje plats, utan kan också exakt bestämma varje persons plats i realtid och därigenom ge lämpliga instruktioner.

Ploonet Studio-plattformens gränssnitt låter användare skapa innehåll med AI utan behov av kraftfulla enheter. Foto: Khuong Nha
När du väl har en virtuell konferencier och röst kan användare anpassa innehållet och värdstilen på Ploonet Studio-plattformen för att massproducera videor .
Ploonet Studios gränssnitt är också enkelt, användarna behöver bara klicka och vänta i ungefär två minuter, så publiceras en ny video av systemet. Allt görs på molnservern så det finns inget krav på terminalkonfiguration. På CES 2023 i Las Vegas tilldelades Ploonet Studios plattform Innovation Award.
En representant för Saltlux sa att deras AI-modell hjälper till att förbättra arbetseffektiviteten med 20 % och sänka driftskostnaderna med mer än 30 %, vilket säkerställer hög tillgänglighet dygnet runt.
För att använda denna MC AI-modell måste användare betala två avgifter. En fast avgift för att återskapa riktiga människor i virtuella utrymmen. Paketets pris varierar beroende på kundens svårighetsgrad. Den andra avgiften är avgiften för att skapa videor i Ploonet Studio, vilken debiteras per timme. Saltlux har inte avslöjat specifika priser för enskilda kunder. Företaget riktar sig till gruppen företagskunder och organisationer samt myndigheter.
Vnexpress.net






Kommentar (0)