Mit 10 Stunden Gesprächsdaten und einer Stunde Aufnahmematerial wird Saltlux einen MC und einen KI-Assistenten erstellen, der Vietnamesisch verstehen und fließend sprechen kann.
Saltlux' KI-Assistent und Metahuman (Nachbildung realer Menschen im virtuellen Raum) gehören zu den Modellen, die bei den Besuchern der AI Expo-Ausstellung im Rahmen des Vietnam Artificial Intelligence Festival ( AI4VN 2023 ) in Ho-Chi-Minh-Stadt großes Interesse geweckt haben.
KI-Assistenten funktionieren ähnlich wie beliebte Chatbots wie ChatGPT, können aber in vielen Kontexten flexibel und präzise auf Vietnamesisch kommunizieren. Metahuman hingegen begeistert viele, da es die Möglichkeit bietet, eine beliebige Person digital nachzubilden.
Diese beiden Modelle können miteinander kombiniert werden, um eine interessante MC-KI-Version zu erstellen, die auf Vietnamesisch kommunizieren kann und Informationen in Echtzeit aktualisiert.

Besucher erleben die KI-Assistenten- und Metahuman-Modelle auf der AI4VN-Ausstellung, die am 21. September in Ho-Chi-Minh-Stadt stattfand. Foto: Khuong Nha
Die Technologie von Saltlux ermöglicht es, nach einer Stunde Aufnahme und etwa zehn Stunden Gespräch eine Kopie von sich selbst zu erstellen. Sobald genügend Bilddaten gesammelt wurden, kopiert die KI automatisch Bilder, Mimik, Bewegungen und Intonation einer realen Person, simuliert diese als virtuellen Moderator und kann sie in verschiedenen Kontexten einsetzen.
Um die Gesichtszüge und Mimik jeder Person präzise zu beschreiben, hat der Entwickler zahlreiche Technologien zur Wissensgraphenerkennung integriert, die semantische Segmentierung, Posenschätzung, Gesichtserkennung, Handgesten, Altersgruppenklassifizierung, Geschlechtsbestimmung usw. ermöglichen, sodass die virtuelle MC-Version fast wie die reale aussieht und normale Benutzer den Unterschied kaum erkennen können.
Anschließend verarbeitet die Sprachanalysetechnologie die natürliche Sprache, um die Stimme und Intonation der jeweiligen Person präzise zu reproduzieren, bevor sie in das virtuelle MC-Modell integriert wird. Saltlux nutzt das Hybrid-Tacotron-Deep-Learning-Modell, das es der KI ermöglicht, sowohl mittlere als auch hohe Stimmlagen realer Personen nachzubilden und so maximale Stabilität und Personalisierung zu gewährleisten.
Anschließend ermöglicht die Sprachsynthese-Engine, die Text in Sprache und umgekehrt – Sprache in Text – umwandelt, der KI-Moderatorin und der Person eine reibungslose, direkte Interaktion auf Vietnamesisch.
Selbst in lauten Umgebungen versteht die MC-KI von Saltlux gesprochene Dialoge präzise und wandelt sie in Text um, bevor sie die zugewiesenen Befehle ausführt. Die KI erkennt Akzente aus verschiedenen Regionen zuverlässig und reagiert schnell auf Themenwechsel. Die Interaktion mit der KI erfolgt per Sprache, Drag & Drop oder Texteingabe im Chatfenster.
Ein großer Vorteil dieser vietnamesischsprachigen KI-Moderatorin ist die Genauigkeit ihrer Antworten. Anders als ChatGPT, das die Antworten eher unstrukturiert gestaltet, bietet Saltlux maximale Kontrolle über die Ergebnisse, indem jedes Themengebiet klar definiert ist. So bezieht die KI beispielsweise bei aktuellen Nachrichten ausschließlich Informationen aus seriösen Zeitungen. Nach der Auswertung und Ergebnisdarstellung zitiert die KI die Artikel, sodass Nutzer bei Bedarf direkt auf den Link zugreifen können, um den Artikel ausführlicher zu lesen.
Bei Fragen zu einem Reiseziel bereitet der Entwickler Inhalte im Voraus auf und setzt sie in verschiedene Kontexte, um die Frage des Nutzers vorherzusagen und so präzise und passende Antworten zu liefern. Die Aufteilung der Inhaltsbereiche und die flexible Gestaltung von Eingabe- und Ausgabefiltern tragen wesentlich dazu bei, die Illusion selbstgenerierter Antworten von KI-Chatbots zu reduzieren.
In Korea wurde mithilfe dieses KI-Modells der „Goodpy National Assistant“ entwickelt, der von der Regierung zur Bereitstellung öffentlicher Verwaltungsdienstleistungen für 20 Millionen Menschen eingesetzt wird. In Vietnam wurden das KI-Modell und der virtuelle Moderator vor zwei Jahren von Saltlux erforscht und in Betrieb genommen. Eine der bekanntesten Anwendungen ist der virtuelle Reiseführer im Tam-Chuc-Pagodenkomplex. Das System hilft Besuchern nicht nur bei Fragen, gibt Wegbeschreibungen und erklärt die einzelnen Sehenswürdigkeiten, sondern kann auch den Standort jedes Besuchers in Echtzeit präzise bestimmen und so passende Anweisungen geben.

Die Benutzeroberfläche der Ploonet Studio-Plattform ermöglicht es Nutzern, mithilfe von KI Inhalte zu erstellen, ohne dass leistungsstarke Geräte erforderlich sind. Foto: Khuong Nha
Sobald man einen virtuellen Moderator und eine Stimme hat, können die Nutzer auf der Ploonet Studio-Plattform den Inhalt und den Moderationsstil anpassen, um Videos in Serie zu produzieren.
Die Benutzeroberfläche von Ploonet Studio ist ebenfalls sehr einfach: Nutzer müssen lediglich klicken und etwa zwei Minuten warten, dann wird ein neues Video vom System veröffentlicht. Da alles auf dem Cloud-Server abläuft, ist keine Konfiguration am Endgerät erforderlich. Auf der CES 2023 in Las Vegas wurde die Ploonet Studio-Plattform mit dem Innovationspreis ausgezeichnet.
Ein Vertreter von Saltlux erklärte, dass ihr KI-Modell dazu beitrage, die Arbeitseffizienz um 20 % zu steigern und die Betriebskosten um mehr als 30 % zu senken, wodurch eine hohe Verfügbarkeit rund um die Uhr gewährleistet werde.
Für die Nutzung dieses MC-KI-Modells fallen zwei Gebühren an. Eine feste Gebühr für die virtuelle Nachbildung realer Personen. Der Paketpreis variiert je nach gewünschtem Schwierigkeitsgrad. Die zweite Gebühr deckt die Videoerstellung mit Ploonet Studio ab und wird stundenweise berechnet. Saltlux veröffentlicht keine konkreten Preise für Privatkunden. Das Unternehmen richtet sich an Geschäftskunden, Organisationen und Regierungen.
Vnexpress.net






Kommentar (0)