Wykorzystując 10 godzin danych dotyczących rozmów i godzinę nagrania, Saltlux stworzy prezentera głosowego i asystenta AI, który będzie w stanie rozumieć i płynnie komunikować się w języku wietnamskim.
Asystent AI i Metahuman firmy Saltlux (odtwarzający prawdziwych ludzi w przestrzeni wirtualnej) to niektóre z modeli, które przyciągnęły dużą uwagę odwiedzających wystawę AI Expo w ramach Wietnamskiego Festiwalu Sztucznej Inteligencji ( AI4VN 2023 ) odbywającego się w Ho Chi Minh City.
Asystenci AI mogą działać podobnie do popularnych chatbotów, takich jak ChatGPT, ale potrafią komunikować się w języku wietnamskim elastycznie i precyzyjnie w wielu kontekstach. Tymczasem Metahuman wzbudza entuzjazm u wielu osób, które tworzą kopię dowolnej osoby w środowisku cyfrowym.
Te dwa modele można połączyć, aby stworzyć ciekawą wersję MC AI, która może komunikować się w języku wietnamskim, a informacje są aktualizowane w czasie rzeczywistym.

Zwiedzający oglądają modele asystenta AI i meta-człowieka na wystawie AI4VN, która odbyła się 21 września w Ho Chi Minh City. Zdjęcie: Khuong Nha
Technologia Saltlux pozwala użytkownikowi stworzyć kopię samego siebie po godzinie nagrania i około 10 godzinach rozmowy. Po zebraniu wystarczającej ilości danych obrazowych, sztuczna inteligencja automatycznie skopiuje wizerunek, mimikę, ruchy i intonację prawdziwej osoby, symulując ją jako wirtualnego konferansjera i wykorzystując w wielu kontekstach.
Aby dokładnie opisać rysy twarzy i wyrazy twarzy każdej osoby, twórca zintegrował wiele technologii rozpoznawania grafów wiedzy, umożliwiających segmentację semantyczną, ocenę pozy, rozpoznawanie twarzy, gestów dłoni, klasyfikację grup wiekowych, płci... dzięki czemu wirtualna wersja MC wygląda niemal jak prawdziwa, a zwykli użytkownicy ledwo zauważają różnicę.
Następnie technologia analizy głosu przetworzy język naturalny, aby dokładnie odtworzyć głos i intonację prawdziwej osoby, a następnie wstawić go do wirtualnego modelu MC. Saltlux wykorzystuje model głębokiego uczenia Hybrid-Tacotron, który pozwala sztucznej inteligencji odtworzyć zarówno średnie, jak i wysokie głosy prawdziwych osób, zapewniając maksymalną stabilność i personalizację.
Następnie silnik syntezy mowy, który umożliwia zamianę tekstu na mowę i odwrotnie - mowę na tekst - pozwoli sztucznej inteligencji (AI) i rozmówcy na płynną interakcję w języku wietnamskim.
W rzeczywistych warunkach, w hałaśliwych warunkach, sztuczna inteligencja MC firmy Saltlux nadal w pełni słyszy kwestie wypowiadane bezpośrednio na scenie i przekształca je na tekst pisany, zanim wykona przypisane polecenia. Sztuczna inteligencja dobrze rozpoznaje akcenty z różnych regionów i szybko reaguje na treści, gdy użytkownicy nagle zmieniają temat. Użytkownicy mogą komunikować się ze sztuczną inteligencją za pomocą głosu, przeciągać i upuszczać polecenia lub wpisywać treści w polu czatu.
Jedną z zalet tego wietnamskojęzycznego AI MC jest dokładność odpowiedzi. Zamiast myśleć o odpowiedziach jak ChatGPT, Saltlux ma nad nimi maksymalną kontrolę, dzieląc każde pole. Na przykład, w przypadku bieżących wiadomości, AI pobiera tylko wiadomości z renomowanych gazet. Po syntezie i podaniu wyników, AI cytuje artykuły, aby użytkownicy mogli bezpośrednio przejść do linku, jeśli chcą przeczytać je dogłębniej.
Zadając pytania dotyczące destynacji turystycznej , programista przygotuje treść z wyprzedzeniem, umieści ją w wielu różnych kontekstach, aby przewidzieć pytanie użytkownika i tym samym udzielić trafnych odpowiedzi z dużą dokładnością. Podział poszczególnych obszarów treści i elastyczne tworzenie filtrów wejściowych i wyjściowych znacznie zmniejszają „złudzenie” wynikające z samoukładania się odpowiedzi przez chatboty AI.
W Korei ten model sztucznej inteligencji stworzył „Asystenta Narodowego Goodpy”, z którego rząd korzysta w celu świadczenia usług administracji publicznej 20 milionom osób. W Wietnamie model sztucznej inteligencji i wirtualny asystent zostały zbadane i wdrożone przez Saltlux dwa lata temu. Jednym z czołowych zastosowań jest wirtualny przewodnik po kompleksie pagody Tam Chuc. System nie tylko pomaga odwiedzającym odpowiadać na pytania, oprowadzać, udzielać wskazówek i objaśniać poszczególne miejsca, ale także precyzyjnie określa lokalizację każdej osoby w czasie rzeczywistym, udzielając w ten sposób odpowiednich wskazówek.

Interfejs platformy Ploonet Studio pozwala użytkownikom tworzyć treści z wykorzystaniem sztucznej inteligencji bez potrzeby korzystania z wydajnych urządzeń. Zdjęcie: Khuong Nha
Mając wirtualnego konferansjera i lektora, użytkownicy mogą dostosowywać treść i styl hostingu na platformie Ploonet Studio, aby masowo produkować filmy .
Interfejs Ploonet Studio jest również prosty – wystarczy kliknąć i odczekać około dwóch minut, aby system opublikował nowy film. Wszystko odbywa się na serwerze w chmurze, więc nie ma potrzeby konfiguracji terminala. Na targach CES 2023 w Las Vegas platforma Ploonet Studio została uhonorowana nagrodą Innovation Award.
Przedstawiciel Saltlux powiedział, że ich model sztucznej inteligencji pomaga zwiększyć wydajność pracy o 20% i obniżyć koszty operacyjne o ponad 30%, zapewniając jednocześnie wysoką dostępność 24 godziny na dobę, 7 dni w tygodniu.
Aby korzystać z tego modelu MC AI, użytkownicy muszą uiścić dwie opłaty. Stałą opłatę za odtworzenie prawdziwych osób w przestrzeni wirtualnej. Cena pakietu będzie się różnić w zależności od poziomu trudności wymaganego przez klienta. Druga opłata to opłata za tworzenie filmów w Ploonet Studio, naliczana godzinowo. Saltlux nie ujawnił konkretnych cen dla klientów indywidualnych. Firma kieruje swoją ofertę do klientów biznesowych, organizacji i instytucji rządowych.
Vnexpress.net
Komentarz (0)