Маючи 10 годин даних розмов та одну годину запису, Saltlux відтворить ведучого та помічника зі штучним інтелектом, який зможе розуміти та вільно спілкуватися в'єтнамською мовою.
Серед моделей, що привернули велику увагу відвідувачів виставки AI Expo в рамках В'єтнамського фестивалю штучного інтелекту ( AI4VN 2023 ), що проходив у Хошиміні, є AI Assistant та Metahuman від Saltlux (відтворення реальних людей у віртуальному просторі).
Асистенти на основі штучного інтелекту можуть працювати аналогічно популярним чат-ботам, таким як ChatGPT, але можуть гнучко та точно спілкуватися в'єтнамською мовою в багатьох контекстах. Тим часом Metahuman викликає захоплення у багатьох людей, створюючи копію будь-якої людини в цифровому середовищі.
Ці дві моделі можна об'єднати, щоб створити цікаву версію MC AI, яка може спілкуватися в'єтнамською мовою з оновленою інформацією в режимі реального часу.

Відвідувачі знайомляться з моделями AI Assistant та Metahuman на виставці AI4VN, що відбулася 21 вересня в Хошиміні. Фото: Khuong Nha
Технологія Saltlux дозволяє людині створити копію себе після години запису та приблизно 10 годин розмови. Зібравши достатньо даних зображення, штучний інтелект автоматично скопіює зображення, вирази обличчя, рухи та інтонацію реальної людини, імітує їх як віртуального ведучого та використовує в багатьох контекстах.
Щоб точно описати риси обличчя та вирази кожної людини, розробник інтегрував багато технологій розпізнавання графів знань, що дозволяють семантичну сегментацію, оцінку пози, розпізнавання обличчя, жестів рук, класифікацію за віковою групою, статтю... так що віртуальна версія MC виглядає майже як справжня, і звичайні користувачі навряд чи можуть розпізнати різницю.
Далі технологія аналізу голосу оброблятиме природну мову, щоб точно відтворити голос та інтонацію реальної людини, перш ніж вставити її у віртуальну модель MC. Saltlux використовує модель глибокого навчання Hybrid-Tacotron, що дозволяє штучному інтелекту відтворювати як середні, так і високі голоси реальних людей, забезпечуючи максимальну стабільність та персоналізацію.
Потім, механізм синтезу мовлення, який дозволяє перетворювати текст на мовлення і навпаки – мовлення на текст – дозволить ведучому ШІ та людині безперешкодно взаємодіяти безпосередньо в'єтнамською мовою.
У реальних умовах шуму штучний інтелект Saltlux з керуванням голосом все ще повністю чує репліки, сказані безпосередньо на сцені, та перетворює їх на письмовий текст, перш ніж виконувати призначені команди. Штучний інтелект добре розпізнає акценти з різних регіонів та швидко реагує на контент, коли користувачі раптово змінюють тему. Користувачі можуть взаємодіяти зі ШІ за допомогою голосу, перетягування команд або введення контенту у вікно чату.
Однією з переваг цього в'єтнамськомовного ШІ-керівника є точність відповідей. Замість того, щоб думати про відповіді, як у ChatGPT, Saltlux має максимальний контроль над відповідями, розділяючи кожне поле. Наприклад, у випадку з поточними новинами ШІ отримуватиме новини лише з авторитетних газет. Після синтезу та надання результатів ШІ цитуватиме статті, щоб користувачі могли безпосередньо отримати доступ до посилання, якщо хочуть прочитати детальніше.
Коли розробник ставить запитання, пов’язані з туристичним напрямком, він заздалегідь готує контент, розміщує його в різних контекстах, щоб передбачити запитання користувача, тим самим надаючи відповідні відповіді з високою точністю. Розподіл кожної області контенту та гнучкість у створенні фільтрів введення та виведення допомагають значно зменшити «ілюзію» самостійно складених відповідей чат-ботів на базі штучного інтелекту.
У Кореї ця модель штучного інтелекту створила «Goodpy National Assistant», який використовується урядом для надання державних адміністративних послуг 20 мільйонам людей. У В'єтнамі модель штучного інтелекту та віртуальний центр керування транспортом були досліджені та запущені компанією Saltlux два роки тому. Одним із найвідоміших застосувань є віртуальний гід по комплексу пагоди Там Чук. Система не лише допомагає відвідувачам відповідати на запитання, проводити екскурсії, давати вказівки та пояснювати кожне місце, але й може точно визначати місцезнаходження кожної людини в режимі реального часу, тим самим надаючи відповідні інструкції.

Інтерфейс платформи Ploonet Studio дозволяє користувачам створювати контент за допомогою штучного інтелекту без необхідності використання потужних пристроїв. Фото: Хуонг Ня
Щойно у вас буде віртуальний ведучий та озвучка, користувачі зможуть налаштувати контент та стиль хостингу на платформі Ploonet Studio для масового виробництва відео .
Інтерфейс Ploonet Studio також простий, користувачам потрібно лише натиснути кнопку та зачекати близько двох хвилин, після чого система опублікує нове відео. Все робиться на хмарному сервері, тому немає потреби в налаштуванні терміналу. На виставці CES 2023 у Лас-Вегасі платформа Ploonet Studio була відзначена нагородою за інновації.
Представник Saltlux заявив, що їхня модель штучного інтелекту допомагає підвищити ефективність роботи на 20% та скоротити операційні витрати більш ніж на 30%, забезпечуючи високу доступність цілодобово.
Щоб користуватися цією моделлю штучного інтелекту MC, користувачам потрібно сплатити дві комісії. Фіксовану плату за відтворення реальних людей у віртуальному просторі. Ціна пакету варіюватиметься залежно від складності, необхідної клієнту. Друга плата – це плата за створення відео в Ploonet Studio, яка стягується погодинно. Saltlux не розголошує конкретні ціни для окремих клієнтів. Компанія орієнтується на групу бізнес-клієнтів та організацій, а також уряди.
Vnexpress.net
Коментар (0)