Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

Молодий інженер використовує штучний інтелект, щоб змінити спосіб набору тексту в'єтнамською мовою

Програмне забезпечення для набору тексту в'єтнамською мовою, інтегроване зі штучним інтелектом, є одним із продуктів, який успішно поєднує креативність із професійними знаннями, прагнучи принести практичну цінність громаді.

ZNewsZNews14/05/2025


Інтерфейс v7, клавіатура з інтегрованим штучним інтелектом. Фото: NVCC .

У інтерв'ю для Tri Thuc - Znews Трі Дик (народився у 2003 році) розповів про ідею застосування штучного інтелекту для зміни способу введення в'єтнамської мови. Інструмент набору тексту v7, його студентський проєкт, переріс у дослідницьку роботу та був прийнятий на IJCAI 2025, престижну конференцію зі штучного інтелекту.

Незважаючи на популярність протягом десятиліть, набор тексту за допомогою Telex або VNI все ще має багато обмежень у взаємодії з користувачем. Тому v7 була створена як легкий інструмент прогнозування, який допомагає скоротити час набору тексту в'єтнамською мовою завдяки інтеграції штучного інтелекту.

Пристрасть до мов та технологій

Його любов до мов і технологій привела його до спеціалізації «Прикладний штучний інтелект» в Технологічному університеті міста Хошимін.

Під час навчання він займався такими проектами, як модель великої мови (LLM) для в'єтнамської мови, програмне забезпечення для перекладу мов етнічних меншин або чат-бот для підтримки вступу. «Цей досвід допоміг мені накопичити міцну основу знань, розвинути мою пристрасть і бажання застосовувати штучний інтелект для створення корисних продуктів для громади», – поділився він.

Інтегрована дерев'яна дошка для фото AI 1

Tri Duc хоче втілити штучний інтелект у життя. Фото: NVCC.

Крім того, маючи досвід у мандаринській та кантонській мовах, Дик усвідомив зв'язок піньїнь/джутпін з в'єтнамською орфографією. Цей фактор також показує, що, на відміну від складності ієрогліфів, китайська система набору тексту піньїнь потребує лише введення «ин», щоб отримати назву нашої країни літерами хань. У той час як для отримання слова «В'єтнам» у телексі чи VNI потрібно 10 клавіш.

Завдяки своїм спостереженням Дюк зрозумів, що під час швидкого спілкування користувачі часто скорочують слова, зберігаючи першу приголосну, наприклад, «hs» для слова «студент». «Якщо люди можуть легко зрозуміти цей стиль письма, штучний інтелект може повністю його зрозуміти, якщо його навчити з правильними даними», – сказав він про обставини, що породили цю ідею.

Замість того, щоб писати повний символ, а потім додавати наголоси під час використання традиційних інструментів набору тексту, таких як Telex або VNI, які дотримуються механізму комплементарності, v7 використовує штучний інтелект, щоб підказати слово, яке ви хочете написати. Технологія точно передбачить повне слово з найменшою можливою кількістю клавіш.

У в'єтнамській орфографічній структурі слово складається з початкової приголосної, рими та тону. Наприклад, слово «Nguyen» складається з «ng», «uyen» та низхідного тону. На основі цього принципу, механізм набору тексту v7 побудований для прогнозування повних слів лише з початковою приголосною та тоном, що допомагає значно зменшити кількість натискань клавіш, зберігаючи при цьому точність.

Завдання навчання в'єтнамської мови для ШІ

За словами Дика, найбільшим викликом було навчити ШІ «розуміти» в'єтнамську мову для роботи з цим інструментом набору тексту. Він перепробував багато моделей, перш ніж обрати GPT-2 як основу, з архітектурою Transformers для гарного розуміння контексту та точного прогнозування слів.

Після вибору базової архітектури, Дюк повністю замінив Токенізатор (кодер словника) на в'єтнамський словник, створений власноруч. Інженер відфільтрував усі дійсні, правильно написані в'єтнамські слова, щоб забезпечити комплексну обробку, передбачаючи будь-яке слово, яке користувач хоче написати.

Ще один виклик полягає в балансуванні прогностичної продуктивності та швидкості відгуку, забезпечуючи, щоб модель могла працювати в режимі реального часу як на комп’ютерах, так і на телефонах, але все ще була достатньо потужною для створення найкращих прогнозів. Після двох місяців безперервного тестування поточна версія правильно виводить майже 70% слів, які вводять користувачі, на початок результату, із затримкою всього 0,03 секунди.

Щодо методу введення на клавіатурі, то, згідно з багатьма дослідженнями, з якими Дик консультувався у лінгвістів Цао Сюань Хао або Анрі Масперо, в'єтнамська мова має не лише 6, а 8 тонів. Щоб скористатися цією функцією, v7 використовує 8-тонову систему замість звичайних 6 (включаючи плоский тон і 5 акцентованих тонів: дієзливий, плоский, питальний, спадний, важкий). На цій клавіатурі під час набору тексту «v7» модель пропонуватиме слово «Viet». Ця ж ідея і для назви продукту.

Поділившись версією v7 у своїй соціальній мережі, Дик сказав, що був дуже радий і здивований, коли модель отримала увагу, підтримку та бажання її випробувати. «Це дало мені чітке відчуття потреби в розумнішому та швидшому інструменті для набору тексту в'єтнамською мовою», – сказав він.

Інтегрована дерев'яна дошка для фото AI 2

Група авторів наукової статті. Зліва направо: Нят Кханг, Хіеу Нгіа та Трі Дук. Фото: NVCC.

Наразі клавіатура все ще перебуває на стадії прототипу, з відкритим вихідним кодом на GitHub для тестування та внесення змін до розробки програмістами або користувачами технологій. Також розробляється повноцінна версія програми для Windows та macOS, яку звичайні користувачі зможуть легко встановити та використовувати.

У майбутньому головним пріоритетом для версії 7 є версія клавіатури на iPhone, щоб покращити спосіб введення в'єтнамського тексту на смартфонах. Крім того, точність моделі буде підвищена завдяки більшому навчанню на даних щоденних розмов, що допоможе штучному інтелекту краще розуміти поширені контексти.

Подорож Дика сприяла розвитку творчості, дозволяючи йому бути в курсі технологічних тенденцій у контексті значних інвестицій В'єтнаму в інфраструктуру штучного інтелекту. Один момент, який його пишає, – це коли v7 вперше створила повне речення. «Саме тоді маленька модель, ймовірно, лише в 1/10 000 від розміру ChatGPT сьогодні, все ще могла думати як людина», – сказав Дик.

Джерело: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


Коментар (0)

No data
No data

У тій самій темі

У тій самій категорії

Небезпечно гойдаючись на скелі, чіпляючись за каміння, щоб зішкрібати варення з морських водоростей на пляжі Гіа Лай
48 годин полювання за хмарами, спостереження за рисовими полями та поїдання курки в Y Ty
Секрет найвищих характеристик Су-30МК2 у небі над Бадінем 2 вересня
Туєн Куанг освітлюється гігантськими ліхтарями середини осені під час фестивальної ночі

Того ж автора

Спадщина

Фігура

Бізнес

No videos available

Новини

Політична система

Місцевий

Продукт