Інженери GenZ створюють безкоштовні програми зі штучним інтелектом для в'єтнамців

Покинувши США та повернувшись додому, Нгуєн Хоанг Куан та його колеги з VILM розробили безкоштовну систему штучного інтелекту (ШІ) для в'єтнамців, яку вони використовуватимуть у сферах обслуговування клієнтів, і яку щомісяця завантажують понад 100 000 разів.

У червні 2023 року 25-річний Нгуєн Хоанг Куан та його колеги 23-річний Фам Нхут Хюй, інженер зі штучного інтелекту в ZaloAI, та 24-річний Дао Мінь Зунг, аспірант Коркського університету, Ірландія, стали співзасновниками некомерційної організації VILM з бажанням допомогти в'єтнамцям максимально оптимально використовувати найсучасніші технології штучного інтелекту.

Після майже 6 місяців досліджень та застосування команда успішно розробила три безкоштовні моделі штучного інтелекту, включаючи OpenHermes, VinaLlama та Vistral. Це фундаментальні дослідження для розробки систем штучного інтелекту, які можуть розуміти та діяти відповідно до побажань користувача (модель великих дій). Ці моделі призначені для застосування в таких технологічних галузях, як управління машинами, роботи, що допомагають людям з інвалідністю краще підтримувати їх без доглядальників, або допомагають програмістам виправляти помилки, віртуальні помічники для догляду за клієнтами або безкоштовні запитання.

OpenHermes досягає 85 000 завантажень на місяць, входячи до 10 найбільш завантажених мовних моделей на HuggingFace (найбільшому у світі сайті обміну моделями штучного інтелекту). Знімок екрана. — OpenHermes досягає 85 000 завантажень на місяць, входячи до 10 найбільш завантажених мовних моделей на HuggingFace (найбільшому у світі сайті обміну моделями штучного інтелекту). *Знімок екрана* .

Модель OpenHermes — це велика мовна модель, яка підтримує англійську мову, як і ChatGPT, але з вищими показниками. Вона дозволяє користувачам завантажувати модель на свої персональні комп'ютери для використання без Інтернету. Примітно, що навчальні дані OpenHermes становлять лише 1/100 від навчальних даних ChatGPT від OpenAI. Наразі цей додаток отримує понад 50 000 завантажень на місяць. OpenHermes-2.5 та OpenHermes-2.5-Vision використовуються понад 40 стартапами в Кремнієвій долині (США).

VinaLlama та Vistral – це дві мовні моделі, орієнтовані на обслуговування в'єтнамського ринку, метою яких є допомогти місцевим користувачам легше використовувати найсучасніші технології штучного інтелекту.

Хоанг Куан провів 7 років, навчаючись у США, та працював в OpenAI інженером-дослідником моделі штучного інтелекту ChatGPT, хоча й не закінчив університет. У 2022 році він працював інженером даних у продукті Microsoft та OpenAI Bing Chat, заробляючи тисячі доларів. До 2023 року, зіткнувшись із хвилею звільнень у сфері технологій у США, Куан зрозумів, що ринок праці після закінчення навчання дуже похмурий, але, побачивши можливості у В'єтнамі, вирішив повернутися додому.

Нгуєн Хоанг Куан. Фото: Надано персонажа — Нгуєн Хоанг Куан. Фото: *NVCC*

У VILM Куан є головним інженером, відповідальним за дослідження методів покращення даних, а також за навчання ШІ. У той час як Нхут Хью виконує роль технічного дослідження в навчанні ШІ, а Мінь Зунг пропонує нові методи в теоретичних дослідженнях.

Куан пояснив, що сучасні моделі великих мов, такі як ChatGPT (Large Language Model), можуть забезпечувати лише текстовий вивід, тоді як люди мають багато способів спілкування та отримання знань. Саме тому команда прагне створити систему, яка може гнучко працювати між різними типами вхідних та вихідних даних (може отримувати та виводити такі дані, як мова, зображення, відео , звуки), не зупиняючись лише на рівні мови.

Щоб досягти мети створення моделей великих дій, команді довелося подолати дві проблеми: безпеку та швидкість. Сучасні програми штучного інтелекту здебільшого використовують дані користувачів та надсилають їх на сервери таких компаній, як OpenAI, для обробки, що викликає занепокоєння щодо безпеки. Команда зосередилася на створенні моделей штучного інтелекту, які є достатньо малими та швидкими для обробки безпосередньо на мобільних пристроях, одночасно балансуючи продуктивність та швидкість, щоб уникнути впливу на взаємодію з користувачем.

Експериментальна команда використовувала дані, отримані від штучного інтелекту, для його навчання, замість того, щоб піти шляхом використання даних з реальних джерел. Спочатку вони мали труднощі з пошуком обчислювальних ресурсів (комп'ютерів для навчання штучного інтелекту), але пізніше переконали великі компанії та лабораторії по всьому світу надати спонсорську допомогу.

Куан зазначив, що головна мета створення цих продуктів — допомогти людям швидко отримувати доступ до програм штучного інтелекту з якістю, не поступаючись ChatGPT чи Bing Chat, а також спростити дослідження та створення моделей штучного інтелекту в майбутньому. Замість використання ChatGPT, який обмежений в'єтнамською мовою та культурою, в'єтнамські компанії можуть завантажити VinaLlama в'єтнамською мовою.

Мовна модель VinaLlama легко обробляє математичну задачу в'єтнамською мовою, на зображенні показано демонстрацію продукту VinaLlama для вирішення математичної задачі. Знімок екрана. — Мовна модель VinaLlama легко обробляє математичну задачу в'єтнамською мовою, на зображенні показано демонстрацію продукту VinaLlama для вирішення математичної задачі. *Знімок екрана.*

Пан Данг Хай Лок, засновник платформи Mindmaid для створення чат-ботів на основі штучного інтелекту, сказав, що з точки зору розробника додатків на основі штучного інтелекту, він зрозумів, що вартість та конфіденційність даних – це два питання, які найбільше турбують бізнес під час розгортання додатків на основі штучного інтелекту. Найбільш задовільним рішенням цієї проблеми є моделі LLM з відкритим кодом, які можуть працювати на інфраструктурі підприємства та вивчати (налаштовувати) більше власних даних підприємства. Тому в'єтнамські моделі LLM з відкритим кодом, такі як VinaLlama, Vistral..., є дуже цінними для просування додатків на основі штучного інтелекту у В'єтнамі.

«Ці моделі з відкритим кодом також дозволяють більшій кількості програмістів та ентузіастів технологій отримати доступ до сфери інженерів штучного інтелекту лише з MacBook, замість того, щоб інвестувати в дорогу інфраструктуру GPU (відеокарти). Це також сприятиме розвитку сили інженерів штучного інтелекту у В'єтнамі, посада, яка користується великим попитом у найближчому майбутньому», – сказав пан Лок.

За словами Куана, в'єтнамці мають дуже добру основу в науковій теорії, добре володіють штучним інтелектом, а ChatGPT також має людські ресурси, які беруть участь у дослідженнях, але їм важче швидко наздоганяти постійно мінливу хвилю технологій. «В'єтнамцям потрібен досвід у створенні продуктів для кінцевих користувачів, щоб вони могли дійсно розуміти проблеми, з якими стикаються, та правильно орієнтувати свої дослідження», – сказав Куан про причину дослідження безкоштовних моделей штучного інтелекту для підтримки в'єтнамців у сфері технологій. Він сказав, що співпрацював з багатьма міжнародними групами та завжди готовий співпрацювати з дослідницькими групами у В'єтнамі.

Нху Куїнь

Посилання на джерело