Vietnam.vn - Nền tảng quảng bá Việt Nam

Д-р Дао Дик Мінь: «Опанування в'єтнамських даних – це перший крок у розробці та опануванні в'єтнамських технологій»

Báo Thanh niênBáo Thanh niên27/05/2024

зображення Працюючи у великій організації зі штучного інтелекту в США, чому ви вирішили повернутися до В'єтнаму та приєднатися до VinBigdata? Працюючи в США, хоча я брав участь у багатьох великих урядових проектах, результати, яких я досягав, часто були лише кількома кроками у великому процесі обробки. Багато разів, через дуже суворі процедури конфіденційності проектів, я навіть не знав, як використовуються розроблені мною рішення. У 2017 році я повернувся до В'єтнаму, коли В'єтнам перебував на стадії розвитку, і було багато проблем, пов'язаних з великими даними та штучним інтелектом, які потребували вирішення. Я прийняв запрошення професора Ву Ха Вана спільно реалізувати мету розробки в'єтнамських технологічних рішень для обслуговування життя в'єтнамського народу. Я вважаю своє повернення до В'єтнаму набагато більш значущим, оскільки зможу працювати над проблемами з більшим впливом.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Доктор Дао Дик Мінь на семінарі

НВКК

У стратегії розвитку штучного інтелекту, яку роль та вплив відіграють великі дані, сер? Дані відіграють дуже важливу та цінну роль у навчанні штучного інтелекту. Щоб навчити високоякісну модель штучного інтелекту, ми часто починаємо з навчання великої бази даних. Тому, щоб мати якісний штучний інтелект, нам спочатку потрібні якісні дані. Якісні дані повинні відповідати стандартам за кількістю та масштабом, якістю, різноманітністю та універсальністю. Процес збору та обробки тисяч годин даних, починаючи з етапу очищення необроблених даних для створення даних найвищої якості для використання в моделі штучного інтелекту, є дуже дорогим та складним. Навпаки, для аналізу великих даних нам потрібно використовувати штучний інтелект, щоб забезпечити здатність точно обробляти дані у великих масштабах, тим самим створюючи більш вирішальні або прогнозовані результати. Наприклад, у процесі розробки продукту віртуального помічника для в'єтнамців (ViVi) нам довелося зібрати та обробити десятки тисяч годин високоякісних аудіоданих, від сотень тисяч голосів з різних регіонів, різного віку та статі, з контентом, що охоплює сотні галузей... Або зовсім нещодавно, запуск ViGPT - "першої в'єтнамської версії ChatGPT для кінцевих користувачів", розробленої на основі моделі великої мови, що повністю належить VinBigdata. Ця модель була навчена на основі 600 ГБ уточнених в'єтнамських даних з багатьох різних галузей. Завдяки нашому розумінню в'єтнамських даних та мови, ми знайшли новий підхід до скорочення часу запуску ViGPT лише за 9 місяців після народження ChatGPT. Це резонанс між великими даними та штучним інтелектом.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.
Яка ваша думка щодо поєднання досліджень з практичною цінністю для служіння громаді? - Я вважаю, що технологічні дослідження є справді успішними лише тоді, коли вони дійсно входять у життя, вирішують соціальні проблеми та покращують життя людей. Щоб створювати практичні комерційні продукти та вирішувати бізнес- та соціальні проблеми, ми повинні завжди звертати увагу та ставити питання: яку цінність дані принесуть життю? Дотепер ми досліджували різноманітні продукти та рішення в різних галузях та професіях, як правило, ViGPT, VinDr - надання рішень штучного інтелекту в медичній візуалізації та діагностиці, VinBase - платформу для штучного інтелекту, або Vizone - набір інтелектуальних рішень для аналізу зображень.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

З ключовими співробітниками VinBigdata на заході корпорації Vingroup

НВКК

4-та промислова революція активно відбувається у світовому масштабі. Які переваги, на вашу думку, має В'єтнам? Порівняно з попередніми революціями, я вважаю, що В'єтнам наразі має багато переваг, які можна реалізувати в рамках цієї 4-ї промислової революції, що допоможе покращити позиції країни на карті світу . Два ключі до досягнення цієї мети – це дані та люди. Наразі у В'єтнамі проживає майже 100 мільйонів людей, з яких значна частина молоді користується телефонами та персональними комп'ютерами. Крім того, у нас є авторитетні експерти зі штучного інтелекту та молоді, висококваліфіковані кадри в галузі інформаційних технологій, а також дуже хороша основа з математики. Отже, які обмеження? Перше обмеження, яке можна побачити, полягає в тому, що, незважаючи на велику чисельність населення, ми все ще маємо труднощі з обробкою даних, зокрема зі стандартизацією та синхронізацією даних на об'єктах, у бізнес-підрозділах та адміністративних одиницях. Крім того, ми також стикаємося з іншими обмеженнями, такими як обмежені інвестиційні ресурси, особливо інвестиції у високопродуктивну обчислювальну інфраструктуру.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.
На вашу думку, наскільки важливим є володіння в'єтнамськими даними на шляху створення та освоєння технологій для обслуговування життя в'єтнамського народу? Наразі у світі існує багато провідних новаторських продуктів штучного інтелекту, зазвичай це продукти штучного інтелекту, створені на основі великих мовних моделей, таких як ChatGPT OpenAI або Bard від Google. Однак в'єтнамська мова не є основною мовною групою для розробки цих продуктів. Тому якість контенту, специфічного для в'єтнамської мови, що повертається користувачам, більш-менш залежить від неї, і існує висока ймовірність помилок, що більш небезпечно, помилок у базових знаннях. Як в'єтнамці, ми маємо перевагу доступу до власних джерел даних. Тільки ми маємо здатність розуміти характеристики в'єтнамських даних, потреби та особливості в'єтнамського народу. Тому володіння в'єтнамськими даними є справді ключем до оволодіння основними технологіями, тобто технологіями, які служитимуть в'єтнамському народу.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Внутрішнє навчання для членів VinBigdata

НВКК

Як отримати доступ до певних джерел даних, особливо коли більшість в'єтнамців сьогодні користуються сайтами соціальних мереж з-за кордону? Фактично, найбільшим джерелом людських даних сьогодні (не лише в'єтнамців) є Інтернет та соціальні мережі. Однак ми все ще можемо отримувати доступ до даних та збирати їх з різних джерел, виходячи з розуміння характеристик в'єтнамських даних, залежно від характеристик, встановлених кожним проектом. Наприклад, моделі GPT OpenAI мають до сотень, навіть трильйонів параметрів, навчені на величезних обсягах даних та коштують мільярди доларів. Порівняно з ними, ми обрали зовсім інший напрямок, виходячи з наших досліджень, можливостей та ресурсів: тобто створення в'єтнамської мовної моделі з архітектурою лише кількох мільярдів параметрів, навченої на наборі в'єтнамських даних обсягом 600 ГБ, які ми зібрали та вдосконалили самі, але з еквівалентними можливостями з точки зору обробки в'єтнамської мови. Результати показують, що наша самостійно розроблена архітектура може самооптимізуватися, скорочувати час навчання мовної моделі, знижувати витрати, водночас забезпечуючи якість моделі. З якими викликами ви та ваша команда зіткнулися в процесі дослідження та розробки продуктів штучного інтелекту? Перший виклик, безумовно, це час. Хвиля технологій штучного інтелекту настає дуже швидко та переживає період буму. У світі провідні технологічні компанії швидко запускають високоякісні продукти, які постійно оновлюються та вдосконалюються. Якщо ми будемо повільними та не запускатимемо продукти вчасно, ми неодмінно відстанемо. З іншого боку, якщо ми хочемо створювати продукти, які можна застосовувати та вирішувати практичні соціальні проблеми, ми також повинні враховувати пошук та розвиток видатних, особливих та унікальних особливостей продукту.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Презентація на Дні штучного інтелекту у В'єтнамі (AI4VN 2023)

НВКК

Насправді, багато людей та організацій у В'єтнамі та світі зазнали значної шкоди через витік даних. Як ви ставитеся до питання безпеки даних? Можна сказати, що будь-яка програма сьогодні походить від даних. Працюючи з даними, з одного боку, ми повинні забезпечити мету застосування даних для створення найкращої технології для життя, а з іншого боку, ми повинні забезпечити безпеку даних для окремих осіб та організацій. Людський фактор є дуже важливою ланкою в процесі забезпечення безпеки даних. До них належать розробники, користувачі продуктів та самі користувачі. Для розробників усвідомлення безпеки даних має бути присутнім з самого початку збору та обробки даних. Часто, коли не виникає жодних проблем, ми не усвідомлюємо важливості безпеки даних. Але якщо трапляється витік даних, збитки можуть бути величезними. Витоки даних можуть статися через технічні проблеми або навмисні атаки на крадіжку даних. Коли дані витікають, особи чи організації можуть використовувати свою інформацію в незаконних цілях зловмисниками, тоді як підприємства можуть зазнати фінансових втрат для виправлення пов'язаних з цим проблем і навіть шкоди бренду.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Доктор Дао Дук Мінь та команда VinBigdata на заході

НВКК

Після прагнення опанувати технології для обслуговування в'єтнамського народу, неодмінно будуть кроки для просування у світ? Будь-яка організація чи підприємство, яке хоче вивести свою продукцію на міжнародний ринок, повинно відповідати міжнародним стандартам. VinBigdata має сильні сторони в рішеннях та технологіях, тому поставити собі за мету підкорити світ є природним. Звичайно, для впровадження багатьох різних продуктів та застосувань необхідна підтримка міжнародних підрозділів з багаторічним досвідом та розумінням користувачів з усього світу. Дякуємо!

Thanhnien.vn

Джерело: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Коментар (0)

No data
No data

У тій самій темі

У тій самій категорії

Збереження духу Свята середини осені через кольори фігурок
Відкрийте для себе єдине село у В'єтнамі, яке входить до списку 50 найкрасивіших сіл світу
Чому цього року популярні ліхтарі з червоними прапорами та жовтими зірками?
В'єтнам переміг у музичному конкурсі «Інтербачення 2025»

Того ж автора

Спадщина

Фігура

Бізнес

No videos available

Новини

Політична система

Місцевий

Продукт