„A vietnami adatok elsajátítása az első lépés a vietnami technológia fejlesztése és elsajátítása felé”

[hirdetés_1]

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 1.

Miután egy nagy mesterséges intelligenciával foglalkozó szervezetnél dolgozott az Egyesült Államokban, miért döntött úgy, hogy visszatér Vietnámba, és csatlakozik a VinBigdatához?

Az Egyesült Államokban dolgozva, bár számos nagyszabású kormányzati projektben vettem részt, az elért eredmények gyakran csupán néhány lépést jelentettek egy nagy folyamatban. Sokszor a projektek szigorú bizalmas kezelése miatt azt sem tudtam, hogyan használják fel az általam kifejlesztett megoldásokat.

2017-ben, amikor visszatértem Vietnámba, még fejlesztési szakaszban volt, és számos, a big data és a mesterséges intelligenciához kapcsolódó probléma merült fel, amelyeket meg kellett oldani. Elfogadtam Vu Ha Van professzor meghívását, hogy közösen megvalósítsuk a vietnami technológiai megoldások fejlesztésének célját, amelyek a vietnami emberek életét szolgálják. A vietnámi visszatérésemet sokkal jelentőségteljesebbnek találtam, mert így nagyobb hatású problémákon dolgozhattam.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2. — Dr. Dao Duc Minh egy workshopon

A mesterséges intelligencia fejlesztésének stratégiájában milyen szerepet és befolyást játszik a big data, uram?

Az adatok hatalmas és értékes szerepet játszanak a mesterséges intelligencia betanításában. Egy kiváló minőségű mesterséges intelligencia modell betanítása gyakran egy nagy adatbázis betanításával kezdődik. Ezért ahhoz, hogy minőségi mesterséges intelligenciával rendelkezzünk, először jó adatokkal kell rendelkeznünk.

A jó minőségű adatoknak meg kell felelniük a mennyiségi és méretbeli, minőségi, változatos és egyetemes szabványoknak. A nyers adattisztítási lépéstől kezdve több ezer órányi adat összegyűjtésének és feldolgozásának folyamata, amelynek célja a mesterséges intelligencia modellekbe betáplálható legmagasabb minőségű adatok létrehozása, nagyon költséges és összetett. Ezzel szemben a big data elemzéséhez mesterséges intelligenciát kell használnunk, hogy biztosítsuk az adatok pontos feldolgozásának képességét nagy léptékben, ezáltal jobb döntő vagy prediktív eredményeket hozva létre.

Például egy vietnami embereknek szánt virtuális asszisztens termék (ViVi) fejlesztése során több tízezer órányi kiváló minőségű hangadatot kellett összegyűjtenünk és feldolgoznunk, több százezer hangtól, különböző régiókból, korosztályokból és neműekből, több száz területet felölelő tartalommal...

Vagy a legutóbbi, a ViGPT – „A ChatGPT első vietnami verziója végfelhasználók számára” – bevezetése, amelyet a VinBigdata teljes tulajdonában lévő nagyméretű nyelvi modellből fejlesztettek ki. Ezt a modellt 600 GB finomított vietnami adat alapján képezték ki, amelyek különböző területekről származnak. A vietnami adatok és nyelv ismeretének köszönhetően új megközelítést találtunk a ViGPT bevezetésének lerövidítésére, mindössze 9 hónappal a ChatGPT megszületése után.

Ez a szinergia a big data és a mesterséges intelligencia között.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.

Mi a véleményed a kutatás gyakorlati értékkel való összekapcsolásáról a közösség szolgálata érdekében?

- Úgy hiszem, hogy a technológiai kutatás csak akkor igazán sikeres, ha ténylegesen belép az életbe, társadalmi problémákat old meg és javítja az emberek életét.

Ahhoz, hogy olyan praktikus kereskedelmi termékeket hozzunk létre, amelyek üzleti és társadalmi problémákat oldanak meg, mindig figyelnünk kell, és fel kell tennünk a kérdést: milyen értéket képviselnek az adatok?

Eddig számos terméket és megoldást kutattunk és fejlesztettünk ki különböző iparágak és területek számára, jellemzően a ViGPT-t, a VinDr-t – amely mesterséges intelligencia alapú megoldásokat kínál az orvosi képalkotó diagnosztikában –, a VinBase-t – egy biomesterséges intelligencia platformot, vagy a Vizone-t – egy intelligens képelemző megoldáskészletet.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5. — A VinBigdata kulcsfontosságú munkatársaival a Vingroup Corporation rendezvényén

A 4. ipari forradalom erőteljesen zajlik globális szinten. Milyen előnyei vannak Ön szerint Vietnamnak?

A korábbi forradalmakhoz képest úgy vélem, hogy Vietnamnak jelenleg számos előnye van arra, hogy kitörjön ebben a 4.0 ipari forradalomban, és javítsa az ország helyzetét a világtérképen. E cél elérésének két kulcsa az adat és az emberek.

Vietnámban jelenleg közel 100 millió ember él, akik közül a fiatalok nagy arányban használnak telefont és személyi számítógépet. Emellett elismert szakértőkkel rendelkezünk a mesterséges intelligencia területén, és minőségi fiatal informatikai személyzettel, valamint nagyon jó matematikai alapokkal rendelkezünk.

Szóval, mik a korlátok?

Az első nyilvánvaló korlátozás, hogy a nagy népesség ellenére továbbra is nehézségeink vannak az adatok kezelésével, különösen az adatok szabványosításával és szinkronizálásával a létesítményekben, üzleti és adminisztratív egységekben.

Emellett más korlátokkal is szembesülünk, mint például a korlátozott beruházási források, különösen a nagy teljesítményű számítástechnikai infrastruktúrába történő beruházások terén.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.

Véleménye szerint mennyire fontos szerepe van a vietnami adatok elsajátításának a vietnami emberek életét szolgáló technológia létrehozásának és elsajátításának folyamatában?

Jelenleg számos vezető MI-termék létezik a világon, jellemzően nagy nyelvi modelleken alapuló MI-alkalmazások, mint például az OpenAI ChatGPT-je vagy a Google Bard-ja. A vietnami nyelv azonban nem a fő nyelvi csoport ezen termékek fejlesztéséhez.

Ezért a felhasználóknak visszaküldött vietnami-specifikus tartalom minősége többé-kevésbé változik, és nagy a hibalehetőség, veszélyesebb esetben az alapvető ismeretekben mutatkozó hibák.

Vietnamiként előnyünkre válik, hogy hozzáférhetünk a saját adatforrásainkhoz. Csak mi vagyunk képesek megérteni a vietnami adatok jellemzőit, a vietnami emberek igényeit és jellemzőit. Ezért a vietnami adatok elsajátítása valójában a kulcs az alapvető technológiák elsajátításához, amelyek a vietnami embereket szolgálják.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7. — Belső képzés VinBigdata tagoknak

Hogyan lehet hozzáférni bizonyos adatforrásokhoz, különösen akkor, amikor a legtöbb vietnami külföldről használja a közösségi oldalakat?

Valójában a humán adatok (nem csak a vietnamiak) legnagyobb forrása napjainkban az internet és a közösségi hálózatok. Azonban továbbra is hozzáférhetünk és gyűjthetünk adatokat különböző forrásokból, a vietnami adatjellemzők megértése alapján, az egyes projektek által meghatározott jellemzőktől függően.

Például az OpenAI GPT-modelljei több száz, akár billió paraméterrel rendelkeznek, hatalmas mennyiségű adaton képződnek, és dollármilliárdokba kerülnek. Hozzájuk képest mi egy teljesen más utat választottunk kutatásaink, képességeink és erőforrásaink alapján: egy vietnami nyelvi modellt hoztunk létre, amelynek architektúrája mindössze néhány milliárd paraméterből áll, egy 600 GB-os vietnami adathalmazon képeztük ki, amelyet mi magunk gyűjtöttünk és finomítottunk, de a vietnami nyelv feldolgozásában is hasonló képességekkel rendelkezik. Az eredmények azt mutatják, hogy saját fejlesztésű architektúránk képes önoptimalizálódni, lerövidíteni a nyelvi modell betanítási idejét, csökkenteni a költségeket, és továbbra is biztosítani a modell minőségét.

Milyen kihívásokkal szembesült Ön és csapata a mesterséges intelligencia termékek kutatása és fejlesztése során?

Az első kihívás minden bizonnyal az idő. A mesterséges intelligencia technológia hulláma nagyon gyorsan érkezik, és robbanásszerű időszakban van. A világ vezető technológiai vállalatai gyorsan piacra dobtak rendkívül komplett termékeket, amelyeket folyamatosan frissítenek és fejlesztenek. Ha lassúak vagyunk, és nem időben dobunk piacra termékeket, biztosan lemaradunk.

Másrészt, ha olyan termékeket akarunk létrehozni, amelyek alkalmazhatók és gyakorlati társadalmi problémákat oldanak meg, akkor a termék kiemelkedő, különleges és egyedi tulajdonságainak megtalálását és fejlesztését is figyelembe kell vennünk.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8. — Előadás a Vietnámi Mesterséges Intelligencia Napján (AI4VN 2023)

Valójában számos magánszemély és szervezet szenvedett el nagy veszteségeket adatszivárgások miatt Vietnámban és világszerte. Hogyan látja az adatbiztonság kérdését?

Elmondható, hogy ma már minden alkalmazás adatokból származik. Az adatokkal való munka során egyrészt biztosítanunk kell azt a célt, hogy az adatokat az élet legjobb technológiájának megteremtésére alkalmazzuk, másrészt pedig garantálnunk kell az egyének és a szervezetek adatbiztonságát.

Az emberi tényező nagyon fontos láncszem az adatbiztonság-biztosítási folyamatban. Ide tartoznak a fejlesztők, a termékfelhasználók és a felhasználók. A fejlesztőknek az adatbiztonsággal kapcsolatos tudatosságnak már az adatgyűjtés és -feldolgozás kezdetétől jelen kell lennie.

Gyakran előfordul, hogy amikor semmi probléma nem történik, nem vagyunk tisztában az adatbiztonság fontosságával. De ha adatszivárgás történik, a kár hatalmas lehet. Az adatszivárgás technikai problémák vagy szándékos adatlopási támadások miatt történhet. Adatszivárgás esetén magánszemélyek vagy szervezetek adatait rosszindulatú személyek használhatják fel illegális célokra, és a vállalkozások anyagi veszteségeket szenvedhetnek el a kapcsolódó problémák megoldása miatt, akár a márkájuk is károsodhat.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9. — Dr. Dao Duc Minh és a VinBigdata csapata egy rendezvényen

Miután a vietnami emberek szolgálatára szolgáló technológia elsajátítására törekedtünk, lesznek-e lépések a világ felé?

Minden olyan szervezetnek vagy vállalkozásnak, amely termékeit a nemzetközi piacra kívánja vinni, meg kell felelnie a nemzetközi szabványoknak. A VinBigdata erősségei a megoldások és a technológia terén vannak, így természetes, hogy a világ meghódítására törekszik.

Természetesen a sokféle termék és alkalmazás telepítéséhez szükség van olyan nemzetközi egységek támogatására, amelyek sokéves tapasztalattal és a világ minden táján élő felhasználók megértésével rendelkeznek.

Köszönöm!

[hirdetés_2]
Forrás: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm