Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

„Zvládnutí vietnamských dat je prvním krokem k rozvoji a zvládnutí vietnamských technologií“

Báo Thanh niênBáo Thanh niên27/05/2024


TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 1.

Poté, co jste pracoval pro velkou organizaci zabývající se umělou inteligencí v USA, proč jste se rozhodl vrátit domů a připojit se k VinBigdata?

Během své práce v USA jsem se sice podílel na mnoha velkých vládních projektech, ale výsledky, které jsem dosáhl, byly často jen několika kroky ve velkém procesu. Vzhledem k přísné důvěrnosti projektů jsem mnohokrát ani nevěděl, jak se řešení, která jsem vyvinul, používají.

V roce 2017 jsem se vrátil do Vietnamu, když byl Vietnam ve fázi rozvoje a bylo potřeba vyřešit mnoho problémů souvisejících s velkými daty a umělou inteligencí. Přijal jsem pozvání profesora Vu Ha Vana, abychom společně realizovali cíl vývoje vietnamských technologických řešení, která by sloužila životům vietnamského lidu. Můj návrat do Vietnamu byl pro mě mnohem smysluplnější, protože jsem se mohl zabývat problémy s větším dopadem.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Dr. Dao Duc Minh na workshopu

Jakou roli a vliv hrají velká data ve strategii rozvoje umělé inteligence, pane?

Data hrají obrovskou a cennou roli při trénování umělé inteligence. Trénování vysoce kvalitního modelu umělé inteligence často začíná trénováním velké databáze. Abychom tedy měli kvalitní umělou inteligenci, potřebujeme nejprve kvalitní data.

Dobrá data vyžadují kvantitu a rozsah, kvalitu, rozmanitost a univerzálnost. Proces shromažďování a zpracování tisíců hodin dat od kroku čištění surových dat až po vytvoření dat nejvyšší kvality, která budou použita pro modely umělé inteligence, je velmi nákladný a složitý. Naproti tomu pro analýzu velkých dat musíme použít umělou inteligenci, abychom zajistili schopnost přesně zpracovávat data ve velkém měřítku, a tím vytvářeli lepší rozhodující nebo prediktivní výsledky.

Například při vývoji virtuálního asistenta pro Vietnamce (ViVi) jsme museli shromáždit a zpracovat desítky tisíc hodin vysoce kvalitních zvukových dat od stovek tisíc hlasů z různých regionů, různého věku a pohlaví, s obsahem zahrnujícím stovky oblastí...

Nebo naposledy spuštění ViGPT – „první vietnamské verze ChatGPT pro koncové uživatele“ vyvinuté z modelu velkého jazyka (Language Model), který plně vlastní VinBigdata. Tento model je trénován na základě 600 GB zpřesněných vietnamských dat z mnoha různých oblastí. Díky našim znalostem vietnamských dat a jazyka jsme našli nový přístup ke zkrácení doby spuštění ViGPT, a to během pouhých 9 měsíců od zrodu ChatGPT.

Toto je rezonance mezi velkými daty a umělou inteligencí.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.

Jaký je váš názor na propojení výzkumu s praktickou hodnotou ve prospěch komunity?

- Věřím, že technologický výzkum je skutečně úspěšný pouze tehdy, když skutečně vstupuje do života, řeší sociální problémy a zlepšuje životy lidí.

Abychom mohli vytvářet praktické komerční produkty, které řeší obchodní a společenské problémy, musíme si vždy klást otázku: jakou hodnotu data přinesou životu?

Doposud jsme zkoumali a vyvíjeli řadu produktů a řešení pro různá odvětví a oblasti, typicky ViGPT, VinDr – poskytující řešení umělé inteligence v lékařské zobrazovací diagnostice, VinBase – platformu pro bio-umělou inteligenci nebo Vizone – sadu inteligentních řešení pro analýzu obrazu.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

S klíčovými pracovníky VinBigdata na akci společnosti Vingroup Corporation

4. průmyslová revoluce probíhá silně v globálním měřítku. Jaké výhody má podle vás Vietnam?

Ve srovnání s předchozími revolucemi se domnívám, že Vietnam má v současné době mnoho výhod, které může v této průmyslové revoluci 4.0 využít a pomoci tak zlepšit postavení země na mapě světa. Dva klíče k dosažení tohoto cíle jsou data a lidé.

Vietnam má v současnosti téměř 100 milionů obyvatel, z nichž vysoký podíl mladých lidí používá telefony a osobní počítače. Kromě toho máme renomované odborníky na umělou inteligenci a kvalitní mladé pracovníky v oblasti informačních technologií a máme velmi dobré základy v matematice.

Jaká jsou tedy omezení?

Prvním zjevným omezením je, že i přes velkou populaci máme stále potíže se zvládáním dat, konkrétně se standardizací a synchronizací dat v zařízeních, obchodních jednotkách a administrativních jednotkách.

Kromě toho čelíme i dalším omezením, jako jsou omezené investiční zdroje, zejména investice do vysoce výkonné výpočetní infrastruktury.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.

Jak důležitou roli podle vašeho názoru hraje vietnamské zvládnutí dat na cestě k vytváření a zvládání technologií, které budou sloužit životům vietnamských lidí?

V současné době existuje mnoho předních produktů umělé inteligence na světě, typicky generativní produkty AI založené na rozsáhlých jazykových modelech, jako je ChatGPT od OpenAI nebo Bard od Googlu. Vietnamština však není hlavní jazykovou skupinou pro vývoj těchto produktů.

Kvalita obsahu specifického pro Vietnam, který se uživatelům vrací, je proto víceméně ovlivněna a existuje vysoká pravděpodobnost chyb, a co je nebezpečnější, chyb v základních znalostech.

Jako Vietnamci máme výhodu přístupu k vlastním datovým zdrojům. Pouze my máme schopnost porozumět charakteristikám vietnamských dat, potřebám a charakteristikám Vietnamců. Zvládnutí vietnamských dat je proto klíčem k ovládnutí základních technologií, které budou sloužit Vietnamcům.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Interní školení pro členy VinBigdata

Jak získat přístup ke konkrétním zdrojům dat, zejména když většina Vietnamců dnes používá sociální sítě ze zahraničí?

Realita je taková, že největším zdrojem lidských dat (nejen vietnamských) je dnes internet a sociální sítě. Stále však můžeme přistupovat k datům a shromažďovat je z různých zdrojů, a to na základě pochopení charakteristik vietnamských dat a v závislosti na charakteristikách stanovených jednotlivými projekty.

Například GPT modely OpenAI mají stovky, ba i biliony parametrů, jsou trénovány na obrovském množství dat a stojí miliardy dolarů. Ve srovnání s nimi jsme na základě našeho výzkumu, schopností a zdrojů zvolili zcela jinou cestu: vytvoření vietnamského jazykového modelu s architekturou pouze několika miliard parametrů, trénovaného na 600 GB vietnamské datové sadě, kterou jsme sami shromáždili a zdokonalili, ale s ekvivalentními možnostmi z hlediska zpracování vietnamštiny. Výsledky ukazují, že naše vlastní architektura se dokáže sama optimalizovat, zkrátit dobu trénování jazykového modelu, snížit náklady a přitom zajistit kvalitu modelu.

S jakými výzvami jste se vy a váš tým setkali v procesu výzkumu a vývoje produktů umělé inteligence?

První výzvou je jistě čas. Vlna technologií umělé inteligence přichází velmi rychle a nachází se v období exploze. Přední technologické společnosti ve světě rychle uvádějí na trh vysoce komplexní produkty, které jsou neustále aktualizovány a vylepšovány. Pokud budeme pomalí a neuvedeme produkty na trh včas, jistě se zaostaneme.

Na druhou stranu, pokud chceme vytvářet produkty, které lze aplikovat a řešit praktické společenské problémy, musíme také zvážit nalezení a rozvoj vynikajících, speciálních a jedinečných vlastností produktu.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Prezentace na Vietnamském dni umělé inteligence (AI4VN 2023)

Ve skutečnosti mnoho jednotlivců a organizací ve Vietnamu i po celém světě utrpělo velké ztráty v důsledku úniků dat. Jak se díváte na otázku zabezpečení dat?

Dá se říci, že jakákoli aplikace dnes vychází z dat. Při práci s daty musíme na jedné straně zajistit cíl využití dat k vytvoření nejlepší technologie pro život a na druhé straně musíme zajistit bezpečnost dat pro jednotlivce i organizace.

Lidský faktor je velmi důležitým článkem v procesu zajišťování bezpečnosti dat. Patří sem vývojáři, uživatelé produktů a uživatelé. Pro vývojáře musí být povědomí o bezpečnosti dat přítomno od samého začátku sběru a zpracování dat.

Často, když není žádný problém, si nejsme vědomi důležitosti zabezpečení dat. Pokud však dojde k úniku dat, škody mohou být obrovské. K únikům dat může dojít v důsledku technických problémů nebo úmyslných útoků s cílem odcizit data. Při úniku dat mohou jednotlivci nebo organizace své informace zneužít zločinci k nezákonným účelům a firmy mohou utrpět finanční ztráty při řešení souvisejících problémů, a dokonce i poškození své značky.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Dr. Dao Duc Minh a tým VinBigdata na akci

Po snaze ovládnout technologie pro službu vietnamskému lidu budou podniknuty kroky k postupu do světa?

Každá organizace nebo firma, která chce uvést své produkty na mezinárodní trh, musí splňovat mezinárodní standardy. VinBigdata má silné stránky v oblasti řešení a technologií, takže je přirozené stanovit si vizi dobýt svět.

Pro nasazení pro mnoho různých produktů a aplikací je samozřejmě nutná podpora mezinárodních jednotek s dlouholetými zkušenostmi a porozuměním uživatelům po celém světě.

Děkuju!



Zdroj: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Komentář (0)

No data
No data

Ve stejném tématu

Ve stejné kategorii

Y Ty je brilantní se zlatou barvou zralého rýžového období
Stará ulice Hang Ma se „převléká“ na uvítanou Svátku středu podzimu
Fialový kopec Suoi Bon kvete mezi plovoucím mořem mraků v Son La
Turisté se hrnou do Y Ty, obklopeného nejkrásnějšími terasovitými poli na severozápadě.

Od stejného autora

Dědictví

Postava

Obchod

No videos available

Zprávy

Politický systém

Místní

Produkt