Vietnam.vn - Nền tảng quảng bá Việt Nam

"Att bemästra vietnamesisk data är det första steget i att utveckla och bemästra vietnamesisk teknologi"

Báo Thanh niênBáo Thanh niên27/05/2024

[annons_1]
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 1.

Efter att ha arbetat för en stor organisation för artificiell intelligens i USA, varför bestämde du dig för att återvända till Vietnam för att börja på VinBigdata?

Medan jag arbetade i USA, trots att jag deltog i många stora statliga projekt, var resultaten jag uppnådde ofta bara några steg i en stor process. Många gånger, på grund av projektens strikta sekretess, visste jag inte ens hur de lösningar jag utvecklade användes.

När jag återvände till Vietnam 2017 var det i utvecklingsstadiet och det fanns många problem relaterade till big data och artificiell intelligens som behövde lösas. Jag accepterade professor Vu Ha Vans inbjudan att tillsammans förverkliga målet att utveckla vietnamesiska tekniska lösningar för att gynna vietnamesernas liv. Jag tyckte att min återkomst till Vietnam var mycket mer meningsfull eftersom jag skulle kunna arbeta med problem med större effekt.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Dr. Dao Duc Minh i en workshop

Vilken roll och vilket inflytande spelar stordata i strategin för att utveckla artificiell intelligens, herr talman?

Data spelar en enorm och värdefull roll i träning av artificiell intelligens. Att träna en högkvalitativ artificiell intelligens-modell börjar ofta med att träna en stor databas. Därför, för att ha artificiell intelligens av hög kvalitet, behöver vi först ha bra data.

Bra data måste uppfylla standarder vad gäller kvantitet och skala, kvalitet, variation och universalitet. Processen att samla in och bearbeta tusentals timmar data från rensningssteget för rådata för att skapa data av högsta kvalitet som kan användas i modeller för artificiell intelligens är mycket dyr och komplex. För att analysera stordata måste vi däremot använda artificiell intelligens för att säkerställa möjligheten att bearbeta data korrekt i stor skala och därigenom skapa bättre avgörande eller prediktiva resultat.

Till exempel, under processen att utveckla en virtuell assistentprodukt för vietnameser (ViVi), var vi tvungna att samla in och bearbeta tiotusentals timmar högkvalitativ ljuddata, från hundratusentals röster från olika regioner, olika åldrar och kön, med innehåll som spänner över hundratals områden...

Eller alldeles nyligen lanseringen av ViGPT – "Den första vietnamesiska versionen av ChatGPT för slutanvändare" utvecklad från en stor språkmodell som helt ägs av VinBigdata. Denna modell är tränad baserat på 600 GB förfinad vietnamesisk data från många olika områden. Med vår förståelse av vietnamesisk data och språk har vi hittat en ny metod för att förkorta lanseringstiden för ViGPT inom bara 9 månader efter att ChatGPT föddes.

Detta är synergin mellan big data och artificiell intelligens.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.

Vad är din syn på att koppla forskning med praktiskt värde för att tjäna samhället?

– Jag tror att teknikforskning bara är verkligt framgångsrik när den faktiskt kommer in i livet, löser sociala problem och förbättrar människors liv.

För att skapa praktiska kommersiella produkter som löser affärs- och sociala problem måste vi alltid vara uppmärksamma och ställa frågan: vilket värde kommer data att ge liv?

Hittills har vi forskat på och utvecklat en mängd olika produkter och lösningar för olika branscher och områden, vanligtvis ViGPT, VinDr – som tillhandahåller AI-lösningar inom medicinsk bilddiagnostik, VinBase – en plattform för bioartificiell intelligens, eller Vizone – en smart uppsättning lösningar för bildanalys.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Med nyckelpersoner från VinBigdata vid ett evenemang för Vingroup Corporation

Den fjärde industriella revolutionen har pågått starkt på global nivå. Vilka fördelar anser du att Vietnam har?

Jämfört med tidigare revolutioner tror jag att Vietnam för närvarande har många fördelar att bryta igenom i denna industriella revolution 4.0, vilket bidrar till att förbättra landets position på världskartan. De två nycklarna till att uppnå detta mål är data och människor.

Vietnam har för närvarande nästan 100 miljoner invånare, varav en hög andel unga använder telefoner och persondatorer. Dessutom har vi välrenommerade experter inom artificiell intelligens och kvalificerad ung personal inom informationsteknik och har en mycket god grund i matematik.

Så vilka är begränsningarna?

Den första uppenbara begränsningen är att trots att vi har en stor befolkning har vi fortfarande svårt att behärska data, särskilt att standardisera och synkronisera data på anläggningar, affärs- och administrativa enheter.

Dessutom står vi inför andra begränsningar, såsom begränsade investeringsresurser, särskilt investeringar i högpresterande datorinfrastruktur.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.

Hur viktig anser du att det är att bemästra vietnamesisk data i processen att skapa och bemästra teknologi för att gynna vietnamesernas liv?

Det finns för närvarande många ledande AI-produkter i världen, vanligtvis AI-applikationer baserade på stora språkmodeller som ChatGPT från OpenAI eller Bard från Google. Vietnamesiska är dock inte den huvudsakliga språkgruppen för utvecklingen av dessa produkter.

Därför påverkas kvaliteten på vietnamesiskt specifikt innehåll som returneras till användarna mer eller mindre och det finns en hög sannolikhet för fel, och ännu farligare, fel i grundläggande kunskaper.

Som vietnameser har vi fördelen att vi har tillgång till våra egna datakällor. Endast vi har förmågan att förstå egenskaperna hos vietnamesisk data, behoven och egenskaperna hos vietnameserna. Därför är det att bemästra vietnamesisk data verkligen nyckeln till att bemästra kärnteknologier, vilka är de teknologier som kommer att tjäna vietnameserna.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Intern utbildning för VinBigdata-medlemmar

Hur får man tillgång till specifika datakällor, särskilt när de flesta vietnameser idag använder sociala nätverkssajter från utlandet?

Faktum är att den största källan till mänsklig data idag (inte bara vietnameser) är internet och sociala nätverk. Vi kan dock fortfarande få tillgång till och samla in data från olika källor, baserat på förståelsen av vietnamesiska dataegenskaper, beroende på de egenskaper som fastställs av varje projekt.

Till exempel har OpenAIs GPT-modeller hundratals, till och med biljoner parametrar, tränas på enorma mängder data och kostar miljarder dollar. Jämfört med dem har vi valt en helt annan väg baserat på vår forskning, våra förmågor och våra resurser: att skapa en vietnamesisk språkmodell med en arkitektur på endast några miljarder parametrar, tränad på en 600 GB stor vietnamesisk datamängd som vi själva samlat in och förfinat, men med motsvarande kapacitet för att bearbeta vietnamesiska. Resultaten visar att vår egenutvecklade arkitektur kan självoptimera, förkorta språkmodellens träningstid, minska kostnaderna och ändå säkerställa modellkvaliteten.

Vilka utmaningar har du och ditt team stött på i processen att forska om och utveckla produkter inom artificiell intelligens?

Den första utmaningen är definitivt tid. Vågen av artificiell intelligens-teknik kommer mycket snabbt och är inne i en explosionsartad period. I världen har ledande teknikföretag snabbt lanserat mycket kompletta produkter, som ständigt uppdateras och förbättras. Om vi ​​är långsamma och inte lanserar produkter i tid kommer vi definitivt att hamna på efterkälken.

Å andra sidan, om vi vill skapa produkter som kan tillämpas och lösa praktiska samhällsproblem, måste vi också överväga att hitta och utveckla produktens framstående, speciella och unika egenskaper.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Presentation på Vietnams dag för artificiell intelligens (AI4VN 2023)

Faktum är att många individer och organisationer i Vietnam och runt om i världen har lidit stora förluster i dataläckor. Hur ser du på frågan om datasäkerhet?

Man kan säga att alla tillämpningar idag kommer från data. När vi arbetar med data måste vi å ena sidan säkerställa målet att tillämpa data för att skapa den bästa tekniken för livet, och å andra sidan måste vi säkerställa datasäkerhet för individer och organisationer.

Den mänskliga faktorn är en mycket viktig länk i processen för datasäkerhetssäkring. De inkluderar utvecklare, produktanvändare och användare. För utvecklare måste medvetenheten om datasäkerhet finnas redan från början av datainsamling och bearbetning.

Ofta, när inga problem uppstår, är vi inte medvetna om vikten av datasäkerhet. Men om en dataläcka inträffar kan skadan bli enorm. Dataläckor kan uppstå på grund av tekniska problem eller avsiktliga attacker för att stjäla data. När dataläckor inträffar kan individer eller organisationer få sin information använd av skurkar för olagliga ändamål, och företag kan drabbas av ekonomiska förluster för att åtgärda relaterade problem, till och med skada sitt varumärke.

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Dr. Dao Duc Minh och VinBigdata-teamet vid ett evenemang

Kommer det att finnas steg för att avancera ut i världen efter strävan att bemästra teknologi för att tjäna det vietnamesiska folket?

Alla organisationer eller företag som vill lansera sina produkter på den internationella marknaden måste följa internationella standarder. VinBigdata har styrkor inom lösningar och teknologi, så det är naturligt att ha en vision att erövra världen.

För att kunna driftsätta för många olika produkter och applikationer är det naturligtvis nödvändigt att ha stöd från internationella enheter med många års erfarenhet och förståelse för användare runt om i världen.

Tack så mycket!


[annons_2]
Källa: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Kommentar (0)

No data
No data

I samma ämne

I samma kategori

Västerländska turister tycker om att köpa leksaker till midhöstfestivalen på Hang Ma Street för att ge till sina barn och barnbarn.
Hang Ma-gatan är strålande i midhöstfärger, ungdomar checkar entusiastiskt in oavbrutet
Historiskt budskap: Träklossar i Vinh Nghiem-pagoden – ett dokumentärt mänsklighetens arv
Beundra Gia Lais kustnära vindkraftsfält gömda i molnen

Av samma författare

Arv

;

Figur

;

Företag

;

No videos available

Aktuella händelser

;

Politiskt system

;

Lokal

;

Produkt

;