Ovennevnte deling ble gitt av professor Vu Ha Van, vitenskapelig direktør i VinBigdata, under en diskusjon med journalister i forbindelse med den nylige lanseringen av ViGPT.

anhvuhavan.jpg
Professor Vu Ha Van, vitenskapelig direktør i VinBigdata.

ViGPT trenger bidrag fra tekniske personer og lokalsamfunnet

Professor Vu Ha Van sa at store selskaper som Google vil velge engelsk eller fransk som hovedspråk når de utvikler store språk. Selv om det også finnes vietnamesisk, vil søke- eller oppslagsresultatene være relativt trege sammenlignet med andre språk. Til en viss grad vil ikke svarene fra disse store språkmodellene på spørsmål fra vietnamesere være fullstendige og nøyaktige.

Derfor håper VinBigdata at ViGPT over tid vil overgå dem i nøyaktighet på spørsmål som er direkte relatert til kultur, historie, geografi ... informasjon om kjennetegn og egenskaper ved vietnameserne. Dette er hva menneskene som skapte den vietnamesiske språkmodellen ønsker og sikter mot i fremtiden når de stiller spørsmål til vietnamesere. Dette vil være en bedre sammenligningskilde enn sammenligninger med andre land.

For å gå dypere inn i analysen, analyserte vitenskapsdirektøren i VinBigdata for eksempel et spørsmål i en «sensitiv» politisk periode om historien til Truong Sa og Hoang Sa. Det er svært vanskelig for oss å garantere at svaret fra Google eller OpenAI ikke har den politiske biasen til grunnleggerne eller bak disse selskapene. Her har vi andre alternativer i Vietnam, det ville være bedre om vi tenkte på det spørsmålet.

«Målet vårt med å bygge en omfattende språkmodell for vietnamesere er å gi de beste svarene til vietnamesere. Vi kan ikke vite målene deres», delte professor Vu Ha Van.

ViGPT innrømmer at det er mange ting ViGPT for øyeblikket ikke kan gjøre like bra som ChatGPT eller Google Bard, fordi investeringsraten til disse bedriftene og tiden de bruker på å implementere er tusenvis av ganger større. Men professor Vu Ha Van sa at i noen spørsmål som er partiske mot Vietnam, som «Hvilket flagg er brodert med seks gylne ord?», vil ViGPT svare at det er Tran Quoc Toans, mens de andre versjonene kan være feil. I fremtiden, med dyptgående spørsmål som dette, vil ViGPT gjøre det bedre hvis det kommer tilbakemeldinger fra innenlandske brukere.

«Hvis brukere bare kritiserer, eller tror at denne store språkmodellen fortsatt er dum når mitt 10 år gamle barn kan spørsmål som det ikke kan, eller stiller lurespørsmål for å bevise at vi er smartere enn AI. Vi er smartere enn AI, men det er ikke for noe formål. Her gjør vi ikke produktet bedre, men gjør menneskene som gjør produktet tristere. Derfor trenger VinBigdata det felles bidraget fra tekniske folk og lokalsamfunnet, vi trenger vietnamesernes selskap for å perfeksjonere produktet slik at det ikke bare er et enkelt serviceverktøy, men også vietnamesernes stolthet», understreket professor Vu Ha Van.

Klar til å støtte og følge den vietnamesiske språkmodellen

I et intervju med VietNamNet sa representanter for oppstartsbedrifter som jobber med AI i Vietnam at de er klare til å støtte og følge VinBigdatas vietnamesiske språkmodell.

ViGPT.jpg
Det er viktig å støtte og følge opp ViGPT for å utvikle en stor vietnamesisk språkmodell.

Dinh Tran Tuan Linh, teknologidirektør i Unikon Joint Stock Company, eieren av Aicontent.vn-plattformen, sa at det for øyeblikket ikke er mange land i Asia som har gjort en innsats for å trene sine egne store språkmodeller på en vellykket måte. Kina, Korea og Japan er ledende ... Derfor er ViGPT et viktig signal for det vietnamesiske folkets innsats for å investere i kjerneteknologi. Ifølge Dinh Tran Tuan Linh må enhver reise på tusen mil starte med de første skrittene. Som en pioner innen AI-applikasjoner er Unikon villig til å delta i å bidra, teste, gi tilbakemeldinger og til og med bruke ViGPT i noen passende skalaprosjekter.

I mellomtiden sa Dang Huu Son, medgründer av Lovinbot, at det at VinBigdata lytter til fellesskapet og ekspertenes kommentarer er en veldig god ting for å utvikle en stor språkmodell spesielt for vietnamesere. Som tekniker ga Dang Huu Son også tilbakemeldinger til VinBigdatas tekniske team etter å ha brukt produktet.

Ifølge Dang Huu Son kan ikke et nylig lansert produkt ferdigstilles umiddelbart, men det kan heller ikke få full støtte fra samfunnet med en gang, fordi det vietnamesiske folket lenge har trodd at Vietnam ikke kan bruke den teknologien, så det trenger fortsatt tid. Samtidig trenger VinBigdata spesifikke instruksjoner om hvordan samfunnet kan støtte og følge opp det bedre.

Dang Huu Loc, grunnleggeren av Mindmaid-plattformen, delte også at det for øyeblikket er svært få land i verden som kan bygge en morsmålsmodell. Selv rike land med sterk informasjonsteknologi som India, eller land med høyere BNP enn Vietnam, som Indonesia, Midtøsten ... kan ikke gjøre det bare fordi de vil, fordi det også avhenger av språkets egenskaper. Derfor har Vietnam, fra et bredere perspektiv, en strategisk fordel i å bygge en morsmålsmodell, og dette vil være en strategisk fordel for vietnameserne til å konkurrere globalt.

Ifølge Dang Huu Loc er enhver innsats for å bygge en stor vietnamesisk språkmodell verdifull, og må kommenteres på en spesifikk måte for å gjøre modellen mer komplett hver dag, i stedet for å bruke noen nåværende mangler til å fornekte all innsatsen til innenlandske teknologienheter. Vietnamesere bør også gi bred kjennskap til viktigheten av stor språkteknologi i AI-æraen og diskutere mer om hvordan de kan bruke den for å skape verdi for seg selv og vietnamesiske bedrifter, i stedet for å sammenligne den store vietnamesiske språkmodellen med de beste store språkmodellene i verden i dag. Fordi stor språkteknologi er en generell AI-teknologi, er den kanskje ikke god på dette problemet, men den er egnet for andre spesifikke problemer. Spesielt den store vietnamesiske språkmodellen vil ha en bedre fordel i problemer knyttet til å forstå og generere vietnamesisk.

Community ViGPT vil bli tilbudt gratis til ideelle organisasjoner . Community ViGPT vil bli tilbudt gratis av VinBigdata til ideelle organisasjoner. Organisasjoner som bruker denne versjonen må imidlertid betale for infrastrukturkostnader som skyen og andre ressurser ved utrulling.