Ovanstående budskap gavs av professor Vu Ha Van, vetenskaplig chef för VinBigdata, vid en diskussion med reportrar i samband med den senaste lanseringen av ViGPT.

anhvuhavan.jpg
Professor Vu Ha Van, vetenskaplig chef på VinBigdata.

ViGPT behöver bidrag från teknisk personal och communityn

Professor Vu Ha Van sa att stora företag som Google, när de utvecklar stora språk, kommer att välja engelska eller franska som huvudspråk. Även om det också finns vietnamesiska, kommer sök- eller uppslagningsresultaten att vara relativt långsamma jämfört med andra språk. Till viss del kommer svaren från dessa stora språkmodeller på frågor från vietnamesiska inte att vara fullständiga och korrekta.

Därför hoppas VinBigdata att ViGPT med tiden kommer att överträffa dem i noggrannhet på frågor som är direkt relaterade till kultur, historia, geografi... information om vietnamesiska människors egenskaper och egenskaper. Det är detta som de människor som skapade den vietnamesiska språkmodellen vill ha och strävar efter i framtiden när de ställer frågor till vietnameser, detta kommer att vara en bättre jämförelsekälla än jämförelser med utländska länder.

För att gå djupare in i detta analyserade VinBigdatas vetenskapliga chef till exempel en fråga under en "känslig" politisk period om Truong Sa och Hoang Sas historia. Det är mycket svårt för oss att garantera att svaret från Google eller OpenAI inte har den politiska partiskheten hos grundarna eller bakom dessa företag. Här har vi andra alternativ i Vietnam, det vore bättre om vi funderade över den frågan.

”Vårt mål med att bygga en omfattande språkmodell för vietnameserna är att ge dem de bästa svaren. Vi kan inte veta deras mål”, delade professor Vu Ha Van.

ViGPT medger att det finns många saker som ViGPT för närvarande inte kan göra lika bra som ChatGPT eller Google Bard, eftersom investeringstakten för dessa företag och den tid de lägger på att implementera är tusentals gånger större. Men professor Vu Ha Van sa att i vissa frågor som är partiska mot Vietnam, såsom "Vems flagga är broderad med sex gyllene ord?", kommer ViGPT att svara att det är Tran Quoc Toans, medan de andra versionerna kan vara fel. I framtiden, med djupgående frågor som denna, kommer ViGPT att göra bättre ifrån sig om det finns feedback från inhemska användare.

”Om användare bara kritiserar, eller tycker att den här stora språkmodellen fortfarande är dum, när mitt 10-åriga barn vet frågor som det inte vet, eller ställer knepiga frågor för att bevisa att vi är smartare än AI. Vi är smartare än AI, men det är inte av någon anledning. Här gör vi inte produkten bättre utan gör de människor som gör produkten ledsnare. Därför behöver VinBigdata det gemensamma bidraget från tekniker och gemenskapen, vi behöver vietnamesernas sällskap för att finslipa produkten så att den inte bara är ett enkelt serviceverktyg, utan också vietnamesernas stolthet”, betonade professor Vu Ha Van.

Redo att stödja och följa den vietnamesiska språkmodellen

I ett samtal med VietNamNet sa representanter för startups som arbetar med AI i Vietnam att de är redo att stödja och följa VinBigdatas vietnamesiska språkmodell.

ViGPT.jpg
Att stödja och följa ViGPT är avgörande för att utveckla en omfattande vietnamesisk språkmodell.

Dinh Tran Tuan Linh, teknikchef för Unikon Joint Stock Company, ägare till Aicontent.vn-plattformen, sa att för närvarande inte många länder i Asien har gjort ansträngningar för att framgångsrikt utbilda sina egna stora språkmodeller. Kina, Korea, Japan är ledande... Därför är ViGPT en viktig signal för det vietnamesiska folkets ansträngningar att investera i kärnteknik. Enligt Dinh Tran Tuan Linh måste varje resa på tusen mil börja med de första stegen. Som pionjär inom AI-tillämpningar är Unikon villig att delta i att bidra, testa, ge feedback och till och med använda ViGPT i vissa lämpliga projekt.

Samtidigt sa Dang Huu Son, medgrundare av Lovinbot, att det är mycket bra att VinBigdata lyssnar på communityn och experternas kommentarer för att utveckla en stor språkmodell specifikt för vietnameser. Som tekniker gav Dang Huu Son också feedback till VinBigdatas tekniska team efter att ha använt produkten.

Enligt Dang Huu Son kan en nylanserad produkt inte färdigställas omedelbart, men den kan inte heller få fullt stöd från gemenskapen direkt, eftersom det vietnamesiska folket länge har trott att Vietnam inte kan göra den tekniken, så det behöver fortfarande tid. Samtidigt behöver VinBigdata ha specifika instruktioner om hur gemenskapen kan stödja och följa den bättre.

Dang Huu Loc, grundare av Mindmaid-plattformen, delade också med sig av att det för närvarande finns väldigt få länder i världen som kan bygga en modersmålsmodell. Även rika länder med stark informationsteknologi som Indien, eller länder med högre BNP än Vietnam som Indonesien, Mellanöstern... kan inte göra det bara för att de vill, eftersom det också beror på språkets egenskaper. Därför har Vietnam, ur ett bredare perspektiv, en strategisk fördel i att bygga en modersmålsmodell, och detta kommer att vara en strategisk fördel för vietnameserna att konkurrera globalt.

Enligt Dang Huu Loc är alla ansträngningar att bygga en stor vietnamesisk språkmodell värdefulla och behöver kommenteras på ett specifikt sätt för att göra modellen mer komplett varje dag, istället för att använda några nuvarande brister för att förneka alla ansträngningar från inhemska teknikenheter. Vietnameserna bör också brett publicera vikten av stor språkteknologi i AI-eran och diskutera mer om hur man kan tillämpa den för att skapa värde för sig själva och vietnamesiska företag, istället för att jämföra den stora vietnamesiska språkmodellen med de bästa stora språkmodellerna i världen idag. Eftersom stor språkteknologi är en generell AI-teknik kanske den inte är bra på detta problem, men den är lämplig för andra specifika problem. I synnerhet kommer den stora vietnamesiska språkmodellen att ha en bättre fördel i problem relaterade till att förstå och generera vietnamesiska.

Community ViGPT kommer att tillhandahållas kostnadsfritt till ideella organisationer . Community ViGPT kommer att tillhandahållas kostnadsfritt av VinBigdata till ideella organisationer. Organisationer som använder den här versionen kommer dock att behöva betala för infrastrukturkostnader som moln och andra resurser vid driftsättning.