VinBigdata heeft bijdragen nodig van technisch personeel en de community voor ViGPT

Bovenstaande bijdrage werd gedaan door professor Vu Ha Van, wetenschappelijk directeur van VinBigdata, tijdens een discussie met verslaggevers in de marge van het recente ViGPT-lanceringsevenement.

Professor Vu Ha Van, Chief Science Officer van VinBigdata.

ViGPT heeft bijdragen nodig van technische mensen en de gemeenschap

Professor Vu Ha Van zei dat grote bedrijven zoals Google bij de ontwikkeling van grote talen Engels of Frans als hoofdtaal zullen kiezen. Hoewel er ook Vietnamees is, zullen de zoekresultaten relatief traag zijn in vergelijking met andere talen. Tot op zekere hoogte zullen de antwoorden van deze grote taalmodellen op vragen vanuit het Vietnamees niet volledig en nauwkeurig zijn.

VinBigdata hoopt daarom dat ViGPT hen in de loop van de tijd zal overtreffen in nauwkeurigheid bij vragen die direct verband houden met cultuur, geschiedenis, geografie... informatie met kenmerken en eigenschappen van Vietnamezen. Dit is wat de makers van het Vietnamese taalmodel willen en nastreven in de toekomst bij het stellen van vragen aan Vietnamezen; dit zal een betere bron van vergelijking zijn dan die van buitenlandse landen.

De directeur Wetenschap van VinBigdata analyseerde bijvoorbeeld een vraag in een "gevoelige" politieke periode over de geschiedenis van Truong Sa en Hoang Sa. Het is voor ons erg moeilijk te garanderen dat het antwoord van Google of OpenAI niet de politieke voorkeur van de oprichters of achter deze bedrijven heeft. Hier hebben we in Vietnam andere opties, het zou beter zijn als we daar eens over nadenken.

"Ons doel bij het bouwen van een groot taalmodel voor Vietnamezen is om de beste antwoorden te bieden aan Vietnamezen. We kunnen hun doelen niet kennen", aldus professor Vu Ha Van.

Toegegeven, er zijn veel dingen die ViGPT momenteel niet zo goed kan als ChatGPT of Google Bard, omdat de investeringsratio van deze bedrijven en de tijd die ze besteden aan de implementatie duizenden keren groter zijn. Professor Vu Ha Van zei echter dat ViGPT bij sommige vragen die bevooroordeeld zijn ten gunste van Vietnam, zoals "Wiens vlag is geborduurd met zes gouden woorden?", zal antwoorden dat het die van Tran Quoc Toan is, terwijl andere versies mogelijk onjuist zijn. In de toekomst zal ViGPT met diepgaande vragen zoals deze beter presteren als er feedback is van binnenlandse gebruikers.

"Als gebruikers alleen maar kritiek leveren, of denken dat dit grote taalmodel nog steeds stom is terwijl mijn 10-jarige kind vragen kent die hij niet kent, of strikvragen stellen om te bewijzen dat we slimmer zijn dan AI. We zijn slimmer dan AI, maar dat is niet voor niets. We maken het product hier niet beter, maar maken de mensen die het product maken verdrietiger. Daarom heeft VinBigdata de gezamenlijke bijdrage van technici en de community nodig, we hebben de steun van Vietnamezen nodig om het product te perfectioneren, zodat het niet alleen een simpele servicetool is, maar ook de trots van de Vietnamezen", benadrukte professor Vu Ha Van.

Klaar om het Vietnamese taalmodel te ondersteunen en begeleiden

In een gesprek met VietNamNet lieten vertegenwoordigers van startups die in Vietnam aan AI werken, weten dat ze bereid zijn om VinBigdata's Vietnamese taalmodel te ondersteunen en begeleiden.

Het ondersteunen en begeleiden van ViGPT is essentieel om een grootschalig Vietnamees taalmodel te ontwikkelen.

De heer Dinh Tran Tuan Linh, technisch directeur van Unikon Joint Stock Company, eigenaar van het Aicontent.vn-platform, zei dat momenteel niet veel landen in Azië inspanningen hebben geleverd om hun eigen grote taalmodellen succesvol te trainen. China, Korea en Japan lopen voorop. ViGPT is daarom een belangrijk signaal voor de Vietnamese bevolking om te investeren in kerntechnologie. Volgens de heer Dinh Tran Tuan Linh moet elke reis van duizend mijl beginnen met de eerste stappen. Als pionier in AI-toepassingen is Unikon bereid om ViGPT bij te dragen, te testen, feedback te geven en zelfs te gebruiken in projecten van geschikte omvang.

Ondertussen zei de heer Dang Huu Son, medeoprichter van Lovinbot, dat het een zeer goede zaak is dat VinBigdata naar de community en de opmerkingen van experts luistert om een groot taalmodel te ontwikkelen, specifiek voor Vietnamezen. Als technicus gaf de heer Dang Huu Son ook feedback aan het technische team van VinBigdata na gebruik van het product.

Volgens de heer Dang Huu Son kan een nieuw gelanceerd product niet onmiddellijk worden voltooid, maar kan het ook niet meteen volledige ondersteuning van de community krijgen, omdat de Vietnamezen al lang denken dat Vietnam die technologie niet kan ontwikkelen en er dus nog tijd voor nodig is. Tegelijkertijd heeft VinBigdata specifieke instructies nodig over hoe de community het product beter kan ondersteunen en begeleiden.

De heer Dang Huu Loc, oprichter van het Mindmaid-platform, gaf ook aan dat er momenteel maar heel weinig landen ter wereld zijn die een moedertaalmodel kunnen ontwikkelen. Zelfs rijke landen met sterke informatietechnologie zoals India, of landen met een hoger bbp dan Vietnam, zoals Indonesië en het Midden-Oosten... kunnen dit niet zomaar doen omdat ze dat willen, omdat het ook afhangt van de taalkenmerken. Vanuit een breder perspectief heeft Vietnam daarom een strategisch voordeel bij het ontwikkelen van een moedertaalmodel, en dit zal een strategisch voordeel zijn voor de Vietnamezen om wereldwijd te concurreren.

Volgens de heer Dang Huu Loc is elke poging om een grootschalig Vietnamees taalmodel te bouwen waardevol en moet er op een specifieke manier commentaar op worden geleverd om het model elke dag completer te maken, in plaats van enkele huidige tekortkomingen te gebruiken om alle inspanningen van binnenlandse technologie-eenheden te ontkennen. Vietnamezen zouden ook het belang van grootschalige taaltechnologie in het AI-tijdperk breed moeten uitdragen en meer moeten discussiëren over hoe deze kan worden toegepast om waarde te creëren voor zichzelf en Vietnamese bedrijven, in plaats van het grootschalige Vietnamese taalmodel te vergelijken met de beste grootschalige taalmodellen ter wereld van vandaag. Omdat grootschalige taal een algemene AI-technologie is, is het mogelijk niet goed voor dit probleem, maar het is wel geschikt voor andere specifieke problemen. Met name het grootschalige Vietnamese taalmodel zal een betere voorsprong hebben bij problemen met betrekking tot het begrijpen en genereren van Vietnamees.

Community ViGPT wordt gratis aangeboden aan non-profitorganisaties. Community ViGPT wordt door VinBigdata gratis aangeboden aan non-profitorganisaties. Organisaties die deze versie gebruiken, moeten echter wel infrastructuurkosten betalen, zoals cloud- en andere resources, bij de implementatie.

Bron