Toen Nguyen Hoang Quan en zijn collega's van VILM de VS verlieten om naar huis terug te keren, ontwikkelden ze een gratis systeem voor kunstmatige intelligentie (AI) dat Vietnamezen kunnen gebruiken in de klantenservice. Het systeem wordt maandelijks meer dan 100.000 keer gedownload.
In juni 2023 richtten de 25-jarige Nguyen Hoang Quan en zijn collega's Pham Nhut Huy (23 jaar), ingenieur kunstmatige intelligentie bij ZaloAI, en Dao Minh Dung (24 jaar), promovendus aan de Universiteit van Cork, Ierland, de non-profitorganisatie VILM op. Ze wilden de Vietnamezen helpen om de meest geavanceerde AI-technologie optimaal te ervaren.
Na bijna 6 maanden onderzoek en toepassing heeft het team met succes drie gratis AI-modellen ontwikkeld, waaronder OpenHermes, VinaLlama en Vistral. Dit zijn de fundamentele studies voor de ontwikkeling van AI-systemen die de wensen van gebruikers kunnen begrijpen en ernaar kunnen handelen (Large Action Model). Deze modellen zijn geschikt voor toepassing in technologische gebieden zoals machinebesturing, robots om mensen met een beperking beter te ondersteunen zonder verzorgers, of om programmeurs te helpen fouten te herstellen, en virtuele assistenten om klanten te helpen of gratis vragen te stellen.
OpenHermes bereikt 85.000 downloads per maand en staat daarmee in de top 10 van meest gedownloade taalmodellen op HuggingFace ( 's werelds grootste site voor het delen van AI-modellen). Screenshot
Het OpenHermes-model is een groot taalmodel dat Engels ondersteunt, net als ChatGPT, maar met hogere scores. Gebruikers kunnen het model downloaden naar hun pc om het zonder internet te gebruiken. Opvallend is dat de trainingsdata van OpenHermes slechts 1/100 bedraagt van de trainingsdata van ChatGPT van OpenAI. Momenteel ontvangt deze applicatie meer dan 50.000 downloads per maand. OpenHermes-2.5 en OpenHermes-2.5-Vision worden gebruikt door meer dan 40 startups in Silicon Valley (VS).
VinaLlama en Vistral zijn twee taalmodellen die speciaal gericht zijn op de Vietnamese markt en die binnenlandse gebruikers willen helpen de meest geavanceerde AI-technologie eenvoudiger te ervaren.
Hoang Quan studeerde zeven jaar in de VS en werkte bij OpenAI als research engineer voor het kunstmatige-intelligentiemodel ChatGPT, ook al had hij geen universitaire opleiding afgerond. In 2022 werkte hij als data engineer voor Microsoft en OpenAI's Bing Chat-product, waar hij duizenden dollars verdiende. Tegen 2023, toen hij te maken kreeg met een golf van ontslagen in de technologiesector in de VS, realiseerde Quan zich dat de arbeidsmarkt na zijn afstuderen er somber uitzag. Maar toen hij kansen zag in Vietnam, besloot hij terug te keren naar huis.
Nguyen Hoang Quan. Foto: NVCC
Bij VILM is Quan hoofdingenieur en verantwoordelijk voor onderzoek naar dataverbeteringstechnieken en AI-training. Nhut Huy neemt de rol van technisch onderzoeker in AI-training op zich en Minh Dung stelt nieuwe methoden voor theoretisch onderzoek voor.
Quan legde uit dat huidige grote taalmodellen zoals ChatGPT (Large Language Model) alleen tekstuele output kunnen leveren, terwijl mensen over talloze manieren beschikken om te communiceren en kennis te vergaren. Daarom streeft het team ernaar een systeem te creëren dat flexibel kan werken tussen verschillende soorten input en output (data zoals taal, afbeeldingen, video's en geluiden kan ontvangen en uitvoeren), en niet alleen stopt bij taalniveau.
Om het doel van het creëren van grote actiemodellen te bereiken, moest het team twee problemen overwinnen: beveiliging en snelheid. Huidige AI-toepassingen gebruiken voornamelijk gebruikersdata en sturen deze ter verwerking naar de servers van bedrijven zoals OpenAI, wat beveiligingsproblemen met zich meebrengt. Het team richtte zich op het creëren van AI-modellen die klein en snel genoeg zijn om direct op mobiele apparaten te worden verwerkt, en tegelijkertijd een evenwicht te vinden tussen prestaties en snelheid om de gebruikerservaring niet te beïnvloeden.
Het experimentele team gebruikte data gegenereerd door AI om de AI zelf te trainen, in plaats van data uit echte bronnen te gebruiken. Aanvankelijk hadden ze moeite met het vinden van rekenkracht (computers om AI te trainen), maar later wisten ze grote bedrijven en laboratoria over de hele wereld te overtuigen om te sponsoren.
Quan zei dat het belangrijkste doel van deze producten is om mensen snel toegang te geven tot AI-toepassingen met een kwaliteit die niet onderdoet voor ChatGPT of Bing Chat, en om onderzoek en de ontwikkeling van AI-modellen in de toekomst eenvoudiger te maken. In plaats van ChatGPT te gebruiken, wat beperkt is in de Vietnamese taal en cultuur, kunnen Vietnamese bedrijven VinaLlama in het Vietnamees downloaden.
Het taalmodel VinaLlama kan eenvoudig een wiskundig probleem in het Vietnamees oplossen. Op de afbeelding ziet u een demo van het VinaLlama-product voor het oplossen van wiskundige problemen. Schermafbeelding.
De heer Dang Hai Loc, oprichter van het AI Chatbot-bouwplatform Mindmaid, gaf aan dat hij zich vanuit het perspectief van een AI-applicatieontwikkelaar realiseerde dat kosten en dataprivacy de twee grootste zorgen van bedrijven zijn bij de implementatie van AI-applicaties. De meest bevredigende oplossing voor dit probleem zijn open-source LLM-modellen, die op de infrastructuur van de onderneming kunnen draaien en meer van de eigen data van de onderneming kunnen leren (finetunen). Daarom zijn Vietnamese open-source LLM-modellen zoals VinaLlama en Vistral zeer waardevol bij het promoten van AI-applicaties in Vietnam.
"Deze open-sourcemodellen stellen programmeurs en technologieliefhebbers ook in staat om met slechts een MacBook toegang te krijgen tot het vakgebied AI Engineer, in plaats van te moeten investeren in dure GPU-infrastructuur (videokaart). Dit zal ook de AI Engineer-kracht in Vietnam bevorderen, een functie waar in de nabije toekomst veel vraag naar is", aldus de heer Loc.
Volgens Quan hebben Vietnamezen een zeer goede basis in wetenschappelijke theorie, zijn ze goed in AI, en ChatGPT heeft ook mensen die deelnemen aan onderzoek, maar ze hebben meer moeite om snel mee te gaan met de steeds veranderende technologiegolf. "Wat Vietnamezen nodig hebben, is ervaring met het maken van producten voor eindgebruikers om de problemen die ze tegenkomen echt te begrijpen en hun onderzoek goed te kunnen sturen," zei Quan over de reden om gratis AI-modellen te onderzoeken ter ondersteuning van Vietnamezen in de technologie. Hij zei dat hij met veel internationale groepen heeft samengewerkt en altijd bereid is om samen te werken met onderzoeksgroepen in Vietnam.
Nhu Quynh
Bronlink






Reactie (0)