De explosie van generatieve kunstmatige intelligentie (Generative AI) heeft het wereldwijde technologielandschap compleet veranderd.
Sinds OpenAI ChatGPT eind 2022 lanceerde, zijn er voortdurend vergelijkbare LLM-modellen verschenen, die in veel sectoren worden toegepast, zoals gezondheidszorg, onderwijs , financiën, recht... De strijd is hevig geworden, niet alleen op ondernemingsniveau, maar ook op nationaal niveau als het gaat om opleidingscapaciteit, computerinfrastructuur en data.
Grote bedrijven zoals OpenAI, Google, Meta of Microsoft met financieel potentieel en gunstige voorwaarden hebben allemaal "snel" miljarden dollars geïnvesteerd in de aanschaf van duizenden high-end GPU's zoals de Nvidia H100 – de kernfactor voor het trainen van LLM-modellen. De aandelenkoers van Nvidia schoot in die periode omhoog, wat de wereldwijde honger naar infrastructuur weerspiegelde.
Ondertussen hebben technologiebedrijven in ontwikkelingslanden, naast kostenproblemen, ook te maken met beperkingen op de import en export van AI-chipapparatuur uit de VS. Dit leidt tot een gebrek aan trainingsapparatuur en een tragere ontwikkeling ten opzichte van technologiegiganten. Met binnenlandse ambities vormt Zalo daarop geen uitzondering.
Wat betreft data vereisten eerdere machine learning-problemen enorme hoeveelheden trainingsdata, maar voor grote taalmodellen is dit een enorme hoeveelheid data. Om een goed model te hebben, heeft het LLM-systeem tientallen of zelfs honderden miljarden invoerteksttokens nodig. Ondertussen is Vietnamees qua populariteit niet "gelijkwaardig" aan Engels en Chinees. Dit heeft de moeilijkheidsgraad voor Vietnamese LLM-ontwikkelaars vergroot.
In 2023 hebben grote taalmodellen (LLM) zoals GPT-3.5 en GPT-4 de technologiewereld veroverd en veel Vietnamese bedrijven hebben ook gekozen voor in het buitenland ontwikkelde, verfijnde modellen om een snellere route te nemen en vooruitgang te boeken in het LLM-opleidingsproces.
Zalo koos een andere weg – moeilijker, maar autonomer: het model zelf vanaf nul trainen (from scratch model). Een weg waarbij alles vanaf nul moet worden opgebouwd – van data en modelarchitectuur tot het volledige trainingsproces. Die beslissing was er niet om te concurreren met de giganten, maar om de ambitie van de Vietnamezen te verwezenlijken: het LLM-model in hun moedertaal beheersen.
"We voorzagen de moeilijkheden en besloten toch al vroeg in te stappen. We concurreerden niet rechtstreeks met de 'grote jongens', maar kozen een nichemarkt waar we het beter konden doen. Onze ambitie is om een model te bouwen dat de Vietnamezen volledig zelf in de hand hebben - van data tot algoritmen", aldus Dr. Nguyen Truong Son, directeur wetenschap bij Zalo AI.
Ondanks de vele obstakels op drie belangrijke gebieden, namelijk infrastructuur, data en opleidingsniveau, hebben Vietnamese ingenieurs proactief oplossingen gevonden om de moeilijkheden te overwinnen. Dit toont de wilskracht en wilskracht van de Vietnamezen in moeilijke omstandigheden, met name in dit geval het overwinnen van uitdagingen tijdens de ontwikkeling van een LLM voor Vietnamezen.
Om LLM's te kunnen opleiden, hadden ingenieurs de juiste infrastructuur nodig. Maar destijds waren GPU's zoals de Nvidia H100 bijna "wereldwijd zeldzaam". Grote bedrijven hadden ze ondertussen al een jaar lang gereserveerd en miljoenen dollars betaald om ze te bezitten. In Vietnam probeerde Zalo ook acht DGX H100-servers te kopen, maar dat was niet eenvoudig, omdat hij op elke levering van de fabrikant moest wachten.
Bij gebrek aan Nvidia GPU's moesten Vietnamese ingenieurs flexibel gebruikmaken van consumenten-GPU's om met elke regel code te experimenteren en elk klein model uit te voeren. In plaats van te wachten, bereidden ingenieurs zich proactief voor, zodat alles klaar zou zijn zodra ze moderne apparatuur tot hun beschikking hadden.
Op het gebied van gegevens heeft Zalo, in plaats van te vertrouwen op de beschikbare bronnen, geïnvesteerd in de bouw van een hoogwaardig datawarehouse specifiek voor het Vietnamees, om het ernstige tekort ten opzichte van Engels en Chinees op te vangen.
Dankzij de flexibele ontwikkelstrategie heeft Zalo de ontwikkeltijd van zijn grote taalmodel succesvol ingekort van de verwachte 18 maanden naar 6 maanden. Eind 2023 werd Zalo's Vietnamese grote taalmodel officieel gelanceerd tijdens een evenement dat de toonaangevende technologie- en AI-community in Vietnam bijeenbracht: de Zalo AI Summit. Hier maakte Zalo's LLM-model zijn debuut via de Kahoot-uitdaging van Tinhte.vn en overtrof het verrassend genoeg GPT 3.5, alleen achter GPT4 - het LLM-model dat destijds als het sterkste ter wereld werd beschouwd.
Zalo's model is gebaseerd op het evaluatieplatform VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models) en is 1,5 keer krachtiger dan OpenAI's GPT-3.5. Tegen eind 2024 zal dit model grote namen zoals GPT-4 (OpenAI), Gemma-2-9B (Google) of Phi-3-small (Microsoft) overtreffen. Qua Vietnamese verwerkingscapaciteit staat het model op de VMLU-ranglijst alleen achter Meta's LLaMA-3-70B.
Zalo beperkt zich niet tot onderzoek, maar brengt geleidelijk technologie uit het laboratorium tot leven door toepassingsproducten van LLM te commercialiseren en te populariseren.
Begin 2025 trok de algemene Q&A-assistent Kiki Info – die als officieel account op het Zalo-platform opereerde – in minder dan twee maanden meer dan 1 miljoen gebruikers. Een andere applicatie, Thiep AI, bereikte ook een indrukwekkend aantal van 15 miljoen gecreëerde en verzonden kaarten in slechts twee maanden.
Zalo's reis gaat niet alleen over een bedrijf dat technologie wil ontwikkelen. Het is een onderdeel van het grotere geheel – waar Vietnam actief innovatie promoot, met beleid uit Resolutie 57-NQ/TW over wetenschap en technologische ontwikkeling en nationale digitale transformatie. Kunstmatige intelligentie (AI) krijgt daarbij met name de nadruk.
De opkomst en snelle ontwikkeling van de Vietnamese LLM van Zalo is niet alleen een technologische stap voorwaarts voor een bedrijf, maar ook een bewijs van de inherente capaciteit en het doorzettingsvermogen van het Vietnamese technologieteam.
Met de 'from scratch'-techniek – het vanaf nul trainen van modellen – koos Zalo voor de lange weg, maar hielp Vietnam wel om AI echt onder de knie te krijgen. Niet alleen qua resultaten, maar ook qua het hele proces van modelarchitectuur, data, algoritmen tot applicatieproducten. Zalo's succes heeft er ook aan bijgedragen dat Vietnam een van de weinige landen in Zuidoost-Azië is geworden met een eigen LLM-model – een strategische mijlpaal in de context van de steeds heviger wordende wereldwijde technologische concurrentie.
Op de lange reis die voor ons ligt, zal Zalo niet stoppen bij één model of een paar producten, maar zal het model blijven perfectioneren om zowel gebruikers te bedienen als een Vietnamees AI-platform van concurrerende kwaliteit te creëren: "Zalo's AI-ontwikkelingstraject is nog lang. We zullen het model blijven optimaliseren, zowel in de breedte als in de diepte, en tegelijkertijd de praktische toepassing bevorderen. Het uiteindelijke doel is om hoogwaardige AI-producten te creëren die de Vietnamese bevolking praktisch van dienst zijn", voegde de heer Son eraan toe.
Zalo's succesvolle ontwikkeling van Vietnamese LLM is niet alleen een doorbraak voor een bedrijf, maar opent ook een potentiële toekomst voor Vietnamese kunstmatige intelligentie. Het doorzettingsvermogen en de ambitie van de Vietnamezen hebben de weg vrijgemaakt voor waardevolle resultaten. De toekomst van Vietnamese kunstmatige intelligentie zal niet alleen een "Zalo" kennen, maar ook een generatie dappere ingenieurs die de technologische wereld zullen volgen, erven en veroveren.
Bron: https://znews.vn/zalo-va-hanh-trinh-lam-chu-llm-tieng-viet-post1561765.html






Reactie (0)