De explosieve groei van generatieve kunstmatige intelligentie (Generatieve AI) heeft het wereldwijde technologielandschap volledig veranderd.
Sinds OpenAI eind 2022 ChatGPT lanceerde, is er een reeks vergelijkbare LLM-modellen verschenen, die in veel sectoren worden toegepast, zoals de gezondheidszorg, het onderwijs , de financiële wereld en de juridische sector. De concurrentie is hevig geworden, niet alleen op bedrijfsniveau, maar ook op nationaal niveau wat betreft trainingscapaciteit, computerinfrastructuur en data.
Grote bedrijven zoals OpenAI, Google, Meta en Microsoft, met hun financiële potentieel en gunstige omstandigheden, hebben allemaal "snel" miljarden dollars geïnvesteerd in duizenden high-end GPU's zoals de Nvidia H100 - de kernfactor voor het trainen van LLM-modellen. De aandelenkoers van Nvidia schoot in die periode omhoog, wat de wereldwijde honger naar infrastructuur weerspiegelde.
Technologiebedrijven in ontwikkelingslanden worden, naast kostenproblemen, ook geconfronteerd met beperkingen op de import en export van AI-chips uit de VS. Dit leidt tot een tekort aan trainingsapparatuur en een achterstand ten opzichte van de technologiegiganten. Zalo, met zijn ambities voor de binnenlandse markt, vormt hierop geen uitzondering.
Wat betreft data vereisten eerdere machine learning-problemen grote hoeveelheden trainingsdata, maar voor grote taalmodellen is dit een enorme hoeveelheid. Om een voldoende goed model te krijgen, heeft het LLM-systeem tientallen, zo niet honderden miljarden, teksttokens als invoer nodig. Tegelijkertijd is Vietnamees qua populariteit niet "gelijkwaardig" aan Engels en Chinees. Dit heeft de moeilijkheid voor Vietnamese LLM-ontwikkelaars aanzienlijk vergroot.
In 2023 hebben grote taalmodellen (LLM's) zoals GPT-3.5 en GPT-4 de technologiewereld stormenderhand veroverd, en veel Vietnamese bedrijven hebben ook gekozen voor door het buitenland ontwikkelde, verfijnde modellen om sneller vooruitgang te boeken in het LLM-trainingsproces.
Zalo koos voor een andere weg – een zwaardere, maar meer autonome aanpak: het model volledig zelf trainen (from-scratch model). Een aanpak die vereist dat alles vanaf nul wordt opgebouwd – van data en modelarchitectuur tot het hele trainingsproces. Deze beslissing was niet bedoeld om te concurreren met de grote spelers, maar om de aspiratie van het Vietnamese volk te verwezenlijken: het LLM-model in hun moedertaal beheersen.
“We hadden de moeilijkheden voorzien en besloten toch al vroeg mee te doen. We hebben niet rechtstreeks de concurrentie met de ‘grote jongens’ aangegaan, maar gekozen voor een nichemarkt waar we beter konden presteren. Het is onze ambitie om een model te ontwikkelen dat volledig in handen is van de Vietnamese bevolking – van data tot algoritmes”, aldus Dr. Nguyen Truong Son, directeur wetenschap bij Zalo AI.
Ondanks de vele obstakels op drie belangrijke gebieden – infrastructuur, data en opleidingsniveau – hebben Vietnamese ingenieurs proactief oplossingen gevonden om de moeilijkheden te overwinnen. Dit toont de veerkracht en wilskracht van het Vietnamese volk in moeilijke omstandigheden, met name in dit geval, bij het overwinnen van uitdagingen tijdens de ontwikkeling van een LLM-opleiding voor Vietnamezen.
Om LLM-ingenieurs op te leiden, hadden ze de juiste infrastructuur nodig. Maar in die tijd waren GPU's zoals de Nvidia H100 vrijwel "wereldwijd zeldzaam". Grote bedrijven hadden ze ondertussen al een jaar van tevoren besteld en miljoenen dollars betaald om ze te bezitten. In Vietnam probeerde Zalo ook 8 DGX H100-servers aan te schaffen, maar dat was niet eenvoudig, omdat ze moesten wachten op elke levering van de fabrikant.
Bij gebrek aan Nvidia GPU's moesten Vietnamese ingenieurs flexibel gebruikmaken van consumenten-GPU's om te experimenteren met elke regel code en elk klein model te draaien. In plaats van af te wachten, bereidden de ingenieurs zich proactief voor, zodat alles klaar zou zijn zodra ze over moderne apparatuur beschikten.
Wat data betreft, heeft Zalo, in plaats van te vertrouwen op beschikbare bronnen, geïnvesteerd in de bouw van een hoogwaardig datawarehouse specifiek voor het Vietnamees, om het ernstige tekort ten opzichte van het Engels en Chinees te compenseren.
Dankzij een flexibele ontwikkelingsstrategie heeft Zalo de ontwikkeltijd van zijn grote taalmodel succesvol verkort van de verwachte 18 maanden naar 6 maanden. Eind 2023 werd Zalo's Vietnamese grote taalmodel officieel gelanceerd tijdens de Zalo AI Summit, een evenement dat de toonaangevende technologie- en AI-gemeenschap in Vietnam samenbracht. Daar maakte Zalo's LLM-model zijn debuut via de Kahoot-uitdaging van Tinhte.vn en overtrof verrassend genoeg GPT 3.5, waarmee het alleen GPT4 – destijds beschouwd als het sterkste LLM-model ter wereld – voor zich moest laten.
Gebaseerd op het VMLU-evaluatieplatform (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models), is het model van Zalo 1,5 keer krachtiger dan OpenAI's GPT-3.5. Eind 2024 zal dit model grote namen als GPT-4 (OpenAI), Gemma-2-9B (Google) en Phi-3-small (Microsoft) overtreffen en qua verwerkingsvermogen van het Vietnamees alleen nog achter Meta's LLaMA-3-70B staan in de VMLU-ranglijst.
Zalo beperkt zich niet alleen tot onderzoek, maar brengt technologie uit het laboratorium geleidelijk aan tot leven door toepassingsproducten van LLM te commercialiseren en populair te maken.
Begin 2025 trok de algemene vraag-en-antwoord-app Kiki Info – die als officieel account op het Zalo-platform opereert – in minder dan twee maanden meer dan 1 miljoen gebruikers. Een andere applicatie, Thiep AI, bereikte eveneens een indrukwekkend aantal van 15 miljoen aangemaakte en verzonden kaarten in slechts twee maanden.
Het traject van Zalo gaat niet alleen over een bedrijf dat technologie wil ontwikkelen. Het is onderdeel van een groter geheel: Vietnam stimuleert innovatie actief, met beleidsmaatregelen zoals Resolutie 57-NQ/TW over wetenschaps- en technologieontwikkeling en de nationale digitale transformatie. Vooral op het gebied van kunstmatige intelligentie staat dit centraal.
De opkomst en snelle ontwikkeling van de Vietnamese LLM-app van Zalo is niet alleen een technologische stap voorwaarts voor het bedrijf, maar ook een bewijs van de inherente capaciteit en het doorzettingsvermogen van het Vietnamese technologieteam.
Met de "from-scratch"-techniek – het trainen van modellen vanaf nul – koos Zalo voor de lange weg, maar hielp Vietnam wel om AI echt onder de knie te krijgen. Niet alleen qua resultaten, maar ook qua het hele proces, van modelarchitectuur, data en algoritmen tot applicatieproducten. Het succes van Zalo heeft er ook toe bijgedragen dat Vietnam een van de weinige Zuidoost-Aziatische landen is met een eigen LLM-model (Learning Learning Model) – een strategische mijlpaal in de context van de steeds heviger wordende wereldwijde technologische concurrentie.
Op de lange weg die voor ons ligt, zal Zalo niet bij één model of een paar producten blijven steken, maar het model blijven perfectioneren om zowel gebruikers te bedienen als een Vietnamees AI-platform van concurrerende kwaliteit te creëren: "De AI-ontwikkeling van Zalo is nog lang niet ten einde. We zullen het model blijven optimaliseren, zowel in de breedte als in de diepte, en tegelijkertijd de praktische toepassing bevorderen. Het uiteindelijke doel is om hoogwaardige AI-producten te creëren die de Vietnamese bevolking daadwerkelijk van dienst zijn", voegde de heer Son eraan toe.
De succesvolle ontwikkeling van het Vietnamese LLM door Zalo is niet alleen een doorbraak voor het bedrijfsleven, maar opent ook een veelbelovende toekomst voor kunstmatige intelligentie in Vietnam. De volharding en ambitie van het Vietnamese volk hebben geleid tot deze waardevolle resultaten. De toekomst van de Vietnamese AI zal niet alleen een "Zalo" kennen, maar ook een generatie dappere ingenieurs voortbrengen die het stokje overnemen en de wereld van de technologie zullen veroveren.
Bron: https://znews.vn/zalo-va-hanh-trinh-lam-chu-llm-tieng-viet-post1561765.html










Reactie (0)