Zalo og reisen med å overvinne hindringer for å erobre hjemlige ambisjoner

Zalo bror 1

Eksplosjonen av generativ kunstig intelligens (Generativ AI) har fullstendig endret det globale teknologilandskapet.

Zalo bror 2

Siden OpenAI lanserte ChatGPT sent i 2022, har en rekke lignende LLM-modeller kontinuerlig dukket opp, brukt på mange felt som helsevesen, utdanning , finans, jus... Kappløpet har blitt hardt, ikke bare på bedriftsnivå, men også på nasjonalt nivå når det gjelder opplæringskapasitet, datainfrastruktur og data.

Store selskaper som OpenAI, Google, Meta eller Microsoft med økonomisk potensial og gunstige betingelser har alle «raskt» investert milliarder av dollar for å eie tusenvis av avanserte GPU-er som Nvidia H100 – kjernefaktoren for trening av LLM-modeller. Nvidias aksjekurs steg i været i løpet av denne perioden, noe som gjenspeiler verdens tørst etter infrastruktur.

Zalo bror 3

I tillegg til kostnadsproblemer står teknologiselskaper i utviklingsland overfor begrensninger i import og eksport av AI-brikkeutstyr fra USA. Dette fører til mangel på treningsutstyr og et lavere tempo sammenlignet med teknologigiganter. Med sin ambisjon om innenlandsk suksess er Zalo også fanget i denne virvelvinden.

Zalo bror 4

Når det gjelder data, krevde tidligere maskinlæringsproblemer store mengder treningsdata, men for store språkmodeller er dette en enorm mengde data. For å ha en god nok modell krever LLM-systemet titalls eller til og med hundrevis av milliarder av inndatateksttokener. Samtidig er vietnamesisk ikke "på nivå" med engelsk og kinesisk når det gjelder popularitet. Dette har mangedoblet vanskeligheten for vietnamesiske LLM-utviklere.

Zalo bror 5

I 2023 har store språkmodeller (LLM) som GPT-3.5 og GPT-4 tatt teknologiverdenen med storm, og mange vietnamesiske bedrifter har også valgt utenlandskproduserte, finjusterte modeller for å ta en snarvei og komme seg videre i LLM-opplæringsprosessen.

Zalo valgte en annen vei – mer krevende, men mer autonom: Selvopplæring av modellen fra bunnen av (fra-scratch-modell). En vei som krever at alt bygges fra bunnen av – fra data, modellarkitektur til hele opplæringsprosessen. Den avgjørelsen var ikke for å konkurrere med gigantene, men for å realisere det vietnamesiske folkets ambisjon: å mestre LLM-modellen på morsmålet sitt.

Zalo bror 6

«Vi forutså vanskelighetene og bestemte oss likevel for å bli med i spillet tidlig. Vi konkurrerte ikke direkte med de «store», men valgte et nisjemarked der vi kunne gjøre det bedre. Vårt mål er å bygge en modell som vietnameserne fullstendig kontrollerer – fra data til algoritmer», delte Dr. Nguyen Truong Son, vitenskapsdirektør ved Zalo AI.

Til tross for at de har møtt mange hindringer innenfor tre hovedfaktorer, inkludert infrastruktur, data og opplæringsnivå, har vietnamesiske ingeniører proaktivt funnet løsninger for å overvinne vanskelighetene. Dette demonstrerer den vietnamesiske befolkningens ånd og viljestyrke under vanskelige omstendigheter, spesielt i dette tilfellet, når det gjelder å overvinne utfordringer i prosessen med å utvikle en juridisk kompetanse (LLM) for vietnamesere.

Zalo bror 7

For å utdanne LLM trengte ingeniører riktig infrastruktur. Men på den tiden var GPU-er som Nvidias H100 nærmest «globale sjeldenheter». I mellomtiden hadde store selskaper forhåndsbestilt dem for et år og betalt millioner av dollar for å eie dem. I Vietnam prøvde Zalo også å kjøpe 8 DGX H100-servere, men det var ikke lett, de måtte vente på hvert parti med leveranser fra produsenten.

I mangel av Nvidia GPU-er måtte vietnamesiske ingeniører fleksibelt bruke forbruker-GPU-er til å eksperimentere på hver kodelinje og kjøre hver lille modell. I stedet for å vente, forberedte ingeniørene seg proaktivt slik at alt ville være klart når de hadde moderne utstyr.

Når det gjelder data, investerte Zalo i stedet for å stole på tilgjengelige ressurser i å bygge et datalager av høy kvalitet spesielt for vietnamesisk, for å kompensere for den alvorlige mangelen sammenlignet med engelsk og kinesisk.

Zalo anh 8

Takket være sin fleksible utviklingsstrategi har Zalo klart å forkorte utviklingstiden for sin store språkmodell fra forventede 18 måneder til 6 måneder. På slutten av 2023 ble Zalos vietnamesiske store språkmodell offisielt lansert på et arrangement som samlet det ledende teknologi- og AI-miljøet i Vietnam – Zalo AI Summit. Her debuterte Zalos LLM-modell gjennom Kahoot-utfordringen satt av Tinhte.vn og overgikk overraskende GPT 3.5, bare bak GPT4 – LLM-modellen som ble ansett som den sterkeste i verden på den tiden.

Basert på evalueringsplattformen VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models), er Zalos modell 1,5 ganger kraftigere enn OpenAIs GPT-3.5. Innen utgangen av 2024 vil denne modellen overgå store navn som GPT-4 (OpenAI), Gemma-2-9B (Google) eller Phi-3-small (Microsoft), bare bak Metas LLaMA-3-70B når det gjelder vietnamesisk prosesseringsevne på VMLUs rangeringer.

Zalo bror 9

Zalo stopper ikke bare ved forskning, men bringer gradvis teknologi fra laboratoriet til live ved å kommersialisere og popularisere applikasjonsprodukter fra LLM.

Zalo anh 10

Tidlig i 2025 tiltrakk den generelle spørsmål-og-svar-assistenten Kiki Info – som opererte som en offisiell konto på Zalo-plattformen – seg mer enn 1 million brukere på under 2 måneder. En annen applikasjon, Thiep AI, nådde også et imponerende antall på 15 millioner kort opprettet og sendt på bare 2 måneder.

Zalo bror 11

Zalos reise handler ikke bare om et selskap som ønsker å utvikle teknologi. Det er en del av det større bildet – der Vietnam aggressivt fremmer innovasjon, med retningslinjer som stammer fra resolusjon 57-NQ/TW om utvikling av vitenskap, teknologi og nasjonal digital transformasjon. Spesielt vektlegger den feltet kunstig intelligens.

Fremveksten og den raske utviklingen av vietnamesisk LLM fra Zalo er ikke bare et teknologisk skritt fremover for en bedrift, men også et vitnesbyrd om den iboende kapasiteten og utholdenheten til det vietnamesiske teknologiteamet.

Med «fra bunnen av»-teknikken – å trene modeller fra bunnen av, valgte Zalo den lange veien, men hjalp Vietnam med å virkelig mestre AI. Ikke bare når det gjelder resultater, men også når det gjelder hele prosessen fra modellarkitektur, data, algoritmer til applikasjonsprodukter. Zalos suksess har også hjulpet Vietnam med å bli et av få sørøstasiatiske land som eier en innenlandsk LLM-modell – en strategisk milepæl i sammenheng med stadig hardere global teknologikonkurranse.

Zalo anh 12

På den lange reisen foran oss vil ikke Zalo stoppe ved bare én modell eller noen få produkter, men vil fortsette å forbedre modellen for både å tjene brukerne og skape en konkurransedyktig, høykvalitets vietnamesisk AI-plattform: «Zalos AI-utviklingsreise er fortsatt lang. Vi vil fortsette å optimalisere modellen både i bredde og dybde, samtidig som vi fremmer praktiske anvendelser. Det endelige målet er å lage AI-produkter av høy kvalitet som praktisk talt tjener det vietnamesiske folket», la Son til.

Zalos vellykkede utvikling av vietnamesisk LLM er ikke bare et gjennombrudd for en bedrift, men åpner også opp en potensiell fremtid for vietnamesisk kunstig intelligens. Det vietnamesiske folkets utholdenhet og ambisjoner har ført reisen mot verdige resultater. Fremtiden for vietnamesisk AI vil ikke bare ha en «Zalo», men også en generasjon modige ingeniører som skal følge, arve og erobre teknologiens verden.

Zalo bror 13