Eksplosjonen av generativ kunstig intelligens (Generativ AI) har fullstendig endret det globale teknologilandskapet.
Siden OpenAI lanserte ChatGPT sent i 2022, har en rekke lignende LLM-modeller kontinuerlig dukket opp, brukt på mange felt som helsevesen, utdanning , finans, jus... Kappløpet har blitt hardt, ikke bare på bedriftsnivå, men også på nasjonalt nivå når det gjelder opplæringskapasitet, datainfrastruktur og data.
Store selskaper som OpenAI, Google, Meta eller Microsoft med økonomisk potensial og gunstige betingelser har alle «raskt» investert milliarder av dollar for å eie tusenvis av avanserte GPU-er som Nvidia H100 – kjernefaktoren for trening av LLM-modeller. Nvidias aksjekurs steg i været i løpet av denne perioden, noe som gjenspeiler verdens tørst etter infrastruktur.
I tillegg til kostnadsproblemer står teknologiselskaper i utviklingsland overfor restriksjoner på import og eksport av AI-brikkeutstyr fra USA. Dette fører til mangel på treningsutstyr og at de er «tregere» sammenlignet med teknologigiganter. Zalo er intet unntak når det gjelder innenlandske ambisjoner.
Når det gjelder data, krevde tidligere maskinlæringsproblemer store mengder treningsdata, men for store språkmodeller er dette en enorm mengde data. For å ha en god nok modell krever LLM-systemet titalls eller til og med hundrevis av milliarder av inndatateksttokener. Samtidig er vietnamesisk ikke "på nivå" med engelsk og kinesisk når det gjelder popularitet. Dette har mangedoblet vanskeligheten for vietnamesiske LLM-utviklere.
I 2023 har store språkmodeller (LLM) som GPT-3.5 og GPT-4 tatt teknologiverdenen med storm, og mange vietnamesiske bedrifter har også valgt utenlandskproduserte, finjusterte modeller for å ta en snarvei og komme seg videre i LLM-opplæringsprosessen.
Zalo valgte en annen vei – mer krevende, men mer autonom: Selvopplæring av modellen fra bunnen av (fra-scratch-modell). En vei som krever at alt bygges fra bunnen av – fra data, modellarkitektur til hele opplæringsprosessen. Den avgjørelsen var ikke for å konkurrere med gigantene, men for å realisere det vietnamesiske folkets ambisjon: å mestre LLM-modellen på morsmålet sitt.
«Vi forutså vanskelighetene og bestemte oss likevel for å bli med i spillet tidlig. Vi konkurrerte ikke direkte med de «store», men valgte et nisjemarked der vi kunne gjøre det bedre. Vårt mål er å bygge en modell som vietnameserne fullstendig kontrollerer – fra data til algoritmer», delte Dr. Nguyen Truong Son, vitenskapsdirektør ved Zalo AI.
Til tross for at de har møtt mange hindringer innenfor tre hovedfaktorer, inkludert infrastruktur, data og opplæringsnivå, har vietnamesiske ingeniører proaktivt funnet løsninger for å overvinne vanskelighetene. Dette demonstrerer den vietnamesiske befolkningens ånd og viljestyrke under vanskelige omstendigheter, spesielt i dette tilfellet, når det gjelder å overvinne utfordringer i prosessen med å utvikle en juridisk kompetanse (LLM) for vietnamesere.
For å utdanne LLM trengte ingeniører riktig infrastruktur. Men på den tiden var GPU-er som Nvidias H100 nærmest «globale sjeldenheter». I mellomtiden hadde store selskaper forhåndsbestilt dem for et år og betalt millioner av dollar for å eie dem. I Vietnam prøvde Zalo også å kjøpe 8 DGX H100-servere, men det var ikke lett, de måtte vente på hvert parti med leveranser fra produsenten.
I mangel av Nvidia GPU-er måtte vietnamesiske ingeniører fleksibelt bruke forbruker-GPU-er til å eksperimentere på hver kodelinje og kjøre hver lille modell. I stedet for å vente, forberedte ingeniørene seg proaktivt slik at alt ville være klart når de hadde moderne utstyr.
Når det gjelder data, investerte Zalo i stedet for å stole på tilgjengelige ressurser i å bygge et datalager av høy kvalitet spesielt for vietnamesisk, for å kompensere for den alvorlige mangelen sammenlignet med engelsk og kinesisk.
Takket være sin fleksible utviklingsstrategi har Zalo klart å forkorte utviklingstiden for sin store språkmodell fra forventede 18 måneder til 6 måneder. På slutten av 2023 ble Zalos vietnamesiske store språkmodell offisielt lansert på et arrangement som samlet det ledende teknologi- og AI-miljøet i Vietnam – Zalo AI Summit. Her debuterte Zalos LLM-modell gjennom Kahoot-utfordringen satt av Tinhte.vn og overgikk overraskende GPT 3.5, bare bak GPT4 – LLM-modellen som ble ansett som den sterkeste i verden på den tiden.
Basert på evalueringsplattformen VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models), er Zalos modell 1,5 ganger kraftigere enn OpenAIs GPT-3.5. Innen utgangen av 2024 vil denne modellen overgå store navn som GPT-4 (OpenAI), Gemma-2-9B (Google) eller Phi-3-small (Microsoft), bare bak Metas LLaMA-3-70B når det gjelder vietnamesisk prosesseringsevne på VMLUs rangeringer.
Zalo stopper ikke bare ved forskning, men bringer gradvis teknologi fra laboratoriet til live ved å kommersialisere og popularisere applikasjonsprodukter fra LLM.
Tidlig i 2025 tiltrakk den generelle spørsmål-og-svar-assistenten Kiki Info – som opererte som en offisiell konto på Zalo-plattformen – seg mer enn 1 million brukere på under 2 måneder. En annen applikasjon, Thiep AI, nådde også et imponerende antall på 15 millioner kort opprettet og sendt på bare 2 måneder.
Zalos reise handler ikke bare om et selskap som ønsker å utvikle teknologi. Det er en del av det større bildet – der Vietnam aggressivt fremmer innovasjon, med retningslinjer fra resolusjon 57-NQ/TW om vitenskapelig og teknologisk utvikling og nasjonal digital transformasjon. Spesielt feltet kunstig intelligens er vektlagt.
Fremveksten og den raske utviklingen av vietnamesisk LLM fra Zalo er ikke bare et teknologisk skritt fremover for en bedrift, men også et vitnesbyrd om den iboende kapasiteten og utholdenheten til det vietnamesiske teknologiteamet.
Med «fra bunnen av»-teknikken – å trene modeller fra bunnen av, valgte Zalo den lange veien, men hjalp Vietnam med å virkelig mestre AI. Ikke bare når det gjelder resultater, men også når det gjelder hele prosessen fra modellarkitektur, data, algoritmer til applikasjonsprodukter. Zalos suksess har også hjulpet Vietnam med å bli et av få sørøstasiatiske land som eier en innenlandsk LLM-modell – en strategisk milepæl i sammenheng med stadig hardere global teknologikonkurranse.
På den lange reisen fremover vil Zalo ikke bare stoppe ved én modell eller noen få produkter, men vil fortsette å perfeksjonere modellen for både å betjene brukerne og skape en vietnamesisk AI-plattform med konkurransedyktig kvalitet: «Zalos AI-utviklingsreise er fortsatt lang. Vi vil fortsette å optimalisere modellen både i bredde og dybde, samtidig som vi fremmer praktisk anvendelse. Det endelige målet er å lage AI-produkter av høy kvalitet som i praksis tjener det vietnamesiske folket», la Son til.
Zalos vellykkede utvikling av vietnamesisk LLM er ikke bare et gjennombrudd for en bedrift, men åpner også opp en potensiell fremtid for vietnamesisk kunstig intelligens. Det vietnamesiske folkets utholdenhet og ambisjoner har ført reisen mot verdige resultater. Fremtiden for vietnamesisk AI vil ikke bare ha en «Zalo», men også en generasjon modige ingeniører som skal følge, arve og erobre teknologiens verden.
Kilde: https://znews.vn/zalo-va-hanh-trinh-lam-chu-llm-tieng-viet-post1561765.html






Kommentar (0)