Zalo och resan att övervinna hinder för att erövra inhemska ambitioner

Zalo nummer 1

Explosionen av generativ artificiell intelligens (Generativ AI) har fullständigt förändrat det globala teknologilandskapet.

Zalo bror 2

Sedan OpenAI lanserade ChatGPT i slutet av 2022 har en rad liknande LLM-modeller kontinuerligt dykt upp, tillämpade inom många områden som hälso- och sjukvård, utbildning , finans, juridik... Kapplöpningen har blivit hård, inte bara på företagsnivå utan även på nationell nivå när det gäller utbildningskapacitet, datorinfrastruktur och data.

Stora företag som OpenAI, Google, Meta eller Microsoft med finansiell potential och gynnsamma villkor har alla "snabbt" investerat miljarder dollar för att äga tusentals avancerade GPU:er som Nvidia H100 – kärnfaktorn för att träna LLM-modeller. Nvidias aktiekurs sköt i höjden under den perioden, vilket återspeglar världens törst efter infrastruktur.

Zalo bror 3

Samtidigt möter teknikföretag i utvecklingsländer, utöver kostnadsproblem, även begränsningar när det gäller att importera och exportera AI-chiputrustning från USA. Detta leder till brist på träningsutrustning och en långsammare takt jämfört med teknikjättar. Med sin ambition att lyckas inhemskt är även Zalo fångad i denna virvelvind.

Zalo bror 4

När det gäller data krävde tidigare maskininlärningsproblem stora mängder träningsdata, men för stora språkmodeller är detta en enorm mängd data. För att ha en tillräckligt bra modell kräver LLM-systemet tiotals eller till och med hundratals miljarder inmatningstexttokens. Samtidigt är vietnamesiska inte "i nivå" med engelska och kinesiska vad gäller popularitet. Detta har mångdubblat svårigheten för vietnamesiska LLM-utvecklare.

Zalo bror 5

År 2023 har stora språkmodeller (LLM) som GPT-3.5 och GPT-4 tagit teknikvärlden med storm, och många vietnamesiska företag har också valt utländskt tillverkade, finjusterade modeller för att ta en genväg och komma vidare i LLM-utbildningsprocessen.

Zalo valde en annan väg – mer mödosam, men mer autonom: Att självträna modellen från grunden (from-scratch-modellen). En väg som kräver att allt byggs från grunden – från data, modellarkitektur till hela träningsprocessen. Det beslutet var inte för att konkurrera med jättarna utan för att förverkliga det vietnamesiska folkets strävan: att bemästra LLM-modellen på sitt modersmål.

Zalo bror 6

”Vi förutsåg svårigheterna och bestämde oss ändå för att ge oss in i spelet tidigt. Vi konkurrerade inte direkt med de ”stora aktörerna” utan valde en nischmarknad där vi kunde göra bättre ifrån oss. Vår ambition är att bygga en modell som vietnameserna helt kontrollerar – från data till algoritmer”, delade Dr. Nguyen Truong Son, vetenskapschef på Zalo AI.

Trots att de mött många hinder inom tre huvudfaktorer, inklusive infrastruktur, data och utbildningsnivå, har vietnamesiska ingenjörer proaktivt hittat lösningar för att övervinna svårigheter. Detta visar den vietnamesiska befolkningens anda och viljestyrka under svåra omständigheter, särskilt i detta fall, att övervinna utmaningar i processen att utveckla en juridikexamen för vietnameser.

Zalo bror 7

För att utbilda juridiktekniker behövde ingenjörer rätt infrastruktur. Men på den tiden var grafikkort som Nvidias H100 nästan "globala rariteter". Samtidigt hade stora företag förbeställt dem i ett år och betalat miljontals dollar för att äga dem. I Vietnam försökte Zalo också köpa 8 DGX H100-servrar, men det var inte lätt, eftersom man var tvungen att vänta på varje leveransomgång från tillverkaren.

I avsaknad av Nvidia-grafikkort var vietnamesiska ingenjörer tvungna att flexibelt använda konsument-GPU:er för att experimentera på varje kodrad och köra varje liten modell. Istället för att vänta förberedde sig ingenjörerna proaktivt så att allt skulle vara klart när de hade modern utrustning.

När det gäller data, istället för att förlita sig på tillgängliga resurser, investerade Zalo i att bygga ett högkvalitativt datalager specifikt för vietnamesiska, för att kompensera för den allvarliga bristen jämfört med engelska och kinesiska.

Zalo anh 8

Tack vare sin flexibla utvecklingsstrategi förkortade Zalo utvecklingstiden för sin stora språkmodell från de beräknade 18 månaderna till bara 6 månader. I slutet av 2023 lanserades Zalos vietnamesiska stora språkmodell officiellt vid Zalo AI Summit, ett evenemang som sammanför ledande teknik- och AI-experter i Vietnam. Där debuterade Zalos LLM-modell genom en Kahoot-utmaning utställd av Tinhte.vn och överträffade överraskande GPT 3.5, rankad bara efter GPT4 – den LLM-modell som vid den tiden ansågs vara den starkaste i världen.

På benchmarkingplattformen VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models) uppnådde Zalos modell 1,5 gånger högre prestanda än OpenAI:s GPT-3.5. I slutet av 2024 hade modellen till och med överträffat stora aktörer som GPT-4 (OpenAI), Gemma-2-9B (Google) och Phi-3-small (Microsoft), och rankades endast efter Metas LLaMA-3-70B i vietnamesisk språkbehandlingskapacitet på VMLU:s ranking.

Zalo bror 9

Zalo stannar inte bara vid forskning, utan för gradvis liv i tekniken från laboratoriet genom att kommersialisera och popularisera applikationsprodukter från LLM.

Zalo anh 10

I början av 2025 lockade den allmänna fråge- och svarsassistenten Kiki Info – som fungerade som ett officiellt konto på Zalo-plattformen – mer än 1 miljon användare på mindre än 2 månader. En annan applikation, Thiep AI, nådde också ett imponerande antal på 15 miljoner skapade och skickade kort på bara 2 månader.

Zalo bror 11

Zalos resa handlar inte bara om ett företag som vill utveckla teknologi. Det är en del av den större bilden – där Vietnam aggressivt främjar innovation, med policyer som härrör från resolution 57-NQ/TW om utveckling av vetenskap, teknologi och nationell digital transformation. I synnerhet betonas området artificiell intelligens.

Framväxten och den snabba utvecklingen av vietnamesisk juridik (LLM) från Zalo är inte bara ett teknologiskt steg framåt för ett företag, utan också ett bevis på den inneboende kapaciteten och uthålligheten hos det vietnamesiska teknikteamet.

Med tekniken ”från grunden” – att träna modeller från grunden – valde Zalo den långa vägen, men hjälpte Vietnam att verkligen bemästra AI. Inte bara vad gäller resultat, utan också vad gäller hela processen från modellarkitektur, data, algoritmer till applikationsprodukter. Zalos framgångar har också hjälpt Vietnam att bli ett av få sydostasiatiska länder som äger en inhemsk LLM-modell – en strategisk milstolpe i samband med den allt hårdare globala teknikkonkurrensen.

Zalo anh 12

På den långa resan framöver kommer Zalo inte att stanna vid bara en modell eller ett fåtal produkter, utan fortsätta att förfina modellen för att både betjäna användarna och skapa en konkurrenskraftig, högkvalitativ vietnamesisk AI-plattform: ”Zalos AI-utvecklingsresa är fortfarande lång. Vi kommer att fortsätta optimera modellen både i bredd och djup, samtidigt som vi främjar praktiska tillämpningar. Det slutgiltiga målet är att skapa högkvalitativa AI-produkter som praktiskt betjänar det vietnamesiska folket”, tillade Son.

Zalos framgångsrika utveckling av vietnamesisk juridik är inte bara ett genombrott för ett företag, utan öppnar också upp en potentiell framtid för vietnamesisk artificiell intelligens. Det vietnamesiska folkets uthållighet och ambition har lett resan mot att nå värdefulla resultat. Framtiden för vietnamesisk AI kommer inte bara att ha en "Zalo", utan också en generation av modiga ingenjörer att följa, ärva och erövra teknikvärlden.

Zalo bror 13