Explosionen av generativ artificiell intelligens (Generativ AI) har fullständigt förändrat det globala teknologilandskapet.
Sedan OpenAI lanserade ChatGPT i slutet av 2022 har en rad liknande LLM-modeller kontinuerligt dykt upp, tillämpade inom många områden som hälso- och sjukvård, utbildning , finans, juridik... Kapplöpningen har blivit hård, inte bara på företagsnivå utan även på nationell nivå när det gäller utbildningskapacitet, datorinfrastruktur och data.
Stora företag som OpenAI, Google, Meta eller Microsoft med finansiell potential och gynnsamma villkor har alla "snabbt" investerat miljarder dollar för att äga tusentals avancerade GPU:er som Nvidia H100 – kärnfaktorn för att träna LLM-modeller. Nvidias aktiekurs sköt i höjden under den perioden, vilket återspeglar världens törst efter infrastruktur.
Samtidigt möter teknikföretag i utvecklingsländer, utöver kostnadsproblem, även restriktioner för import och export av AI-chiputrustning från USA. Detta leder till brist på träningsutrustning och att de är "långsammare" jämfört med teknikjättar. Zalo är inget undantag med inhemska ambitioner.
När det gäller data krävde tidigare maskininlärningsproblem stora mängder träningsdata, men för stora språkmodeller är detta en enorm mängd data. För att ha en tillräckligt bra modell kräver LLM-systemet tiotals eller till och med hundratals miljarder inmatningstexttokens. Samtidigt är vietnamesiska inte "i nivå" med engelska och kinesiska vad gäller popularitet. Detta har mångdubblat svårigheten för vietnamesiska LLM-utvecklare.
År 2023 har stora språkmodeller (LLM) som GPT-3.5 och GPT-4 tagit teknikvärlden med storm, och många vietnamesiska företag har också valt utländskt tillverkade, finjusterade modeller för att ta en genväg och komma vidare i LLM-utbildningsprocessen.
Zalo valde en annan väg – mer mödosam, men mer autonom: Att självträna modellen från grunden (from-scratch-modellen). En väg som kräver att allt byggs från grunden – från data, modellarkitektur till hela träningsprocessen. Det beslutet var inte för att konkurrera med jättarna utan för att förverkliga det vietnamesiska folkets strävan: att bemästra LLM-modellen på sitt modersmål.
”Vi förutsåg svårigheterna och bestämde oss ändå för att ge oss in i spelet tidigt. Vi konkurrerade inte direkt med de ”stora aktörerna” utan valde en nischmarknad där vi kunde göra bättre ifrån oss. Vår ambition är att bygga en modell som vietnameserna helt kontrollerar – från data till algoritmer”, delade Dr. Nguyen Truong Son, vetenskapschef på Zalo AI.
Trots att de mött många hinder inom tre huvudfaktorer, inklusive infrastruktur, data och utbildningsnivå, har vietnamesiska ingenjörer proaktivt hittat lösningar för att övervinna svårigheter. Detta visar den vietnamesiska befolkningens anda och viljestyrka under svåra omständigheter, särskilt i detta fall, att övervinna utmaningar i processen att utveckla en juridikexamen för vietnameser.
För att utbilda juridiktekniker behövde ingenjörer rätt infrastruktur. Men på den tiden var grafikkort som Nvidias H100 nästan "globala rariteter". Samtidigt hade stora företag förbeställt dem i ett år och betalat miljontals dollar för att äga dem. I Vietnam försökte Zalo också köpa 8 DGX H100-servrar, men det var inte lätt, eftersom man var tvungen att vänta på varje leveransomgång från tillverkaren.
I avsaknad av Nvidia-grafikkort var vietnamesiska ingenjörer tvungna att flexibelt använda konsument-GPU:er för att experimentera på varje kodrad och köra varje liten modell. Istället för att vänta förberedde sig ingenjörerna proaktivt så att allt skulle vara klart när de hade modern utrustning.
När det gäller data, istället för att förlita sig på tillgängliga resurser, investerade Zalo i att bygga ett högkvalitativt datalager specifikt för vietnamesiska, för att kompensera för den allvarliga bristen jämfört med engelska och kinesiska.
Tack vare sin flexibla utvecklingsstrategi har Zalo framgångsrikt förkortat utvecklingstiden för sin stora språkmodell från de förväntade 18 månaderna till 6 månader. I slutet av 2023 lanserades Zalos vietnamesiska stora språkmodell officiellt vid ett evenemang som samlade den ledande teknik- och AI-communityn i Vietnam - Zalo AI Summit. Här debuterade Zalos LLM-modell genom Kahoot-utmaningen som sattes av Tinhte.vn och överträffade överraskande GPT 3.5, bara bakom GPT4 - LLM-modellen som ansågs vara den starkaste i världen vid den tiden.
Baserat på utvärderingsplattformen VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models) är Zalos modell 1,5 gånger kraftfullare än OpenAIs GPT-3.5. I slutet av 2024 kommer denna modell att överträffa stora namn som GPT-4 (OpenAI), Gemma-2-9B (Google) eller Phi-3-small (Microsoft), bara efter Metas LLaMA-3-70B vad gäller vietnamesisk bearbetningsförmåga på VMLUs ranking.
Zalo stannar inte bara vid forskning, utan för gradvis liv i tekniken från laboratoriet genom att kommersialisera och popularisera applikationsprodukter från LLM.
I början av 2025 lockade den allmänna fråge- och svarsassistenten Kiki Info – som fungerade som ett officiellt konto på Zalo-plattformen – mer än 1 miljon användare på mindre än 2 månader. En annan applikation, Thiep AI, nådde också ett imponerande antal på 15 miljoner skapade och skickade kort på bara 2 månader.
Zalos resa handlar inte bara om ett företag som vill utveckla teknologi. Det är en del av den större bilden – där Vietnam aggressivt främjar innovation, med policyer från resolution 57-NQ/TW om vetenskaplig och teknisk utveckling och nationell digital transformation. I synnerhet betonas området artificiell intelligens.
Framväxten och den snabba utvecklingen av vietnamesisk juridik (LLM) från Zalo är inte bara ett teknologiskt steg framåt för ett företag, utan också ett bevis på den inneboende kapaciteten och uthålligheten hos det vietnamesiska teknikteamet.
Med tekniken ”från grunden” – att träna modeller från grunden – valde Zalo den långa vägen, men hjälpte Vietnam att verkligen bemästra AI. Inte bara vad gäller resultat, utan också vad gäller hela processen från modellarkitektur, data, algoritmer till applikationsprodukter. Zalos framgångar har också hjälpt Vietnam att bli ett av få sydostasiatiska länder som äger en inhemsk LLM-modell – en strategisk milstolpe i samband med den allt hårdare globala teknikkonkurrensen.
På den långa resan framöver kommer Zalo inte bara att stanna vid en modell eller ett fåtal produkter utan fortsätta att finslipa modellen för att både betjäna användarna och skapa en vietnamesisk AI-plattform med konkurrenskraftig kvalitet: ”Zalos AI-utvecklingsresa är fortfarande lång. Vi kommer att fortsätta optimera modellen både i bredd och djup, samtidigt som vi främjar praktisk tillämpning. Det slutgiltiga målet är att skapa AI-produkter av hög kvalitet som praktiskt betjänar det vietnamesiska folket”, tillade Son.
Zalos framgångsrika utveckling av vietnamesisk juridik är inte bara ett genombrott för ett företag, utan öppnar också upp en potentiell framtid för vietnamesisk artificiell intelligens. Det vietnamesiska folkets uthållighet och ambition har lett resan mot att nå värdefulla resultat. Framtiden för vietnamesisk AI kommer inte bara att ha en "Zalo", utan också en generation av modiga ingenjörer att följa, ärva och erövra teknikvärlden.
Källa: https://znews.vn/zalo-va-hanh-trinh-lam-chu-llm-tieng-viet-post1561765.html






Kommentar (0)