
Zalo AI Summit, som først ble avholdt i 2017, er et arrangement som samler anerkjente eksperter innen KI. Med temaet «Vietnam i KI-ifiseringens æra» vil Zalo AI Summit 2025 presentere løsninger for bruk av KI i hverdagen, forutsi KI-trender og vise frem Zalos prestasjoner med å bringe KI nærmere brukerne.
I sin åpningstale uttalte Nguyen Minh Tu, teknologidirektør hos Zalo, at AI-æraen begynte å dukke opp i 2018–2019 med de første transformatormodellene. Det var imidlertid ikke før GPT-3.5 og ChatGPT dukket opp i 2022 at disse språkmodellene nådde høy kvalitet og ble tilgjengelige for et bredere publikum.
«Det var da AI-æraen begynte, da folk begynte å bruke ChatGPT», understreket Tu.
Positivt signal for Vietnam
Etter hvert som selskaper som Google, Anthropic og DeepSeek i økende grad forbedrer storspråkmodellering (LLM), opplever AI-markedet et vendepunkt kalt agentisk AI.
I motsetning til konvensjonell AI, som bare kan løse enkeltoppgaver, er agentisk AI et autonomt system som er i stand til å koble sammen flere agenter for å håndtere komplekse problemer.
«Agentic AI fungerer som våre ansatte. Den kan analysere, resonnere, utføre oppgaver og skrive rapporter basert på våre kommandoer», la Tu til.
I Vietnam er Zalo et av selskapene som integrerer mange AI-funksjoner for å betjene brukerne. Innen 2025 forventes antallet brukere av disse tjenestene å nå over 17 millioner, en økning på over 200 %. Mer enn 7,5 millioner mennesker bruker dikteringsfunksjonen (konvertering av tale til tekst).
«Denne funksjonen har endret måten mange bruker Zalo på. I stedet for å skrive tekst er det mye raskere og mer praktisk å bruke stemmen», understreket Tú.
Funksjonen med å oversette meldinger fra vietnamesisk til engelsk har også tiltrukket seg et stort antall brukere. Tu avslørte at live-oversettelse for Zalo-samtaler snart vil bli lagt til.
![]() |
Mr. Nguyen Minh Tu, direktør for teknologi i Zalo. |
Utover å betjene sluttbrukere, støtter AI også Zalos drift. Selskapet har bygget en chatbot for kundeservice, som bidrar til å løse oppskaleringsproblemet i perioder med høy trafikk når det er vanskelig å rekruttere flere ansatte.
Etter 3 måneders implementering oppnådde chatbot-systemet i Zalo en svarprosent på 90 %, høyere enn menneskelig respons. Bare omtrent 2–3 % av tilfellene krevde menneskelig assistanse fra chatboten.
En representant for Zalo erkjente at det fortsatt er noen utfordringer med å bruke AI internt, som dreier seg om personvern og sikkerhet. Derfor velger plattformen en fleksibel tilnærming, anvender en egenutviklet modell for sensitive data og utnytter eksterne chatboter for mindre sensitive data.
Herr Tú nevnte også Zalo AI Challenge 2025, en konkurranse for å utvikle AI-applikasjonsløsninger i hverdagen. Foruten unge mennesker og studenter tiltrakk årets konkurranse seg flere elever fra videregående skole, og noen kom til og med blant de fem beste.
«Dette viser at KI har gjennomsyret alle deler av samfunnet, og har spredt seg til og med til skoler der barn blir eksponert for KI i svært ung alder. Dette er et positivt tegn for Vietnam i en tid med «KI-transformasjon»», understreket en representant for Zalo.
Bølgen av AI-agenter
I den første sesjonen reiste førsteamanuensis Quan Thanh Tho fra Ho Chi Minh City University of Technology spørsmålet om hvordan multimodal AI vil forandre verden . Han argumenterte for at LLM har nådd sin sluttfase, og at teknologitrenden gradvis beveger seg mot Multi-Agent Systems (MAS).
Førsteamanuensis Dr. var enig med Mr. Tu angående den viktige milepælen for LLM med introduksjonen av GPT-3.5, og uttalte at det felles målet til chatboter er å etterligne mennesker så tett som mulig. Konseptet med AI-agenter eksisterte før, men blomstret bare virkelig under LLM-rammeverket.
«Agent er en ganske klassisk arkitektur, og når den kombineres med LLM, gir den muligheten for kommunikasjon mellom modeller», sa Tho. Nøkkelordene «AI Agents» og «Agentic AI» har også vært blant de mest søkte ordene på Google Trends fra slutten av 2024 og frem til i dag.
![]() |
Førsteamanuensis dr. Quan Thanh Tho, leder for Institutt for informatikk og ingeniørfag, Ho Chi Minh-byens teknologiske universitet. |
Førsteamanuensisen delte at agentisk AI rett og slett er et system som består av flere agenter som jobber sammen. Når agentene mottar en kommando fra brukeren, vil de analysere forespørselen, tildele oppgaver, velge passende verktøy og utføre dem trinn for trinn for å oppnå høyere effektivitet sammenlignet med én enkelt modell.
Herr Tho presenterte også noen praktiske anvendelser av MAS i innenlandske bedrifter. Spesielt kan AI-agenter behandle PDF-filer, bilder og dokumenter samtidig, noe som forbedrer effektiviteten med 40–60 %. I forsikringssektoren hjelper denne teknologien et selskap med å automatisere 20–40 % av arbeidsmengden sin.
Videre har AI-agenter muligheten til å samle inn sanntidsinformasjon, noe som bidrar til å gi umiddelbare markedspriser. På jobben uttalte førsteamanuensis Dr. [Navn] at AI-agentsystemet fungerer som en intelligent assistent, i stand til å svare på skolerelaterte spørsmål fra foreldre og elever. Innen utdanning bidrar AI-agenter til å lage personlige læringsmodeller skreddersydd for hver elevs læringsvei.
![]() |
Zalo AI Summit 2025 tiltrakk seg et stort antall deltakere som var interessert i AI-feltet. |
Totalt sett ligger fordelen med MAS i evnen til å håndtere flere komplekse problemer parallelt. Gjennom resonneringsprosessen kan agenter behandle informasjon uavhengig, lære av hverandre og lære av brukeren for å redusere feil og produsere nøyaktige og personlige resultater.
Moderne agentarkitekturer leveres ofte som verktøy og plattformer med brukervennlige grensesnitt, noe som gjør dem mer tilgjengelige for allmennheten.
Basert på disse fordelene understreket Tho viktigheten av å anvende teknologi og justere interne arbeidsprosesser i bedrifter. Ifølge førsteamanuensisen er dette en bølge som bedrifter må være spesielt oppmerksomme på, sett i lys av den sterke innovasjonstrenden som finner sted over hele verden.
Hva kommer etter agentisk AI?
I den senere tid har menneskelignende roboter blitt en trend som tiltrekker seg oppmerksomhet i teknologiverdenen. Dette er også den vanligste bruken av fysisk AI.
Dr. Tran Minh Quan, seniorutviklerteknolog hos Nvidia Vietnam, delte sine tanker om dette emnet og understreket at fysisk AI er den mest avanserte utviklingen innen AI-trender, etter æraen med generativ AI eller agentisk AI.
«Disse AI-modellene er i stand til å motta kommandoer eller inndata, og deretter produsere spesifikke handlinger som påvirker motorer eller kontrollkomponenter i roboter som robotarmer, autonome kjøretøy, fabrikker osv.», delte Quan, og ga en oversikt over fysisk AI.
![]() |
Dr. Tran Minh Quan fra Nvidia delte sine innsikter om trendene innen fysisk AI. |
Ifølge representanter for Nvidia kan fysisk AI bli en billionindustri i fremtiden. Potensialet for å bruke fysisk AI er enormt, gitt at den nåværende globale maskinvareinfrastrukturen inkluderer omtrent 2 milliarder industrikameraer, 10 millioner fabrikker, 200 000 lagerbygninger og 1,5 milliarder kjøretøy, for ikke å nevne milliarder av humanoide roboter som kan bli utplassert i fremtiden.
«Hvis hver enhet var utstyrt med en AI-«hjerne» for å håndtere den nåværende arbeidsmengden, kunne oppgavene som støttes vært i en helt annen skala enn de er i dag», la Quan til.
Behovet for fysisk AI stammer fra mangel på personell i mange bransjer. Høyt kvalifiserte jobber i tøffe miljøer, som sveising i lukkede, mørke rom, viser seg å være vanskelige for mennesker.
Roboter er nå en løsning som balanserer personal- og driftskostnader. Kostnadene kan optimaliseres ettersom roboter nå har evnen til å lære nye oppgaver uavhengig, i stedet for bare å utføre repeterende jobber.
«Det er derfor ChatGPT-øyeblikket for robotikk kan komme i år eller neste år», understreket Quan.
![]() |
Fysisk AI regnes som det neste steget etter generativ AI og agentisk AI. |
For å realisere denne visjonen foreslo representanter for Nvidia en modell med tre datamaskiner, som tilsvarer tre viktige stadier i utviklingen av fysisk AI.
Følgelig fokuserer den første fasen på å bygge grunnlaget på serveren. Etter trening kan modellen plasseres i et simuleringsmiljø for å lære om årsakssammenhenger, noe som hjelper modellen med å utvikle bedre atferd i den virkelige verden.
Simulering hjelper roboter med å gjenkjenne objekter nøyaktig og hvordan de skal håndtere dem. Enda viktigere er det at simulering lar flere roboter jobbe sammen samtidig, og teste kollisjonsscenarier uten å pådra seg kostnaden for maskinvare i den virkelige verden. Til slutt muliggjør det direkte distribusjon til maskinvaren.
Utfordringen med å distribuere AI i stor skala.
Prosessen med «KI-isering», som innebærer å integrere teknologi i den daglige driften for å forbedre effektiviteten og støtte beslutningstaking, akselererer globalt.
Ifølge Dr. Chau Thanh Duc, forskningsdirektør ved Zalo AI, stammer tempoet i utviklingen av AI i Vietnam fra mange faktorer, særlig utviklingen av AI-modeller, den raske forbedringen av maskinvare- og datainfrastruktur, og den digitale transformasjonsprosessen.
Vietnam regnes som et av landene med betydelig potensial for AI-utvikling, noe som fremgår av talentanskaffelsesprogrammer, bygging av et teknologifellesskap og statlig støtte. Videre vurderes vietnamesiske borgere å ha et høyt nivå av beredskap for digital transformasjon.
![]() |
Dr. Chau Thanh Duc, forskningsdirektør ved Zalo AI. |
I denne transformasjonen lanserte Zalo mange AI-relaterte funksjoner, som den virtuelle assistenten Kiki. Selskapet har som mål å utvikle verktøy som øker arbeidseffektiviteten og er spesielt enkle å bruke for alle. Zalos verktøy støtter alt fra koding, programmering og forskning til hverdagsaktiviteter som kommunikasjon, oversettelse og bildesøk.
Eksperter mener imidlertid at dette bare er begynnelsen, og at det fortsatt er mange vanskeligheter i AI-transformasjonsprosessen. Dr. Nguyen Truong Son, vitenskapsdirektør ved Zalo AI, sa at vanskelighetene stammer fra sikkerhet, kostnadsproblemer og høye krav fra brukerne. Dette er ikke bare vanskeligheter for Zalo, men også for brukere og bedrifter.
Den første hindringen dreier seg om å velge en AI-modell som sikrer et visst nivå av autonomi. Tredjepartsmodeller tilbyr ofte bedre ytelse og utdatakvalitet, mens interne modeller har fordelen av informasjonskontroll, men er begrenset når det gjelder stabilitet og effektivitet.
![]() ![]() ![]() ![]() |
Informasjon delt av Zalo AI-representanter. |
Videre deler de fleste nåværende modeller felles svakheter som ufullstendig nøyaktighet og inkonsekvent utdata. Mange chatboter har begrenset evne til å forstå og behandle vietnamesisk, og klarer ikke å oppfylle spesifikke krav eller kontekster.
For å løse dette problemet foreslo eksperter hos Zalo flere løsninger, som å bruke avansert modellutviklingsteknologi og kombinere pålitelige datakilder under chatbot-opplæring. Samtidig evaluerte utviklingsteamet modellen kontinuerlig gjennom interne tester.
En annen utfordring ligger i å balansere kostnader, ytelse og sikkerhet. Ifølge Dr. Nguyen Truong Son kan bruk av en liten modell for å håndtere komplekse forespørsler øke behandlingstiden og driftskostnadene, og omvendt.
![]() |
Dr. Nguyen Truong Son, vitenskapsdirektør ved Zalo AI. |
Han argumenterte for at optimalisering kan starte helt fra kommandoinndatafasen. Brukere kan redusere tokenkostnader ved å begrense unødvendig lengde og gi klar og konsis kontekst for chatboten.
På systemnivå implementerer Zalo-teamet ulike løsninger, som å foreslå passende kommandoer og distribuere kontrolllag for å sikre sikkerheten til brukerinformasjon.
Alt i alt anses Vietnam å være godt forberedt på den globale AI-bølgen. Zalo er en av de tidlige deltakerne i denne transformasjonen, og fokuserer på å håndtere utfordringene knyttet til kostnader, kvalitet og sikkerhet ved utrulling av AI i stor skala.
Det harde chipkappløpet
Eksplosjonen av AI er et resultat av fremskritt innen maskinvare eller brikker. Dr. Pham Hy Hieu fra OpenAI understreker at fremveksten av ChatGPT revolusjonerte brikkene, noe som gjorde det mulig for Nvidia å vokse raskt på kort tid.
Da ChatGPT først ble lansert, var driften nesten utelukkende avhengig av Nvidia-brikker. Dette førte til en økning i maskinvarekjøp fra teknologigiganter som Anthropic og Meta.
Spillet er imidlertid ikke bare for Nvidia. Konkurrenter som AMD og Google tilbyr også optimale maskinvareløsninger for utviklere av AI-modellering.
«Styrken av chips og chiprelatert kapital påvirker også økonomiske strømmer, i hvert fall veksten i den amerikanske økonomien.»
Dessuten har selskaper som ønsker å utvikle AI også ambisjoner om å utvikle sine egne brikker fordi kostnadene ved å kjøpe brikker øker, så selv en liten besparelse er en stor fordel. Det er derfor alle selskaper ønsker å være selvforsynte med brikkeressurser, la Hieu til.
![]() |
Dr. Pham Hy Hieu, som representerer OpenAI. |
Markedet for AI-brikker er for tiden delt inn i to hovedkategorier basert på deres tiltenkte bruk. Den første kategorien er treningsbrikker, som krever evnen til å utføre stor matrisemultiplikasjon, jevn dimensjonalitet og høy båndbredde for å koble til tusenvis av brikker samtidig.
Den andre typen er inferensbrikken, som krever et mer beskjedent antall lenker (rundt 50–100 brikker) og fokuserer på små matriseproblemer av uregelmessig størrelse. Inferensbrikker krever imidlertid god effektoptimalisering for bærekraftig drift.
Hvis man ser tilbake på utviklingshistorien, der perioden fra 2019–2023 fokuserte på trening og datakomprimering for GPT-modeller, flyttes fokuset fra 2024 og utover til resonneringsevner. Dette skiftet fører til en etterspørsel etter inferensbrikker.
«Hvilken rolle spiller Vietnam i chipproduksjonen? Selv om chipindustrien er en billionindustri, trenger vi ikke titalls milliarder dollar for å delta. Vietnamesere kan bidra til AI-chiplandskapet på mange måter», delte Hieu.
![]() |
Innsikt fra Dr. Pham Hy Hieu om maskinvare i AI-infrastruktur. |
Representanter for OpenAI foreslo to hovedretninger. I stedet for å konkurrere om å produsere brikker for storskala språkmodeller, kunne Vietnam fokusere på å utvikle lavstrømsbrikker for biler, smarttelefoner eller implanterbare medisinske enheter. Dette er markedssegmenter med betydelig vekstpotensial og lavere investeringskostnader.
For det andre er det integreringen av maskinvare og programvare. Bidrag som Flash Attention 2-algoritmen demonstrerer hvordan en smart kombinasjon av programmering og maskinvare kan skape gjennombrudd uten å kreve massive kapitalinvesteringer.
«Fremtiden ligger i hendene på de som tør å se muligheter, tør å ta risikoer og tør å møte farer», konkluderte Hieu.
Fremragende lag på Zalo AI Challenge 2025
Etter foredragsholdernes presentasjoner ble mange praktiske løsninger for bruk av kunstig intelligens presentert på Zalo AI Challenge 2025. Konkurransen, som ble lansert i slutten av oktober, tiltrakk seg mer enn 1000 deltakende lag.
I år er Zalo AI Challenge delt inn i to kategorier: RoadBuddy (bruker algoritmer for å identifisere trafikkskilt) og AeroEyes (designer AI for droner for å gjenkjenne objekter på bakken). Vinnerlagene vil motta en total pengepremie på 12 000 dollar i tillegg til gaver fra sponsorer.
Ifølge arrangørene var årets eksamensoppgaver praktiske, og viste potensialet til AI utenfor forskningsmiljøer for å løse problemer i den virkelige verden.
I RoadBuddy-utfordringen fokuserte deltakerne på å behandle data fra bilkameraer. Lagene måtte behandle videodatasett som varte i 0–15 sekunder, tatt opp under ulike tidsforhold. AI-modellens oppgave var å nøyaktig identifisere detaljer som veiskilt, trafikklys og kjørefeltmarkeringer som dukket opp i videoen.
![]() ![]() ![]() ![]() |
Deling og utdeling av premier for Zalo AI Challenge 2025. |
Med et datasett bestående av 1500 treningseksempler, 500 offentlige testeksempler og 500 private testeksempler, ble de konkurrerende lagene evaluert basert på to kriterier: nøyaktighet og responstid.
Ifølge Mr. Nguyen Truong Sons vurdering brukte deltakerne avanserte teknikker som Vision Language Model (VLM). Den generelle prosessen innebærer å trekke ut bilder fra video som inndata, og deretter kombinere dem med modeller som Qwen eller YOLO for å identifisere objekter og gi logisk analyse.
I de endelige resultatene tok CtelAI-teamet førsteplassen med en nøyaktighet på 71,3 %, etterfulgt av BitterSweet med 70,5 %.
Med temaet AeroEyes deltok lagene i en kvalifiseringsrunde før de gikk videre til finalen. I finalen måtte kandidatene programmere modeller direkte på droner, etablere flyvebaner og kontrollere kameraer under reelle forhold for å oppdage objekter.
På grunn av oppgavens vanskelighetsgrad var antallet lag som oppfylte kravene ikke høyt, så arrangørene var fleksible og introduserte et tilleggstema. De konkurrerende lagene justerte raskt modellene sine for å oppfylle kravene. Som et resultat vant lag AIO_C3A takket være sin høyeste effektivitet. Andreplassen ble delt av lagene IUH_Alers_K16 og AEB.
Kilde: https://znews.vn/ai-se-di-xa-den-dau-post1613033.html
























Kommentar (0)