
Nylig ble resultatene av AI City Challenge 2025 (AI i smarte byer) kunngjort innenfor rammen av den internasjonale konferansen om datasyn (ICCV 2025) på Hawaii (USA). Etter seieren i 2024 vant VNPTs AI-ingeniørteam i år førsteplassen i kategorien Behandling og gjenkjenning av objekter fra ultravidvinkelkamerabildedata på edge-enheter (edge AI). Problemet krever et AI-system med sanntidsbehandlingshastighet, direkte på kompakte maskinvareenheter, samtidig som det sikrer høy nøyaktighet i gjenkjenningen av objekter fra svært forvrengte bildedata, og oppfyller praktiske behov.
AI City Challenge 2025 er en av verdens mest prestisjefylte årlige konkurranser om kunstig intelligens (KI) brukt i smarte byer. Årets konkurranse inkluderer fire kategorier med høyere kompleksitet enn tidligere sesonger, og tiltrekker seg mer enn 30 000 lag fra land med sterk KI-utvikling, som USA, Kina, Korea, Taiwan osv.
VNPTs ingeniørteam leder an takket være AIs nøyaktighet og prosesseringshastighet i utkanten.
Utfordringen med å forbedre AI-kapasiteter i utkanten
Problemet med å behandle og gjenkjenne objekter fra bildedata fra ultravidvinkelkameraer har vært inkludert i AI City Challenge siden 2024, noe som gjenspeiler trenden med å bruke datasyn til nåværende trafikkovervåkingssystemer. Med høy praktisk anvendelighet er kategorien alltid løpet med det største antallet lag i hele konkurransen. I år økes vanskelighetsgraden på kategorien når lagene, i tillegg til å behandle forvrengte og deformerte bilder nøyaktig, må optimalisere hele prosessen slik at modellen kan fungere effektivt på edge-enheter.
VNPTs ingeniørteam bruker mange teknikker for å raskt og nøyaktig identifisere kjøretøy.
Lagene måtte optimalisere modellene sine for å kjøre effektivt på Jetson Orin, en liten enhet plassert ved datainnsamlingspunktet (kalt en kantenhet), som har en effektgrense på 30 W og mye lavere datakraft enn en sentral server. Dette betydde at lagene ikke kunne bruke altfor store modeller, men måtte effektivisere og optimalisere programmet for å kjøre raskere, bruke mindre ressurser og fortsatt gjenkjenne kjøretøy nøyaktig. Disse endringene gjorde AI City Challenge 2025 til en av de vanskeligste sesongene hittil, spesielt ettersom lagene lærte av fjorårets erfaringer og konkurransenivået økte betydelig.
Dra nytte av erfaring med optimalisering av modeller i den virkelige verden
I trafikkovervåkingsproblemer er datainfrastruktur og nettverkstilkoblinger ofte begrenset, noe som gjør utviklingen av AI-modeller som er både nøyaktige og effektive til en stor utfordring. Dette er også grunnen til at Edge AI har blitt en uunngåelig trend. I stedet for å sende alle data til en sentral server for behandling, plasseres modellen rett ved innsamlingsenheten (for eksempel et kamera), noe som bidrar til å reagere raskere, redusere ventetid, spare båndbredde og sikre datasikkerhet, spesielt i store overvåkingssystemer.
Ifølge resultatene som ble kunngjort på AI City Challenge 2025, kom VNPTs ingeniørteam på førsteplass, og overgikk hundrevis av team fra store teknologiselskaper, forskningsinstitutter og universiteter over hele verden. Denne prestasjonen bidrar til å styrke AI-økosystemet for trafikkovervåking og bysikkerhet i landet, der ultravidvinkelkameraer blir bredt distribuert for å utvide observasjonsområdet, redusere blindsoner, redusere antall installerte enheter og forbedre effektiviteten til driften av byinfrastruktur. Med mer enn syv års erfaring med å utvikle AI-modeller for bildebehandling og distribuere dem innenlands, har VNPTs ingeniørteam samlet evnen til å balansere nøyaktighet, hastighet og driftskostnader – faktorer som bestemmer effektiviteten av å bruke AI i reelle miljøer.

VNPT-teamet har utviklet og mestret mer enn 40 AI-modeller for bildebehandling.
For tiden har VNPT-teamet utviklet og mestret mer enn 40 forskjellige AI-modeller for bildebehandling, som registreringsskilt, måling av trafikkflyt, hjelmdeteksjon, samt modeller spesifikke for Vietnam, som å oppdage kjøretøy som frakter tre personer, transportere store varer eller oppdage branner og våpen innen sikkerhet og byovervåking. Disse modellene er optimalisert for å operere på en rekke maskinvare, fra GPU-er, CPU-er til NPU-er, og oppfyller de ulike kravene til systemer og kunder.
For å kunne distribueres effektivt i stor skala, spesielt i den lokale modellen og i utkanten av infrastrukturen med hundrevis av kameraer samtidig, har VNPT-ingeniører også bygget optimale behandlingsmetoder som tillater samtidig drift av hundrevis av videodatastrømmer . Denne tilnærmingen gjør AI-løsninger enkle å skalere, sparer ressurser og er egnet for infrastrukturforhold på mange steder.
Ved å anvende denne erfaringen i AI City Challenge 2025, brukte teamet en kombinasjon av teknikker som modellkomprimering for å redusere størrelse og prosesseringsressurser, optimalisering av bildebehandlingsflyt for å redusere latens, og forbedring av programmeringsspråk og kodestruktur for å danne den overordnede prosesseringskjeden for høyest mulig ytelse. Denne tilnærmingen hjelper modellen med å opprettholde nøyaktighet samtidig som den øker slutningshastigheten og distribusjonen på maskinvarebegrensede kantenheter.
Tverrfaglig dyp læringsplattform for AI-forskning
VNPT har ikke bare et team av unge, talentfulle medarbeidere og en sterk datainfrastruktur, men en av de viktigste forutsetningene for at VNPT skal ha et omfattende AI-produktøkosystem som oppfyller internasjonale standarder og vinner høye priser i prestisjetunge konkurranser, er den dyptgående AI-forskningsplattformen på mange felt.
Når det gjelder AI-applikasjoner innen bildebehandling, fremmer VNPT, i tillegg til smarte by- og trafikksystemer, også forskningsapplikasjoner innen det medisinske feltet. I september 2025 annonserte gruppen vitenskapelig forskning på MICCAI 2025 – verdens ledende konferanse om AI og datasyn innen medisin. Forskningen fokuserte på AI-applikasjoner innen diagnostisering av skjoldbruskkreft, utført med data fra nesten 10 000 pasienter i tre regioner i landet over fire år. Prosjektet spiller en grunnleggende rolle i å utvikle automatiske diagnostiske støttesystemer som er egnet for befolkningskarakteristikker og medisinske tilstander i landet, og bidrar til å forbedre nøyaktigheten, forkorte diagnosetiden, redusere arbeidsmengden for leger og utvide tilgangen til medisinske tjenester av høy kvalitet til grasrotnivå.
VNPTs AI-ingeniørteam publiserte forskning på mange prestisjetunge vitenskapelige konferanser.
Innen språk- og talebehandling annonserte VNPT også forskning på EMNLP 2025 – en A*-rangert AI-konferanse om naturlig språkbehandling, og ICASSP 2025 – en A1-rangert konferanse om talebehandling. Disse arbeidene anvender avanserte maskinlæringsteknikker i utviklingen av store språkmodeller (LLM) og generativ AI, med sikte på å forbedre AI-modellers evne til å forstå vietnamesisk kontekst, følelser og nyanser – som er komplekse faktorer og sjelden modellert i internasjonale korpus. Takket være dette er det vietnamesiske språket i økende grad tilstede i det globale NLP-forskningsmiljøet, noe som åpner for muligheten for å bygge sterke, unike og passende språkmodeller for vietnamesere.
Kilde: https://vnpt.com.vn/gioi-thieu/tin-tuc/nhom-ky-su-tre-viet-nam-hai-nam-lien-tiep-dung-dau-san-choi-ai-toan-cau.html






Kommentar (0)