På den globale teknologibegivenheten Computex 2026 som ble holdt i Taipei, Taiwan, flyttet fokuset i diskusjonene i halvleder- og databehandlingsindustrien seg betydelig fra «Cloud AI» til «Edge AI». Maskinvareindustrien gjennomgår en omstrukturering ettersom datakraft på datasenternivå integreres i personlige enheter plassert direkte på arbeidsplassen.
Skiftet fra responsiv AI til autonome agenter (Agent AI)
I de tidlige stadiene av bølgen av kunstig intelligens involverte den vanlige driftsprosessen at brukere sendte inn dataforespørsler til skyservere som OpenAI, Google eller Microsoft og mottok svar. Denne arkitekturen avslørte imidlertid mange begrensninger når det gjaldt overføringsforsinkelse, båndbreddekostnader og sikkerheten til kildedataene.

Nvidia DGX Spark er en serie personlige datamaskiner som er spesielt utviklet for AI og vil bli distribuert i Vietnam.
Bilde: Anh Quân
Utviklingen av Agentic AI – en generasjon av autonome programvareagenter som er i stand til å planlegge, resonnere og samhandle direkte med lokale filsystemer – stiller nye krav til maskinvareinfrastrukturen. I stedet for å respondere passivt, fungerer disse agentene som digitale menneskelige ressurser og behandler en kontinuerlig strøm av informasjon i sanntid. For å sikre dataintegritet og sikkerhet har det blitt en viktig teknisk løsning å få AI-modeller til å operere offline på brukernes enheter.
Et godt eksempel på denne trenden er DGX Spark AI-personlig datamaskin, introdusert på Computex 2026. Enheten har et kompakt skrivebordsdesign, men leverer ytelsen til et miniatyr-superdatasystem takket være den enkle Nvidia GB10 Grace Blackwell Superchip.
Enhetens uavhengige drift er avhengig av et 128 GB LPDDR5X Unified Memory-system med høyhastighetsbåndbredde. I AI-arkitektur bestemmer minnekapasitet og hastighet evnen til å behandle store språkmodeller (LLM-er). Dette lar dataingeniører kjøre modeller med opptil 200 milliarder parametere direkte på selve enheten, i stedet for å distribuere dem på skyservere.
Når det gjelder spesifikasjoner, integrerer Blackwell-arkitekturen GPU-en 5. generasjons Tensor-kjerner (FP4-presisjonsformat) som gir 1 petaFLOP med datakraft. ARM-CPU-en med 20 kjerner er ansvarlig for å koordinere data mellom det lokale filsystemet og AI-modellen.

Arbeidsstasjonene som dekker AI-behovene i bedriftskanten kommer nå i kompakte størrelser, noe som gjør dem enkle å distribuere i ulike skalaer.
Bilde: Anh Quân
På utstillingsstandene ble infrastrukturløsninger for denne trenden tydelig differensiert gjennom synkroniserte systemer fra originale produsenter og spesialiserte leverandører av maskinvareintegrasjonsløsninger. Et godt eksempel er Leadtek, som viser frem en rekke arbeidsstasjoner og servere fra sine Nvidia-sertifiserte systemer. WinFast WS950 AI-arbeidsstasjonen er rettet mot de lokale (interne) driftsbehovene til små og mellomstore bedrifter, og støtter multi-GPU-konfigurasjoner med to profesjonelle Nvidia RTX PRO 6000 Blackwell Workstation Edition-grafikkort, noe som gir totalt opptil 192 GB GDDR7 GPU-minne. I større skala tillater WinFast GS5855T-serversystemet deres integrering av opptil åtte RTX PRO Blackwell-arkitektur-GPU-er for å møte kravene til intensive AI-inferens- og treningsoppgaver.
Optimalisering av sikkerhet og driftskostnader.
Å drive AI i utkanten av nettverket gjennom et lokalt maskinvaresystem løser tre kjerneutfordringer i dagens teknologiske infrastruktur. Den første er datasikkerhet. All forretningsinformasjon, intern kildekode og personopplysninger lagres og behandles i et sandkassemiljø isolert fra internett, noe som begrenser risikoen for datalekkasje til tredjeparter.
Nye Edge AI-løsninger vist frem på Computex 2026
Det neste er spørsmålet om faste databehandlingskostnader. Leie av skyinfrastruktur, som faktureres basert på tokenbeløp, medfører betydelige variable kostnader etter hvert som den skaleres. Drift på offline maskinvare omdanner disse kostnadene til en investering i anleggsmidler, noe som optimaliserer langsiktig drift. Til slutt er det spørsmålet om lokal skalerbarhet: Gjennom høyhastighetstilkoblingsprotokoller kan brukere koble sammen kantdatabehandlingssystemer for å dele ressurser, og skalere kantmodelleringsbehandlingsmuligheter til enorme størrelser.
Kilde: https://thanhnien.vn/ai-roi-dam-may-ve-ban-lam-viec-185260605224532968.htm










