Tijdens het wereldwijde technologie-evenement Computex 2026 in Taipei, Taiwan, verschoof de focus van de discussies in de halfgeleider- en computerindustrie aanzienlijk van "Cloud AI" naar "Edge AI". De hardware-industrie ondergaat een herstructurering doordat rekenkracht op datacenterniveau wordt geïntegreerd in persoonlijke apparaten die direct op de werkplek worden geplaatst.
De verschuiving van responsieve AI naar autonome agenten (Agent AI)
In de beginfase van de kunstmatige intelligentie-golf bestond het gebruikelijke werkproces uit het indienen van dataverzoeken door gebruikers bij cloudservers zoals OpenAI, Google of Microsoft, waarna zij antwoorden ontvingen. Deze architectuur bleek echter veel beperkingen te hebben met betrekking tot transmissievertraging, bandbreedtekosten en de beveiliging van de brongegevens.

De Nvidia DGX Spark is een serie pc's die speciaal ontworpen zijn voor AI en die in Vietnam gedistribueerd zullen worden.
Foto: Anh Quân
De ontwikkeling van Agentic AI – een generatie autonome softwareagenten die in staat zijn tot plannen, redeneren en rechtstreeks interageren met lokale bestandssystemen – stelt nieuwe eisen aan de hardware-infrastructuur. In plaats van passief te reageren, fungeren deze agenten als digitale menselijke hulpbronnen en verwerken ze een continue stroom informatie in realtime. Om de data-integriteit en -beveiliging te waarborgen, is het een essentiële technische oplossing geworden om AI-modellen offline op de apparaten van gebruikers te laten werken.
Een uitstekend voorbeeld van deze trend is de DGX Spark AI-pc, die werd geïntroduceerd op Computex 2026. Het apparaat heeft een compact desktopontwerp, maar levert de prestaties van een miniatuur-supercomputer dankzij de enkele Nvidia GB10 Grace Blackwell Superchip.
De onafhankelijke werking van het apparaat is gebaseerd op een 128 GB LPDDR5X Unified Memory-systeem met een hoge bandbreedte. In AI-architectuur bepalen de geheugencapaciteit en -snelheid het vermogen om grote taalmodellen (LLM's) te verwerken. Hierdoor kunnen data-engineers modellen met maximaal 200 miljard parameters rechtstreeks op het apparaat zelf uitvoeren, in plaats van ze op cloudservers te implementeren.
Qua specificaties integreert de Blackwell-architectuur GPU 5e generatie Tensor-cores (FP4-precisieformaat) die 1 petaFLOP aan rekenkracht leveren. De 20-core ARM-CPU is verantwoordelijk voor de coördinatie van gegevens tussen het lokale bestandssysteem en het AI-model.

De werkstations die voorzien in de AI-behoeften aan de rand van bedrijfsnetwerken zijn nu verkrijgbaar in compacte formaten, waardoor ze eenvoudig op verschillende schaal kunnen worden ingezet.
Foto: Anh Quân
Op de beursstands werden infrastructuuroplossingen voor deze trend duidelijk onderscheiden door middel van gesynchroniseerde systemen van originele fabrikanten en gespecialiseerde leveranciers van hardware-integratieoplossingen. Een goed voorbeeld hiervan is Leadtek, dat een reeks werkstations en servers van hun Nvidia-gecertificeerde systemen presenteerde. Het WinFast WS950 AI-werkstation, gericht op de interne (on-premises) operationele behoeften van kleine en middelgrote ondernemingen, ondersteunt multi-GPU-configuraties met twee professionele Nvidia RTX PRO 6000 Blackwell Workstation Edition-grafische kaarten, goed voor een totaal van maximaal 192 GB GDDR7 GPU-geheugen. Op grotere schaal biedt hun WinFast GS5855T-serversysteem de integratie van maximaal acht RTX PRO Blackwell-architectuur-GPU's om te voldoen aan de eisen van intensieve AI-inferentie- en trainingstaken.
Optimalisatie van beveiliging en operationele kosten.
Het inzetten van AI aan de rand van het netwerk via een lokaal hardwaresysteem pakt drie kernuitdagingen van de huidige technologische infrastructuur aan. Ten eerste gegevensbeveiliging. Alle bedrijfsgegevens, interne broncode en persoonsgegevens worden opgeslagen en verwerkt in een sandbox-omgeving die is afgesloten van het internet, waardoor het risico op datalekken naar derden wordt beperkt.
Nieuwe Edge AI-oplossingen gepresenteerd op Computex 2026
Vervolgens is er de kwestie van de vaste computerkosten. Het huren van cloudinfrastructuur, waarvoor tokenbedragen in rekening worden gebracht, brengt aanzienlijke variabele kosten met zich mee naarmate de infrastructuur groeit. Door offline hardware te gebruiken, worden deze kosten omgezet in een investering in vaste activa, wat de bedrijfsvoering op de lange termijn optimaliseert. Ten slotte is er de kwestie van lokale schaalbaarheid: via snelle verbindingsprotocollen kunnen gebruikers edge computing-systemen koppelen om resources te delen, waardoor de verwerkingscapaciteit van edge-modellen enorm kan worden opgeschaald.
Bron: https://thanhnien.vn/ai-roi-dam-may-ve-ban-lam-viec-185260605224532968.htm








