La evenimentul tehnologic global Computex 2026, care a avut loc la Taipei, Taiwan, discuțiile din industria semiconductorilor și a calculatoarelor s-au mutat semnificativ de la „Cloud AI” la „Edge AI”. Industria hardware trece printr-o restructurare, pe măsură ce puterea de calcul la nivel de centru de date este integrată în dispozitive personale plasate direct în spațiul de lucru.
Trecerea de la IA receptivă la agenți autonomi (IA cu agenți)
În primele etape ale valului inteligenței artificiale, procesul operațional obișnuit implica trimiterea de solicitări de date către servere cloud precum OpenAI, Google sau Microsoft și primirea de răspunsuri. Cu toate acestea, această arhitectură a relevat numeroase limitări în ceea ce privește latența transmisiei, costurile lățimii de bandă și securitatea datelor sursă.

Nvidia DGX Spark este o linie de computere personale special concepute pentru inteligență artificială și care vor fi distribuite în Vietnam.
Foto: Anh Quân
Dezvoltarea inteligenței artificiale (IA) agentice — o generație de agenți software autonomi capabili să planifice, să raționeze și să interacționeze direct cu sistemele de fișiere locale — impune noi cerințe asupra infrastructurii hardware. În loc să răspundă pasiv, acești agenți acționează ca resurse umane digitale, procesând un flux continuu de informații în timp real. Pentru a asigura integritatea și securitatea datelor, aducerea modelelor de IA în funcțiune offline pe dispozitivele utilizatorilor a devenit o soluție tehnică esențială.
Un exemplu excelent al acestei tendințe este computerul personal DGX Spark AI, prezentat la Computex 2026. Dispozitivul se mândrește cu un design desktop compact, dar oferă performanța unui sistem de supercomputing în miniatură datorită supercipului său unic Nvidia GB10 Grace Blackwell.
Funcționarea independentă a dispozitivului se bazează pe un sistem de memorie unificată LPDDR5X de 128 GB cu lățime de bandă mare. În arhitectura inteligenței artificiale, capacitatea și viteza memoriei determină abilitatea de a procesa modele lingvistice mari (LLM). Acest lucru permite inginerilor de date să ruleze direct modele cu până la 200 de miliarde de parametri chiar pe dispozitiv, în loc să le implementeze pe servere cloud.
În ceea ce privește specificațiile, GPU-ul cu arhitectură Blackwell integrează nuclee Tensor de a 5-a generație (format de precizie FP4), oferind o putere de calcul de 1 petaFLOP. CPU-ul ARM cu 20 de nuclee este responsabil pentru coordonarea datelor dintre sistemul de fișiere local și modelul de inteligență artificială.

Stațiile de lucru care deservesc nevoile de inteligență artificială la marginea întreprinderii vin acum în dimensiuni compacte, ceea ce le face ușor de implementat la diferite scări.
Foto: Anh Quân
La standurile expoziționale, soluțiile de infrastructură pentru această tendință au fost diferențiate în mod clar prin sisteme sincronizate de la producătorii originali și furnizori specializați de soluții de integrare hardware. Un exemplu excelent este Leadtek, care prezintă o gamă de stații de lucru și servere de la sistemele sale certificate Nvidia. Vizând nevoile operaționale locale (interne) ale întreprinderilor mici și mijlocii, stația de lucru AI WinFast WS950 acceptă configurații multi-GPU cu două plăci grafice profesionale Nvidia RTX PRO 6000 Blackwell Workstation Edition, oferind un total de până la 192 GB de memorie GPU GDDR7. La o scară mai mare, sistemul lor de server WinFast GS5855T permite integrarea a până la opt GPU-uri cu arhitectură RTX PRO Blackwell pentru a satisface cerințele sarcinilor intensive de inferență și antrenament AI.
Optimizarea securității și a costurilor de operare.
Operarea inteligenței artificiale la marginea rețelei prin intermediul unui sistem hardware local abordează trei provocări principale ale infrastructurii tehnologice actuale. Prima este securitatea datelor. Toate informațiile de afaceri, codul sursă intern și datele personale sunt stocate și procesate într-un mediu sandbox izolat de internet, limitând riscul de scurgere de date către terți.
Noi soluții de inteligență artificială Edge prezentate la Computex 2026
Următoarea este problema costurilor fixe de calcul. Închirierea infrastructurii cloud, care este facturată în funcție de sumele de token-uri, implică costuri variabile semnificative pe măsură ce se scalează. Operarea pe hardware offline transformă aceste costuri într-o investiție în active fixe, optimizând operațiunile pe termen lung. În cele din urmă, există problema scalabilității locale: prin protocoale de conectivitate de mare viteză, utilizatorii pot conecta sistemele de calcul de la marginea datelor pentru a partaja resurse, scalând capacitățile de procesare a modelării de la marginea datelor la dimensiuni masive.
Sursă: https://thanhnien.vn/ai-roi-dam-may-ve-ban-lam-viec-185260605224532968.htm







