Al Computex 2026, l'evento tecnologico globale tenutosi a Taipei, Taiwan, il focus delle discussioni nei settori dei semiconduttori e dell'informatica si è spostato significativamente dalla "Cloud AI" alla "Edge AI". Il settore hardware sta attraversando una fase di ristrutturazione, poiché la potenza di calcolo tipica dei data center viene integrata nei dispositivi personali collocati direttamente negli ambienti di lavoro.
Il passaggio dall'intelligenza artificiale reattiva agli agenti autonomi (IA agente)
Nelle prime fasi dell'era dell'intelligenza artificiale, il processo operativo comune prevedeva che gli utenti inviassero richieste di dati a server cloud come OpenAI, Google o Microsoft e ricevessero risposte. Tuttavia, questa architettura ha rivelato numerose limitazioni in termini di latenza di trasmissione, costi di banda e sicurezza dei dati di origine.

Nvidia DGX Spark è una linea di personal computer progettati specificamente per l'intelligenza artificiale e sarà distribuita in Vietnam.
Foto: Anh Quân
Lo sviluppo dell'IA agentica, una generazione di agenti software autonomi capaci di pianificare, ragionare e interagire direttamente con i file system locali, sta imponendo nuove esigenze all'infrastruttura hardware. Anziché limitarsi a rispondere passivamente, questi agenti agiscono come risorse umane digitali, elaborando un flusso continuo di informazioni in tempo reale. Per garantire l'integrità e la sicurezza dei dati, rendere i modelli di IA operativi offline sui dispositivi degli utenti è diventata una soluzione tecnica essenziale.
Un esempio lampante di questa tendenza è il personal computer DGX Spark AI, presentato al Computex 2026. Il dispositivo vanta un design compatto da desktop, ma offre le prestazioni di un sistema di supercalcolo in miniatura grazie al suo singolo chip Nvidia GB10 Grace Blackwell Superchip.
Il funzionamento autonomo del dispositivo si basa su un sistema di memoria unificata LPDDR5X da 128 GB con larghezza di banda ad alta velocità. Nell'architettura AI, la capacità e la velocità della memoria determinano la capacità di elaborare modelli linguistici di grandi dimensioni (LLM). Ciò consente agli ingegneri dei dati di eseguire direttamente sul dispositivo modelli con un massimo di 200 miliardi di parametri, anziché distribuirli su server cloud.
In termini di specifiche, la GPU con architettura Blackwell integra core Tensor di quinta generazione (formato di precisione FP4) che forniscono una potenza di calcolo di 1 petaFLOP. La CPU ARM a 20 core è responsabile del coordinamento dei dati tra il file system locale e il modello di intelligenza artificiale.

Le workstation che soddisfano le esigenze di intelligenza artificiale ai margini dell'azienda sono ora disponibili in dimensioni compatte, il che ne facilita l'implementazione su diverse scale.
Foto: Anh Quân
Presso gli stand espositivi, le soluzioni infrastrutturali per questa tendenza si sono chiaramente distinte attraverso sistemi sincronizzati di produttori originali e fornitori specializzati di soluzioni di integrazione hardware. Un esempio lampante è Leadtek, che ha presentato una gamma di workstation e server della sua linea Nvidia-Certified Systems. Pensata per le esigenze operative interne (on-premise) delle piccole e medie imprese, la workstation AI WinFast WS950 supporta configurazioni multi-GPU con due schede grafiche professionali Nvidia RTX PRO 6000 Blackwell Workstation Edition, per un totale di fino a 192 GB di memoria GPU GDDR7. Su scala più ampia, il sistema server WinFast GS5855T consente l'integrazione di un massimo di otto GPU con architettura RTX PRO Blackwell per soddisfare le esigenze di attività intensive di inferenza e addestramento dell'IA.
Ottimizzazione della sicurezza e dei costi operativi.
L'implementazione dell'IA in locale, tramite un sistema hardware dedicato, affronta tre sfide fondamentali dell'infrastruttura tecnologica odierna. La prima è la sicurezza dei dati. Tutte le informazioni aziendali, il codice sorgente interno e i dati personali vengono archiviati ed elaborati in un ambiente sandbox isolato da Internet, limitando il rischio di fughe di dati a terzi.
Nuove soluzioni di Edge AI presentate al Computex 2026
Successivamente, si pone il problema dei costi fissi di elaborazione. L'affitto dell'infrastruttura cloud, il cui costo è calcolato in base alla quantità di token utilizzati, comporta costi variabili significativi man mano che aumenta la scalabilità. L'utilizzo di hardware offline trasforma questi costi in un investimento fisso, ottimizzando le operazioni a lungo termine. Infine, c'è la questione della scalabilità locale: tramite protocolli di connettività ad alta velocità, gli utenti possono collegare sistemi di edge computing per condividere le risorse, scalando le capacità di elaborazione della modellazione edge a dimensioni enormi.
Fonte: https://thanhnien.vn/ai-roi-dam-may-ve-ban-lam-viec-185260605224532968.htm








