Dall'esplosione dell'intelligenza artificiale, le unità di elaborazione grafica (GPU) di Nvidia sono diventate il principale punto di riferimento del mondo tecnologico per quanto riguarda le infrastrutture di intelligenza artificiale.
La capitalizzazione di mercato di Nvidia, il costo del capitale per i fornitori di servizi cloud o la velocità di addestramento delle aziende di sviluppo di modelli: in definitiva, tutto si riduce a un'unica equazione: chi possiede più GPU si avvicina di più a conquistare un posto nel prossimo round della corsa all'intelligenza artificiale.
Tuttavia, al Computex 2026, la nuova storia raccontata dal fondatore di Nvidia, Jensen Huang, non ruota più esclusivamente attorno alle GPU.
Il ritorno della CPU
Nvidia ha annunciato il suo ingresso nel mercato dei processori per PC con la serie RTX Spark. Il lancio della nuova linea di chip è previsto per questo autunno e la serie si confronterà direttamente con Intel e AMD.
Tuttavia, ciò che ha catturato l'attenzione del mondo tecnologico è stata Vera, la prima linea di CPU per data center sviluppate internamente da Nvidia, lanciata ufficialmente. Il signor Huang ha addirittura affermato che questa sarebbe diventata la nuova principale forza trainante della crescita dell'azienda, puntando a un mercato delle CPU da 200 miliardi di dollari .
![]() |
Vera – la prima CPU personalizzata di Nvidia progettata specificamente per orchestrare l'IA agente, le chiamate agli strumenti e la gestione del contesto a lungo termine. Foto: Nvidia. |
Le aspettative del CEO di Nvidia non sono infondate. Con l'esplosione degli agenti di intelligenza artificiale, possedere molte GPU non è più sufficiente.
La GPU continua a svolgere un ruolo fondamentale nel processo di inferenza del modello, ma prima e dopo ogni inferenza, il sistema necessita della CPU per gestire la pianificazione, le chiamate agli strumenti e il flusso di dati.
Questo è anche il motivo per cui le CPU si stanno affermando come il nuovo punto focale dell'infrastruttura di intelligenza artificiale. Nelle prime fasi del boom dell'IA generativa, l'attenzione del settore era quasi interamente concentrata sull'addestramento dei modelli.
L'addestramento richiede l'elaborazione di una serie di calcoli matriciali paralleli di grandi dimensioni, che rappresentano il punto di forza assoluto delle GPU. In questo caso, la CPU svolge solo un ruolo di supporto, come l'inizializzazione del sistema, il trasferimento dei dati e la gestione delle attività.
Di conseguenza, negli ultimi anni, ottimizzare completamente la GPU e ridurre al minimo l'utilizzo della CPU è diventato quasi un principio condiviso dall'intero settore tecnologico.
Tuttavia, con il passaggio dell'IA dall'addestramento di modelli linguistici su larga scala all'inferenza su larga scala, e con l'avvento dell'IA basata su agenti, la natura del carico di lavoro inizia a cambiare.
Gli agenti di intelligenza artificiale non sono sistemi lineari di domande e risposte. Al contrario, scompongono un compito complesso in più fasi, tra cui la chiamata di strumenti esterni, la lettura e la scrittura su database, l'esecuzione di ricerche, l'esecuzione di codice, la gestione dell'autenticazione e la gestione della cache di contesto.
Il sistema valuta quindi se il risultato corrente è valido prima di decidere l'azione successiva. Una singola richiesta dell'utente può attivare simultaneamente decine, persino centinaia, di agenti secondari che lavorano in parallelo.
![]() |
Architettura della CPU Vera. Immagine: Nvidia. |
Il coordinamento, la chiamata degli strumenti, la gestione della memoria e la collaborazione tra questi agenti secondari non vengono eseguiti in gran parte sulla GPU.
La GPU è ancora in grado di gestire l'inferenza del modello, ovvero l'attività più simile al "pensiero". Tuttavia, tra un'inferenza e l'altra, la CPU deve analizzare l'output del modello, decidere quale strumento richiamare successivamente, gestire il piano di esecuzione, occuparsi della lettura e scrittura dei file, avviare le richieste di rete e, infine, inviare i risultati alla GPU.
La prossima mania globale
In precedenza, la configurazione standard di un server di intelligenza artificiale consisteva tipicamente in una CPU abbinata a otto GPU di ultima generazione. Tuttavia, con il passaggio dei carichi di lavoro di intelligenza artificiale dall'addestramento all'inferenza e poi agli agenti di intelligenza artificiale, il rapporto CPU-GPU si sta spostando da 1:8 a 1:4 e in futuro potrebbe raggiungere 1:1 o addirittura essere superiore.
Questo è anche il motivo per cui Lisa Su, CEO di AMD, ha ripetutamente sottolineato come l'industria tecnologica in passato abbia sottovalutato il valore delle CPU nell'era dell'intelligenza artificiale.
Dal suo punto di vista, il solo mercato dei data center potrebbe superare i 1.000 miliardi di dollari entro i prossimi 3-4 anni. Questo enorme mercato richiede la coesistenza di molteplici tecnologie come CPU, GPU e ASIC.
Solo 6-12 mesi fa, le CPU erano raramente menzionate sul mercato e nessuno pensava che sarebbero diventate rare. Tuttavia, con l'esplosione della domanda di potenza di calcolo, le CPU sono ufficialmente tornate al centro della scena.
L'amministratore delegato di AMD prevede che nei prossimi cinque anni il tasso di crescita annuo composto del mercato delle CPU per data center supererà il 35%, superando di gran lunga il tasso di crescita inferiore al 10% registrato negli anni precedenti.
Anziché impegnarsi in una guerra dei prezzi con Intel o AMD, la vera strategia di Nvidia è quella di eliminare completamente i fattori limitanti rappresentati dalle CPU di terze parti, dalla larghezza di banda PCIe e dalle reti a bassa velocità che ostacolano le prestazioni delle GPU.
![]() |
Il CEO di Nvidia tiene in mano due laptop dotati di chip RTX Spark al Computex 2026, a segnare il ritorno dell'azienda nel mercato dei chip per PC. Foto: Nvidia . |
Il colosso delle schede grafiche vuole internalizzare la CPU, rendendola perfettamente compatibile con la sua piattaforma AI proprietaria, per garantire che le sue migliori GPU non vengano limitate nelle prestazioni.
Seguendo questa direzione, Nvidia ha lanciato Vera, la prima CPU personalizzata progettata specificamente per orchestrare l'IA agentica, le chiamate agli strumenti e la gestione del contesto a lungo termine.
Tuttavia, la realtà è che il principale beneficiario di questo boom delle CPU non è altri che l'ex gigante Intel. I bilanci mostrano che i ricavi di Intel nel primo trimestre del 2026 hanno raggiunto i 13,6 miliardi di dollari , con un aumento del 7% rispetto all'anno precedente, mentre l'utile netto è balzato del 156%.
Il CEO di Intel, Lip-Bu Tan, ha dichiarato che le linee di prodotti Xeon serie 6 (basate sul processo Intel 3) e Core serie 3 (basate sul processo Intel 18A) sono entrambe entrate nella fase di accelerazione della produzione di massa.
Tuttavia, ha anche riconosciuto che Intel non è ancora in grado di soddisfare pienamente la domanda del mercato e che si prevede che questo trend di crescita continuerà fino al 2027.
Fonte: https://znews.vn/mo-vang-tiep-theo-cua-nvidia-post1657130.html









