De când a explodat valul de inteligență artificială, unitatea de procesare grafică (GPU) de la Nvidia a fost cel mai mare punct de interes al lumii tehnologice în ceea ce privește infrastructura inteligenței artificiale.
Capitalizarea de piață a Nvidia, costul capitalului pentru furnizorii de servicii cloud sau viteza de antrenament a companiilor de dezvoltare a modelelor - toate se reduc în cele din urmă la o singură ecuație: cine are mai multe GPU-uri se apropie de asigurarea unui loc în următoarea rundă a cursei IA.
Totuși, la Computex 2026, noua poveste spusă de fondatorul Nvidia, Jensen Huang, nu se mai învârte exclusiv în jurul GPU-urilor.
Revenirea procesorului
Nvidia și-a anunțat intrarea pe piața procesoarelor pentru PC cu RTX Spark. Așteptată să fie lansată în această toamnă, noua linie de procesoare va concura direct cu Intel și AMD.
Totuși, ceea ce a atras atenția lumii tehnologiei a fost Vera – prima linie de procesoare pentru centre de date dezvoltate de Nvidia, care a fost lansată oficial. Domnul Huang a afirmat chiar că acesta va fi noul motor major de creștere al companiei, vizând o piață de procesoare de 200 de miliarde de dolari .
![]() |
Vera – primul procesor personalizat de la Nvidia, conceput special pentru orchestrarea inteligenței artificiale Agentic, a apelurilor de instrumente și a gestionării contextului pe termen lung. Fotografie: Nvidia. |
Așteptările CEO-ului Nvidia nu sunt nefondate. Odată cu explozia agenților de inteligență artificială, deținerea multor GPU-uri nu mai este suficientă.
GPU-ul joacă în continuare un rol esențial în procesul de inferență a modelului, dar înainte și după fiecare inferență, sistemul are nevoie de CPU pentru a gestiona programarea, apelurile de instrumente și fluxul de date.
Acesta este și motivul pentru care procesoarele (CPU) devin noul punct central al infrastructurii IA. În primele etape ale boom-ului generativ al IA, accentul industriei s-a concentrat aproape în întregime pe antrenarea modelelor.
Antrenamentul necesită procesarea unei serii de calcule matriceale paralele masive – acesta fiind punctul forte absolut al GPU-urilor. În acest caz, procesorul joacă doar un rol de suport, cum ar fi inițializarea sistemului, transportul datelor și gestionarea sarcinilor.
Prin urmare, în ultimii ani, optimizarea completă a GPU-ului și minimizarea CPU-ului au devenit aproape consensul întregii industrii tehnologice.
Totuși, pe măsură ce IA trece de la antrenamentul modelelor lingvistice la scară largă la inferența la scară largă și continuă în era IA cu agenți, natura volumului de muncă începe să se schimbe.
Agenții IA nu sunt sisteme liniare de întrebări și răspunsuri. În schimb, ei împart o sarcină complexă în mai mulți pași, inclusiv apelarea instrumentelor externe, citirea și scrierea în baze de date, efectuarea de căutări, executarea codului, gestionarea autentificării și gestionarea memorării în cache a contextului.
Sistemul evaluează apoi dacă rezultatul curent este valid înainte de a decide asupra următoarei acțiuni. O singură solicitare a utilizatorului poate declanșa simultan zeci, chiar sute, de agenți copii care lucrează în paralel.
![]() |
Arhitectura procesorului Vera. Imagine: Nvidia. |
Coordonarea, apelarea instrumentelor, gestionarea memoriei și colaborarea dintre acești agenți copii nu sunt în mare parte efectuate pe GPU.
GPU-ul poate gestiona în continuare inferența modelului – cel mai apropiat lucru de „gândire”. Dar între inferențe, CPU-ul trebuie să analizeze rezultatul modelului, să decidă ce instrument să apeleze în continuare, să gestioneze planul de execuție, să gestioneze citirile și scrierile fișierelor, să inițieze cereri de rețea și, în final, să livreze rezultatele înapoi către GPU.
Următoarea nebunie globală
Anterior, configurația standard a serverului AI consta de obicei dintr-un procesor asociat cu opt dintre cele mai recente GPU-uri. Cu toate acestea, pe măsură ce sarcinile de lucru AI trec de la antrenament la inferență și apoi la agenți AI, raportul CPU-GPU scade de la 1:8 la 1:4, iar în viitor ar putea ajunge la 1:1 sau chiar mai mult.
De aceea, Lisa Su, CEO-ul AMD, a subliniat în repetate rânduri că industria tehnologică a subestimat anterior valoarea procesoarelor în era inteligenței artificiale.
Din perspectiva ei, piața centrelor de date ar putea depăși 1 trilion de dolari în următorii 3-4 ani. Această piață enormă necesită coexistența mai multor tehnologii, cum ar fi procesoarele, GPU-urile și circuitele ASIC.
În urmă cu doar 6-12 luni, procesoarele erau rareori menționate pe piață și nimeni nu credea că vor deveni rare. Cu toate acestea, odată cu explozia cererii de putere de calcul, procesoarele au revenit oficial în centrul atenției.
Directorul general al AMD estimează că, în următorii cinci ani, rata anuală compusă de creștere a pieței procesoarelor pentru centre de date va depăși 35%, depășind cu mult rata de creștere de sub 10% din anii precedenți.
În loc să se angajeze într-un război al prețurilor cu Intel sau AMD, strategia reală a Nvidia este de a elimina complet impactul negativ asupra procesoarelor aftermarket, lățimii de bandă PCIe și rețelelor de viteză redusă care limitează performanța GPU-urilor.
![]() |
CEO-ul Nvidia ține în mână două laptopuri cu procesoare RTX Spark la Computex 2026, marcând revenirea companiei pe piața procesoarelor pentru PC. Foto: Nvidia . |
Gigantul plăcilor grafice dorește să internalizeze procesorul, făcându-l să se potrivească perfect în platforma sa proprie de inteligență artificială pentru a se asigura că cele mai bune GPU-uri ale sale nu sunt împiedicate.
Urmând această direcție, Nvidia a lansat Vera – primul procesor personalizat conceput special pentru orchestrarea inteligenței artificiale Agentic, a apelurilor de instrumente și a gestionării contextului pe termen lung.
Totuși, realitatea este că cel mai mare beneficiar al acestei explozii a procesoarelor nu este altul decât fostul gigant Intel. Rapoartele financiare arată că veniturile Intel în primul trimestru al anului 2026 au ajuns la 13,6 miliarde de dolari , o creștere de 7% față de anul precedent, în timp ce profitul net a crescut cu 156%.
Directorul general al Intel, Lip-Bu Tan, a declarat că liniile de produse Xeon 6 (bazată pe procesul Intel 3) și Core 3 (bazată pe procesul Intel 18A) au intrat ambele în faza de accelerare a producției de masă.
Cu toate acestea, el a recunoscut, de asemenea, că Intel încă nu este capabilă să satisfacă pe deplin cererea pieței și că se așteaptă ca această tendință de creștere să continue până în 2027.
Sursă: https://znews.vn/mo-vang-tiep-theo-cua-nvidia-post1657130.html










