Siden AI-bølgen eksploderede, har Nvidias grafikprocessor (GPU) været det største fokus i tech-verdenen med hensyn til AI-infrastruktur.
Nvidias markedsværdi, kapitalomkostningerne for cloud-udbydere eller træningshastigheden hos modeludviklingsvirksomheder – alt sammen koger i sidste ende ned til én ligning: Den, der har flere GPU'er, kommer tættere på at sikre sig en plads i næste runde af AI-kapløbet.
På Computex 2026 drejer den nye historie, som Nvidia-grundlægger Jensen Huang fortæller, sig dog ikke længere udelukkende om GPU'er.
CPU'ens tilbagevenden
Nvidia har annonceret sin indtræden på markedet for pc-processorer med RTX Spark. Den nye chiplinje, der forventes at blive lanceret i efteråret, vil konkurrere direkte med Intel og AMD.
Det, der dog fangede teknologiverdenens opmærksomhed, var Vera – Nvidias første serie af egenudviklede datacenter-CPU'er, som officielt blev lanceret. Huang hævdede endda, at dette ville blive virksomhedens nye store vækstmotor med et CPU-marked på 200 milliarder dollars i sigte.
![]() |
Vera – Nvidias første brugerdefinerede CPU, der er specielt designet til at orkestrere Agentic AI, værktøjskald og langsigtet kontekststyring. Foto: Nvidia. |
Nvidias administrerende direktørs forventninger er ikke ubegrundede. Med eksplosionen af AI-agenter er det ikke længere nok at eje mange GPU'er.
GPU'en spiller stadig en central rolle i modelinferensprocessen, men før og efter hver inferens har systemet brug for CPU'en til at håndtere planlægning, værktøjskald og dataflow.
Det er også derfor, at CPU'er fremstår som det nye fokuspunkt for AI-infrastruktur. I de tidlige stadier af AI-generationsboomet var branchens fokus næsten udelukkende på modeltræning.
Træning kræver behandling af en række massive parallelle matrixberegninger – hvilket er GPU'ers absolutte styrke. I dette tilfælde spiller CPU'en kun en understøttende rolle, såsom at initialisere systemet, transportere data og administrere opgaver.
Som følge heraf er det i de seneste par år næsten blevet konsensus i hele teknologibranchen at optimere GPU'en fuldstændigt og minimere CPU'en.
Men i takt med at AI skifter fra storstilet sprogmodeltræning til storstilet inferens og fortsætter ind i Agent AI's æra, begynder arbejdsbyrden at ændre sig.
AI-agenter er ikke lineære spørgsmål-og-svar-systemer. I stedet opdeler de en kompleks opgave i flere trin, herunder kald af eksterne værktøjer, læsning og skrivning til databaser, udførelse af søgninger, udførelse af kode, håndtering af godkendelse og administration af kontekstcaching.
Systemet evaluerer derefter, om det aktuelle resultat er gyldigt, før det beslutter sig for den næste handling. En enkelt brugeranmodning kan samtidig udløse snesevis, ja endda hundredvis, af underordnede agenter, der arbejder parallelt.
![]() |
Arkitekturen af Vera CPU'en. Billede: Nvidia. |
Koordineringen, værktøjskald, hukommelsesstyring og samarbejde mellem disse underordnede agenter udføres stort set ikke på GPU'en.
GPU'en kan stadig håndtere modelinferens – det tætteste man kommer på "tænkning". Men mellem inferenserne skal CPU'en analysere modellens output, beslutte hvilket værktøj der skal kaldes næste gang, administrere udførelsesplanen, håndtere fillæsninger og -skrivninger, initiere netværksanmodninger og endelig levere resultaterne tilbage til GPU'en.
Den næste globale dille
Tidligere bestod standardkonfigurationen af AI-servere typisk af én CPU parret med otte af de nyeste GPU'er. Men efterhånden som AI-arbejdsbelastninger skifter fra træning til inferens og derefter til AI-agenter, bevæger CPU-til-GPU-forholdet sig fra 1:8 ned til 1:4, og i fremtiden kan det nå 1:1 eller endda højere.
Det er også derfor, at AMD's administrerende direktør, Lisa Su, gentagne gange har understreget, at tech-industrien tidligere undervurderede værdien af CPU'er i AI-æraen.
Fra hendes perspektiv kan datacentermarkedet alene overstige 1 billion dollars inden for de næste 3-4 år. Dette enorme marked kræver sameksistens af flere teknologier såsom CPU'er, GPU'er og ASIC'er.
For bare 6-12 måneder siden var CPU'er sjældent nævnt på markedet, og ingen troede, at de ville blive mangelvare. Men med den eksplosive efterspørgsel efter computerkraft er CPU'er officielt vendt tilbage til centrum.
AMDs administrerende direktør forudsiger, at den årlige vækstrate for markedet for datacenter-CPU'er vil overstige 35 % i løbet af de næste fem år, hvilket langt overstiger vækstraten på under 10 % i de foregående år.
I stedet for at gå i priskrig med Intel eller AMD, er Nvidias virkelige strategi fuldstændigt at eliminere belastningen fra eftermarkeds-CPU'er, PCIe-båndbredde og lavhastighedsnetværk, der hæmmer GPU-ydeevnen.
![]() |
Nvidias administrerende direktør holder to bærbare computere drevet af RTX Spark-chips på Computex 2026, hvilket markerer virksomhedens tilbagevenden til pc-chipmarkedet. Foto: Nvidia . |
Grafikkortgiganten ønsker at internalisere CPU'en, hvilket gør den til et perfekt match i sin proprietære AI-platform for at sikre, at deres bedste GPU'er ikke holdes tilbage.
I overensstemmelse med denne retning lancerede Nvidia Vera – den første brugerdefinerede CPU, der er specifikt designet til at orkestrere Agentic AI, værktøjskald og langsigtet kontekststyring.
Realiteten er dog, at den største modtager af dette CPU-boom er ingen ringere end den tidligere gigant Intel. Finansielle rapporter viser, at Intels omsætning i første kvartal af 2026 nåede 13,6 milliarder dollars , en stigning på 7 % i forhold til året før, mens nettoresultatet steg med 156 %.
Intels administrerende direktør, Lip-Bu Tan, udtalte, at produktlinjerne Xeon 6-serien (baseret på Intel 3-processen) og Core 3-serien (baseret på Intel 18A-processen) begge er gået ind i accelerationsfasen for masseproduktion.
Han erkendte dog også, at Intel stadig ikke er i stand til fuldt ud at imødekomme markedets efterspørgsel, og at denne væksttendens forventes at fortsætte indtil 2027.
Kilde: https://znews.vn/mo-vang-tiep-theo-cua-nvidia-post1657130.html









