Desde que a onda da IA explodiu, a unidade de processamento gráfico (GPU) da Nvidia tem sido o principal foco do mundo da tecnologia no que diz respeito à infraestrutura de IA.
A capitalização de mercado da Nvidia, o custo de capital para provedores de serviços em nuvem ou a velocidade de treinamento de empresas de desenvolvimento de modelos — tudo se resume, em última análise, a uma única equação: quem tiver mais GPUs estará mais perto de garantir uma vaga na próxima rodada da corrida da IA.
No entanto, na Computex 2026, a nova história contada pelo fundador da Nvidia, Jensen Huang, não gira mais em torno exclusivamente de GPUs.
O retorno da CPU
A Nvidia anunciou sua entrada no mercado de processadores para PC com o RTX Spark. Com lançamento previsto para este outono (do hemisfério norte), a nova linha de chips competirá diretamente com a Intel e a AMD.
No entanto, o que chamou a atenção do mundo da tecnologia foi o Vera – a primeira linha de CPUs para data centers desenvolvida pela própria Nvidia, que foi lançada oficialmente. O Sr. Huang chegou a afirmar que esse seria o novo principal motor de crescimento da empresa, visando um mercado de CPUs de US$ 200 bilhões .
![]() |
Vera – a primeira CPU personalizada da Nvidia projetada especificamente para orquestrar IA Agética, chamadas de ferramentas e gerenciamento de contexto de longo prazo. Foto: Nvidia. |
As expectativas do CEO da Nvidia não são infundadas. Com a explosão de agentes de IA, possuir muitas GPUs já não é suficiente.
A GPU ainda desempenha um papel fundamental no processo de inferência de modelos, mas antes e depois de cada inferência, o sistema precisa da CPU para lidar com o agendamento, as chamadas de ferramentas e o fluxo de dados.
É por isso também que as CPUs estão emergindo como o novo ponto focal da infraestrutura de IA. Nos estágios iniciais do boom da IA generativa, o foco da indústria era quase inteiramente no treinamento de modelos.
O treinamento exige o processamento de uma série de cálculos matriciais paralelos massivos – que é o ponto forte das GPUs. Nesse caso, a CPU desempenha apenas um papel de apoio, como inicializar o sistema, transportar dados e gerenciar tarefas.
Como resultado, nos últimos anos, otimizar totalmente a GPU e minimizar o uso da CPU tornou-se praticamente um consenso em toda a indústria de tecnologia.
No entanto, à medida que a IA passa do treinamento de modelos de linguagem em larga escala para a inferência em larga escala, e continua na era da IA orientada a agentes, a natureza da carga de trabalho começa a mudar.
Os agentes de IA não são sistemas lineares de perguntas e respostas. Em vez disso, eles dividem uma tarefa complexa em várias etapas, incluindo a chamada de ferramentas externas, leitura e gravação em bancos de dados, realização de buscas, execução de código, tratamento de autenticação e gerenciamento de cache de contexto.
Em seguida, o sistema avalia se o resultado atual é válido antes de decidir a próxima ação. Uma única solicitação do usuário pode acionar simultaneamente dezenas, até mesmo centenas, de agentes filhos trabalhando em paralelo.
![]() |
Arquitetura da CPU Vera. Imagem: Nvidia. |
A coordenação, a chamada de ferramentas, o gerenciamento de memória e a colaboração entre esses agentes filhos não são, em grande parte, realizados na GPU.
A GPU ainda consegue lidar com a inferência de modelos – o mais próximo que se pode chegar de "pensar". Mas, entre as inferências, a CPU precisa analisar a saída do modelo, decidir qual ferramenta chamar em seguida, gerenciar o plano de execução, lidar com leituras e gravações de arquivos, iniciar solicitações de rede e, finalmente, enviar os resultados de volta para a GPU.
A próxima febre global
Anteriormente, a configuração padrão de um servidor de IA consistia tipicamente em uma CPU emparelhada com oito das GPUs mais recentes. No entanto, à medida que as cargas de trabalho de IA migram do treinamento para a inferência e, em seguida, para agentes de IA, a proporção CPU-GPU está diminuindo de 1:8 para 1:4 e, no futuro, poderá atingir 1:1 ou até mesmo ser maior.
É por isso também que a CEO da AMD, Lisa Su, tem enfatizado repetidamente que a indústria de tecnologia subestimou anteriormente o valor das CPUs na era da IA.
Na perspectiva dela, o mercado de data centers, por si só, poderá ultrapassar US$ 1 trilhão nos próximos 3 a 4 anos. Esse mercado gigantesco exige a coexistência de múltiplas tecnologias, como CPUs, GPUs e ASICs.
Há apenas 6 a 12 meses, as CPUs eram raramente mencionadas no mercado, e ninguém imaginava que se tornariam escassas. No entanto, com a explosão da demanda por poder computacional, as CPUs voltaram oficialmente ao centro das atenções.
O CEO da AMD prevê que, nos próximos cinco anos, a taxa de crescimento anual composta do mercado de CPUs para data centers ultrapassará os 35%, superando em muito a taxa de crescimento de menos de 10% registrada nos anos anteriores.
Em vez de entrar em uma guerra de preços com a Intel ou a AMD, a verdadeira estratégia da Nvidia é eliminar completamente o impacto negativo de CPUs de terceiros, da largura de banda PCIe e das redes de baixa velocidade que estão limitando o desempenho das GPUs.
![]() |
O CEO da Nvidia segura dois laptops equipados com chips RTX Spark na Computex 2026, marcando o retorno da empresa ao mercado de chips para PCs. Foto: Nvidia . |
A gigante das placas gráficas quer internalizar a CPU, tornando-a perfeita para sua plataforma de IA proprietária, garantindo que suas melhores GPUs não sejam limitadas.
Seguindo essa direção, a Nvidia lançou o Vera – a primeira CPU personalizada projetada especificamente para orquestrar IA Agética, chamadas de ferramentas e gerenciamento de contexto de longo prazo.
No entanto, a realidade é que o maior beneficiário desse boom de CPUs é ninguém menos que a antiga gigante Intel. Relatórios financeiros mostram que a receita da Intel no primeiro trimestre de 2026 atingiu US$ 13,6 bilhões , um aumento de 7% em relação ao ano anterior, enquanto o lucro líquido disparou 156%.
O CEO da Intel, Lip-Bu Tan, afirmou que as linhas de produtos Xeon série 6 (baseada no processo Intel 3) e Core série 3 (baseada no processo Intel 18A) entraram na fase de aceleração da produção em massa.
No entanto, ele também reconheceu que a Intel ainda não consegue atender plenamente à demanda do mercado e que essa tendência de crescimento deve continuar até 2027.
Fonte: https://znews.vn/mo-vang-tiep-theo-cua-nvidia-post1657130.html










