A Nvidia desempenhou um papel central no boom da IA no ano passado com suas caras unidades de processamento gráfico (GPUs) para servidores, incluindo a H100. Elas são essenciais para treinar e implementar IA generativa, como o ChatGPT da OpenAI.
A Nvidia continua a demonstrar sua força no segmento de GPUs para o consumidor final, anunciando três novas placas de vídeo na CES 2024: a RTX 4060 Super, a RTX 4070 Ti Super e a RTX 4080 Super, com preços entre US$ 599 e US$ 999. Elas contam com "núcleos tensores" adicionais, projetados para executar aplicativos de IA generativa. Além disso, a Nvidia também fornece placas de vídeo para notebooks da Acer, Dell, Lenovo, entre outras.
A demanda pelas GPUs empresariais da Nvidia — que custam dezenas de milhares de dólares por chip e normalmente são usadas em sistemas de oito GPUs — ajudou a empresa a registrar fortes vendas, elevando sua capitalização de mercado para mais de US$ 1 trilhão.
GPUs para PCs são a fonte de renda da Nvidia há muito tempo, usadas para jogar videogames . Mas a empresa afirma que as placas de vídeo deste ano estão passando por uma reformulação e são voltadas para executar modelos de IA sem enviar informações de volta para a nuvem. Por exemplo, o chip RTX 4080 pode gerar vídeos de IA 150% mais rápido do que seu antecessor. Outras melhorias de software tornam o processamento de modelos de linguagem extensa cinco vezes mais rápido.
Justin Walker, diretor sênior de gerenciamento de produtos da Nvidia, afirmou que a empresa vendeu 100 milhões de GPUs RTX. A Nvidia espera que os aplicativos de IA que serão lançados no próximo ano aproveitem as novas GPUs. A Microsoft deve anunciar o Windows 12, a próxima versão do Windows, ainda este ano.
O novo chip da Nvidia pode ser usado para criar imagens na ferramenta Firefly do Adobe Photoshop ou remover fundos durante videochamadas. A Nvidia também está desenvolvendo ferramentas para desenvolvedores de jogos integrarem IA generativa em seus títulos.
Os chips demonstram que, embora a Nvidia continue mais comprometida com GPUs para servidores, ela competirá com Intel, AMD e Qualcomm no segmento de IA local. As três rivais anunciaram novos chips para uso em "PCs com IA", de acordo com a CNBC. A indústria de tecnologia está descobrindo a melhor forma de implementar IA generativa, que exige enorme poder computacional e é cara para ser executada na nuvem.
Uma solução técnica promovida pelos rivais da Microsoft e da Nvidia é chamada de "AI PC", ou às vezes chamada de "edge compute". Em vez de usar supercomputadores poderosos pela internet, o dispositivo teria chips de IA mais potentes e poderia executar grandes modelos de linguagem ou aplicativos de imagens criativas, mas com algumas falhas.
As novas placas gráficas obedecerão às restrições de exportação dos EUA e poderão ser vendidas para a China, fornecendo uma alternativa para pesquisadores e empresas chinesas que não podem pagar pelas GPUs de servidor mais potentes da Nvidia.
(De acordo com a CNBC)
Fonte
Comentário (0)