A Nvidia já foi conhecida como fabricante de chips usados em videogames, mas mudou seu foco para o mercado de data center nos últimos anos.
A empresa americana de chips prosperou durante a pandemia, com o aumento da demanda por jogos e aplicativos em nuvem e a onda de mineração de criptomoedas se espalhando pelo mundo . Ao final do ano fiscal encerrado em 29 de janeiro, o negócio de chips para data centers representava mais de 50% da receita da empresa.
Enquanto isso, o popular chatbot ChatGPT levou a inteligência artificial generativa (IA) ao próximo nível neste ano, usando grandes quantidades de dados existentes para criar novos conteúdos sobre tópicos que vão de poesia a programação de computadores.
A Microsoft e a Alphabet, duas gigantes da tecnologia, também são grandes nomes no setor de IA, acreditando que a tecnologia generativa pode mudar a maneira como as pessoas trabalham. Ambas lançaram uma corrida para integrar IA em mecanismos de busca e softwares de escritório, com a ambição de dominar esse setor.
O Goldman Sachs estima que o investimento dos EUA em IA pode ser de aproximadamente 1% da produção econômica do país até 2030.
Supercomputadores usados para processar dados e executar IA generativa dependem de unidades de processamento gráfico (GPUs). As GPUs são projetadas para lidar com cálculos específicos relacionados à computação de IA, com muito mais eficiência do que as unidades centrais de processamento de outros fabricantes de chips, como a Intel. Por exemplo, o ChatGPT da OpenAI é alimentado por milhares de GPUs Nvidia.
Enquanto isso, a Nvidia detém cerca de 80% da participação de mercado de GPUs. Seus principais concorrentes incluem a Advanced Micro Devices e chips de IA internos de empresas de tecnologia como Amazon, Google e Meta Platforms.
O segredo da sublimação
O salto da empresa foi possível graças ao H100, um chip baseado na nova arquitetura da Nvidia chamada "Hopper" – nome dado em homenagem à pioneira da programação americana Grace Hopper. A explosão da inteligência artificial tornou o H100 a commodity mais cobiçada do Vale do Silício.
Os chips superdimensionados usados em data centers têm 80 bilhões de transistores, cinco vezes o silício que alimenta os iPhones mais recentes. Embora custem o dobro do seu antecessor, o A100 (lançado em 2020), os usuários do H100 afirmam que oferecem três vezes mais desempenho.
O H100 se mostrou particularmente popular entre empresas de “Big Tech” como Microsoft e Amazon, que estão construindo data centers inteiros focados em cargas de trabalho de IA, e startups de IA de nova geração como OpenAI, Anthropic, Stability AI e Inflection AI, pois promete maior desempenho que pode acelerar lançamentos de produtos ou reduzir custos de treinamento ao longo do tempo.
“Este é um dos recursos de engenharia mais escassos que existem”, disse Brannin McBee, diretor de estratégia e fundador da CoreWeave, uma startup de nuvem baseada em IA que foi uma das primeiras empresas a receber remessas do H100 no início deste ano.
Outros clientes não tiveram a mesma sorte da CoreWeave, tendo que esperar até seis meses para que o produto treinasse seus enormes modelos de dados. Muitas startups de IA estão preocupadas que a Nvidia não consiga atender à demanda do mercado.
Elon Musk também encomendou milhares de chips Nvidia para sua startup de IA, dizendo que "GPUs são mais difíceis de encontrar do que medicamentos atualmente".
“Os custos com computação dispararam. O valor mínimo gasto em hardware de servidor para desenvolver IA criativa chegou a US$ 250 milhões”, compartilhou o CEO da Tesla.
Embora a H100 seja oportuna, o avanço da Nvidia em IA remonta a duas décadas, com foco em inovação de software e não de hardware. Em 2006, a empresa lançou o software Cuda, que permite que GPUs sejam usadas como aceleradoras para outras tarefas além de gráficas.
“A Nvidia viu o futuro antes de todo mundo e apostou em GPUs programáveis. Eles enxergaram a oportunidade, apostaram alto e superaram consistentemente seus concorrentes”, disse Nathan Benaich, sócio da Air Street Capital e investidor em startups de IA .
(De acordo com a Reuters, FT)
[anúncio_2]
Fonte
Comentário (0)