DNVN - Le 18 novembre, The Information a rapporté que la puce d'IA Blackwell de Nvidia rencontrait des problèmes de surchauffe sur les serveurs, suscitant des inquiétudes chez certains clients quant au manque de temps pour exploiter de nouveaux centres de données.
Selon des sources internes, le GPU Blackwell a subi une surchauffe excessive lors de son fonctionnement dans une armoire serveur pouvant contenir jusqu'à 72 puces.
Nvidia a demandé à plusieurs reprises à ses fournisseurs de modifier la structure des armoires de serveurs afin de résoudre le problème de température, sur la base des retours d'information fournis à The Information par les ingénieurs de Nvidia et les clients ayant connaissance du problème.
Un porte-parole de Nvidia a déclaré que l'entreprise collabore étroitement avec les principaux fournisseurs de services cloud et les équipes d'ingénierie pour résoudre le problème. Nvidia a précisé que ces ajustements techniques sont normaux et prévus.
En mars, Nvidia a présenté la gamme de puces Blackwell, dont le lancement était prévu pour le deuxième trimestre 2024. Cependant, ce plan a été retardé, affectant des clients majeurs tels que Meta Platforms (Facebook), Google (Alphabet) et Microsoft.
La puce Blackwell ambitionne de révolutionner le traitement graphique et l'intelligence artificielle. Composée de deux cellules de silicium interconnectées, elle permettrait, selon Nvidia, d'améliorer les performances de traitement jusqu'à 30 fois par rapport à la génération précédente, notamment pour des applications telles que les chatbots. Ce produit devrait jouer un rôle crucial dans les grands centres de données et les applications d'IA exigeant une puissance de calcul élevée.
Thanh Mai (t/h)
Source : https://doanhnghiepvn.vn/cong-nghe/chip-ai-blackwell-cua-nvidia-gap-van-de-qua-nhiet-tren-may-chu/20241119090620652






Comment (0)