DNVN - Le 18 novembre, The Information a rapporté que la puce Blackwell AI de Nvidia rencontrait des problèmes de surchauffe sur les serveurs, suscitant des inquiétudes chez certains clients quant au manque de temps pour exploiter de nouveaux centres de données.
Selon des sources internes, le GPU Blackwell a subi une chaleur excessive lorsqu'il fonctionnait dans une armoire de serveur capable de contenir jusqu'à 72 puces.
Nvidia a demandé à plusieurs reprises à ses fournisseurs de modifier la structure des armoires de serveurs pour résoudre le problème thermique, sur la base des commentaires des ingénieurs et des clients de Nvidia ayant connaissance du problème fournis à The Information.
Un porte-parole de Nvidia a déclaré dans un communiqué que l'entreprise travaillait en étroite collaboration avec les principaux fournisseurs de cloud et leurs équipes d'ingénierie pour résoudre ce problème. Nvidia a précisé que ces ajustements techniques étaient normaux et planifiés.
En mars, Nvidia a présenté sa gamme de puces Blackwell, dont le lancement était prévu au deuxième trimestre 2024. Cependant, le plan a été retardé, affectant des clients majeurs tels que Meta Platforms (Facebook), Google d'Alphabet et Microsoft.
La puce Blackwell se veut pionnière dans le traitement graphique et l'intelligence artificielle. Composée de deux cellules de silicium interconnectées, cette gamme de puces, selon Nvidia, pourrait améliorer jusqu'à 30 fois les performances de traitement par rapport à la génération précédente, notamment dans des applications telles que les chatbots. Ce produit devrait jouer un rôle important dans les grands centres de données et les applications d'IA exigeant une puissance de calcul élevée.
Thanh Mai (à temps partiel)
Source : https://doanhnghiepvn.vn/cong-nghe/chip-ai-blackwell-cua-nvidia-gap-van-de-qua-nhiet-tren-may-chu/20241119090620652
Comment (0)