DNVN - Le 18 novembre, The Information a rapporté que la puce d'IA Blackwell de Nvidia rencontrait des problèmes de surchauffe sur les serveurs, suscitant des inquiétudes chez certains clients quant au manque de temps pour exploiter de nouveaux centres de données.
Selon des sources internes, le GPU Blackwell a subi une surchauffe excessive lors de son fonctionnement dans une baie de serveurs pouvant contenir jusqu'à 72 puces.
Nvidia a demandé à plusieurs reprises à ses fournisseurs de modifier l'architecture des racks de serveurs afin de résoudre le problème de température, sur la base des retours d'information des ingénieurs de Nvidia et des clients connaissant bien le problème, qui les ont fournis à The Information.
Un porte-parole de Nvidia a déclaré dans un communiqué de presse que l'entreprise collabore étroitement avec les principaux fournisseurs de services cloud et les équipes techniques afin de résoudre le problème. Nvidia a précisé que ces ajustements techniques sont normaux et font partie d'un plan de continuité d'activité.
En mars, Nvidia a présenté sa gamme de puces Blackwell, dont le lancement était prévu pour le deuxième trimestre 2024. Cependant, ce plan a été retardé, impactant des clients majeurs tels que Meta Platforms (Facebook), Google (Alphabet) et Microsoft.
La puce Blackwell se positionne comme un produit novateur dans le domaine du traitement graphique et de l'intelligence artificielle. Grâce à sa conception à deux cellules de silicium interconnectées, Nvidia affirme que cette puce peut améliorer les performances de traitement jusqu'à 30 fois par rapport à la génération précédente, notamment pour des applications telles que les chatbots. Ce produit devrait jouer un rôle crucial dans les grands centres de données et les applications d'IA exigeant une puissance de calcul élevée.
Thanh Mai (compilé)
Source : https://doanhnghiepvn.vn/cong-nghe/chip-ai-blackwell-cua-nvidia-gap-van-de-qua-nhiet-บน-may-chu/20241119090620652








Comment (0)