Le géant Windows a déclaré ne pas avoir l'intention de commercialiser ces puces. Ces nouvelles puces d'IA seront utilisées en interne pour des produits logiciels, ainsi que dans le cadre de son service de cloud computing Azure.
Solutions à la hausse des coûts
Microsoft et d’autres géants de la technologie comme Alphabet (Google) sont confrontés au coût élevé de la fourniture de services d’IA, qui peut être plus de 10 fois supérieur à celui des services traditionnels comme les moteurs de recherche.
Les dirigeants de Microsoft affirment qu'ils prévoient de faire face à la hausse des coûts de l'IA en utilisant un modèle de plateforme commun pour intégrer l'IA en profondeur à l'ensemble de l'écosystème logiciel. Et la puce Maia est conçue pour cela.
La puce Maia est conçue pour exécuter de grands modèles de langage (LLM), la base du service Azure OpenAI, une collaboration entre Microsoft et la société propriétaire de ChatGPT.
« Nous pensons que cela nous donne un moyen de pouvoir fournir de meilleures solutions à nos clients à un rythme plus rapide, à moindre coût et avec une qualité supérieure », a déclaré Scott Guthrie, vice-président exécutif de la division cloud et IA de Microsoft.
Microsoft a également annoncé qu'il offrirait l'année prochaine à ses clients Azure des services cloud fonctionnant sur les dernières puces phares de Nvidia et d'AMD. Le groupe teste actuellement GPT-4 sur des puces AMD.
Concurrence accrue dans le secteur du cloud
La deuxième puce, nom de code Cobalt, a été lancée par Microsoft pour réduire les coûts internes et concurrencer le service cloud AWS d'Amazon, qui utilise sa propre puce conçue par ses soins « Graviton ».
Cobalt est une unité centrale de traitement (CPU) basée sur Arm actuellement testée pour alimenter le logiciel de messagerie d'entreprise Teams.
Des représentants d'AWS ont déclaré que leur puce Graviton comptait actuellement environ 50 000 clients. L'entreprise organisera également une conférence pour les développeurs plus tard ce mois-ci.
« AWS continuera d'innover pour fournir de futures générations de puces conçues sur mesure qui offrent des performances de prix encore meilleures, pour toute charge de travail dont les clients ont besoin », a déclaré un représentant d'AWS dans un communiqué après que Microsoft a annoncé le duo de puces IA.
Rani Borkar, vice-président du matériel et de l'infrastructure Azure, a déclaré que les deux nouvelles puces sont fabriquées selon le processus 5 nm de TSMC.
Dans ce document, Maia est associé à des câbles réseau Ethernet standard, plutôt que d'utiliser la technologie réseau Nvidia personnalisée plus coûteuse que Microsoft a utilisée dans les supercalculateurs conçus pour OpenAI.
(Selon Reuters)
MediaTek lance une puce d'IA mobile capable de composer des poèmes et de créer des images sans Internet
Le concepteur de puces mobiles MediaTek vient de lancer le chipset Dimensity 9300 5G avec un processeur AI intégré (également appelé APU), compatible avec les tâches d'IA génératives telles que la génération d'images à partir d'invites de texte sans connexion Internet.
Nvidia fait face à une interdiction immédiate d'exportation de certaines puces d'IA
Le gouvernement américain exige que Nvidia cesse immédiatement d'exporter certaines puces sans licence du ministère du Commerce.
La « licorne » de la puce IA s'associe à Samsung et défie Nvidia
Tenstorrent, une start-up spécialisée dans les puces d'IA d'un milliard de dollars dont le siège social est au Canada, vient de conclure un accord pour utiliser la technologie de fabrication de microprocesseurs de 4 nanomètres (nm) de Samsung.
Source
Comment (0)