Le géant de Windows a déclaré n'avoir aucun projet de commercialisation de ces puces. Celles-ci seront utilisées en interne pour ses logiciels, ainsi que dans le cadre de son service de cloud computing Azure.
Solutions à la hausse des coûts
Microsoft et d'autres géants de la technologie comme Alphabet (Google) sont confrontés au coût élevé de la fourniture de services d'IA, qui peut être plus de 10 fois supérieur à celui des services traditionnels comme les moteurs de recherche.
Les dirigeants de Microsoft affirment vouloir s'attaquer au coût croissant de l'IA en utilisant un modèle de plateforme commune afin d'intégrer profondément l'IA dans l'ensemble de l'écosystème logiciel. La puce Maia est conçue précisément à cet effet.
La puce Maia est conçue pour exécuter de grands modèles de langage (LLM), la base du service Azure OpenAI, une collaboration entre Microsoft et la société propriétaire de ChatGPT.
« Nous pensons que cela nous permet de proposer à nos clients de meilleures solutions plus rapidement, à moindre coût et avec une qualité supérieure », a déclaré Scott Guthrie, vice-président exécutif de la division cloud et IA de Microsoft.
Microsoft a également annoncé que l'année prochaine, elle proposera à ses clients Azure des services cloud fonctionnant sur les puces les plus récentes et performantes de Nvidia et d'Advanced Micro Devices (AMD). Le groupe teste actuellement GPT-4 sur les puces AMD.
Concurrence accrue dans le secteur du cloud
La seconde puce, nom de code Cobalt, a été lancée par Microsoft pour réduire les coûts internes et concurrencer le service cloud AWS d'Amazon, qui utilise sa propre puce conçue en interne, « Graviton ».
Cobalt est un processeur central (CPU) basé sur l'architecture Arm, actuellement en cours de test pour alimenter le logiciel de messagerie d'entreprise Teams.
Les représentants d'AWS ont indiqué que leur puce Graviton compte actuellement environ 50 000 clients. L'entreprise organisera également une conférence pour les développeurs plus tard ce mois-ci.
« AWS continuera d'innover pour fournir les futures générations de puces conçues sur mesure offrant des performances encore meilleures en termes de prix, pour toutes les charges de travail dont les clients ont besoin », a déclaré un représentant d'AWS dans un communiqué après l'annonce par Microsoft du duo de puces d'IA.
Rani Borkar, vice-présidente de la division matériel et infrastructure Azure, a déclaré que les deux nouvelles puces sont fabriquées selon le procédé 5 nm de TSMC.
Dans cette configuration, Maia est associée à des câbles réseau Ethernet standard, plutôt qu'à la technologie réseau Nvidia personnalisée plus coûteuse que Microsoft a utilisée dans les supercalculateurs construits pour OpenAI.
(Selon Reuters)
MediaTek lance une puce d'IA mobile capable de composer des poèmes et de créer des images sans connexion Internet.
Le concepteur de puces mobiles MediaTek vient de lancer le chipset Dimensity 9300 5G avec un processeur d'IA intégré (également connu sous le nom d'APU), compatible avec des tâches d'IA générative telles que la génération d'images à partir d'invites textuelles sans connexion Internet.
Nvidia a immédiatement interdit l'exportation de certaines puces d'IA.
Le gouvernement américain exige qu'Nvidia cesse immédiatement d'exporter certaines puces sans licence du département du Commerce.
Une puce d'IA « licorne » s'associe à Samsung et défie Nvidia.
Tenstorrent, une start-up de puces d'IA d'un milliard de dollars basée au Canada, vient de conclure un accord pour utiliser la technologie de fabrication de microprocesseurs 4 nanomètres (nm) de Samsung.
Source










Comment (0)