Lors du salon mondial des technologies Computex 2026 qui s'est tenu à Taipei, à Taïwan, les discussions dans les secteurs des semi-conducteurs et de l'informatique se sont nettement déplacées de l'« IA du cloud » vers l'« IA en périphérie ». L'industrie du matériel informatique est en pleine restructuration, la puissance de calcul des centres de données étant intégrée aux appareils personnels placés directement sur le lieu de travail.
Le passage de l'IA réactive aux agents autonomes (IA agent)
Aux débuts de l'essor de l'intelligence artificielle, le processus opérationnel courant consistait pour les utilisateurs à soumettre des requêtes de données à des serveurs cloud tels qu'OpenAI, Google ou Microsoft et à recevoir des réponses. Cependant, cette architecture a révélé de nombreuses limitations concernant la latence de transmission, les coûts de bande passante et la sécurité des données sources.

Nvidia DGX Spark est une gamme d'ordinateurs personnels spécialement conçus pour l'IA et qui sera distribuée au Vietnam.
Photo : Anh Quân
Le développement de l'IA agentique – une génération d'agents logiciels autonomes capables de planifier, de raisonner et d'interagir directement avec les systèmes de fichiers locaux – impose de nouvelles exigences aux infrastructures matérielles. Au lieu de répondre passivement, ces agents agissent comme des ressources humaines numériques, traitant un flux continu d'informations en temps réel. Afin de garantir l'intégrité et la sécurité des données, le fonctionnement hors ligne des modèles d'IA sur les appareils des utilisateurs est devenu une solution technique essentielle.
Un parfait exemple de cette tendance est l'ordinateur personnel DGX Spark AI, présenté au Computex 2026. L'appareil se targue d'un design de bureau compact, mais offre les performances d'un système de supercalculateur miniature grâce à sa seule puce Nvidia GB10 Grace Blackwell Superchip.
Le fonctionnement autonome de l'appareil repose sur un système de mémoire unifiée LPDDR5X de 128 Go à haut débit. En architecture d'IA, la capacité et la vitesse de la mémoire déterminent l'aptitude à traiter des modèles de langage complexes (LLM). Cela permet aux ingénieurs de données d'exécuter directement sur l'appareil des modèles comportant jusqu'à 200 milliards de paramètres, sans avoir à les déployer sur des serveurs cloud.
Côté spécifications, le GPU Blackwell intègre des cœurs Tensor de 5e génération (format de précision FP4) offrant une puissance de calcul de 1 pétaFLOPS. Le CPU ARM à 20 cœurs assure la coordination des données entre le système de fichiers local et le modèle d'IA.

Les stations de travail répondant aux besoins en IA en périphérie des réseaux d'entreprise sont désormais disponibles en formats compacts, ce qui facilite leur déploiement à différentes échelles.
Photo : Anh Quân
Sur les stands d'exposition, les solutions d'infrastructure répondant à cette tendance étaient clairement mises en avant grâce à des systèmes synchronisés provenant de fabricants d'origine et de fournisseurs spécialisés en intégration matérielle. Leadtek en est un parfait exemple, présentant une gamme de stations de travail et de serveurs certifiés Nvidia. Ciblant les besoins opérationnels internes des PME, la station de travail WinFast WS950 AI prend en charge les configurations multi-GPU avec deux cartes graphiques professionnelles Nvidia RTX PRO 6000 Blackwell Workstation Edition, offrant jusqu'à 192 Go de mémoire GPU GDDR7. À plus grande échelle, le serveur WinFast GS5855T permet l'intégration de jusqu'à huit GPU RTX PRO Blackwell pour répondre aux exigences des tâches intensives d'inférence et d'entraînement en IA.
Optimisation de la sécurité et des coûts d'exploitation.
L'exploitation de l'IA en périphérie via un système matériel local répond à trois défis majeurs des infrastructures technologiques actuelles. Le premier concerne la sécurité des données. Toutes les informations commerciales, le code source interne et les données personnelles sont stockés et traités dans un environnement isolé (sandbox) et déconnecté d'Internet, limitant ainsi le risque de fuite de données vers des tiers.
De nouvelles solutions d'IA embarquée présentées au Computex 2026
Vient ensuite la question des coûts fixes de calcul. La location d'infrastructures cloud, facturée au forfait, engendre des coûts variables importants à mesure que l'infrastructure évolue. L'exploitation sur du matériel hors ligne transforme ces coûts en un investissement en actifs fixes, optimisant ainsi les opérations à long terme. Enfin, il y a la question de l'évolutivité locale : grâce à des protocoles de connectivité haut débit, les utilisateurs peuvent connecter des systèmes de calcul en périphérie pour partager des ressources, ce qui permet d'étendre considérablement les capacités de traitement de la modélisation en périphérie.
Source : https://thanhnien.vn/ai-roi-dam-may-ve-ban-lam-viec-185260605224532968.htm








