image de la leçon 70.png
Un système de stockage d'entreprise évolutif qui permet une circulation fluide des données entre le stockage et les modèles d'IA. Photo : Midjourney

L'intelligence artificielle transforme la manière dont les entreprises stockent et accèdent aux données. En effet, les systèmes de stockage de données traditionnels étaient conçus pour traiter des commandes simples provenant de quelques utilisateurs à la fois, tandis que les systèmes d'IA actuels, composés de millions d'agents, doivent accéder à des volumes massifs de données et les traiter en continu et en parallèle.

Les systèmes de stockage traditionnels présentent désormais de nombreux niveaux de complexité, ce qui ralentit l'IA car les données doivent traverser de nombreuses couches avant d'atteindre le GPU (unité de traitement graphique), considéré comme la « cellule cérébrale » de l'IA.

Cloudian, cofondée par Michael Tso (du MIT) et Hiroshi Ohta, aide le stockage de données à suivre le rythme de la révolution de l'IA. L'entreprise a développé un système de stockage d'entreprise évolutif qui facilite la circulation fluide des données entre le stockage et les modèles d'IA.

Le système réduit la complexité en appliquant le calcul parallèle au stockage, en consolidant les fonctionnalités d'IA et de données sur une seule plateforme de traitement parallèle capable de stocker, de récupérer et de traiter des ensembles de données à grande échelle, avec des connexions directes à haut débit entre le stockage et les GPU et les CPU.

La plateforme intégrée de calcul et de stockage de Cloudian simplifie la création d'outils d'IA à l'échelle commerciale, tout en fournissant aux entreprises une infrastructure de stockage capable de suivre le rythme de l'explosion de l'IA.

« On oublie souvent que l'IA repose avant tout sur les données », explique Tso. « On ne peut pas améliorer les performances de l'IA de 10 % avec 10 % de données en plus, ni même avec 10 fois plus de données ; il en faut 1 000 fois plus. Stocker les données de manière à faciliter leur gestion et intégrer les calculs directement dans le système pour pouvoir les effectuer instantanément, sans avoir à les déplacer : voilà la voie que suit le secteur. »

Stockage d'objets et IA

Actuellement, la plateforme Cloudian utilise une architecture de stockage objet, où tous les types de données (documents, vidéos , données de capteurs) sont stockés sous forme d'objets uniques avec des métadonnées. Le stockage objet permet de gérer des volumes massifs de données dans une structure plate, ce qui le rend idéal pour les données non structurées et les systèmes d'IA. Auparavant, il était impossible d'envoyer des données directement à un modèle d'IA sans les copier au préalable dans la mémoire de l'ordinateur, ce qui entraînait de la latence et un gaspillage d'énergie.

En juillet, Cloudian a annoncé l'extension de son système de stockage objet avec une base de données vectorielle, qui stocke les données dans un format immédiatement exploitable par l'IA. Dès l'ingestion des données, Cloudian calcule en temps réel leur format vectoriel afin de prendre en charge les outils d'IA tels que les moteurs de recommandation, la recherche et les assistants vocaux.

Cloudian a également annoncé un partenariat avec NVIDIA afin que son système de stockage fonctionne directement avec ses GPU. Cloudian a indiqué que ce nouveau système permet un traitement IA plus rapide et des coûts de calcul réduits.

« NVIDIA nous a contactés il y a environ un an et demi, car les GPU ne sont utiles que lorsqu'on dispose de données à traiter », explique Tso. « Aujourd'hui, on comprend qu'il est plus simple d'appliquer l'IA aux données que de déplacer d'énormes volumes de données. Notre système de stockage intègre de nombreuses fonctions d'IA, ce qui nous permet de prétraiter et de post-traiter les données au plus près de leur lieu de collecte et de stockage. »

Stockage priorisé par l'IA

Cloudian aide environ 1 000 entreprises dans le monde entier à tirer le meilleur parti de leurs données, notamment de grands fabricants, des institutions financières, des établissements de santé et des agences gouvernementales.

Par exemple, la plateforme de stockage de Cloudian aide un grand constructeur automobile à utiliser l'IA pour déterminer le moment où chaque robot de production nécessite une maintenance. Cloudian collabore également avec la Bibliothèque nationale de médecine des États-Unis pour stocker des articles de recherche et des brevets, et avec la Base de données nationale sur le cancer pour stocker des séquences d'ADN tumoral — des ensembles de données précieux que l'IA peut traiter pour contribuer à la recherche de nouveaux traitements ou à de nouvelles découvertes.

« Les GPU sont un formidable catalyseur », affirme Tso. « La loi de Moore prévoit un doublement de la puissance de calcul tous les deux ans, mais les GPU peuvent paralléliser les tâches sur une puce, connecter plusieurs GPU en série et aller au-delà de cette loi. Cette échelle propulse l'IA vers de nouveaux sommets d'intelligence, mais pour exploiter pleinement le potentiel des GPU, il est indispensable de leur fournir des données à un rythme aussi rapide que leur puissance de calcul. Et pour cela, il faut supprimer tous les intermédiaires entre le GPU et les données. »

(Selon le MIT)

Source : https://vietnamnet.vn/cloudian-dua-du-lieu-den-gan-ai-hon-bao-gio-het-2433241.html