Jensen Huang, PDG de Nvidia. Photo : Reuters . |
Conscientes de la crainte d'être « écrasées » par Nvidia, de nombreuses petites entreprises d'IA démantèlent proactivement leurs technologies obsolètes avant même que le géant concurrent ne passe à l'action. C'est également ainsi que Tuhin Srivastava, cofondateur de la plateforme d'inférence IA Baseten, se prépare à réagir au lancement de la nouvelle plateforme de Nvidia.
« En matière d'IA, il faut brûler les bateaux. Nous ne les avons pas encore brûlés, mais nous avons acheté le kérosène », a déclaré Srivastava à Business Insider .
L'histoire a commencé en début d'année, lorsque l'équipe de Srivastava travaillait sur le modèle de raisonnement DeepSeek R1. L'implémentation a rencontré des difficultés dues à des goulots d'étranglement dans le processus de raisonnement de l'IA, ce qui a entraîné une réponse lente et inefficace aux clients.
Bien que Baseten disposât de la puce Nvidia H200 — la plus performante de l'époque —, le logiciel Triton Inference Server fourni ne gérait pas correctement les requêtes d'inférence complexes. Baseten a donc dû développer son propre logiciel pour optimiser le processus.
En mars dernier, Jensen Huang, PDG de Nvidia, a présenté Dynamo, une plateforme d'inférence open source qui optimise le processus d'inférence sur les puces Nvidia. Huang a décrit Dynamo comme « le système d'exploitation de l'usine à IA ».
![]() |
Jensen Huang prend la parole lors de la conférence Nvidia sur les technologies GPU (GTC) au SAP Center de San Jose, en Californie, aux États-Unis. Photo : Reuters |
Avec le lancement de Dynamo, Srivastava savait que la plateforme de Baseten serait bientôt dépassée. Il prévoyait que son entreprise aurait besoin de plusieurs mois pour effectuer la transition vers le nouveau système.
« J'étais mentalement préparé à cela », a-t-il déclaré.
Il n'y a pas que Nvidia ; tout le secteur de l'apprentissage automatique évolue à une vitesse fulgurante. Les modèles d'IA deviennent de plus en plus complexes, nécessitant une puissance de calcul accrue, mais ils deviennent aussi rapidement obsolètes à mesure que les ingénieurs découvrent des algorithmes plus performants.
« On ne peut pas s'en tenir indéfiniment à un seul cadre de travail ou à une seule façon de faire », a commenté Karl Mozurkewich, architecte en chef de la société d'informatique en nuage Valdi.
Selon Brown, un youtubeur et développeur d'IA, l'IA a transformé des choses autrefois considérées comme « invincibles » par l'industrie technologique en des choses « facilement jetables ».
Brown raconte que, lorsqu'il travaillait comme ingénieur chez Twitch, il a rencontré une vive opposition lorsqu'il a proposé de réécrire le projet au lieu de s'appuyer sur les bases existantes. « J'ai dû apprendre à agir vite avant que quiconque puisse m'en empêcher », a-t-il déclaré.
C’est aussi pourquoi les startups spécialisées en IA sont souvent plus agiles que les grandes entreprises, qui sont freinées par des processus obsolètes et des coûts d’investissement élevés.
Quinn Slack, PDG de Sourcegraph, plateforme de programmation IA, estime qu'environ 80 % des entreprises du classement Fortune 500 réalisent que leur première plateforme d'IA doit être modifiée après seulement une réunion d'une heure.
Cependant, tout le monde ne choisit pas de « brûler les bateaux ».
Ben Miller, PDG de la plateforme d'investissement immobilier Fundrise, développe un nouveau produit d'IA pour son secteur. Il estime que si le modèle actuel est performant, l'entreprise ne se précipitera pas pour adopter une nouvelle solution.
« Je m'en tiens à ce qui fonctionne aussi longtemps que possible », a déclaré Miller, ajoutant que cela s'explique en partie par le fait qu'il dirige une grande organisation.
La réflexion de Miller illustre un exercice d'équilibriste courant dans le secteur : entre innovation continue et maintien de la stabilité.
Mozurkewich souligne qu'une fois qu'un produit est très proche du consommateur, les avantages de « faire vite et de prendre des risques » diminuent considérablement.
« Rien ne garantit que le lancement de la fonctionnalité la plus innovante vous permettra d'acquérir plus de clients ou de revenus », a-t-il déclaré.
Dans le monde de l'IA, où la technologie évolue chaque mois, le choix entre innovation et durabilité reste une question majeure sans réponse définitive.
Source : https://znews.vn/cac-hang-ai-dang-tu-huy-de-tang-toc-post1549478.html







Comment (0)