Lors de son événement annuel TechXchange, IBM a annoncé son modèle d'IA le plus avancé à ce jour, Granite 3.0. Les modèles de langage phares Granite de troisième génération d'IBM surpassent ou égalent les modèles de taille similaire des principaux fournisseurs de modèles sur de multiples benchmarks académiques et industriels, démontrant ainsi des performances robustes, une transparence et une sécurité optimales.

IBM dévoile son modèle d'IA le plus avancé à ce jour, Granite 3.0.
Conformément à l'engagement de l'entreprise envers l'IA open source, les modèles Granite sont publiés sous la licence permissive Apache 2.0, ce qui les rend uniques par la combinaison de performances, de flexibilité et d'autonomie qu'ils offrent aux entreprises clientes et à la communauté dans son ensemble.
Les nouveaux modèles de langage Granite 3.0 8B et 2B sont conçus comme des modèles « grand public » pour l’IA d’entreprise, offrant d’excellentes performances pour des tâches telles que la génération augmentée par la recherche (RAG), la classification, la synthèse, l’extraction d’entités et l’utilisation d’outils. Ces modèles compacts et flexibles sont conçus pour être adaptés aux données d’entreprise et s’intégrer facilement dans divers environnements et flux de travail.
Alors que de nombreux modèles de langage de grande taille (MLG) sont entraînés sur des données publiques, la grande majorité des données d'entreprise restent inexploitées. En combinant un petit modèle Granite avec des données d'entreprise, notamment grâce à la technique d'alignement révolutionnaire InstructLab (lancée par IBM et Red Hat en mai), IBM estime que les entreprises peuvent atteindre des performances spécifiques à une tâche équivalentes à celles de modèles plus volumineux, pour un coût bien moindre (des coûts de 3 à 23 fois inférieurs à ceux des grands modèles de pointe ont été observés lors de premières démonstrations de faisabilité).
Modèle d'IA Granite 3.0.
La version 3.0 de Granite réaffirme l’engagement d’IBM à garantir la transparence, la sécurité et la confiance dans ses produits d’IA. Le rapport technique et le guide d’utilisation responsable de Granite 3.0 décrivent les jeux de données utilisés pour l’entraînement des modèles, détaillent les étapes de filtrage, de nettoyage et de curation appliquées, et présentent des résultats complets sur les performances des modèles sur les principaux benchmarks académiques et d’entreprise.
Les modèles « Granite 3.0 » sont open source, à l’instar des autres versions de la suite d’IA Granite d’IBM. Cette approche diffère de celle de concurrents tels que Microsoft, qui facturent l’accès aux modèles. En contrepartie, IBM propose Watsonx, un outil payant permettant d’exécuter les modèles au sein des centres de données après leur personnalisation.
Plusieurs variantes des nouveaux modèles Granite sont disponibles dès aujourd'hui pour un usage commercial sur la plateforme Watsonx. Certains de ces modèles seront également disponibles dans la suite logicielle de Nvidia, permettant ainsi aux entreprises d'intégrer des modèles d'IA.
Les nouveaux modèles Granite ont été entraînés à l'aide d'unités de traitement graphique (GPU) H100 de Nvidia, un leader dans le domaine des puces d'IA, a déclaré Dario Gil, directeur de la recherche chez IBM.
(Selon IBM, Reuters)
Source : https://www.baogiaothong.vn/ibm-phat-hanh-moi-ai-hinh-cho-doanh-nghiep-uu-viet-hon-microsoft-192241021144242992.htm







Comment (0)