OpenAI affirme avoir publié deux modèles de langage de pondération ouverts qui excellent dans l'inférence avancée et sont optimisés pour fonctionner sur des ordinateurs portables avec des niveaux de performances similaires à ses modèles d'inférence propriétaires 4o-mini.
Les paramètres ou poids formés d'un modèle de langage pondéré ouvert sont accessibles au public et utilisés par les développeurs pour analyser et affiner le modèle pour des tâches spécifiques sans avoir besoin des données de formation d'origine.
« L'un des avantages des modèles ouverts est qu'ils peuvent être exécutés localement. Ils peuvent être exécutés derrière leur propre pare-feu, sur leur propre infrastructure », a déclaré Greg Brockman, cofondateur d'OpenAI, dans un communiqué de presse.

Les versions gpt-oss 120B et 20B peuvent fonctionner nativement sur les ordinateurs portables.
Les modèles de langage de poids ouverts diffèrent des modèles open source dans la mesure où ils donnent accès à l'intégralité du code source, aux données de formation et à la méthodologie.
Par ailleurs, Amazon a annoncé que les modèles de pondération ouverts d'OpenAI sont désormais disponibles sur la place de marché Bedrock Generative AI d'Amazon Web Services. « C'est la première fois qu'un modèle OpenAI est disponible sur Bedrock », a déclaré Atul Deo, chef de produit chez Bedrock.
« OpenAI a développé d'excellents modèles, et nous pensons qu'ils constitueront d'excellentes options open source ou de modélisation ouverte pour nos clients », a déclaré Deo lors d'une interview. Il a refusé de discuter d'éventuels accords contractuels entre AWS et OpenAI.
Amazon a annoncé la semaine dernière un ralentissement de la croissance de son unité AWS, notamment par rapport à ses concurrents.

Le modèle gpt-oss-20b est vendu sur la plateforme e-commerce Sage Maker.
Le paysage des modèles d'IA open source et des pondérations ouvertes a été controversé cette année. Pendant un temps, les modèles Llama de META ont été considérés comme les meilleurs, mais la situation a changé en début d'année avec la sortie par l'entreprise chinoise DeepSeek d'un modèle de raisonnement puissant et économique, tandis que Meta peinait à développer Llama 4.
Les deux nouveaux modèles OpenAI sont les premiers modèles ouverts publiés par OpenAI depuis GPT-2, sorti en 2019.
Le plus grand modèle d'OpenAI, gpt-oss-120b, peut fonctionner sur un seul GPU, et le deuxième modèle, gpt-oss-20b, est suffisamment petit pour fonctionner directement sur un ordinateur personnel, a déclaré la société.
OpenAI affirme que ces modèles fonctionnent de manière similaire à ses modèles d'inférence propriétaires appelés o3-mini et o4-mini, et excellent particulièrement dans la programmation, les mathématiques compétitives et les requêtes liées à la santé.
Les modèles sont entraînés sur un ensemble de données textuelles centrées sur les sciences , les mathématiques et la programmation, en plus des connaissances générales. OpenAI ne publie pas de benchmarks comparant ses modèles à pondération ouverte à des modèles concurrents comme DeepSeek-R1.
OpenAI, soutenu par Microsoft et actuellement évalué à 300 milliards de dollars, lève désormais jusqu'à 40 milliards de dollars dans un nouveau tour de financement mené par Softbank Group.
Source : https://khoahocdoisong.vn/openai-phat-hanh-phien-ban-open-weight-co-the-chay-tren-laptop-post2149044060.html
Comment (0)