OpenAI gibt an, zwei offene Gewichtssprachenmodelle veröffentlicht zu haben, die sich durch fortgeschrittene Inferenz auszeichnen und für die Ausführung auf Laptops mit ähnlichen Leistungsniveaus wie die proprietären 4o-mini-Inferenzmodelle optimiert sind.
Die trainierten Parameter oder Gewichte eines offenen gewichteten Sprachmodells sind öffentlich zugänglich und werden von Entwicklern verwendet, um das Modell für bestimmte Aufgaben zu analysieren und zu optimieren, ohne dass die ursprünglichen Trainingsdaten erforderlich sind.
„Eines der einzigartigen Dinge an offenen Modellen ist, dass sie lokal ausgeführt werden können. Sie können sie hinter ihren eigenen Firewalls und auf ihrer eigenen Infrastruktur ausführen“, sagte OpenAI-Mitbegründer Greg Brockman in einer Pressemitteilung.

Die 120B- und 20B-gpt-oss-Versionen können nativ auf Laptops ausgeführt werden.
Offene Weight-Language-Modelle unterscheiden sich von Open-Source-Modellen dadurch, dass sie Zugriff auf den gesamten Quellcode, die Trainingsdaten und die Methodik bieten.
Unabhängig davon gab Amazon bekannt, dass die offenen Gewichtsmodelle von OpenAI jetzt auf dem Bedrock Generative AI-Marktplatz von Amazon Web Services verfügbar sind. Dies sei das erste Mal, dass ein OpenAI-Modell auf Bedrock verfügbar sei, sagte Atul Deo, Produktmanager bei Bedrock.
„OpenAI hat großartige Modelle entwickelt, und wir glauben, dass diese Modelle großartige Open-Source-Optionen bzw. offene Modellierungsoptionen für Kunden sein werden“, sagte Deo in einem Interview. Er lehnte es ab, über etwaige vertragliche Vereinbarungen zwischen AWS und OpenAI zu sprechen.
Amazon letzte Woche, nachdem das Unternehmen ein verlangsamtes Wachstum seiner AWS-Einheit gemeldet hatte, insbesondere im Vergleich zur Konkurrenz.

Das Modell gpt-oss-20b wird auf der E-Commerce-Plattform Sage Maker verkauft.
Die Landschaft der Open-Source-KI-Modelle und offenen Gewichte war in diesem Jahr umstritten. Eine Zeit lang galten die Llama-Modelle von META als die besten, doch das änderte sich Anfang des Jahres, als das chinesische Unternehmen DeepSeek ein leistungsstarkes und kostengünstiges Reasoning-Modell veröffentlichte, während Meta Schwierigkeiten bei der Entwicklung von Llama 4 hatte.
Die beiden neuen OpenAI-Modelle sind die ersten offenen Modelle, die OpenAI seit der Veröffentlichung von GPT-2 im Jahr 2019 veröffentlicht hat.
Das größere Modell von OpenAI, gpt-oss-120b, kann auf einer einzelnen GPU ausgeführt werden, und das zweite Modell, gpt-oss-20b, ist klein genug, um direkt auf einem PC ausgeführt zu werden, so das Unternehmen.
Laut OpenAI weisen diese Modelle eine ähnliche Leistung auf wie die proprietären Inferenzmodelle o3-mini und o4-mini und eignen sich besonders gut für die Bereiche Programmierung, Leistungsmathematik und gesundheitsbezogene Abfragen.
Die Modelle werden anhand eines reinen Textdatensatzes trainiert, der sich neben Allgemeinwissen auch auf Naturwissenschaften , Mathematik und Programmierung konzentriert. OpenAI veröffentlicht keine Benchmarks, die seine Open-Weight-Modelle mit Konkurrenzmodellen wie DeepSeek-R1 vergleichen.
Das von Microsoft unterstützte Unternehmen OpenAI, das derzeit mit 300 Milliarden US-Dollar bewertet wird, sammelt in einer neuen Finanzierungsrunde unter der Leitung der Softbank Group nun bis zu 40 Milliarden US-Dollar ein.
Quelle: https://khoahocdoisong.vn/openai-phat-hanh-phien-ban-open-weight-co-the-chay-tren-laptop-post2149044060.html
Kommentar (0)