OpenAI kündigte am 5. August zum ersten Mal seit der Einführung von GPT-2 im Jahr 2019 zwei offene gewichtete Sprachmodelle an.
Ein Modell künstlicher Intelligenz gilt als offenes Gewicht, wenn seine Parameter, d. h. die Faktoren, die zur Verbesserung der Ergebnisse und Vorhersagen während des Trainings beitragen, öffentlich verfügbar sind.
Offene Gewichtungsmodelle können Transparenz und Kontrolle bieten, unterscheiden sich jedoch von Open-Source-Modellen, bei denen der gesamte Quellcode für jedermann zur Verwendung und Änderung verfügbar ist.
Laut OpenAI sollen diese Nur-Text-Modelle mit den Namen gpt-oss-120b und gpt-oss-20b Entwicklern, Forschern und Unternehmen kostengünstigere Optionen bieten, die einfach zu bedienen und anzupassen sind.
Beide neuen Modelle von OpenAI können erweiterte Inferenz-, Tool- und neuronale Verarbeitungsaufgaben bewältigen. Sie sind für den Einsatz auf Verbraucherhardware, Cloud-Plattformen und On-Device-Anwendungen konzipiert.
Laut OpenAI können Benutzer gpt-oss-20b auf einem Laptop ausführen und es als persönlichen Assistenten verwenden, der Dateien durchsuchen und schreiben kann.
Das Unternehmen ist eine Partnerschaft mit Nvidia, Advanced Micro Devices (AMD), Cerebras und Groq eingegangen, um sicherzustellen, dass diese Modelle auf einer Vielzahl von Chips gut funktionieren.
Die Veröffentlichung der offenen Gewichtungsmodelle von OpenAI wurde mit Spannung erwartet, auch weil das Unternehmen die Markteinführung wiederholt verschoben hat, da es mehr Zeit benötigt, um zusätzliche Sicherheitstests durchzuführen und Hochrisikobereiche zu überprüfen.
OpenAI gab am 5. August bekannt, dass es umfangreiche Trainings- und Sicherheitstests seiner Open-Weight-Modelle durchgeführt habe. Das Unternehmen filterte in der Vortrainingsphase schädliche chemische, biologische, radiologische und nukleare Daten heraus und simulierte, wie böswillige Akteure versuchen könnten, die Modelle für böswillige Zwecke zu optimieren.
OpenAI sagte außerdem, dass es mit drei unabhängigen Expertengruppen zusammengearbeitet habe, um Feedback zu seiner Einschätzung dieses böswilligen Optimierungsprozesses zu erhalten.
In den letzten Jahren haben auch mehrere andere Technologieunternehmen wie Meta, das von Microsoft unterstützte Mistral AI und das chinesische Startup DeepSeek offene Gewichtungsmodelle veröffentlicht./.
Quelle: https://www.vietnamplus.vn/openai-lan-dau-phat-hanh-mo-hinh-ai-trong-so-mo-ke-tu-nam-2019-post1054037.vnp
Kommentar (0)