Az OpenAI augusztus 5-én két nyílt súlyozott nyelvi modellt jelentett be, először a GPT-2 2019-es indulása óta.
Egy mesterséges intelligencia modellt nyílt súlyozásúnak tekintünk, ha a paraméterei, azaz azok a tényezők, amelyek segítenek javítani a kimenetet és az előrejelzéseket a betanítás során, nyilvánosan elérhetők.
A nyílt súlyozási modellek átláthatóságot és kontrollt biztosíthatnak, de különböznek a nyílt forráskódú modellektől, amelyek a teljes forráskódot bárki számára elérhetővé teszik, felhasználhatják és módosíthatják.
Az OpenAI szerint ezek a csak szöveges modellek, a gpt-oss-120b és a gpt-oss-20b, úgy lettek kialakítva, hogy a fejlesztők, kutatók és vállalatok számára olcsóbb, könnyen kezelhető és testreszabható lehetőségeket biztosítsanak.
Az OpenAI mindkét új modellje képes kezelni a fejlett következtetési, eszközhasználati és neurális feldolgozási feladatokat. Úgy tervezték őket, hogy a fogyasztói hardverektől a felhőplatformokon át az eszközalkalmazásokig mindenhol fussanak.
Az OpenAI szerint a felhasználók a gpt-oss-20b-t laptopon futtathatják, és személyi asszisztensként használhatják, amely fájlokban kereshet és írhat.
A cég az Nvidia, az Advanced Micro Devices (AMD), a Cerebras és a Groq cégekkel lépett partnerségre annak érdekében, hogy ezek a modellek számos chipen jól működjenek.
Az OpenAI nyílt súlyozási modelljeinek megjelenését nagy várakozás előzte meg, részben azért, mert a vállalat többször is elhalasztotta a bevezetést, mivel több időre van szüksége további biztonsági tesztek elvégzéséhez és a magas kockázatú területek felülvizsgálatához.
Az OpenAI augusztus 5-én bejelentette, hogy kiterjedt képzési és biztonsági tesztelést végzett nyílt súlyú modelljein. A vállalat az előképzés során kiszűrte a káros kémiai, biológiai, radiológiai és nukleáris adatokat, és szimulálta, hogyan próbálhatják meg a rosszindulatú szereplők a modellek finomhangolását rosszindulatú célokra.
Az OpenAI azt is közölte, hogy három független szakértői csoporttal dolgozott együtt, hogy visszajelzést kapjon a rosszindulatú módosítási folyamat értékeléséről.
Az elmúlt években számos más technológiai vállalat, mint például a Meta, a Microsoft által támogatott Mistral AI és a kínai DeepSeek startup is kiadott nyílt súlyozási modelleket.
Forrás: https://www.vietnamplus.vn/openai-lan-dau-phat-hanh-mo-hinh-ai-trong-so-mo-ke-tu-nam-2019-post1054037.vnp
Hozzászólás (0)