Firma OpenAI 5 sierpnia ogłosiła dwa otwarte ważone modele językowe po raz pierwszy od premiery GPT-2 w 2019 r.
Model sztucznej inteligencji uważa się za ważony w sposób otwarty, jeśli jego parametry, czyli czynniki pomagające udoskonalić wyniki i przewidywania podczas treningu, są publicznie dostępne.
Otwarte modele ważenia mogą zapewnić przejrzystość i kontrolę, ale różnią się od modeli open source, w których cały kod źródłowy jest dostępny dla każdego do wykorzystania i modyfikacji.
Według OpenAI te modele tekstowe o nazwach gpt-oss-120b i gpt-oss-20b mają na celu zapewnienie deweloperom, badaczom i firmom niedrogich opcji, które są łatwe w obsłudze i dostosowywaniu.
Oba nowe modele OpenAI mogą obsługiwać zaawansowane wnioskowanie, korzystanie z narzędzi i zadania przetwarzania neuronowego. Zostały zaprojektowane do działania na wielu platformach, od sprzętu konsumenckiego, przez platformy chmurowe, po aplikacje na urządzeniach.
OpenAI informuje, że użytkownicy mogą uruchomić gpt-oss-20b na laptopie i używać go jako osobistego asystenta umożliwiającego wyszukiwanie w plikach i zapisywanie danych.
Firma nawiązała współpracę z firmami Nvidia, Advanced Micro Devices (AMD), Cerebras i Groq, aby mieć pewność, że modele te będą działać dobrze na wielu typach układów scalonych.
Wydanie przez OpenAI otwartych modeli ważenia było długo oczekiwane, częściowo dlatego, że firma wielokrotnie przekładała premierę, gdyż potrzebowała więcej czasu na przeprowadzenie dodatkowych testów bezpieczeństwa i analizę obszarów wysokiego ryzyka.
Firma OpenAI poinformowała 5 sierpnia, że przeprowadziła szeroko zakrojone szkolenia i testy bezpieczeństwa swoich modeli wagowych. Podczas wstępnego szkolenia firma odfiltrowała szkodliwe dane chemiczne, biologiczne, radiologiczne i nuklearne oraz symulowała, jak cyberprzestępcy mogliby próbować dostroić modele do złośliwych celów.
Firma OpenAI poinformowała również, że współpracowała z trzema niezależnymi grupami ekspertów, aby uzyskać opinie na temat oceny procesu złośliwego modyfikowania ustawień.
W ostatnich latach kilka innych firm technologicznych, takich jak Meta, wspierany przez Microsoft Mistral AI i chiński startup DeepSeek, również opublikowało otwarte modele ważenia./.
Źródło: https://www.vietnamplus.vn/openai-lan-dau-phat-hanh-mo-hinh-ai-trong-so-mo-ke-tu-nam-2019-post1054037.vnp
Komentarz (0)