Model sztucznej inteligencji (AI) S1, stworzony przez amerykańskich naukowców, ma podobno kosztować zaledwie 50 dolarów, ale oferuje możliwości rozumowania równoważne modelowi O1 firmy OpenAI, który jest znacznie droższy. Pojawienie się S1 nastąpiło po imponującym sukcesie DeepSeek, który w ostatnich dniach wywołał poruszenie w Dolinie Krzemowej.
Wojna o „tańszą sztuczną inteligencję” zaostrza się od czasu pojawienia się DeepSeek
Zespół upublicznił kod źródłowy s1 w serwisie GitHub, wraz z kodem i danymi użytymi do zbudowania modelu. Artykuł opublikowany w zeszłym tygodniu wyjaśnia proces tworzenia modelu, podkreślając zastosowane przez nich sprytne techniki. Zamiast zaczynać od zera od nowego modelu wnioskowania, zespół wykorzystał istniejący model językowy i przeprowadził proces „dostrajania”, wykorzystując możliwości wnioskowania z eksperymentalnego modelu Google Gemini 2.0 Flash Thinking.
Koszty operacyjne sztucznej inteligencji wynoszą nieco poniżej 50 dolarów
Szkolenie modelu s1 zajęło zaledwie 30 minut i wykorzystało 16 procesorów graficznych Nvidia H100. Chociaż każdy procesor graficzny kosztuje około 25 000 dolarów, koszt wynajęcia procesu wyniósł mniej niż 50 dolarów dzięki usługom przetwarzania w chmurze. Zespół odkrył w szczególności użyteczną sztuczkę: poinstruowanie modelu, aby „czekał” przed udzieleniem ostatecznej odpowiedzi, co usprawniło jego rozumowanie i zaowocowało lepszymi rozwiązaniami.
Chociaż S1 poczynił znaczne postępy przy niskich kosztach, istnieją obawy dotyczące jego skalowalności. Wykorzystanie modelu Google jako „nauczyciela” rodzi pytania o jego zdolność do konkurowania z wiodącymi modelami sztucznej inteligencji. Google prawdopodobnie będzie uważnie śledzić sytuację, zwłaszcza biorąc pod uwagę toczący się spór sądowy między OpenAI a DeepSeek.
Source: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Komentarz (0)