A kínai startup, a DeepSeek R1 mesterséges intelligencia modelljét – amely januári indulásakor sokkolta az amerikai tőzsdét – publikálták az első lektorált tanulmányban, amely bemutatja, hogyan fejlesztett ki egy hatékony LLM-et mindössze 300 000 dollárért.
Az R1-et úgy tervezték, hogy kiválóan teljesítsen olyan logikai feladatokban, mint a matematika és a programozás, így olcsó riválisa lehet az amerikai technológiai óriások által fejlesztett eszközöknek.
Ez egy „nyílt súlyú” modell, amely ingyenesen letölthető, és jelenleg a legnépszerűbb modell a Hugging Face platformon, több mint 10,9 millió letöltéssel.
A Nature című folyóiratban megjelent, januárban megjelent kézirat frissített változata először azt mutatta ki, hogy az R1 betanítása mindössze 294 000 dollárba került, azon felül, hogy körülbelül 6 millió dollárt költöttek az alapmodell megépítésére.
Ez a szám jóval alacsonyabb, mint a versenytársak állítólag elköltött több tízmillió dollárja.
A DeepSeek szerint az R1-et elsősorban Nvidia H800 chipekkel képezték ki, amelyek exportját az Egyesült Államok 2023 óta betiltotta Kínába.
Az R1 áttörése a „tiszta megerősítéses tanulás” alkalmazása volt, ahol a modellt próbálgatással és hibával képezik ki, és a helyes válaszokért jutalmat kapnak, ahelyett, hogy emberek által választott példákból tanulnának. Emellett belső becslések segítségével értékeli saját erőfeszítéseit, ezt a technikát „relatív csoportpolitikai optimalizálásnak” nevezik, ami segít a teljesítmény növelésében.
„A szigorú szakmai értékelési folyamat segít validálni a modell értékét és megbízhatóságát” – mondja Huan Sun kutató (Ohio Állami Egyetem). „Más cégeknek is ugyanezt kellene tenniük.”
Lewis Tunstall, a Hugging Face gépi tanulással foglalkozó mérnöke szerint ez egy fontos precedens, mivel az átláthatóság a mesterséges intelligencia fejlesztésében segít a kockázatok pontosabb felmérésében.
A DeepSeek azt állítja, hogy az R1-et nem az OpenAI modelljeiből származó adatokkal képezték ki, bár elismeri, hogy az alapul szolgáló modellt webes adatokon képezték ki – amelyek magukban foglalhatják a mesterséges intelligencia által generált tartalmakat is.
A szakértők szerint bár ezt nehéz abszolút módon ellenőrizni, a jelenlegi bizonyítékok arra utalnak, hogy a puszta fokozás elegendő a magas teljesítmény eléréséhez.
A ScienceAgentBench teszten az R1 nem érte el a pontossági lista élét, de jó egyensúlyt talált a hatékonyság és a költségek között. A kutatók most a DeepSeek módszerét szeretnék alkalmazni a meglévő jogi mesterképzésben részt vevők érvelési képességeinek javítására, valamint a matematikán és programozáson túli területekre való kiterjesztésére.
Tunstall úr szerint az R1 „forradalmat indított” a mesterséges intelligencia fejlesztésében.
Forrás: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp






Hozzászólás (0)