A szárazföldi vállalatok költségcsökkentést érnek el azáltal, hogy kisebb adatmennyiségeken képzett modelleket építenek, amelyek kevesebb számítási teljesítményt igényelnek, de optimalizált hardvert igényelnek – mondta Lee Kai-Fu, a 01.ai alapítója és a Google China korábbi vezetője.

A UC Berkeley SkyLab és az LMSYS által nemrégiben közzétett rangsor szerint a 01.ai startup Yi-Lingtning modellje a harmadik helyen végzett, holtversenyben az x.AI Grok-2-jével, az OpenAI és a Google mögött. Ez a rangsor a felhasználók lekérdezésekre adott válaszai alapján készült.

2d82e5b153faa85bf01e3f82affa4e298ec4f24e.avif.jpg
A mesterséges intelligencia működtetésének költségeinek csökkentése Kína számára egy módja annak, hogy versenyre keljen az Egyesült Államokkal. Fotó: FT

A 01.ai és a DeepSeek két szárazföldi mesterséges intelligencia cég, amelyek kisebb adathalmazokra összpontosítanak a modellek betanítására, miközben olcsó, magasan képzett munkaerőt alkalmaznak.

Az FT szerint a Yi-Lightning következtetési költsége millió tokenenként 14 cent, szemben az OpenAI GPT o1-mini 26 centjével. Eközben a GPT 4o költsége akár 4,40 dollár is lehet millió tokenenként. A válasz generálásához használt tokenek száma az egyes lekérdezések összetettségétől függ.

A Yi-Lightning alapítói elárulták, hogy a cég 3 millió dollárt költött „kezdeti betanításra”, mielőtt a különböző felhasználási esetekre finomhangolták volna. Lee elmondta, hogy a céljuk „nem a legjobb modell létrehozása volt, hanem egy versengő modell felépítése, amely „5-10-szer olcsóbb”.

A 01.ai, a DeepSeek, a MiniMax és a Stepfun által alkalmazott módszert „szakértői modellezésnek” nevezik – ami egyszerűen azt jelenti, hogy több, domain-specifikus adathalmazokon betanított neurális hálózatot kombinálnak.

A kutatók ezt a megközelítést kulcsfontosságúnak tartják a big data modellekével megegyező intelligenciaszint elérésére, de kevesebb számítási teljesítménnyel. A megközelítés nehézsége azonban az, hogy a mérnököknek a betanítási folyamatot „több szakértővel” kell összehangolniuk egyetlen általános modell helyett.

A csúcskategóriás mesterséges intelligencia chipekhez való hozzáférés nehézségei miatt a kínai vállalatok a kiváló minőségű adatkészletek fejlesztése felé fordultak, amelyek felhasználhatók szakértői modellek betanítására, ezáltal versenyezve a nyugati riválisokkal.

Lee elmondta, hogy a 01.ai nem hagyományos módszerekkel gyűjti az adatokat, például könyveket szkennel vagy cikkeket gyűjt a WeChat üzenetküldő alkalmazásban, amelyek nem érhetők el a nyílt weboldalon.

Az alapító úgy véli, hogy Kína jobb helyzetben van, mint az Egyesült Államok, hatalmas, olcsó műszaki tehetségbázisával.

(Az FT és a Bloomberg szerint)

A Meta elindítja az „öntanuló” MI-modellt A közösségi médiaóriás, a Meta nemrégiben bejelentett egy új MI-modellt, amely önálló tanulási értékelési (STE) funkcióval rendelkezik, és leszűkítheti az emberi beavatkozást a MI fejlesztési folyamatába.