Az Alibaba, a Baidu és a ByteDance technológiai óriások versenyeznek azért, hogy alákínálják a „következtetésen” alapuló mesterséges intelligencia költségeit, olyan árakat kínálva, amelyek 90%-kal alacsonyabbak az amerikai versenytársaik által kínált áraknál.
A szárazföldi vállalatok költségcsökkentést érnek el azáltal, hogy kisebb adatmennyiségeken képzett modelleket építenek, amelyek kevesebb számítási teljesítményt igényelnek, de optimalizált hardvert igényelnek – mondta Lee Kai-Fu, a 01.ai alapítója és a Google China korábbi vezetője.
A UC Berkeley SkyLab és az LMSYS által nemrégiben közzétett rangsor szerint a 01.ai startup Yi-Lingtning modellje a harmadik helyen végzett, holtversenyben az x.AI Grok-2-jével, az OpenAI és a Google mögött. Ez a rangsor a felhasználók lekérdezésekre adott válaszai alapján készült.
A 01.ai és a DeepSeek két szárazföldi mesterséges intelligencia cég, amelyek kisebb adathalmazokra összpontosítanak a modellek betanítására, miközben olcsó, magasan képzett munkaerőt alkalmaznak.
Az FT szerint a Yi-Lightning következtetési költsége millió tokenenként 14 cent, szemben az OpenAI GPT o1-mini 26 centjével. Eközben a GPT 4o költsége akár 4,40 dollár is lehet millió tokenenként. A válasz generálásához használt tokenek száma az egyes lekérdezések összetettségétől függ.
A Yi-Lightning alapítói elárulták, hogy a cég 3 millió dollárt költött „kezdeti betanításra”, mielőtt a különböző felhasználási esetekre finomhangolták volna. Lee elmondta, hogy a céljuk „nem a legjobb modell létrehozása volt, hanem egy versengő modell felépítése, amely „5-10-szer olcsóbb”.
A 01.ai, a DeepSeek, a MiniMax és a Stepfun által alkalmazott módszert „szakértői modellezésnek” nevezik – ami egyszerűen azt jelenti, hogy több, domain-specifikus adathalmazokon betanított neurális hálózatot kombinálnak.
A kutatók ezt a megközelítést kulcsfontosságúnak tartják a big data modellekével megegyező intelligenciaszint elérésére, de kevesebb számítási teljesítménnyel. A megközelítés nehézsége azonban az, hogy a mérnököknek a betanítási folyamatot „több szakértővel” kell összehangolniuk egyetlen általános modell helyett.
A csúcskategóriás mesterséges intelligencia chipekhez való hozzáférés nehézségei miatt a kínai vállalatok a kiváló minőségű adatkészletek fejlesztése felé fordultak, amelyek felhasználhatók szakértői modellek betanítására, ezáltal versenyezve a nyugati riválisokkal.
Lee elmondta, hogy a 01.ai nem hagyományos módszerekkel gyűjti az adatokat, például könyveket szkennel vagy cikkeket gyűjt a WeChat üzenetküldő alkalmazásban, amelyek nem érhetők el a nyílt weboldalon.
Az alapító úgy véli, hogy Kína jobb helyzetben van, mint az Egyesült Államok, hatalmas, olcsó műszaki tehetségbázisával.
(Az FT és a Bloomberg szerint)
[hirdetés_2]
Forrás: https://vietnamnet.vn/trung-quoc-giam-90-chi-phi-ai-suy-luan-so-voi-my-2334520.html
Hozzászólás (0)