Companiile din China continentală reduc costurile prin construirea de modele antrenate pe cantități mai mici de date, necesitând o putere de calcul mai mică, dar hardware optimizat, a declarat Lee Kai-Fu, fondatorul 01.ai și fostul șef al Google China.

Conform clasamentelor anunțate recent de UC Berkeley SkyLab și LMSYS, modelul Yi-Lingtning al startup-ului 01.ai s-a clasat pe locul trei, la egalitate cu Grok-2 de la x.AI, după OpenAI și Google. Acest clasament se bazează pe scorurile utilizatorilor pentru răspunsurile la interogări.

2d82e5b153faa85bf01e3f82affa4e298ec4f24e.avif.jpg
Reducerea costurilor operațiunilor de inteligență artificială este o modalitate prin care China poate concura cu SUA. Foto: FT

01.ai și DeepSeek sunt companii de inteligență artificială din China continentală care adoptă o strategie de concentrare pe seturi de date mai mici pentru antrenarea modelelor, angajând în același timp forță de muncă ieftină și înalt calificată.

FT a declarat că costul inferenței Yi-Lightning este de 14 cenți pe milion de token-uri, comparativ cu 26 de cenți pentru GPT o1-mini de la OpenAI. Între timp, GPT 4o costă până la 4,40 dolari pe milion de token-uri. Numărul de token-uri utilizate pentru a genera un răspuns depinde de complexitatea fiecărei interogări.

Fondatorii Yi-Lightning au dezvăluit că firma a cheltuit 3 milioane de dolari pe „instruire inițială”, înainte de a face ajustări fine pentru diferite cazuri de utilizare. Lee a spus că scopul lor „nu a fost să creeze cel mai bun model”, ci să construiască un model concurent care să fie „de 5-10 ori mai ieftin”.

Metoda aplicată de 01.ai, DeepSeek, MiniMax și Stepfun se numește „modelare expertă” – ceea ce înseamnă pur și simplu combinarea mai multor rețele neuronale antrenate pe seturi de date specifice domeniului.

Cercetătorii consideră această abordare ca o modalitate esențială de a atinge același nivel de inteligență ca modelele de big data, dar cu o putere de calcul mai mică. Cu toate acestea, dificultatea abordării este că inginerii trebuie să orchestreze procesul de instruire cu „mai mulți experți” în loc de un singur model general.

Din cauza dificultăților în accesarea cipurilor de inteligență artificială de ultimă generație, companiile chineze s-au orientat către dezvoltarea de seturi de date de înaltă calitate, care pot fi utilizate pentru antrenarea modelelor de experți, concurând astfel cu rivalii occidentali.

Lee a spus că 01.ai are metode netradiționale de colectare a datelor, cum ar fi scanarea cărților sau colectarea articolelor în aplicația de mesagerie WeChat, care nu sunt accesibile pe site-ul web deschis.

Fondatorul consideră că China este mai bine poziționată decât SUA, având în vedere imensa sa rezervă de talente tehnice ieftine.

(Conform FT, Bloomberg)

Gigantul rețelelor sociale Meta a anunțat un nou model de inteligență artificială cu funcție de evaluare a autoînvățării (STE), care poate restrânge intervenția umană în procesul de dezvoltare a inteligenței artificiale.