Modelul de inteligență artificială (IA) s1 creat de cercetătorii americani se spune că are un cost de operare de doar 50 USD, dar oferă capacități de raționament echivalente cu modelul o1 al OpenAI, care costă mult mai mult. Apariția lui s1 vine după succesul impresionant al DeepSeek, care a stârnit agitație în Silicon Valley în ultimele zile.
Războiul „inteligentei artificiale ieftine” se intensifică odată cu apariția DeepSeek
Echipa a făcut public codul sursă s1 pe GitHub, împreună cu codul și datele utilizate pentru construirea modelului. Un articol publicat săptămâna trecută explică procesul de dezvoltare a modelului, evidențiind tehnicile ingenioase utilizate. În loc să pornească de la zero cu un nou model de raționament, echipa a folosit un model de limbaj existent și a efectuat un proces de „ajustare fină” prin distilarea capacităților de raționament din modelul experimental Gemini 2.0 Flash Thinking de la Google.
Costurile de operare ale inteligenței artificiale sunt puțin „sub 50 de dolari”
Antrenarea modelului s1 a durat doar 30 de minute, folosind 16 GPU-uri Nvidia H100. Deși fiecare GPU costă în jur de 25.000 de dolari, costul închirierii procesului a fost sub 50 de dolari datorită serviciilor de cloud computing. În special, echipa a descoperit un truc util: instruirea modelului să „aștepte” înainte de a da un răspuns final, ceea ce i-a îmbunătățit raționamentul și a dus la soluții mai bune.
Deși s1 a înregistrat progrese semnificative la un cost redus, există îngrijorări cu privire la scalabilitatea sa. Utilizarea modelului Google ca „profesor” ridică semne de întrebare cu privire la capacitatea sa de a concura cu modelele de inteligență artificială de top din prezent. Google va urmări probabil îndeaproape situația, mai ales având în vedere litigiul în curs dintre OpenAI și DeepSeek.
Sursă: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
Comentariu (0)