În urma nebuniei DeepSeek, marile companii tehnologice chineze s-au grăbit rapid să lanseze modele lingvistice mari (LLM) pentru a concura și a câștiga cotă de piață.
Tehnologia globală se accelerează
Pe 29 ianuarie, în prima zi a Anului Nou Lunar 2025, Alibaba Group a lansat o nouă versiune a modelului de inteligență artificială (IA) Qwen 2.5 și a anunțat că acest model este mai puternic decât DeepSeek. Potrivit Alibaba, Qwen 2.5 „depășește în aproape toate aspectele” cele mai avansate modele de IA ale OpenAI și Meta (SUA), cum ar fi GPT-4o și Llama-3.1-405B.
Anterior, DeepSeek a lansat asistenți bazați pe inteligență artificială folosind modelele DeepSeek-V3 și DeepSeek-R1 la un cost doar o fracțiune din cel al produselor companiilor americane.
Două „cutremure” DeepSeek și Alibaba au creat o cursă pentru modernizarea inteligenței artificiale chiar în China. În special, chatbot-ul cu inteligență artificială low-cost ChatGLM a fost dezvoltat de o echipă de cercetare de la Universitatea Tsinghua și compania Zhipu AI. ChatGLM este un chatbot cu inteligență artificială open-source capabil să genereze text, să traducă și să răspundă la întrebări.
Gigantul tehnologic Baidu, Ernie Bot, a lansat și o versiune îmbunătățită, Ernie 4.0 Turbo, capabilă să îndeplinească diverse sarcini, inclusiv generarea de text, traducerea, răspunsul la întrebări, crearea de imagini etc. Între timp, ByteDance - compania-mamă a TikTok - și-a actualizat modelul emblematic de inteligență artificială și a anunțat că a trecut scorul o1 al OpenAI în testul AIME - un standard care măsoară capacitatea inteligenței artificiale de a procesa și de a răspunde la instrucțiuni complexe.
DeepSeek amenință, de asemenea, piața globală, forțând giganți tehnologici de top precum OpenAI, Meta, Google, Microsoft... să își ajusteze strategiile de investiții. Corporațiile americane de tehnologie au investit anterior în fabrici de inteligență artificială și fabrici de date, dar de acum înainte vor trebui să se concentreze pe îmbunătățirea algoritmilor pentru a reduce costurile și a opera mai rapid și mai eficient. Recent, OpenAI a introdus funcția Deep Research, care ajută ChatGPT să sintetizeze și să cerceteze informații. Punctul culminant al acestei funcții este capacitatea de a afișa detalii ale procesului de cercetare, inclusiv citări și rezumate ale metodelor utilizate, facilitând urmărirea și verificarea informațiilor de către utilizatori.
Alte țări precum India, Coreea de Sud... participă, de asemenea, la dezvoltarea de chatbot-uri cu inteligență artificială low-cost. De exemplu, în India, compania Reliance Jio a miliardarului Mukesh Ambani a lansat primul chatbot cu inteligență artificială care acceptă limbile locale, numit BharatGPT. Acesta este un pas semnificativ înainte în domeniul inteligenței artificiale din India, ajutând tehnologia să ajungă mai ușor la populația care nu vorbește limba engleză.
Interfața DeepSeek și Qwen 2.5 Fotografie: Future/Qwen/Shutterstock
Ce oportunități pentru Vietnam?
Dl. Lu Vincent The Hung - fondator și CEO al EduX Global Institute Joint Stock Company - a declarat că, în trecut, industria tehnologică anunțase adesea că costul construirii modelelor de inteligență artificială ajungea la miliarde de dolari. Cu toate acestea, lansarea R1 de către start-up-ul tehnologic DeepSeek, cu un cost de doar 6 milioane de dolari - dacă este adevărat - ar putea fi forța motrice pentru țări și companii start-up să își dezvolte propria inteligență artificială cu performanțe ridicate și costuri reduse. De acolo, companiile, în special întreprinderile mici și mijlocii, pot accesa și aplica inteligența artificială fără a fi nevoite să investească costuri inițiale prea mari; pot promova transformarea digitală în domeniile producției, comerțului, serviciilor, educației ...
Cu toate acestea, modelul R1, lansat recent de DeepSeek, s-a confruntat cu numeroase controverse legate de securitatea datelor și copierea modelelor de inteligență artificială ale altor companii de tehnologie. Prin urmare, pentru a-și crea propriile modele de inteligență artificială la costuri reduse, țările și companiile trebuie să înțeleagă cu atenție principiile de funcționare, algoritmii, codul sursă etc., în loc să le copieze sau să le fure. „Un model de inteligență artificială de succes nu ține doar de capacitatea de procesare, ci și de cost. Companiile vietnameze ar trebui să urmeze direcția construirii de soluții care pot fi extinse și personalizate în funcție de cerințele multor industrii diferite”, a sugerat dl. Hung.
Potrivit domnului Phan Tan Quoc - director adjunct al Programului de Inovație KPMG Vietnam, concurența acerbă de pe piața inteligenței artificiale va fi atât presiune, cât și motivație pentru întreprinderile vietnameze de a crea rapid modele utile și prestigioase pentru a servi utilizatorii și clienții interni. Domnul Quoc a recomandat ca guvernul să adopte politici care să încurajeze întreprinderile și persoanele fizice să participe la dezvoltarea inteligenței artificiale, să construiască baze de date și, în același timp, să sprijine investițiile în centre de cercetare în domeniul inteligenței artificiale.
„Tendința de partajare a codului open source în comunitatea IA poate ajuta dezvoltatorii să profite de model și să îl îmbunătățească. În viitorul viitor, multe startup-uri și persoane fizice vor accesa și aplica cu ușurință IA în operațiunile lor, atunci când vor apărea multe modele noi de IA, care vor satisface nevoi specifice”, a declarat dl. Quoc.
Potrivit experților, atunci când dezvoltă inteligența artificială, companiile trebuie să stabilească în mod clar dacă modelul poate rezolva o problemă specifică, poate aduce valoare reală utilizatorilor și poate prezenta diferențe în ceea ce privește caracteristicile sau aspectele remarcabile. Modelul DeepSeek este o lecție pentru companiile globale de tehnologie, ale căror costuri autodeclarate sunt extrem de scăzute, dar cu performanțe care depășesc ChatGPT. În continuare, este necesar să se înțeleagă clar cererea de inteligență artificială pe piață pentru a se asigura că inteligența artificială este suficient de competitivă și poate fi profitabilă.
Este DeepSeek chiar ieftin?
În raportul său, DeepSeek a declarat că costul total al antrenării modelului de inteligență artificială a fost mai mic de 6 milioane de dolari, în principal din cauza închirierii de unități de procesare grafică de la NVIDIA. Cu toate acestea, recent, firma de cercetare și consultanță în domeniul semiconductorilor SemiAnalysis a calculat că costul dezvoltării DeepSeek este mult mai mare decât cel declarat.
Se estimează că DeepSeek va opera un sistem de calcul masiv, format din aproximativ 50.000 de GPU-uri Hopper, cu 10.000 de GPU-uri H800 și 10.000 de GPU-uri H100 mai puternice, alături de GPU-uri H20 suplimentare. Cheltuielile totale de capital pentru servere sunt estimate la aproximativ 1,6 miliarde de dolari, iar costurile de operare sunt de aproximativ 944 de milioane de dolari.
Sursă: https://nld.com.vn/co-hoi-tu-nhung-con-dia-chan-ai-196250204200528423.htm
Comentariu (0)