DeepSeek, cel mai popular startup chinez din ultimele zile, a ridicat îndoieli cu privire la afirmația sa de a crea o inteligență artificială la egalitate cu OpenAI, cu o investiție de doar 5 milioane de dolari.
DeepSeek a avut o acoperire mediatică extinsă și pe rețelele sociale la începutul Anului Șarpelui, provocând tremurături semnificative pe piețele bursiere globale.
Cu toate acestea, un raport recent al firmei de consultanță financiară Bernstein avertizează că, în ciuda realizărilor impresionante, afirmația creării unui sistem de inteligență artificială comparabil cu cel al OpenAI pentru doar 5 milioane de dolari este inexactă.
Potrivit lui Bernstein, declarația DeepSeek este înșelătoare și nu reflectă imaginea de ansamblu.
„Credem că DeepSeek nu a «creat OpenAI cu 5 milioane de dolari»; modelele sunt fantastice, dar nu credem că sunt miracole; iar panica din weekend pare să fi fost exagerată”, se arată în raport.

DeepSeek dezvoltă două modele principale de inteligență artificială: DeepSeek-V3 și DeepSeek R1. Modelul de limbaj V3 la scară largă utilizează arhitectura MOE, combinând modele mai mici pentru a obține performanțe ridicate, utilizând în același timp mai puține resurse de calcul decât modelele tradiționale.
Pe de altă parte, modelul V3 are 671 de miliarde de parametri, dintre care 37 de miliarde sunt activi în orice moment, încorporând inovații precum MHLA pentru a reduce utilizarea memoriei și utilizând FP8 pentru o eficiență mai mare.
Antrenarea modelului V3 a necesitat un cluster de 2.048 de GPU-uri Nvidia H800 pe o perioadă de două luni, echivalentul a 5,5 milioane de ore GPU. Deși unele estimări estimează costul instruirii la aproximativ 5 milioane de dolari, raportul lui Bernstein subliniază că această cifră acoperă doar resursele de calcul și nu ia în considerare costurile semnificative legate de cercetare, testare și alte cheltuieli de dezvoltare.
Modelul DeepSeek R1 se bazează pe fundația V3, utilizând învățarea prin consolidare (RL) și alte tehnici pentru a asigura capacitatea de inferență.
Modelul R1 poate concura cu modelele OpenAI în sarcinile de raționament. Cu toate acestea, Bernstein subliniază că dezvoltarea R1 necesită resurse semnificative, deși acestea nu sunt detaliate în raportul DeepSeek.
Comentând despre DeepSeek, Bernstein a lăudat modelele ca fiind impresionante. De exemplu, modelul V3 are performanțe la fel de bune sau mai bune decât alte modele lingvistice importante din lingvistică, programare și matematică, necesitând în același timp mai puține resurse.
Procesul de pre-antrenament V3 a necesitat doar 2,7 milioane de ore de lucru GPU, sau 9% din resursele de calcul ale altor modele de top.
Bernstein a concluzionat că, deși progresele DeepSeek sunt demne de remarcat, trebuie să fim precauți cu afirmațiile exagerate. Ideea de a crea un concurent pentru OpenAI cu doar 5 milioane de dolari pare greșită.
(Conform Times of India)
Sursă: https://vietnamnet.vn/deepseek-khong-the-lam-ai-tuong-duong-openai-voi-5-trieu-usd-2367340.html






Comentariu (0)