DeepSeek a fost detronată.

Qwen3, o nouă tehnologie lansată de Alibaba. Fotografie: SCMP .

Conform celor mai recente teste de benchmark pentru inteligența artificială, modelul de inteligență artificială Qwen3, lansat recent de Alibaba, a depășit modelul R1 de la DeepSeek, devenind modelul open-source cu cel mai bine cotat nivel din lume .

Mai exact, datele de la LiveBench, o platformă independentă care evaluează modelele lingvistice mari (LLM), tehnologia fundamentală pentru serviciile de inteligență artificială generativă precum ChatGPT, arată că Qwen3 a depășit R1 în teste.

Evaluarea capacităților modelelor de inteligență artificială open-source include programarea, matematica, analiza datelor și instruirea în limbaj.

Alibaba a lansat seria sa de modele cu inteligență artificială Qwen3 pe 28 aprilie. Compania susține că acest chatbot poate rivaliza sau chiar depăși, în unele cazuri, cele mai bune modele actuale de la OpenAI sau Google.

Cu o dimensiune de până la 235 de miliarde de parametri, Qwen3 are performanțe comparabile cu DeepSeek-V2 și OpenAI GPT-4, care au aproximativ 236 de miliarde, respectiv 175 de miliarde de parametri. Utilizatorii vor putea în curând să îl descarce sub licență deschisă pe platforma de dezvoltare AI Hugging Face și Github, odată ce această serie de modele va fi lansată.

Compania a declarat că colecția Qwen3 include modele hibride, ceea ce înseamnă că pot aloca flexibil timp pentru raționament în vederea rezolvării problemelor complexe sau pot răspunde rapid la solicitări simple. În acest model, capacitatea de raționament permite autoverificarea acurateței informațiilor, dar acest lucru vine cu un decalaj semnificativ.

Acest design facilitează alocarea bugetului în mod corespunzător pentru fiecare sarcină specifică de către utilizatori. În plus, acest model învață și de la mulți competitori din întreaga lume.

Folosind o arhitectură de tip „mix of experts” (MoE) similară cu DeepSeek, Qwen3 poate optimiza performanța de calcul utilizând doar o fracțiune din costul de antrenament. Această metodă împarte sarcinile în mai multe părți separate și necesită doar o cantitate suficientă de date intensive pentru a le îndeplini.

Conform echipei de dezvoltare, Qwen3 suportă până la 119 limbi și este antrenat pe un set de date de aproape 36 de trilioane de token-uri, echivalentul a 27 de trilioane de cuvinte. Datele de antrenament provin din diverse surse, cum ar fi manuale, seturi de întrebări-răspunsuri, cod de programare sau chiar date generate de inteligența artificială etc.

Deși se află în fruntea clasamentului open-source, testul extins de benchmark realizat de LiveBench arată că Qwen3 este încă în urma modelelor de inteligență artificială cu sursă închisă de top din lume. Cele mai importante dintre acestea sunt o3 de la OpenAI, Gemini Pro 2.5 de la Google și Claude 3.7 de la Anthropic.

În prezent, cel mai avansat model OpenAI susținut de Microsoft, o3-mini high, se află în fruntea clasamentului general al modelelor de IA la nivel mondial.

Sursă: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html