Qwen3, o nouă tehnologie lansată de Alibaba. Fotografie: SCMP . |
Conform celor mai recente teste de referință din lumea inteligenței artificiale, modelul de inteligență artificială Qwen3, lansat recent de Alibaba, a depășit R1 de la DeepSeek, devenind modelul open-source cu cel mai înalt rang din lume .
Mai exact, datele de la LiveBench, o platformă independentă care evaluează modelele lingvistice mari (LLM), tehnologia care stă la baza serviciilor de inteligență artificială generativă precum ChatGPT, arată că Qwen3 a depășit R1 în teste.
Revizuirea capacităților modelelor de inteligență artificială open source include programarea, matematica, analiza datelor și instruirea în limbaj.
Seria de modele de inteligență artificială numită Qwen3 a fost lansată de Alibaba pe 28 aprilie. Compania susține că acest chatbot poate fi comparabil cu, și chiar depăși, în unele cazuri, cele mai bune modele disponibile în prezent de la OpenAI sau Google.
Cu o dimensiune de până la 235 de miliarde de parametri, Qwen3 se află la egalitate cu DeepSeek-V2 și OpenAI GPT-4, care au aproximativ 236 de miliarde, respectiv 175 de miliarde de parametri. Utilizatorii vor putea în curând să îl descarce sub o licență deschisă pe platforma de dezvoltare AI Hugging Face și Github, odată ce seria de modele va fi lansată.
Compania spune că colecția Qwen3 include modele hibride, ceea ce înseamnă că își pot flexibiliza timpul pentru a deduce pentru a rezolva probleme complexe sau pentru a răspunde rapid la solicitări simple. În acest caz, inferența permite modelului să autoverifice acuratețea informațiilor, dar are o latență ridicată.
Acest design facilitează alocarea bugetului adecvat pentru fiecare sarcină specifică de către utilizatori. În plus, acest model învață și de la mulți competitori din întreaga lume.
Folosind o arhitectură de tip „amestec de experți” (MoE) similară cu DeepSeek, Qwen3 poate maximiza eficiența computațională la o fracțiune din costul de antrenament. Aceasta este o abordare care împarte o sarcină în părți separate și recomandă doar suficiente date detaliate pentru executare.
Conform echipei de dezvoltare, Qwen3 suportă până la 119 limbi și este antrenat pe un set de date de aproape 36.000 de miliarde de token-uri, echivalentul a 27.000 de miliarde de cuvinte. Datele de antrenament sunt preluate din numeroase surse, cum ar fi manuale, seturi de întrebări-răspunsuri, cod de programare sau inteligență artificială generată automat...
Deși se află în fruntea clasamentului open-source, testele ample efectuate de LiveBench arată că Qwen3 este în urma modelelor de inteligență artificială cu sursă închisă de top din lume, în special o3 de la OpenAI, Gemini Pro 2.5 de la Google și Claude 3.7 de la Anthropic.
În prezent, modelul de top al OpenAI, susținut de Microsoft, o3-mini high, se află în fruntea clasamentului general al modelelor de IA din lume.
Sursă: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










Comentariu (0)