DeepSeek został zdetronizowany.

Qwen3, nowa technologia wprowadzona przez Alibaba. Zdjęcie: SCMP .

Według najnowszych testów porównawczych sztucznej inteligencji (AI), najnowszy model sztucznej inteligencji Qwen3 firmy Alibaba prześcignął model R1 firmy DeepSeek i stał się najlepiej ocenianym modelem open source na świecie .

Dane z LiveBench, niezależnej platformy oceniającej duże modele językowe (LLM), technologię bazową dla generatywnych usług AI, takich jak ChatGPT, pokazują, że Qwen3 przewyższył R1 w testach.

Ocena możliwości modeli sztucznej inteligencji typu open source obejmuje programowanie, matematykę, analizę danych i nauczanie języków.

Alibaba wypuściła serię modeli Qwen3 AI 28 kwietnia. Firma twierdzi, że ten chatbot może dorównać, a w niektórych przypadkach nawet przewyższyć, najlepsze obecne modele od OpenAI i Google.

Z rozmiarem do 235 miliardów parametrów, Qwen3 oferuje wydajność porównywalną z DeepSeek-V2 i OpenAI GPT-4, które mają odpowiednio około 236 miliardów i 175 miliardów parametrów. Użytkownicy będą mogli wkrótce pobrać go na otwartej licencji z platformy rozwoju sztucznej inteligencji Hugging Face i Github, gdy tylko ta seria modeli zostanie wydana.

Firma poinformowała, że kolekcja Qwen3 obejmuje modele hybrydowe, co oznacza, że mogą one elastycznie przydzielać czas na rozumowanie w celu rozwiązywania złożonych problemów lub szybkiego reagowania na proste żądania. W tym modelu zdolność rozumowania pozwala na samodzielną weryfikację poprawności informacji, ale wiąże się to ze znacznym opóźnieniem czasowym.

Ta konstrukcja ułatwia użytkownikom odpowiednie przydzielanie budżetu do każdego konkretnego zadania. Co więcej, model ten czerpie inspirację z doświadczeń wielu konkurentów na całym świecie.

Wykorzystując architekturę „mieszanki ekspertów” (MoE), podobną do DeepSeek, Qwen3 może optymalizować wydajność obliczeniową, zużywając jedynie ułamek kosztów szkolenia. Ta metoda dzieli zadania na wiele oddzielnych części i wymaga jedynie wystarczającej ilości danych o dużej intensywności przetwarzania, aby je wykonać.

Według zespołu programistów, Qwen3 obsługuje do 119 języków i jest trenowany na zbiorze danych liczącym prawie 36 bilionów tokenów, co odpowiada 27 bilionom słów. Dane treningowe pochodzą z różnych źródeł, takich jak podręczniki, zestawy pytań i odpowiedzi, kod programistyczny, a nawet dane generowane przez sztuczną inteligencję itp.

Pomimo czołowej pozycji w rankingach open source, rozszerzone testy porównawcze LiveBench pokazują, że Qwen3 wciąż pozostaje w tyle za wiodącymi na świecie modelami zamkniętej sztucznej inteligencji. Najbardziej widoczne z nich to o3 od OpenAI, Gemini Pro 2.5 od Google i Claude 3.7 od Anthropic.

Obecnie najbardziej zaawansowany model OpenAI wspierany przez Microsoft, o3-mini high, znajduje się na szczycie ogólnego rankingu modeli AI na świecie.

Źródło: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html