Qwen3, nowa technologia wprowadzona przez Alibaba. Zdjęcie: SCMP . |
Według najnowszych testów porównawczych świata sztucznej inteligencji, najnowszy model sztucznej inteligencji Alibaby, Qwen3, prześcignął model R1 firmy DeepSeek i stał się najwyżej ocenianym modelem open source na świecie .
Dane z LiveBench, niezależnej platformy, która porównuje duże modele językowe (LLM), technologię stanowiącą podstawę generatywnych usług AI, takich jak ChatGPT, pokazują, że Qwen3 uzyskał w testach lepsze wyniki niż R1.
Przegląd możliwości modeli sztucznej inteligencji typu open source obejmuje programowanie, matematykę, analizę danych i nauczanie języków.
Seria modeli AI o nazwie Qwen3 została wydana przez Alibaba 28 kwietnia. Firma twierdzi, że ten chatbot może dorównywać, a w niektórych przypadkach nawet przewyższać najlepsze modele dostępne obecnie od OpenAI lub Google.
Z rozmiarem do 235 miliardów parametrów, Qwen3 dorównuje DeepSeek-V2 i OpenAI GPT-4, które mają odpowiednio około 236 miliardów i 175 miliardów parametrów. Użytkownicy będą mogli wkrótce pobrać go na otwartej licencji z platformy rozwoju sztucznej inteligencji Hugging Face i Github, gdy tylko seria modeli zostanie udostępniona.
Firma twierdzi, że kolekcja Qwen3 zawiera modele hybrydowe, co oznacza, że mogą one elastycznie dostosowywać swój czas, aby wnioskować w celu rozwiązywania złożonych problemów lub szybko reagować na proste żądania. W tym przypadku wnioskowanie pozwala modelowi samodzielnie sprawdzić dokładność informacji, ale wiąże się z dużym opóźnieniem.
Taka konstrukcja ułatwia użytkownikom przydzielenie odpowiedniego budżetu na każde konkretne zadanie. Ponadto, model ten czerpie inspirację z doświadczeń wielu konkurentów na całym świecie.
Wykorzystując architekturę „mieszanki ekspertów” (MoE), podobną do DeepSeek, Qwen3 może maksymalizować wydajność obliczeniową przy ułamku kosztów szkolenia. To podejście polega na rozbiciu zadania na oddzielne części i rekomendowaniu tylko wystarczającej ilości danych do wykonania.
Według zespołu programistów, Qwen3 obsługuje do 119 języków i jest trenowany na zbiorze danych liczącym prawie 36 000 miliardów tokenów, co odpowiada 27 000 miliardom słów. Dane treningowe pochodzą z wielu źródeł, takich jak podręczniki, zestawy pytań i odpowiedzi, kod programistyczny czy samodzielnie generowana sztuczna inteligencja.
Mimo zajęcia pierwszego miejsca w rankingu oprogramowania typu open source, szczegółowe testy przeprowadzone przez LiveBench pokazują, że Qwen3 ustępuje czołowym na świecie modelom sztucznej inteligencji o zamkniętym kodzie źródłowym, w szczególności o3 firmy OpenAI, Gemini Pro 2.5 firmy Google i Claude 3.7 firmy Anthropic.
Obecnie najlepszy model OpenAI wspierany przez Microsoft, o3-mini high, znajduje się na szczycie ogólnego rankingu modeli AI na świecie.
Źródło: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










Komentarz (0)