Ujawniono nowy „atut” DeepSeek.

Nowa sztuczna inteligencja DeepSeek nadal wzbudza sensację w świecie technologii dzięki swojej wyjątkowej wydajności. Zdjęcie: SCMP .

DeepSeek oficjalnie wprowadza DeepSeek V3-0324, najnowszą wersję języka programowania rodziny V3 języków modelowania wielkoskalowego (LLM).

Podobnie jak jego poprzednicy, ten model jest udostępniany bezpłatnie i na zasadzie open source za pośrednictwem platformy Hugging Face. W porównaniu z poprzednimi wersjami zawiera znaczące udoskonalenia, zwłaszcza w zakresie rozumowania i programowania.

Dokładniej rzecz ujmując, według OpenRouter, DeepSeek V3-0324 został stworzony przy użyciu metody Mixture of Experts (MoE), bardzo popularnej w niektórych chińskich modelach sztucznej inteligencji, i ma 685 miliardów parametrów.

Według wstępnych recenzji, ten model wykazuje imponującą wydajność w szerokim zakresie zadań. Tymczasem wpis na Reddicie pokazuje, że DeepSeek V3-0324 dogonił model Sonnet 3.7 firmy Google w teście generowania kodu.

Źródła wskazują również, że DeepSeek V3-0324 potrafi generować długie fragmenty kodu bez błędów. Serwis analityczny Vidhya przetestował ten model i odnotował jego zdolność do płynnego generowania 700 linii kodu.

Na platformie X aplikacja DeepSeek V3-0324 również zrobiła furorę. Aby to udowodnić, użytkownik Deepanshu Sharma opublikował film pokazujący, że ten model sztucznej inteligencji potrafi płynnie generować kompletne strony internetowe z ponad 800 liniami kodu.

W grudniu 2024 roku DeepSeek stał się najgłośniejszą chińską firmą zajmującą się sztuczną inteligencją, wprowadzając na rynek DeepSeek-V3. Model ten osiągnął wydajność porównywalną z GPT-4o, ale wykorzystywał jedynie ułamek zasobów obliczeniowych.

Niedługo potem DeepSeek opublikował swój model wnioskowania DeepSeek-R1. Według TechCrunch , R1 przewyższył model o1 firmy OpenAI w testach porównawczych takich jak AIME, MATH-500 i SWE-bench Verified.

Jednocześnie kwota 5,6 mln dolarów przeznaczona na ostateczne szkolenie modelu DeepSeek jest szokująca, jeśli porównać ją z setkami milionów dolarów, jakie czołowe amerykańskie firmy wydają na szkolenie swoich modeli.

Źródło: https://znews.vn/at-chu-bai-moi-cua-deepseek-lo-dien-post1540831.html