![]() |
DeepSeek postanowił konkurować, oferując niskie ceny. Zdjęcie: Bloomberg . |
Na początku 2025 roku, premiera DeepSeek R1 spowodowała, że kapitalizacja rynkowa Nvidii spadła w ciągu jednego dnia o 600 miliardów dolarów . W tym czasie świat technologii był wstrząśnięty tym nowym modelem z Chin. Rok później pojawił się DeepSeek V4, który najwyraźniej nie odniósł sukcesu.
DeepSeek nie jest już tajemnicą. Model V4 opiera się na architekturze MoE z 1,6 biliona parametrów, ale każda inferencja wyzwala tylko 49 miliardów parametrów. Ten mechanizm „wywołania na żądanie” drastycznie obniża koszty inferencji bez wpływu na wydajność. Okno kontekstowe osiąga milion tokenów, pozwalając użytkownikom na umieszczenie całych wierszy poleceń lub raportów składających się z setek tysięcy słów w jednej rozmowie.
DeepSeek przyznaje, że V4 pozostaje w tyle za modelami z zamkniętą pętlą o około 3-6 miesięcy. Jednak gdy klaster obliczeniowy z procesorem Huawei Ascend 950 zacznie działać jeszcze w tym roku, cena V4 gwałtownie spadnie.
„To oświadczenie firmy, która już zaplanowała swój kolejny ruch, a nie firmy reagującej pod presją” – skomentował jeden z analityków branżowych.
Problem z V4 nie polega na najwyższej wydajności. Jest on wystarczająco dobry, aby spełniać minimalne standardy branżowe. Analiza Union Bancaire Privee sugeruje, że różnica w wydajności między topowymi modelami będzie praktycznie nieistotna dla zdecydowanej większości użytkowników.
Gdy wszystko jest wystarczająco dobre, bitwa przenosi się na cenę, ekosystem i to, kto staje się domyślnym wyborem w globalnym procesie pracy programistów. DeepSeek doskonale to rozumie. Ich strategia open source to sposób na przyciągnięcie dziesiątek tysięcy globalnych programistów do tworzenia aplikacji na ich platformie bez ponoszenia kosztów marketingu lub sprzedaży.
DeepSeek nie pozyskał jeszcze inwestycji zewnętrznych. Tencent i Alibaba, dwie firmy, które opracowały własne modele sztucznej inteligencji, najwyraźniej konkurują o udział w pierwszej rundzie inwestycji DeepSeek. Wynika to z faktu, że strategia DeepSeek „maksymalna wydajność plus open source” ma potencjał, aby ukształtować globalny standard infrastruktury sztucznej inteligencji.
Źródło: https://znews.vn/deepseek-hut-hoi-post1646660.html








Komentarz (0)