DeepSeek nadaje niespotykany dotąd rozmach wysiłkom Chin zmierzającym do zmniejszenia zależności od ekosystemu Nvidia.
Chińscy producenci układów scalonych od lat podziwiają firmę Nvidia, gdyż amerykański gigant zbudował sobie niezrównaną pozycję w branży dzięki jej możliwościom sprzętowym i opatentowanemu zestawowi narzędzi CUDA, których inżynierowie używają do tworzenia aplikacji na procesorach graficznych (GPU) tej firmy.
Jednak wraz z premierą DeepSeek V3 i R1, firmy te zyskują coraz większą szansę na odejście od strategii Nvidii.
Infinigence AI, dostawca platformy infrastruktury obliczeniowej, poinformował, że w tym celu współpracuje z siedmioma wiodącymi chińskimi producentami układów scalonych: Biren Technology, Hygon Information Technology, Moore Threads, MetaX, Enflame, Iluvatar CoreX i Ascend.
Podczas styczniowej wizyty w Chinach, prezes Nvidii, Jensen Huang, powiedział, że około 1,5 miliona programistów w tym kraju korzysta z CUDA. Firma nawiązała również współpracę z ponad 3000 startupów, aby pomóc w rozwoju branży technologicznej w tym kraju.
Dokładna liczba chipów użytych przez DeepSeek do wytrenowania modeli V3 i R1 pozostaje tajemnicą, pojawiły się jednak spekulacje, że chipy Huawei odegrały kluczową rolę w sukcesie tego startupu.
Według Tom's Hardware, modele działające na Huawei Ascend 910C mogą osiągnąć 60% wydajności wnioskowania Nvidia H100. Zależność od ekosystemu oprogramowania Nvidia prawdopodobnie zmniejszy się wraz ze wzrostem znaczenia wnioskowania AI w przyszłości.
Tymczasem chińscy producenci chipów zintensyfikowali działania mające na celu dostosowanie DeepSeek i zmniejszenie zależności od amerykańskich chipów. Raport Centralnej Telewizji Chińskiej (CCTV) wykazał, że co najmniej 15 krajowych producentów chipów dostosowało swoje produkty, aby lepiej obsługiwać szkolenie i działanie DeepSeek, umożliwiając uruchamianie modeli DeepSeek na „krajowej infrastrukturze obliczeniowej”.
Według dyrektora generalnego Ouyang Jian, firmie Kunlun Xin, produkującej układy AI należącej do Baidu, dostosowanie swojego sprzętu do modelu open source DeepSeek zajęło niecały tydzień, znacznie szybciej niż w przypadku modeli open source.
W zeszłym tygodniu firma poinformowała o rozpoczęciu obsługi modeli DeepSeek V3 i R1, co umożliwi deweloperom szybkie wdrażanie aplikacji przy niskich kosztach.
Modele sztucznej inteligencji firmy DeepSeek są postrzegane jako dowód odporności Chin na ograniczenia nałożone przez USA, a niektóre przełomowe prognozy tego startupu przyczyniają się do rozwoju sztucznej inteligencji w wielu krajowych branżach.
Projektant układów scalonych, Loongson Technology, wsparł modele DeepSeek, umożliwiając użytkownikom uruchamianie ich bezpośrednio na komputerach. Dział przetwarzania w chmurze Huawei nawiązał również współpracę ze start-upem SiliconFlow, zajmującym się infrastrukturą AI, aby udostępnić modele DeepSeek V3 i R1 w swojej usłudze chmurowej Ascend. Huawei twierdzi, że wydajność jest porównywalna z uruchamianiem modeli na zaawansowanych procesorach graficznych.
(Według SCMP)
Źródło: https://vietnamnet.vn/deepseek-tao-dong-luc-de-trung-quoc-giam-le-thuoc-nvidia-2370958.html
Komentarz (0)