Po fali popularności DeepSeek duże chińskie firmy technologiczne szybko zaczęły wprowadzać na rynek modele dużych języków (LLM), aby konkurować i zdobywać udziały w rynku.
Globalna technologia przyspiesza
29 stycznia, w pierwszy dzień Księżycowego Nowego Roku 2025, Alibaba Group wprowadziła na rynek nową wersję modelu sztucznej inteligencji (AI) Qwen 2.5 i ogłosiła, że jest on bardziej wydajny niż DeepSeek. Według Alibaby, Qwen 2.5 „przewyższa pod niemal każdym względem” najbardziej zaawansowane modele AI OpenAI i Meta (USA), takie jak GPT-4o i Llama-3.1-405B.
Wcześniej firma DeepSeek wprowadziła na rynek asystentów AI wykorzystujących modele DeepSeek-V3 i DeepSeek-R1, których cena stanowiła ułamek ceny produktów firm amerykańskich.
Dwa „trzęsienia ziemi” – DeepSeek i Alibaba – zapoczątkowały wyścig ulepszeń sztucznej inteligencji w Chinach. Warto zauważyć, że niedrogi chatbot oparty na sztucznej inteligencji ChatGLM został opracowany przez zespół badawczy z Uniwersytetu Tsinghua i firmy Zhipu AI Company. ChatGLM to chatbot oparty na sztucznej inteligencji (o otwartym kodzie źródłowym), który potrafi generować tekst, tłumaczyć tekst i odpowiadać na pytania.
Ernie Bot, gigant technologiczny Baidu, wprowadził na rynek również ulepszoną wersję, Ernie 4.0 Turbo, która może wykonywać różne zadania, w tym generowanie tekstu, tłumaczenie, odpowiadanie na pytania, tworzenie obrazów itp. W międzyczasie ByteDance – spółka macierzysta TikToka – zaktualizowała swój flagowy model sztucznej inteligencji i ogłosiła, że zdał on test OpenAI o1 w teście AIME – standardzie mierzącym zdolność sztucznej inteligencji do przetwarzania i reagowania na złożone instrukcje.
DeepSeek zagraża również rynkowi globalnemu, zmuszając czołowych gigantów technologicznych, takich jak OpenAI, Meta, Google, Microsoft... do dostosowania swoich strategii inwestycyjnych. Amerykańskie korporacje technologiczne inwestowały wcześniej w fabryki sztucznej inteligencji (AI) i fabryki danych (data factory), ale od teraz będą musiały skupić się na ulepszaniu algorytmów, aby obniżyć koszty oraz działać szybciej i wydajniej. Niedawno OpenAI wprowadziło funkcję Deep Research, która pomaga ChatGPT syntetyzować i badać informacje. Najważniejszą cechą tej funkcji jest możliwość wyświetlania szczegółów procesu badawczego, w tym cytowań i podsumowań zastosowanych metod, co ułatwia użytkownikom śledzenie i weryfikację informacji.
Niektóre inne kraje, takie jak Indie i Korea Południowa, również uczestniczą w rozwoju tanich chatbotów opartych na sztucznej inteligencji. Na przykład w Indiach firma miliardera Mukesha Ambaniego, Reliance Jio Company, uruchomiła pierwszego chatbota opartego na sztucznej inteligencji, obsługującego języki lokalne, o nazwie BharatGPT. To znaczący krok naprzód w dziedzinie sztucznej inteligencji w Indiach, ułatwiający dotarcie technologii do osób nieanglojęzycznych.
Interfejs DeepSeek i Qwen 2.5 Zdjęcie: Future/Qwen/Shutterstock
Jakie możliwości dla Wietnamu?
Pan Lu Vincent The Hung – założyciel i prezes EduX Global Institute Joint Stock Company – powiedział, że w przeszłości branża technologiczna często ogłaszała koszty budowy modeli sztucznej inteligencji sięgające miliardów dolarów. Jednak uruchomienie platformy R1 przez technologiczny startup DeepSeek, którego koszt wyniósł zaledwie 6 milionów dolarów – jeśli to prawda – może być siłą napędową dla krajów i startupów, które będą rozwijać własną sztuczną inteligencję o wysokiej wydajności i niskich kosztach. Dzięki temu firmy, zwłaszcza małe i średnie, będą mogły korzystać z AI i wdrażać ją bez konieczności inwestowania zbyt dużych nakładów początkowych; promować transformację cyfrową w sektorach produkcji, handlu, usług, edukacji …
Jednak nowo wprowadzony na rynek model R1 firmy DeepSeek spotkał się z wieloma kontrowersjami związanymi z bezpieczeństwem danych i kopiowaniem modeli AI innych firm technologicznych. Dlatego, aby tworzyć własne modele AI przy niskich kosztach, kraje i firmy muszą dokładnie zrozumieć zasady działania, algorytmy, kod źródłowy itp., zamiast kopiować lub kraść. „Skuteczny model AI to nie tylko kwestia mocy obliczeniowej, ale także kosztów. Wietnamskie firmy powinny podążać za trendem tworzenia rozwiązań, które można rozszerzać i dostosowywać do potrzeb wielu różnych branż” – zasugerował pan Hung.
Według pana Phan Tan Quoc, zastępcy dyrektora ds. programu innowacji KPMG w Wietnamie, zacięta konkurencja na rynku sztucznej inteligencji będzie zarówno presją, jak i motywacją dla wietnamskich przedsiębiorstw do szybkiego tworzenia użytecznych i prestiżowych modeli, służących krajowym użytkownikom i klientom. Pan Quoc zalecił rządowi wprowadzenie polityki zachęcającej przedsiębiorstwa i osoby prywatne do udziału w rozwoju sztucznej inteligencji, budowania baz danych, a jednocześnie wspierania inwestycji w centra badawcze zajmujące się sztuczną inteligencją.
„Trend udostępniania otwartego kodu źródłowego w społeczności AI może pomóc programistom wykorzystać potencjał tego modelu i go udoskonalić. W przyszłości wiele startupów i osób prywatnych będzie miało łatwy dostęp do sztucznej inteligencji i będzie mogło ją łatwo wdrażać w swoich działaniach, gdy pojawią się nowe modele AI, spełniające specyficzne potrzeby” – powiedział pan Quoc.
Według ekspertów, firmy rozwijające sztuczną inteligencję muszą jasno określić, czy dany model jest w stanie rozwiązać konkretny problem, przynieść realną wartość użytkownikom oraz czy wyróżnia się pod względem funkcji lub wyjątkowych cech. Model DeepSeek to lekcja dla globalnych firm technologicznych, które deklarują bardzo niskie koszty, ale ich wydajność podobno przewyższa ChatGPT. Następnie konieczne jest dokładne zrozumienie popytu na sztuczną inteligencję na rynku, aby upewnić się, że jest ona wystarczająco konkurencyjna i może przynieść zyski.
Czy DeepSeek jest naprawdę tani?
W swoim raporcie firma DeepSeek podała, że całkowity koszt szkolenia modelu sztucznej inteligencji wyniósł mniej niż 6 milionów dolarów, głównie dzięki wynajmowi procesorów graficznych od firmy NVIDIA. Jednak niedawno firma badawczo-konsultingowa SemiAnalysis, zajmująca się półprzewodnikami, oszacowała, że koszt opracowania DeepSeek jest znacznie wyższy niż podawano.
Szacuje się, że DeepSeek będzie obsługiwał potężny system obliczeniowy składający się z około 50 000 procesorów graficznych Hopper, w tym 10 000 procesorów graficznych H800 i 10 000 bardziej wydajnych procesorów graficznych H100, a także dodatkowych procesorów graficznych H20. Całkowite nakłady inwestycyjne na serwery szacuje się na około 1,6 miliarda dolarów, a koszty operacyjne na około 944 miliony dolarów.
Źródło: https://nld.com.vn/co-hoi-tu-nhung-con-dia-chan-ai-196250204200528423.htm
Komentarz (0)