Zaledwie kilka lat temu Chiny wyobrażały sobie, że w przyszłości zdominują światowy wyścig sztucznej inteligencji, wykorzystując ogromne zasoby danych kraju do opracowywania aplikacji takich jak rozpoznawanie twarzy.
Ostatnie osiągnięcia w dziedzinie sztucznej inteligencji generatywnej – wykorzystanie dużych modeli do tworzenia treści takich jak tekst, obrazy i wideo – zmieniły równowagę, w wyniku czego Chiny po raz kolejny wyglądają na maruderów.
Premiera Sory 16 lutego zbiega się z rosnącym wyzwaniem, z jakim Chiny borykają się w związku z odcięciem od zaawansowanych procesorów graficznych (GPU) firmy Nvidia, wynikającym z zaostrzających się ograniczeń eksportowych USA. Najlepsi producenci sztucznej inteligencji w tym kraju są o kilka lat w tyle za swoimi zagranicznymi odpowiednikami.
Zhou Hongyi, założyciel firmy zajmującej się bezpieczeństwem internetowym 360 Security Technology, nazwał Sorę „kubłem zimnej wody wylanym na Chiny” – donosił Yicai 23 lutego. Dodał, że pomogło to wielu ludziom dostrzec przepaść dzielącą ich od światowych przywódców.
OpenAI nie udostępniło jeszcze Sory publicznie. Nie jest ona open source, jak niektóre jej poprzedniczki. Dostęp do wersji próbnej Sory ma tylko ograniczona liczba osób.
W Chinach Narodowa Administracja Cyberprzestrzeni wymaga rejestracji wszystkich publicznych modeli dużych języków (LLM) w rządzie. Światowi giganci, tacy jak OpenAI i Google, nie świadczyli jeszcze oficjalnie usług w tym kraju.
Ta nieobecność doprowadziła do rywalizacji wielu krajowych gigantów technologicznych o pozycję na rynku, oferujących ponad 200 programów LLM. Baidu, Tencent i Alibaba wprowadziły własne programy LLM.
Jednak niewiele narzędzi może równać się z Sorą, częściowo dlatego, że nie wykorzystują one jeszcze nowej architektury Diffusion Transformer (DiT). ByteDance, spółka macierzysta TikToka, poinformowała, że jej wewnętrzne narzędzie do sterowania ruchem w wideo Boximator, wykorzystywane do wspomagania tworzenia filmów, jest wciąż w powijakach i nie jest gotowe do masowej premiery.
Firma przyznaje, że między Boximatorem a wiodącymi modelami do tworzenia filmów wideo istnieje duża różnica pod względem jakości obrazu, wierności i czasu trwania.
Zamiast dogonić Sorę, niektórzy przedstawiciele branży widzą pilniejszy problem w uzyskaniu dostępu do modeli OpenAI. Jednak amerykańscy ustawodawcy dążą do ograniczenia dostępu Chin do ich usług w chmurze AI.
Anonimowy chiński programista powiedział SCMP, że możliwą ścieżką rozwoju dla chińskich inżynierów AI jest „najpierw zdekodowanie Sora i trenowanie go przy użyciu własnych danych, aby stworzyć podobny produkt”. Xu Liang, przedsiębiorca z branży AI z siedzibą w Hangzhou, uważa, że Chiny wkrótce będą oferować podobne usługi, choć może nadal istnieć niewielka różnica między chińskimi produktami a Sora.
Wang Shuyi, profesor specjalizujący się w sztucznej inteligencji i uczeniu maszynowym na Uniwersytecie Normalnym w Tianjinie (TJNU), skomentował to następująco: doświadczenie zdobyte w rozwijaniu programów LLM w ciągu ostatniego roku pozwoliło chińskim dużym przedsiębiorstwom technologicznym na zdobycie wiedzy w tej dziedzinie i zaopatrzenie się w niezbędny sprzęt, co umożliwi im produkcję takich produktów jak Sora w ciągu najbliższych 6 miesięcy.
Kilka miesięcy przed premierą Sora, grupa badaczy opublikowała VBench, narzędzie do benchmarkingu modeli generowania wideo. Zespół VBench, w którego skład weszli badacze z singapurskiego Uniwersytetu Technologicznego Nanyang i Szanghajskiego Laboratorium Sztucznej Inteligencji w Chinach, odkrył, że Sora przewyższa inne modele pod względem ogólnej jakości wideo, na podstawie demonstracji udostępnionych przez OpenAI.
Lu Yanxia, dyrektor ds. badań nowych technologii w IDC China, powiedział, że tacy giganci technologiczni jak Baidu, Alibaba i Tencent będą jednymi z pierwszych, którzy wprowadzą podobne usługi w kraju.
Dodała, że do wyścigu dołączą również iFlyTek, SenseTime i Hikvision, które znajdują się na liście firm objętych sankcjami Waszyngtonu.
Jednak zdaniem analityków Chiny nadal stoją przed trudnym zadaniem, ponieważ ich rynek technologiczny jest coraz bardziej odizolowany od świata pod względem kapitału, sprzętu, danych, a nawet ludzi.
Różnica w wartości rynkowej między czołowymi chińskimi firmami technologicznymi a tymi ze Stanów Zjednoczonych, takimi jak Microsoft, Google i Nvidia, znacznie się pogłębiła w ostatnich latach, ponieważ Pekin zacieśniał swoją kontrolę.
Ponadto, chociaż kiedyś uważano, że Chiny mają przewagę pod względem ilości danych, pan Lu zauważył, że obecnie kraj ten zmaga się z niedoborem wysokiej jakości danych potrzebnych do trenowania nowszych modeli, a do tego dochodzi wyzwanie w postaci ograniczonego dostępu do zaawansowanych chipów.
Niedobór talentów to kolejny problem, zdaniem dyrektorów IDC, ponieważ najlepsi i najzdolniejsi w dziedzinie AI często łatwiej zabłysnąć, pracując dla wiodących graczy w USA. Na przykład w OpenAI eksperci technologiczni z Chin stanowią trzon grupy. Spośród 1677 członków OpenAI na LinkedIn, 23 studiowało na Uniwersytecie Tsinghua.
Jednak nawet przy wystarczającej liczbie talentów eksperci zastanawiają się, jak daleko zajdzie rodzima chińska sztuczna inteligencja, skoro istnieją ograniczenia wynikające z napięć handlowych między USA a Chinami.
Ping An Securities ostrzega w swoim raporcie, że dalsze wysiłki mające na celu ograniczenie eksportu układów scalonych ze Stanów Zjednoczonych mogą przyspieszyć rozwój chińskiego przemysłu układów scalonych na potrzeby sztucznej inteligencji, ale „krajowe alternatywy mogą nie spełnić oczekiwań”.
Waszyngton zablokował chińskim firmom dostęp do najnowocześniejszych półprzewodników na świecie. W październiku 2023 roku Stany Zjednoczone ponownie zaostrzyły przepisy, blokując Chinom kontynentalnym dostęp do układów GPU, które Nvidia zaprojektowała specjalnie dla chińskich klientów, aby ominąć wcześniejsze ograniczenia.
Alexander Harrowell, analityk ds. zaawansowanych obliczeń w firmie badawczo-konsultingowej Omdia, zauważa, że Chiny dysponują innymi opcjami niż GPU do szkoleń LLM, takimi jak TPU Google, Ascend Huawei, Trainium AWS czy jedna z wielu ofert startupów. Będzie to jednak wymagało większego nakładu pracy w zakresie rozwoju oprogramowania i administracji systemami.
Według przedsiębiorcy Xu, rynek chiński będzie miał szczególne możliwości, gdy opublikowane zostaną raporty techniczne dotyczące Sora i modelu wideo open source. „Chińskie firmy będą miały platformę, z której będą mogły się uczyć” – powiedział. Dodał, że lokalne modele wideo lepiej wspierają również Chiny.
(Według SCMP)
Źródło
Komentarz (0)