Ještě před několika lety si Čína představovala, že nakonec ovládne globální závod v oblasti umělé inteligence tím, že využije své obrovské množství dat k vývoji aplikací, jako je rozpoznávání obličeje.
Nedávný vývoj v generativní umělé inteligenci – využití velkých modelů k produkci obsahu, jako je text, obrázky a video – posunul rovnováhu a Čína opět vypadá jako zaostávající země.
Spuštění Sory 16. února přichází v době, kdy Čína čelí rostoucímu problému v podobě odříznutí od pokročilých grafických procesorů (GPU) od společnosti Nvidia kvůli stupňujícím se vývozním omezením ze strany USA. Nejlepší hráči v oblasti umělé inteligence v zemi zaostávají za svými zahraničními protějšky o několik let.
Zhou Hongyi, zakladatel firmy 360 Security Technology, která se zabývá internetovou bezpečností, nazval Soru „kýblem studené vody vylitým na Čínu,“ uvedl 23. února server Yicai. Řekl, že to mnoha lidem pomohlo vidět propast mezi nimi a světovými lídry.
OpenAI zatím nezveřejnila Soru. Není open source jako někteří její předchůdci. K zkušební verzi Soru má přístup pouze omezený počet lidí.
V Číně vyžaduje Národní správa kyberprostoru registraci všech veřejných velkých jazykových modelů (LLM) u vlády. Světoví giganti jako OpenAI a Google zde zatím oficiálně neposkytují své služby.
Tato absence vedla k tomu, že mnoho domácích technologických gigantů bojuje o pozici na trhu s více než 200 programy LLM. Baidu, Tencent a Alibaba zavedly své vlastní programy LLM.
Jen málo nástrojů se však může srovnávat se Sorou, částečně proto, že zatím nepoužívají novou architekturu Diffusion Transformer (DiT). Mateřská společnost TikToku, ByteDance, uvedla, že její interní nástroj pro řízení pohybu videa Boximator, který se používá k podpoře tvorby videa, je stále v plenkách a není připraven k masovému vydání.
Společnost připouští, že mezi Boximatorem a předními modely pro tvorbu videa je velký rozdíl, pokud jde o kvalitu obrazu, věrnost a délku trvání.
Spíše než dohánění Sora, někteří v oboru vidí naléhavější problém v získání přístupu k modelům OpenAI. Američtí zákonodárci se však snaží omezit přístup Číny k jejím cloudovým službám umělé inteligence.
Nejmenovaný čínský vývojář sdělil serveru SCMP, že možnou cestou pro čínské inženýry umělé inteligence je „nejprve dekódovat Soru a trénovat ji s vlastními daty, aby vytvořili podobný produkt“. Xu Liang, podnikatel v oblasti umělé inteligence se sídlem v Chang-čou, se domnívá, že Čína bude brzy mít podobné služby, i když mezi čínskými produkty a Sorou může stále existovat mírný rozdíl.
Wang Shuyi, profesor specializující se na umělou inteligenci a strojové učení na Tianjin Normal University (TJNU), k tomu uvedl: „Zkušenosti s vývojem programů LLM v uplynulém roce umožnily velkým čínským technologickým firmám nashromáždit si v této oblasti znalosti a nashromáždit potřebný hardware, což jim umožní v příštích 6 měsících vyrábět produkty, jako je Sora.“
Několik měsíců před spuštěním Sora vydala skupina výzkumníků VBench, nástroj pro srovnávání modelů generování videa. Tým VBench, který zahrnoval výzkumníky ze singapurské Nanyangské technologické univerzity a Šanghajské laboratoře umělé inteligence v Číně, zjistil, že Sora na základě demonstrací poskytnutých OpenAI překonává ostatní modely v celkové kvalitě videa.
Lu Yanxia, ředitel výzkumu pro vznikající technologie v IDC China, uvedl, že technologickí giganti jako Baidu, Alibaba a Tencent budou mezi prvními, kteří v zemi zavedou podobné služby.
Dodala, že se do závodu zapojí iFlyTek, SenseTime a Hikvision – všechny jsou na washingtonském seznamu sankcí.
Čína ale stále čelí těžkému boji, protože její technologický trh se podle analytiků stále více izoluje od světa, pokud jde o kapitál, hardware, data a dokonce i lidi.
Rozdíl v tržní hodnotě mezi předními čínskými technologickými společnostmi a americkými společnostmi, jako jsou Microsoft, Google a Nvidia, se v posledních letech výrazně prohloubil, protože Peking zpřísnil svou kontrolu.
Navíc, ačkoliv Čína byla kdysi vnímána jako země s výhodou, pokud jde o množství dat, pan Lu poukázal na to, že země nyní čelí nedostatku kvalitních dat potřebných k trénování novějších modelů, spolu s problémem omezeného přístupu k pokročilým čipům.
Nedostatek talentů je podle vedoucích pracovníků IDC dalším problémem, protože ti nejlepší a nejbystřejší v oblasti umělé inteligence se často snáze prosadí prací pro přední hráče v USA. Například v OpenAI tvoří technologickí experti z Číny základní skupinu. Z 1 677 členů OpenAI na LinkedIn studovalo 23 na Univerzitě Tsinghua.
Odborníci si však i s dostatečným počtem talentů kladou otázku, jak daleko může čínská umělá inteligence dojít, když čelí stávajícím omezením plynoucím z obchodního napětí mezi USA a Čínou.
Společnost Ping An Securities ve své zprávě varovala, že pokračující úsilí o omezení vývozu čipů z USA by mohlo urychlit rozvoj čínského průmyslu čipů s umělou inteligencí, ale „domácí alternativy nemusí splnit očekávání“.
Washington zablokoval čínským společnostem přístup k nejpokročilejším polovodičům na světě. V říjnu 2023 USA opět zpřísnily předpisy a zablokovaly pevninské části přístup k grafickým procesorům (GPU), které společnost Nvidia navrhla speciálně pro čínské zákazníky, aby se vyhnula předchozím omezením.
Alexander Harrowell, pokročilý výpočetní analytik ve skupině pro technologický výzkum a poradenství Omdia, poznamenává, že Čína má pro vzdělávání v oblasti LLM i jiné možnosti než grafické procesory, jako je Google TPU, Huawei Ascend, AWS Trainium nebo některá z nabídek řady startupů. Bude to však vyžadovat větší úsilí ve vývoji softwaru a správě systémů.
Podle podnikatele Xu bude mít čínský trh zvláštní příležitosti, až budou zveřejněny technické zprávy o platformě Sora a modelu open-source videa. „Bude zde platforma, od které se čínské firmy mohou učit,“ řekl. Místní modely videa také lépe podporují čínštinu, dodal.
(Podle SCMP)
Zdroj






Komentář (0)