
Čipy jsou jednou z klíčových součástí systémů pro trénování umělé inteligence a provoz modelů. Trend umělé inteligence v posledních letech vytvořil závod v hardwaru mezi velkými společnostmi, což vedlo analytiky k předpovědím bezprostředního nedostatku.
Odborníci předpovídají, že s postupující fází školení firmy přesouvají své investice směrem k systémům nasazení umělé inteligence, známým také jako inference. To vytváří nové výzvy v dodávkách a výrobě čipů, ale zároveň představuje příležitosti pro firmy zabývající se umělou inteligencí se správnými investičními strategiemi.
Skutečný problém
Exploze umělé inteligence je výsledkem pokroku v hardwaru. Na summitu Zalo AI Summit 2025 Dr. Pham Hy Hieu z OpenAI zdůraznil, že vznik ChatGPT způsobil revoluci v oblasti čipů a umožnil společnosti Nvidia dosáhnout rychlého růstu v krátkém čase.
Technicky vzato jsou čipy pro umělou inteligenci klíčové, protože 80 % výpočtů v modelech umělé inteligence tvoří násobení matic. Trh s čipy umělé inteligence je v současné době rozdělen na dva hlavní typy na základě jejich zamýšleného použití. Prvním typem jsou trénovací čipy, které vyžadují schopnost provádět velké násobení matic s konzistentním počtem dimenzí a silnou šířkou pásma pro současné připojení tisíců čipů.
Druhým typem je inferenční/servisní čip, který vyžaduje skromnější počet spojů (kolem 50–100 čipů) a zaměřuje se na malé, nepravidelně velké maticové problémy. Inferenční čipy však pro udržitelný provoz vyžadují dobrou optimalizaci výkonu.
Při pohledu zpět na historii vývoje, pokud se období let 2019–2023 zaměřovalo na trénování a kompresi dat pro GPT modely, od roku 2024 se pozornost přesouvá k možnostem uvažování. Tento posun vedl k poptávce po inferenčních čipech.
|
Dr. Pham Hy Hieu. Foto: Phuong Lam . |
V rozhovoru pro Tri Thuc - Znews Dr. Pham Hy Hieu uvedl, že tento trend vytváří nové výzvy pro oblast umělé inteligence, protože čipy se zatím nevyvíjejí dostatečně rychle, aby držely krok s rychlostí těchto modelů.
„V OpenAI si lidé často dělají legraci, že bez ohledu na to, jak rychlejší budou inženýři vytvářet čipy, vědci najdou způsob, jak využít veškerý ten výpočetní výkon,“ řekl pan Hieu.
Podle Dr. Hieua v tomto odvětví chybí šířka pásma pro přenos dat mezi pamětí s vysokou šířkou pásma (HBM) a pamětí na čipu (SRAM). Jak modely přecházejí z učení k odvozování znalostí, data se ukládají do HBM, poté se v každém kroku odvozování přenášejí do SRAM pro výpočet a nakonec se přenášejí zpět do HBM.
„Čím hlouběji model vychází ze závěrů, tím více kroků přenosu dat je zapotřebí, což vede k „úzkému hrdlu“ v šířce pásma mezi HBM a SRAM. K tomuto nedostatku dochází v roce 2025 a předpokládá se, že bude pokračovat i v roce 2026,“ uvedl dále Dr. Hieu.
Zástupci OpenAI uvedli, že v nadcházejícím roce budou výrobci čipů, jako jsou Nvidia a AMD, investovat do šířky pásma HBM-SRAM, aby se tento problém vyřešil. Náklady na výrobu této šířky pásma jsou však velmi vysoké a společnosti mohou omezit další funkce svých čipů, aby kontrolovaly prodejní cenu.
V důsledku toho se v tomto odvětví mohou objevit čipy se silnou šířkou pásma HBM-SRAM, ale některé další specifikace mohou oslabit.
Dalším trendem z pohledu softwaru je, že společnosti zabývající se umělou inteligencí, jako jsou OpenAI, xAI, Anthropic atd., mohou své modely doladit tak, aby prováděly méně inference, nebo inferenci pouze v případě potřeby.
„Jednoduše řečeno, pokud považujete ChatGPT za docela dobrého/vynikajícího studenta střední školy, a když položíte jednoduchý matematický problém, nástroj by měl mít na vyřešení odpovědi pouze 15 sekund. Ale u problému na úrovni mezinárodní soutěže by nástroj měl na vyřešení odpovědi potřebovat hodinu,“ dodal Dr. Hieu.
Celkově se tyto dva trendy mohou spojit a řešit úzké hrdlo šířky pásma HBM-SRAM, kterému čelí odvětví umělé inteligence.
Hra velkých hráčů
Závod v oblasti čipů pro umělou inteligenci se netýká jen technologií, ale také kontroly dodavatelského řetězce. V době spuštění ChatGPT závisel provoz modelu téměř výhradně na čipech Nvidia. To vedlo k prudkému nárůstu nákupů hardwaru technologickými giganty, jako jsou Anthropic a Meta.
Hra však není jen pro Nvidii. Konkurenti jako AMD a Google také nabízejí optimální hardwarová řešení pro vývojáře modelů umělé inteligence. Zástupci OpenAI nicméně uznávají, že vývoj čipů pro umělou inteligenci je velmi obtížný, a to i přes miliardy dolarů investovaných těmito společnostmi.
Podle Dr. Hieua se Meta stále potýká s obtížemi, protože její čip MTIA „zatím nikdo nepoužívá“. Amazon vyvíjí dva čipy, včetně trénovacího čipu Trainium a serverového čipu Inferentia, ale také se potýká s podobnými obtížemi jako Meta.
Google byl v tomto ohledu úspěšnější, protože jeho tenzorové procesory (TPU) nabízejí poměrně vysoký výkon, což společnosti pomáhá zbavit se závislosti na Nvidii. To také snižuje tlak nedostatku čipů, protože Google nemusí soutěžit o nákup velkého množství čipů od Nvidie.
Dr. Hieu se však domnívá, že problém Googlu pramení ze skutečnosti, že TPU se velmi obtížně programují kvůli použití „bizarního“ programovacího jazyka.
„Tato anomálie zbytečně a absurdně ztěžuje programování TPU od Googlu. Pokud tedy Google neprodá nebo nepronajme své TPU za mnohem nižší cenu než GPU od Nvidie, nikdo jejich TPU nebude používat,“ řekl Dr. Hieu serveru Tri Thuc - Znews .
Google a Amazon však mají chytrou strategii při investování do startupů zabývajících se umělou inteligencí, jako jsou Anthropic a SSI; rozdíl je v tom, že namísto investování v hotovosti těmto startupům poskytují čipy. Tímto způsobem obě společnosti nacházejí trh pro své čipy a pomáhají zmírnit jejich nedostatek.
|
Přednáška Dr. Phama Hy Hieua o hardwaru v infrastruktuře umělé inteligence na summitu Zalo AI Summit 2025. Foto: Phuong Lam . |
Vzhledem k prognózám nedostatku se velké společnosti snaží hromadit čipy pro umělou inteligenci díky svým dostatečným finančním zdrojům. To ovlivňuje přístup mnoha startupů a malých podniků v oblasti umělé inteligence k hardwaru.
Dr. Hieu předpověděl dva trendy. Zaprvé, malé startupy se stanou závislými na velkých společnostech prostřednictvím API služeb. Například startupy vyvíjející umělou inteligenci na podporu programování budou muset používat Claude od Anthropic nebo Codex od OpenAI.
„Tato závislost ‚obohatí‘ velké hráče, alespoň do té doby, než startup vyroste do bodu, kdy bude mít dostatek peněz na nákup čipů.“
Jen velmi málo startupů přežije do této fáze, ale Cursor je v roce 2025 výjimkou. Přestože jsou stále silně závislí na Anthropicu, začali získávat čipy pro vývoj vlastních modelů,“ sdělil zástupce OpenAI.
Následoval vznik velkých startupů, založených průmyslovými giganty, schopných získat značný kapitál na nákup čipů. Mezi příklady patří Thinking Machines, která získala 2 miliardy dolarů (založila ji Mira Murati, bývalá technologická ředitelka OpenAI), a SSI, která získala 1 miliardu dolarů (založil ji Ilya Sutskever, dříve také spoluzakladatel OpenAI).
Příležitosti pro vietnamské firmy
Přestože závod v oblasti umělé inteligence představuje celosvětově mnoho výzev, Dr. Hieu se domnívá, že vietnamské podniky stále mají příležitosti, a to jak ve vývoji čipů, tak v investicích do infrastruktury.
"Jakou roli hraje Vietnam ve výrobě čipů?"
„Ačkoli je čipový průmysl odvětvím s obratem v bilionech dolarů, k účasti nepotřebujeme desítky miliard dolarů. Vietnamci mohou k plánu vývoje čipů pro umělou inteligenci přispět mnoha způsoby,“ uvedl pan Hieu na akci Zalo AI Summit 2025.
Zástupci OpenAI nastínili dva hlavní směry vývoje. Místo závodění ve výrobě čipů pro rozsáhlé jazykové modely by se Vietnam mohl zaměřit na vývoj nízkoenergetických čipů pro automobily, chytré telefony nebo implantabilní zdravotnické prostředky. Jedná se o segmenty trhu s významným růstovým potenciálem a nižšími investičními náklady.
Za druhé, je tu integrace hardwaru a softwaru. Příspěvky jako algoritmus Flash Attention 2 ukazují, jak chytrá kombinace programování a hardwaru může vést k průlomům bez nutnosti masivních kapitálových investic.
|
Dr. Pham Hy Hieu představuje čip AI. Foto: Phuong Lam . |
Pokud jde o investice do infrastruktury, Dr. Hieu se domnívá, že by nebylo příliš obtížné investovat do relativně malého počtu čipů pro výzkum a vývoj.
„Nedávno jsem se dozvěděl, že osm čipů Nvidia H200 stojí 250 000 dolarů. Tolik čipů by mohlo posloužit potřebám výzkumu a vývoje,“ řekl pan Hieu serveru Tri Thuc - Znews .
Jakmile však firmy najdou ten správný vzorec pro produkty umělé inteligence, budou muset investovat do větší infrastruktury. Společnost Nvidia nedávno spustila nové řešení prodeje grafických karet (GPU), které umožňuje dlouhodobý pronájem s možností upgradu namísto přímého nákupu velkého množství GPU.
„Toto by mohl být efektivnější investiční přístup. V současné době však vývoj umělé inteligence pro velkou uživatelskou základnu stále vyžaduje značný kapitál. A co je nejdůležitější, musíme mít správné pochopení a posouzení efektivity našich investic,“ zdůraznil Dr. Hieu.
Zdroj: https://znews.vn/linh-kien-quan-important-of-the-ai-race-post1613844.html









Komentář (0)