На глобальній технологічній виставці Computex 2026, що проходила в Тайбеї, Тайвань, фокус обговорень у напівпровідниковій та обчислювальній галузях значно змістився з «хмарного штучного інтелекту» на «периферійний штучний інтелект». Індустрія обладнання переживає реструктуризацію, оскільки обчислювальна потужність центрів обробки даних інтегрується в персональні пристрої, розміщені безпосередньо в робочому просторі.
Перехід від адаптивного штучного інтелекту до автономних агентів (ШІ агентів)
На ранніх стадіях розвитку штучного інтелекту звичайний операційний процес полягав у тому, що користувачі надсилали запити даних до хмарних серверів, таких як OpenAI, Google або Microsoft, та отримували відповіді. Однак така архітектура виявила багато обмежень щодо затримки передачі, вартості пропускної здатності та безпеки вихідних даних.

Nvidia DGX Spark — це лінійка персональних комп'ютерів, спеціально розроблених для штучного інтелекту, яка буде розповсюджуватися у В'єтнамі.
Фото: Ань Куан
Розробка агентного штучного інтелекту (AI) — покоління автономних програмних агентів, здатних планувати, міркувати та безпосередньо взаємодіяти з локальними файловими системами, — ставить нові вимоги до апаратної інфраструктури. Замість пасивного реагування ці агенти діють як цифрові людські ресурси, обробляючи безперервний потік інформації в режимі реального часу. Для забезпечення цілісності та безпеки даних переведення моделей штучного інтелекту в автономний режим на пристроях користувачів стало важливим технічним рішенням.
Яскравим прикладом цієї тенденції є персональний комп'ютер DGX Spark AI, представлений на Computex 2026. Пристрій може похвалитися компактним дизайном настільного комп'ютера, але забезпечує продуктивність мініатюрної суперкомп'ютерної системи завдяки своєму єдиному суперчіпу Nvidia GB10 Grace Blackwell.
Незалежна робота пристрою спирається на систему об'єднаної пам'яті LPDDR5X об'ємом 128 ГБ з високошвидкісною пропускною здатністю. В архітектурі штучного інтелекту обсяг пам'яті та швидкість визначають здатність обробляти великі мовні моделі (LLM). Це дозволяє інженерам обробки даних безпосередньо запускати моделі з 200 мільярдами параметрів на самому пристрої, а не розгортати їх на хмарних серверах.
Що стосується характеристик, графічний процесор на архітектурі Blackwell інтегрує ядра Tensor 5-го покоління (формат точності FP4), що забезпечують обчислювальну потужність 1 петафлопс. 20-ядерний процесор ARM відповідає за координацію даних між локальною файловою системою та моделлю штучного інтелекту.

Робочі станції, що обслуговують потреби штучного інтелекту на периферії підприємства, тепер мають компактні розміри, що полегшує їх розгортання в різних масштабах.
Фото: Ань Куан
На виставкових стендах інфраструктурні рішення для цього тренду були чітко диференційовані завдяки синхронізованим системам від оригінальних виробників та постачальників спеціалізованих рішень для інтеграції обладнання. Яскравим прикладом є Leadtek, який продемонстрував низку робочих станцій та серверів зі своїх сертифікованих Nvidia систем. Орієнтована на локальні (внутрішні) операційні потреби малих та середніх підприємств, робоча станція WinFast WS950 AI підтримує конфігурації з кількома графічними процесорами з двома професійними відеокартами Nvidia RTX PRO 6000 Blackwell Workstation Edition, що забезпечує загалом до 192 ГБ пам'яті GDDR7. У більшому масштабі їхня серверна система WinFast GS5855T дозволяє інтегрувати до восьми графічних процесорів на архітектурі RTX PRO Blackwell для задоволення потреб інтенсивних завдань виведення та навчання штучного інтелекту.
Оптимізація витрат на безпеку та експлуатацію.
Експлуатація штучного інтелекту на периферії через локальну апаратну систему вирішує три основні проблеми сучасної технологічної інфраструктури. Перша – це безпека даних. Вся бізнес-інформація, внутрішній вихідний код і персональні дані зберігаються та обробляються в ізольованому від Інтернету середовищі, що обмежує ризик витоку даних третім сторонам.
Нові рішення Edge AI, представлені на Computex 2026
Далі постає питання фіксованих витрат на обчислення. Оренда хмарної інфраструктури, плата за яку стягується на основі кількості токенів, несе значні змінні витрати в міру масштабування. Робота на автономному обладнанні перетворює ці витрати на інвестиції в основні засоби, оптимізуючи довгострокові операції. Нарешті, є питання локальної масштабованості: завдяки протоколам високошвидкісного підключення користувачі можуть підключати системи периферійних обчислень для спільного використання ресурсів, масштабуючи можливості моделювання периферійних обчислень до величезних розмірів.
Джерело: https://thanhnien.vn/ai-roi-dam-may-ve-ban-lam-viec-185260605224532968.htm








