
Графічні процесори – це мозок комп'ютерів зі штучним інтелектом.
Простіше кажучи, графічний процесор (GPU) діє як мозок комп'ютера зі штучним інтелектом.
Як ви вже, можливо, знаєте, центральний процесор (CPU) – це мозок комп’ютера. Перевага графічного процесора (GPU) полягає в тому, що це спеціалізований CPU для виконання складних обчислень. Найшвидший спосіб виконати ці обчислення – це спільне вирішення задачі групою графічних процесорів. Навіть у цьому випадку навчання моделі штучного інтелекту може тривати тижні або навіть місяці. Після побудови вона розміщується у фронтенд-комп’ютерній системі, і користувачі можуть ставити запитання до моделі штучного інтелекту; цей процес називається логічним висновком.
Комп'ютер зі штучним інтелектом містить кілька графічних процесорів.
Найкраща архітектура для вирішення задач штучного інтелекту полягає у використанні групи графічних процесорів у стійці, підключених до комутатора зверху стійки. Кілька стійок з графічними процесорами можуть бути додатково підключені в ієрархічну систему мережевого підключення. Зі складнішими задачами, які потрібно вирішити, вимоги до графічних процесорів також зростають, і деякі проекти потенційно потребують розгортання кластерів з тисяч графічних процесорів.
Кожен кластер штучного інтелекту – це невелика мережа.
Під час створення кластера штучного інтелекту необхідно налаштувати невелику комп'ютерну мережу для підключення та забезпечення спільної роботи графічних процесорів та ефективного обміну даними.

На діаграмі вище показано кластер штучного інтелекту, де кола внизу представляють робочі процеси, що виконуються на графічних процесорах. Графічні процесори підключаються до комутаторів у верхній стійці (ToR). Ці комутатори ToR також підключаються до комутаторів магістральної мережі, показаних на діаграмі вище, демонструючи чітку ієрархію мережі, необхідну, коли задіяно кілька графічних процесорів.
Мережі є вузьким місцем у розгортанні штучного інтелекту.
Минулої осені на глобальному саміті Open Computer Project (OCP), де делегати створювали інфраструктуру штучного інтелекту наступного покоління, делегат Лой Нгуєн з Marvell Technology вказав на ключову проблему: «мережі – це нове вузьке місце».
Технічно, висока затримка пакетів або їх втрата через перевантаження мережі може призвести до повторної відправки пакетів, що значно збільшує час виконання завдань (JCT). В результаті, графічні процесори вартістю мільйони або десятки мільйонів доларів, що належать підприємствам, марнуються через неефективні системи штучного інтелекту, що завдає шкоди підприємствам як з точки зору доходів, так і з точки зору часу виведення на ринок.
Тестування та вимірювання є вирішальними умовами для успішної роботи мереж штучного інтелекту.
Для ефективної роботи кластера штучного інтелекту, графічні процесори повинні мати можливість використовувати свою повну потужність, щоб скоротити час навчання та впроваджувати моделі навчання для максимізації рентабельності інвестицій. Тому тестування та оцінка продуктивності кластера штучного інтелекту є необхідними (рис. 2). Однак це завдання не є легким, оскільки архітектура системи включає багато налаштувань та взаємозв'язків між графічним процесором та мережевою структурою, які повинні доповнювати один одного для вирішення проблеми.

Це створює багато труднощів та викликів у вимірюванні мереж штучного інтелекту:
– Проблема реплікації всієї виробничої мережі в лабораторії пов’язана з обмеженнями у вартості, обладнанні, нестачі висококваліфікованих інженерів з мереж штучного інтелекту, просторі, джерелі живлення та температурі.
- Тестування на місці у виробничій системі зменшує доступну обчислювальну потужність самої виробничої системи.
- Складність точного відтворення проблем через різницю в масштабі та обсязі проблем.
- Складність того, як графічні процесори з'єднуються між собою.
Щоб вирішити ці проблеми, компанії можуть проводити бенчмаркінг підмножини запропонованих налаштувань у лабораторному середовищі для порівняння ключових параметрів, таких як JCT (час виконання завдання), пропускна здатність, яку може досягти команда ШІ, та порівнювати їх з використанням комутаційної платформи та використанням кешування. Цей бенчмаркінг допомагає знайти правильний баланс між робочим навантаженням графічного процесора/обробки та проектуванням/встановленням мережі. Після того, як результати будуть задоволені, комп'ютерні архітектори та мережеві інженери можуть застосувати ці налаштування у виробництві та виміряти нові результати.
Дослідницькі лабораторії підприємств, дослідницькі інститути та університети працюють над аналізом кожного аспекту побудови та експлуатації ефективних мереж штучного інтелекту, щоб вирішити проблеми роботи у великих мережах, особливо враховуючи, що передовий досвід постійно змінюється. Такий повторюваний спільний підхід — єдиний спосіб для підприємств виконувати повторювані вимірювання та швидке тестування сценаріїв «якщо-тоді», що є фундаментальним для оптимізації мереж на базі штучного інтелекту.
(Джерело: Keysight Technologies)
Джерело: https://vietnamnet.vn/ket-noi-mang-ai-5-dieu-can-biet-2321288.html









