
Нещодавно в рамках Міжнародної конференції з комп'ютерного зору (ICCV 2025) на Гаваях (США) відбулася церемонія оголошення результатів конкурсу AI City Challenge 2025 (ШІ в розумних містах). Після перемоги у 2024 році, цього року команда інженерів ШІ VNPT посіла перше місце в категорії «Обробка та розпізнавання об'єктів із даних зображень надширококутних камер на периферійних пристроях» (edge AI). Для вирішення цієї проблеми потрібна система ШІ зі швидкістю обробки в режимі реального часу, безпосередньо на компактних апаратних пристроях, яка б забезпечувала високу точність розпізнавання об'єктів із сильно спотворених даних зображень, задовольняючи практичні потреби.
AI City Challenge 2025 – одне з найпрестижніших у світі щорічних змагань зі штучного інтелекту (ШІ), що застосовується в розумних містах. Цьогорічні змагання включають чотири категорії з вищою складністю, ніж у попередні сезони, та залучають понад 30 000 команд з країн із сильним розвитком ШІ, таких як США, Китай, Корея, Тайвань тощо.
Команда інженерів VNPT є лідером завдяки точності та швидкості обробки даних штучним інтелектом на периферії.
Завдання покращення можливостей штучного інтелекту на периферії
Проблема обробки та розпізнавання об'єктів із даних зображень надширококутної камери включена до AI City Challenge з 2024 року, що відображає тенденцію застосування комп'ютерного зору до сучасних систем моніторингу дорожнього руху. Завдяки високій практичності, ця категорія завжди є гонкою з найбільшою кількістю команд у всіх змаганнях. Цього року складність категорії зростає, оскільки, окрім точної обробки спотворених та деформованих зображень, команди повинні оптимізувати весь процес, щоб модель могла ефективно працювати на периферійних пристроях.
Команда інженерів VNPT застосовує багато методів для швидкої та точної ідентифікації транспортних засобів.
Команди мали оптимізувати свої моделі для ефективної роботи на Jetson Orin, невеликому пристрої, розташованому в точці збору даних (так званому граничному пристрої), який має обмеження потужності 30 Вт і набагато меншу обчислювальну потужність, ніж центральний сервер. Це означало, що команди не могли використовувати надто великі моделі, але мали оптимізувати та оптимізувати програму, щоб вона працювала швидше, споживала менше ресурсів і все ще точно розпізнавала транспортні засоби. Ці зміни зробили AI City Challenge 2025 одним із найскладніших сезонів на сьогоднішній день, особливо враховуючи, що команди врахували досвід минулого року, а рівень конкуренції значно зріс.
Скористайтеся перевагами досвіду оптимізації моделей у реальному світі
У проблемах моніторингу трафіку обчислювальна інфраструктура та мережеві з’єднання часто обмежені, що робить розробку моделей штучного інтелекту, які є одночасно точними та ефективними, великою проблемою. Це також є причиною, чому Edge AI став неминучою тенденцією. Замість того, щоб надсилати всі дані на центральний сервер для обробки, модель розміщується безпосередньо на пристрої збору даних (наприклад, камері), що допомагає швидше реагувати, зменшувати затримки, економити пропускну здатність та забезпечувати безпеку даних, особливо у великомасштабних системах моніторингу.
Згідно з результатами, оголошеними на AI City Challenge 2025, команда інженерів VNPT посіла перше місце, перевершивши сотні команд з великих технологічних корпорацій, дослідницьких інститутів та університетів з усього світу. Це досягнення сприяє зміцненню екосистеми штучного інтелекту для моніторингу дорожнього руху та міської безпеки в країні, де широко розгортаються надширококутні камери для розширення зони спостереження, зменшення сліпих зон, зменшення кількості встановлених пристроїв та підвищення ефективності роботи міської інфраструктури. Маючи понад семирічний досвід розробки моделей штучного інтелекту для обробки зображень та їх впровадження всередині країни, команда інженерів VNPT накопичила здатність балансувати точність, швидкість та експлуатаційні витрати – фактори, що визначають ефективність застосування штучного інтелекту в реальних середовищах.

Команда VNPT розробила та освоїла понад 40 моделей штучного інтелекту для обробки зображень.
Наразі команда VNPT розробила та освоїла понад 40 різних моделей штучного інтелекту для обробки зображень, таких як розпізнавання номерних знаків, вимірювання потоку транспорту, виявлення шоломів, а також моделі, специфічні для В'єтнаму, такі як виявлення транспортних засобів, що перевозять трьох осіб, перевозять великогабаритні вантажі або виявлення пожеж та зброї в галузі безпеки та міського спостереження. Ці моделі оптимізовані для роботи на різноманітному обладнанні, від графічних процесорів, центральних процесорів до нейронних процесорів, задовольняючи різноманітні вимоги систем та клієнтів.
Щоб мати змогу ефективно розгортати рішення у великих масштабах, особливо в локальній моделі та на периферії з сотнями камер одночасно, інженери VNPT також розробили оптимальні методи обробки, які дозволяють одночасну роботу з сотнями потоків відеоданих . Такий підхід робить рішення на основі штучного інтелекту легкими для масштабування, економить ресурси та підходить для умов інфраструктури в багатьох місцевостях.
Застосовуючи цей досвід до AI City Challenge 2025, команда застосувала комбінацію таких методів, як стиснення моделі для зменшення розміру та ресурсів обробки, оптимізація потоку обробки зображень для зменшення затримки, а також удосконалення мови програмування та структури коду для формування загального ланцюжка обробки для найвищої продуктивності. Такий підхід допомагає моделі підтримувати точність, одночасно збільшуючи швидкість виведення та розгортання на периферійних пристроях з обмеженим обладнанням.
Багатодисциплінарна платформа для досліджень штучного інтелекту глибокого навчання
Не лише володіючи командою молодих, талановитих співробітників та потужною обчислювальною інфраструктурою, VNPT, однією з важливих передумов для створення комплексної екосистеми продуктів штучного інтелекту, яка відповідає міжнародним стандартам та отримує високі нагороди на престижних конкурсах, є поглиблена дослідницька платформа в галузі штучного інтелекту в багатьох галузях.
Щодо застосування штучного інтелекту в обробці зображень, окрім розумних міських та дорожніх систем, VNPT також сприяє дослідницькому застосуванню в медичній галузі. У вересні 2025 року група оголосила про наукові дослідження на MICCAI 2025 – провідній світовій конференції з питань штучного інтелекту та комп’ютерного зору в медицині. Дослідження було зосереджено на застосуванні штучного інтелекту в діагностиці раку щитоподібної залози та проведено з використанням даних майже 10 000 пацієнтів у 3 регіонах країни протягом 4 років. Проект відіграє фундаментальну роль у розробці автоматичних систем діагностичної підтримки, що відповідають характеристикам населення та медичним станам у країні, допомагаючи підвищити точність, скоротити час діагностики, зменшити навантаження на лікарів та розширити доступ до високоякісних медичних послуг на низовому рівні.
Команда інженерів штучного інтелекту VNPT публікувала дослідження на багатьох престижних наукових конференціях.
У галузі мови та обробки мовлення VNPT також оголосила про дослідження на EMNLP 2025 – конференції з питань штучного інтелекту, що отримала рейтинг A*, з обробки природної мови, та ICASSP 2025 – конференції з питань обробки мовлення, що отримала рейтинг A1. Ці роботи застосовують передові методи машинного навчання для розробки великих мовних моделей (LLM) та генеративного штучного інтелекту, спрямовані на покращення здатності моделей штучного інтелекту розуміти в'єтнамський контекст, емоції та нюанси, які є складними факторами та рідко моделюються в міжнародних корпусах. Завдяки цьому в'єтнамська мова дедалі більше присутня у світовій дослідницькій спільноті NLP, відкриваючи можливість створення сильних, унікальних та відповідних мовних моделей для в'єтнамців.
Джерело: https://vnpt.com.vn/gioi-thieu/tin-tuc/nhom-ky-su-tre-viet-nam-hai-nam-lien-tiep-dung-dau-san-choi-ai-toan-cau.html






Коментар (0)