
Недавно в рамках Международной конференции по компьютерному зрению (ICCV 2025) на Гавайях (США) состоялась церемония подведения итогов конкурса AI City Challenge 2025 (ИИ в умных городах). Вслед за победой в 2024 году, в этом году команда инженеров ИИ VNPT заняла первое место в категории «Обработка и распознавание объектов на изображениях с широкоугольной камеры на периферийных устройствах (ИИ на периферийных устройствах). Для решения этой задачи требуется система ИИ, способная обрабатывать данные в режиме реального времени непосредственно на компактных аппаратных устройствах, обеспечивая при этом высокую точность распознавания объектов на сильно искаженных изображениях, что отвечает практическим потребностям.
AI City Challenge 2025 — одно из самых престижных ежегодных соревнований в мире по искусственному интеллекту (ИИ), применяемому в умных городах. В этом году конкурс включает четыре категории повышенной сложности по сравнению с предыдущими сезонами и привлекает более 30 000 команд из стран с высоким уровнем развития ИИ, таких как США, Китай, Корея, Тайвань и другие.
Команда инженеров VNPT лидирует благодаря точности искусственного интеллекта и скорости обработки данных на периферии.
Задача расширения возможностей ИИ на периферии
Задача обработки и распознавания объектов на изображениях, полученных с помощью сверхширокоугольной камеры, включена в программу AI City Challenge с 2024 года, отражая тенденцию применения компьютерного зрения в современных системах мониторинга дорожного движения. Благодаря высокой практичности, эта категория всегда является гонкой с наибольшим количеством команд в соревновании. В этом году сложность категории возросла: помимо точной обработки искаженных и деформированных изображений, командам необходимо оптимизировать весь процесс для эффективной работы модели на периферийных устройствах.
Команда инженеров VNPT применяет множество методов для быстрой и точной идентификации транспортных средств.
Командам требовалось оптимизировать свои модели для эффективной работы на Jetson Orin, небольшом устройстве, расположенном в точке сбора данных (так называемом периферийном устройстве), мощность которого ограничена 30 Вт, а вычислительная мощность значительно ниже, чем у центрального сервера. Это означало, что команды не могли использовать слишком большие модели, но им пришлось оптимизировать и оптимизировать программу для более быстрой работы, снижения потребления ресурсов и обеспечения точного распознавания транспортных средств. Эти изменения сделали AI City Challenge 2025 одним из самых сложных сезонов на сегодняшний день, особенно с учетом того, что команды извлекли уроки из прошлогоднего опыта, а уровень конкуренции значительно возрос.
Воспользуйтесь преимуществами реального опыта оптимизации моделей
При решении задач мониторинга дорожного движения вычислительная инфраструктура и сетевые соединения часто ограничены, что делает разработку точных и эффективных моделей ИИ сложной задачей. Именно поэтому периферийный ИИ стал неизбежной тенденцией. Вместо того, чтобы отправлять все данные на центральный сервер для обработки, модель размещается непосредственно на устройстве сбора данных (например, камере), что позволяет быстрее реагировать, сокращать задержки, экономить полосу пропускания и обеспечивать безопасность данных, особенно в крупномасштабных системах мониторинга.
Согласно результатам, объявленным на конкурсе AI City Challenge 2025, команда инженеров VNPT заняла первое место, обойдя сотни команд из крупных технологических корпораций, исследовательских институтов и университетов по всему миру. Это достижение способствует укреплению экосистемы ИИ для мониторинга дорожного движения и обеспечения безопасности в городах страны, где широко используются сверхширокоугольные камеры для расширения зоны наблюдения, уменьшения слепых зон, сокращения количества установленных устройств и повышения эффективности эксплуатации городской инфраструктуры. Обладая более чем семилетним опытом разработки и внедрения моделей ИИ для обработки изображений внутри страны, команда инженеров VNPT накопила опыт баланса между точностью, скоростью и эксплуатационными расходами — факторами, определяющими эффективность применения ИИ в реальных условиях.

Команда VNPT разработала и освоила более 40 моделей ИИ для обработки изображений.
В настоящее время команда VNPT разработала и освоила более 40 различных моделей ИИ для обработки изображений, таких как распознавание номерных знаков, измерение транспортного потока, обнаружение шлемов, а также модели, специфичные для Вьетнама, такие как обнаружение транспортных средств с тремя пассажирами, крупногабаритных грузов, а также обнаружение пожаров и оружия в сфере безопасности и городского видеонаблюдения. Эти модели оптимизированы для работы на различном оборудовании, от графических процессоров, центральных процессоров до нейронных процессоров, что отвечает разнообразным требованиям систем и клиентов.
Для эффективного масштабного развертывания, особенно в локальной модели и на периферии с сотнями камер одновременно, инженеры VNPT также разработали оптимальные методы обработки, позволяющие одновременно обрабатывать сотни потоков видеоданных . Такой подход позволяет легко масштабировать решения на основе ИИ, экономит ресурсы и подходит для инфраструктуры различных локаций.
Применяя этот опыт к AI City Challenge 2025, команда использовала комбинацию таких методов, как сжатие модели для уменьшения размера и потребляемых вычислительных ресурсов, оптимизация потока обработки изображений для снижения задержки, а также уточнение языка программирования и структуры кода для формирования общей цепочки обработки с целью достижения максимальной производительности. Такой подход помогает модели сохранять точность, одновременно повышая скорость вывода и возможности развертывания на периферийных устройствах с аппаратными ограничениями.
Междисциплинарная исследовательская платформа для глубокого обучения искусственного интеллекта
Помимо наличия команды молодых талантливых сотрудников и мощной вычислительной инфраструктуры, одним из важных условий для того, чтобы VNPT имела комплексную экосистему продуктов ИИ, соответствующую международным стандартам и завоевавшую высокие награды на престижных конкурсах, является углубленная исследовательская платформа в области ИИ во многих областях.
Что касается применения ИИ в обработке изображений, помимо интеллектуальных городских и транспортных систем, VNPT также продвигает исследовательские приложения в области медицины. В сентябре 2025 года группа объявила о проведении научного исследования на MICCAI 2025 — ведущей мировой конференции по ИИ и компьютерному зрению в медицине. Исследование было сосредоточено на применении ИИ в диагностике рака щитовидной железы и проводилось на данных почти 10 000 пациентов в трёх регионах страны в течение четырёх лет. Проект играет основополагающую роль в разработке автоматизированных систем диагностической поддержки, учитывающих особенности населения и состояние здоровья в стране, способствуя повышению точности, сокращению времени постановки диагноза, снижению нагрузки на врачей и расширению доступа к высококачественным медицинским услугам для населения.
Команда инженеров искусственного интеллекта VNPT публиковала исследования на многих престижных научных конференциях.
В области языка и обработки речи VNPT также анонсировала исследования на EMNLP 2025 – конференции по ИИ с рейтингом A*, посвящённой обработке естественного языка, и ICASSP 2025 – конференции с рейтингом A1, посвящённой обработке речи. Эти работы используют передовые методы машинного обучения для разработки больших языковых моделей (LLM) и генеративного ИИ, стремясь улучшить способность моделей ИИ понимать вьетнамский контекст, эмоции и нюансы – сложные факторы, которые редко моделируются в международных корпусах. Благодаря этому вьетнамский язык всё больше представлен в мировом сообществе исследователей естественного языка, открывая возможность создания сильных, уникальных и подходящих языковых моделей для вьетнамцев.
Источник: https://vnpt.com.vn/gioi-thieu/tin-tuc/nhom-ky-su-tre-viet-nam-hai-nam-lien-tiep-dung-dau-san-choi-ai-toan-cau.html






Комментарий (0)