Niedawno na Hawajach (USA) odbyła się ceremonia ogłoszenia wyników konkursu AI City Challenge 2025 (AI w inteligentnych miastach), który odbył się w ramach Międzynarodowej Konferencji na temat Widzenia Komputerowego (ICCV 2025).
Po zwycięstwie w 2024 roku, tegoroczny zespół inżynierów AI VNPT zdobył pierwsze miejsce w kategorii „Przetwarzanie i rozpoznawanie obiektów z danych obrazu z kamery ultraszerokokątnej na urządzeniach brzegowych” (Edge AI). Problem wymaga systemu sztucznej inteligencji (AI) z szybkością przetwarzania w czasie rzeczywistym, bezpośrednio na kompaktowych urządzeniach sprzętowych, zapewniającego jednocześnie wysoką dokładność rozpoznawania obiektów z silnie zniekształconych danych obrazu, co spełnia praktyczne wymagania.
AI City Challenge to jeden z najbardziej prestiżowych corocznych konkursów na świecie poświęconych sztucznej inteligencji stosowanej w inteligentnych miastach. Tegoroczny konkurs obejmuje cztery kategorie o wyższej złożoności niż w poprzednich sezonach, przyciągając ponad 30 000 zespołów z krajów o silnym rozwoju sztucznej inteligencji, takich jak USA, Chiny, Korea Południowa i Tajwan (Chiny).

Najtrudniejszy sezon egzaminacyjny
Problem przetwarzania i rozpoznawania obiektów z danych obrazu z kamery ultraszerokokątnej odzwierciedla trend stosowania wizji komputerowej w obecnych systemach monitorowania ruchu drogowego. Dzięki wysokiej praktyczności, kategoria ta jest torem wyścigowym z największą liczbą rywalizujących zespołów. Trudność w tej kategorii polega na konieczności szybkiego i dokładnego przetwarzania zniekształconych i zdeformowanych obrazów, a także efektywnej pracy na urządzeniach brzegowych.
Zespoły musiały zoptymalizować swoje modele tak, aby działały na Jetsonie Orinie, niewielkim urządzeniu umieszczonym w punkcie gromadzenia danych (tzw. urządzeniu brzegowym), które ma limit mocy 30 W i znacznie niższą moc obliczeniową niż serwer centralny. Oznaczało to, że zespoły nie mogły korzystać z nadmiernie dużych modeli, ale musiały je odchudzić i zoptymalizować, aby program działał szybko, zużywał mniej zasobów i nadal precyzyjnie rozpoznawał pojazdy.

Zmiany te sprawiają, że sezon AI City Challenge 2025 staje się jednym z najtrudniejszych dotychczas, tym bardziej że drużyny wyciągnęły wnioski z ubiegłorocznych doświadczeń, a poziom rywalizacji znacząco wzrósł.
Skorzystaj z doświadczenia w optymalizacji modeli w świecie rzeczywistym
W monitorowaniu ruchu infrastruktura obliczeniowa i łączność sieciowa są często ograniczone, co utrudnia tworzenie modeli AI, które byłyby jednocześnie dokładne i wydajne. Właśnie dlatego Edge AI stał się trendem. Zamiast wysyłać wszystkie dane do centralnego serwera w celu przetworzenia, model jest umieszczany bezpośrednio w urządzeniu zbierającym dane (takim jak kamera), co pomaga szybciej reagować, zmniejszać opóźnienia, oszczędzać przepustowość i zapewniać bezpieczeństwo danych, szczególnie w systemach monitoringu na dużą skalę.
Dzięki ponad siedmioletniemu doświadczeniu w opracowywaniu i wdrażaniu modeli sztucznej inteligencji do przetwarzania obrazu zespół inżynierów VNPT osiągnął umiejętność równoważenia dokładności, szybkości i kosztów operacyjnych.
Obecnie VNPT posiada ponad 40 modeli sztucznej inteligencji do przetwarzania obrazu, takich jak rozpoznawanie tablic rejestracyjnych, pomiar natężenia ruchu, wykrywanie kasków, a także modele specyficzne dla Wietnamu, takie jak wykrywanie pojazdów przewożących trzy osoby, przewożących duże ładunki czy wykrywanie pożarów i broni w systemach monitoringu. Modele te są zoptymalizowane pod kątem działania na wielu typach sprzętu, od procesorów graficznych (GPU), przez procesory CPU, po układy NPU, spełniając zróżnicowane wymagania systemów.
Aby skutecznie wdrażać na dużą skalę, zwłaszcza w modelu lokalnym i na brzegu sieci z setkami kamer jednocześnie, inżynierowie VNPT opracowali również optymalne metody przetwarzania, które umożliwiają jednoczesną obsługę setek strumieni danych wideo . Takie podejście sprawia, że rozwiązania AI są łatwo skalowalne, oszczędzają zasoby i dostosowują się do warunków infrastrukturalnych w wielu lokalizacjach.
Wykorzystując to doświadczenie w ramach AI City Challenge 2025, zespół zastosował kombinację technik, aby stworzyć całościowy łańcuch przetwarzania, który osiąga najwyższą wydajność. Takie podejście pomaga modelowi zachować dokładność, jednocześnie zwiększając szybkość wnioskowania i możliwości wdrażania na urządzeniach brzegowych o ograniczonej konfiguracji.

Wyniki VNPT w ramach AI City Challenge 2025 przyczyniają się do wzmocnienia ekosystemu sztucznej inteligencji (AI) w zakresie monitorowania ruchu drogowego i bezpieczeństwa miejskiego w kraju, gdzie kamery ultraszerokokątne są stopniowo wdrażane na szeroką skalę.
W kontekście zastosowań sztucznej inteligencji w przetwarzaniu obrazu, oprócz inteligentnych systemów miejskich i systemów ruchu drogowego, VNPT promuje również zastosowania badawcze w medycynie. We wrześniu 2025 roku grupa ogłosiła rozpoczęcie badań naukowych na konferencji MICCAI 2025 – wiodącej na świecie konferencji poświęconej sztucznej inteligencji i komputerowej wizji w medycynie. Badania koncentrowały się na zastosowaniach sztucznej inteligencji w diagnostyce raka tarczycy i były prowadzone na podstawie danych pochodzących od blisko 10 000 pacjentów z 3 regionów kraju w ciągu 4 lat. Projekt odgrywa fundamentalną rolę w rozwoju automatycznych systemów wspomagania diagnostyki, dostosowanych do specyfiki populacji Wietnamu i stanu zdrowia, przyczyniając się do poprawy dokładności, skrócenia czasu diagnozy, zmniejszenia obciążenia pracą lekarzy i rozszerzenia dostępu do wysokiej jakości usług medycznych na poziomie lokalnym.
Source: https://www.vietnamplus.vn/nhom-ky-su-tre-viet-nam-hai-nam-lien-vo-dich-san-choi-ai-toan-cau-post1073042.vnp






Komentarz (0)