
Niedawno, w ramach Międzynarodowej Konferencji na temat Widzenia Komputerowego (ICCV 2025) na Hawajach (USA), odbyła się ceremonia ogłoszenia wyników konkursu AI City Challenge 2025 (AI in smart cities). Po zwycięstwie w 2024 roku, w tym roku zespół inżynierów AI z VNPT zdobył pierwsze miejsce w kategorii „Przetwarzanie i rozpoznawanie obiektów z danych obrazu z kamery ultraszerokokątnej na urządzeniach brzegowych” (edge AI). Problem wymaga systemu AI o prędkości przetwarzania w czasie rzeczywistym, bezpośrednio na kompaktowych urządzeniach, zapewniającego jednocześnie wysoką dokładność rozpoznawania obiektów z silnie zniekształconych danych obrazu, co spełnia praktyczne wymagania.
AI City Challenge 2025 to jeden z najbardziej prestiżowych corocznych konkursów na świecie poświęconych sztucznej inteligencji (AI) stosowanej w inteligentnych miastach. Tegoroczny konkurs obejmuje cztery kategorie o wyższej złożoności niż w poprzednich sezonach, przyciągając ponad 30 000 zespołów z krajów o silnym rozwoju AI, takich jak Stany Zjednoczone, Chiny, Korea, Tajwan itp.
Zespół inżynierów VNPT wyznacza trendy dzięki dokładności sztucznej inteligencji i szybkości przetwarzania na brzegu sieci.
Wyzwanie związane ze zwiększeniem możliwości sztucznej inteligencji na brzegu sieci
Problem przetwarzania i rozpoznawania obiektów z danych obrazu z kamery ultraszerokokątnej jest uwzględniany w konkursie AI City Challenge od 2024 roku, odzwierciedlając trend stosowania wizji komputerowej w obecnych systemach monitorowania ruchu drogowego. Dzięki wysokiej praktyczności, kategoria ta zawsze rywalizuje z największą liczbą zespołów w całych zawodach. W tym roku poziom trudności kategorii jest wyższy, ponieważ oprócz precyzyjnego przetwarzania zniekształconych i zdeformowanych obrazów, zespoły muszą zoptymalizować cały proces, aby model mógł efektywnie działać na urządzeniach brzegowych.
Zespół inżynierów VNPT stosuje wiele technik umożliwiających szybką i dokładną identyfikację pojazdów.
Zespoły musiały zoptymalizować swoje modele, aby działały efektywnie na Jetson Orin, niewielkim urządzeniu zlokalizowanym w punkcie gromadzenia danych (tzw. edge device), które ma limit mocy 30 W i znacznie niższą moc obliczeniową niż serwer centralny. Oznaczało to, że zespoły nie mogły korzystać z nadmiernie dużych modeli, ale musiały usprawnić i zoptymalizować program, aby działał szybciej, zużywał mniej zasobów i nadal precyzyjnie rozpoznawał pojazdy. Te zmiany sprawiły, że AI City Challenge 2025 był jednym z najtrudniejszych sezonów do tej pory, zwłaszcza że zespoły wyciągnęły wnioski z ubiegłorocznych doświadczeń, a poziom rywalizacji znacząco wzrósł.
Skorzystaj z doświadczenia w optymalizacji modeli w świecie rzeczywistym
W przypadku problemów z monitorowaniem ruchu infrastruktura obliczeniowa i połączenia sieciowe są często ograniczone, co sprawia, że opracowanie modeli AI, które są jednocześnie dokładne i wydajne, stanowi duże wyzwanie. To również powód, dla którego Edge AI stał się nieuniknionym trendem. Zamiast wysyłać wszystkie dane do centralnego serwera w celu przetworzenia, model jest umieszczany bezpośrednio w urządzeniu zbierającym dane (takim jak kamera), co pomaga w szybszym reagowaniu, zmniejszeniu opóźnień, oszczędzaniu przepustowości i zapewnieniu bezpieczeństwa danych, szczególnie w systemach monitorowania na dużą skalę.
Zgodnie z wynikami ogłoszonymi podczas konkursu AI City Challenge 2025, zespół inżynierów VNPT zajął pierwsze miejsce, wyprzedzając setki zespołów z największych korporacji technologicznych, instytutów badawczych i uniwersytetów na całym świecie. To osiągnięcie przyczynia się do wzmocnienia ekosystemu sztucznej inteligencji (AI) w zakresie monitorowania ruchu drogowego i bezpieczeństwa miejskiego w kraju, gdzie kamery ultraszerokokątne są szeroko stosowane w celu rozszerzenia obszaru obserwacji, zmniejszenia martwych pól, ograniczenia liczby zainstalowanych urządzeń i poprawy efektywności działania infrastruktury miejskiej. Dzięki ponad siedmioletniemu doświadczeniu w opracowywaniu modeli AI do przetwarzania obrazu i ich wdrażaniu w kraju, zespół inżynierów VNPT zgromadził umiejętność równoważenia dokładności, szybkości i kosztów operacyjnych – czynników decydujących o skuteczności zastosowania AI w rzeczywistych warunkach.

Zespół VNPT opracował i opanował ponad 40 modeli sztucznej inteligencji do przetwarzania obrazu.
Obecnie zespół VNPT opracował i opanował ponad 40 różnych modeli sztucznej inteligencji do przetwarzania obrazu, takich jak rozpoznawanie tablic rejestracyjnych, pomiar natężenia ruchu, wykrywanie kasków, a także modele specyficzne dla Wietnamu, takie jak wykrywanie pojazdów przewożących trzy osoby, przewożących ładunki wielkogabarytowe, czy wykrywanie pożarów i broni w obszarze bezpieczeństwa i monitoringu miejskiego. Modele te są zoptymalizowane pod kątem działania na różnorodnych platformach sprzętowych, od procesorów graficznych (GPU), przez procesory CPU, po układy NPU, spełniając zróżnicowane wymagania systemów i klientów.
Aby umożliwić efektywne wdrożenie na dużą skalę, zwłaszcza w modelu lokalnym i na brzegu sieci z setkami kamer jednocześnie, inżynierowie VNPT opracowali również optymalne metody przetwarzania, które umożliwiają jednoczesną obsługę setek strumieni danych wideo . Takie podejście ułatwia skalowanie rozwiązań AI, oszczędza zasoby i sprawdza się w warunkach infrastrukturalnych w wielu lokalizacjach.
Wykorzystując to doświadczenie w ramach AI City Challenge 2025, zespół zastosował kombinację technik, takich jak kompresja modelu w celu zmniejszenia rozmiaru i zasobów przetwarzania, optymalizacja przepływu przetwarzania obrazu w celu zmniejszenia opóźnień oraz udoskonalenie języka programowania i struktury kodu, aby stworzyć cały łańcuch przetwarzania zapewniający najwyższą wydajność. Takie podejście pomaga modelowi zachować dokładność, jednocześnie zwiększając szybkość wnioskowania i wdrażanie na urządzeniach brzegowych o ograniczonych możliwościach sprzętowych.
Multidyscyplinarna platforma badawcza do głębokiego uczenia się sztucznej inteligencji
VNPT dysponuje nie tylko zespołem młodych, utalentowanych pracowników i mocną infrastrukturą obliczeniową, ale także jednym z ważnych założeń umożliwiających stworzenie kompleksowego ekosystemu produktów AI, który spełnia międzynarodowe standardy i zdobywa wysokie nagrody w prestiżowych konkursach. Jest to dogłębna platforma badawcza poświęcona AI w wielu dziedzinach.
W kontekście zastosowań sztucznej inteligencji w przetwarzaniu obrazu, oprócz inteligentnych systemów miejskich i systemów ruchu drogowego, VNPT promuje również zastosowania badawcze w medycynie. We wrześniu 2025 roku grupa ogłosiła rozpoczęcie badań naukowych na konferencji MICCAI 2025 – wiodącej na świecie konferencji poświęconej sztucznej inteligencji i komputerowej wizji w medycynie. Badania koncentrowały się na zastosowaniach sztucznej inteligencji w diagnostyce raka tarczycy i były prowadzone na podstawie danych pochodzących od blisko 10 000 pacjentów z 3 regionów kraju w ciągu 4 lat. Projekt odgrywa fundamentalną rolę w rozwoju automatycznych systemów wspomagania diagnostyki, dostosowanych do charakterystyki populacji i stanu zdrowia w kraju, przyczyniając się do poprawy dokładności, skrócenia czasu diagnozy, zmniejszenia obciążenia pracą lekarzy i rozszerzenia dostępu do wysokiej jakości usług medycznych na poziomie lokalnym.
Zespół inżynierów zajmujących się sztuczną inteligencją VNPT opublikował badania na wielu prestiżowych konferencjach naukowych.
W dziedzinie przetwarzania języka i mowy, VNPT ogłosił również badania na EMNLP 2025 – konferencji AI z oceną A*, poświęconej przetwarzaniu języka naturalnego, oraz ICASSP 2025 – konferencji z oceną A1, poświęconej przetwarzaniu mowy. Prace te wykorzystują zaawansowane techniki uczenia maszynowego do tworzenia dużych modeli językowych (LLM) i generatywnej sztucznej inteligencji, dążąc do poprawy zdolności modeli AI do rozumienia kontekstu, emocji i niuansów wietnamskich – czynników złożonych i rzadko modelowanych w międzynarodowych korpusach. Dzięki temu język wietnamski jest coraz bardziej obecny w globalnej społeczności badawczej zajmującej się przetwarzaniem języka naturalnego, co otwiera możliwość budowania silnych, unikalnych i odpowiednich modeli językowych dla Wietnamczyków.
Source: https://vnpt.com.vn/gioi-thieu/tin-tuc/nhom-ky-su-tre-viet-nam-hai-nam-lien-tiep-dung-dau-san-choi-ai-toan-cau.html






Komentarz (0)