Kürzlich fand im Rahmen der International Conference on Computer Vision (ICCV 2025) in Hawaii (USA) die feierliche Bekanntgabe der Ergebnisse der AI City Challenge 2025 (KI in Smart Cities) statt.
Nach dem Sieg im Jahr 2024 belegte das KI-Engineering-Team des VNPT in diesem Jahr den ersten Platz in der Kategorie „Verarbeitung und Erkennung von Objekten aus Bilddaten von Ultraweitwinkelkameras auf Edge-Geräten (Edge AI). Das Problem erfordert ein System künstlicher Intelligenz (KI) mit Echtzeit-Verarbeitungsgeschwindigkeit direkt auf kompakten Hardwaregeräten, das gleichzeitig eine hohe Genauigkeit bei der Erkennung von Objekten aus stark verzerrten Bilddaten gewährleistet und so den praktischen Anforderungen gerecht wird.
Die AI City Challenge ist einer der weltweit renommiertesten jährlichen Wettbewerbe zum Thema KI in Smart Cities. Der diesjährige Wettbewerb umfasst vier Kategorien mit höherer Komplexität als in den Vorjahren und zieht mehr als 30.000 Teams aus Ländern mit starker KI-Entwicklung wie den USA, China, Südkorea, Taiwan (China) usw. an.

Die härteste Prüfungszeit
Die Problematik der Verarbeitung und Erkennung von Objekten aus Ultraweitwinkel-Kamerabilddaten spiegelt den Trend zur Anwendung von Computer Vision in aktuellen Verkehrsüberwachungssystemen wider. Aufgrund ihres hohen Praxisbezugs ist diese Kategorie die Rennstrecke mit den meisten teilnehmenden Teams. Die Schwierigkeit dieser Kategorie liegt in der Notwendigkeit, verzerrte und deformierte Bilder schnell und präzise zu verarbeiten und gleichzeitig auf Edge-Geräten effektiv zu arbeiten.
Die Teams mussten ihre Modelle für die Ausführung auf dem Jetson Orin optimieren, einem kleinen Gerät am Datenerfassungspunkt (Edge Device), das eine Leistungsgrenze von 30 W und eine deutlich geringere Rechenleistung als ein zentraler Server hat. Das bedeutete, dass die Teams keine übermäßig großen Modelle verwenden durften, sondern diese verschlanken und optimieren mussten, damit das Programm schnell lief, weniger Ressourcen verbrauchte und die Fahrzeuge dennoch präzise erkannte.

Diese Änderungen machen die AI City Challenge 2025 zu einer der bisher härtesten Saisons, insbesondere da die Teams aus den Erfahrungen des letzten Jahres gelernt haben und das Wettbewerbsniveau deutlich gestiegen ist.
Profitieren Sie von der Erfahrung in der Modelloptimierung aus der Praxis
Bei der Verkehrsüberwachung sind Recheninfrastruktur und Netzwerkkonnektivität oft begrenzt. Das erschwert die Entwicklung präziser und effizienter KI-Modelle. Edge-KI ist daher ein Trend. Anstatt alle Daten zur Verarbeitung an einen zentralen Server zu senden, wird das Modell direkt am Erfassungsgerät (z. B. einer Kamera) platziert. Dies ermöglicht schnellere Reaktionen, reduzierte Latenzzeiten, spart Bandbreite und gewährleistet die Datensicherheit, insbesondere bei groß angelegten Überwachungssystemen.
Mit mehr als sieben Jahren Erfahrung in der Entwicklung und Bereitstellung von KI-Modellen zur Bildverarbeitung hat das Ingenieurteam von VNPT die Fähigkeit entwickelt, Genauigkeit, Geschwindigkeit und Betriebskosten in Einklang zu bringen.
Derzeit verfügt VNPT über mehr als 40 KI-Modelle für die Bildverarbeitung, beispielsweise zur Kennzeichenerkennung, Verkehrsflussmessung, Helmerkennung und vietnamesischen Modellen wie der Erkennung von Fahrzeugen mit drei Personen, dem Transport sperriger Güter oder der Erkennung von Feuer und Waffen in der Sicherheitsüberwachung. Diese Modelle sind für den Betrieb auf vielen Hardwaretypen optimiert, von GPUs über CPUs bis hin zu NPUs, und erfüllen die vielfältigen Anforderungen der Systeme.
Um einen effektiven Einsatz in großem Maßstab zu ermöglichen, insbesondere im On-Premise-Modell und am Netzwerkrand mit Hunderten von Kameras gleichzeitig, haben die VNPT-Ingenieure zudem optimale Verarbeitungsmethoden entwickelt, die den gleichzeitigen Betrieb von Hunderten von Videodatenströmen ermöglichen. Dieser Ansatz macht KI-Lösungen leicht skalierbar, ressourcenschonend und für die Infrastrukturbedingungen vieler Standorte geeignet.
Das Team nutzte diese Erfahrung für die AI City Challenge 2025 und kombinierte verschiedene Techniken, um die gesamte Verarbeitungskette zu bilden, die die höchste Leistung erzielt. Dieser Ansatz trägt dazu bei, die Genauigkeit des Modells aufrechtzuerhalten und gleichzeitig die Inferenzgeschwindigkeit und die Einsatzfähigkeit auf Edge-Geräten mit begrenzter Konfiguration zu erhöhen.

Die Ergebnisse des VNPT bei der AI City Challenge 2025 tragen zur Stärkung des KI-Ökosystems für die Verkehrsüberwachung und städtische Sicherheit im Land bei, wo Ultraweitwinkelkameras nach und nach in großem Umfang eingesetzt werden.
Im Hinblick auf KI-Anwendungen in der Bildverarbeitung fördert VNPT neben intelligenten Stadt- und Verkehrssystemen auch Forschungsanwendungen im medizinischen Bereich. Im September 2025 kündigte die Gruppe wissenschaftliche Forschung auf der MICCAI 2025 an – der weltweit führenden Konferenz zu KI und Computer Vision in der Medizin. Die Forschung konzentrierte sich auf KI-Anwendungen in der Schilddrüsenkrebsdiagnose und wurde über einen Zeitraum von vier Jahren mit Daten von fast 10.000 Patienten in drei Regionen des Landes durchgeführt. Das Projekt spielt eine grundlegende Rolle bei der Entwicklung automatischer Diagnoseunterstützungssysteme, die auf die Merkmale der vietnamesischen Bevölkerung und die medizinischen Bedingungen zugeschnitten sind. Es trägt dazu bei, die Genauigkeit zu verbessern, die Diagnosezeit zu verkürzen, die Arbeitsbelastung der Ärzte zu reduzieren und den Zugang zu hochwertigen medizinischen Dienstleistungen bis an die Basis zu erweitern.
Quelle: https://www.vietnamplus.vn/nhom-ky-su-tre-viet-nam-hai-nam-lien-vo-dich-san-choi-ai-toan-cau-post1073042.vnp






Kommentar (0)