
Πρόσφατα, πραγματοποιήθηκε η τελετή ανακοίνωσης των αποτελεσμάτων του διαγωνισμού AI City Challenge 2025 (AI in smart cities) στο πλαίσιο του Διεθνούς Συνεδρίου για την Υπολογιστική Όραση (ICCV 2025) στη Χαβάη (ΗΠΑ). Μετά τη νίκη το 2024, φέτος η ομάδα μηχανικών τεχνητής νοημοσύνης του VNPT κατέκτησε την πρώτη θέση στην κατηγορία Επεξεργασία και αναγνώριση αντικειμένων από δεδομένα εικόνας κάμερας εξαιρετικά ευρείας γωνίας σε συσκευές edge (edge AI). Το πρόβλημα απαιτεί ένα σύστημα τεχνητής νοημοσύνης με ταχύτητα επεξεργασίας σε πραγματικό χρόνο, απευθείας σε συμπαγείς συσκευές υλικού, εξασφαλίζοντας παράλληλα υψηλή ακρίβεια στην αναγνώριση αντικειμένων από δεδομένα εικόνας με υψηλή παραμόρφωση, καλύπτοντας πρακτικές ανάγκες.
Το AI City Challenge 2025 είναι ένας από τους πιο αναγνωρισμένους ετήσιους διαγωνισμούς στον κόσμο για την τεχνητή νοημοσύνη (AI) που εφαρμόζεται σε έξυπνες πόλεις. Ο φετινός διαγωνισμός περιλαμβάνει τέσσερις κατηγορίες με μεγαλύτερη πολυπλοκότητα από τις προηγούμενες σεζόν, προσελκύοντας περισσότερες από 30.000 ομάδες από χώρες με ισχυρή ανάπτυξη της Τεχνητής Νοημοσύνης, όπως οι ΗΠΑ, η Κίνα, η Κορέα, η Ταϊβάν κ.λπ.
Η ομάδα μηχανικών της VNPT πρωτοπορεί χάρη στην ακρίβεια και την ταχύτητα επεξεργασίας της Τεχνητής Νοημοσύνης στα άκρα.
Η πρόκληση της ενίσχυσης των δυνατοτήτων της Τεχνητής Νοημοσύνης στα όρια
Το πρόβλημα της επεξεργασίας και αναγνώρισης αντικειμένων από δεδομένα εικόνας υπερευρυγώνιας κάμερας έχει συμπεριληφθεί στο AI City Challenge από το 2024, αντανακλώντας την τάση εφαρμογής της υπολογιστικής όρασης στα τρέχοντα συστήματα παρακολούθησης της κυκλοφορίας. Με υψηλή πρακτικότητα, η κατηγορία είναι πάντα ο αγώνας με τον μεγαλύτερο αριθμό ομάδων σε ολόκληρο τον διαγωνισμό. Φέτος, η δυσκολία της κατηγορίας αυξάνεται όταν, εκτός από την ακριβή επεξεργασία παραμορφωμένων και παραμορφωμένων εικόνων, οι ομάδες πρέπει να βελτιστοποιήσουν ολόκληρη τη διαδικασία, ώστε το μοντέλο να μπορεί να λειτουργεί αποτελεσματικά σε συσκευές edge.
Η ομάδα μηχανικών της VNPT εφαρμόζει πολλές τεχνικές για την γρήγορη και ακριβή αναγνώριση οχημάτων.
Οι ομάδες έπρεπε να βελτιστοποιήσουν τα μοντέλα τους ώστε να λειτουργούν αποτελεσματικά στο Jetson Orin, μια μικρή συσκευή που βρίσκεται στο σημείο συλλογής δεδομένων (που ονομάζεται συσκευή edge), η οποία έχει όριο ισχύος 30W και πολύ χαμηλότερη υπολογιστική ισχύ από έναν κεντρικό διακομιστή. Αυτό σήμαινε ότι οι ομάδες δεν μπορούσαν να χρησιμοποιήσουν υπερβολικά μεγάλα μοντέλα, αλλά έπρεπε να βελτιστοποιήσουν και να βελτιστοποιήσουν το πρόγραμμα ώστε να λειτουργεί πιο γρήγορα, να καταναλώνει λιγότερους πόρους και να αναγνωρίζει με ακρίβεια τα οχήματα. Αυτές οι αλλαγές κατέστησαν το AI City Challenge 2025 μια από τις πιο δύσκολες σεζόν μέχρι σήμερα, ειδικά καθώς οι ομάδες έμαθαν από την εμπειρία του περασμένου έτους και το επίπεδο του ανταγωνισμού αυξήθηκε σημαντικά.
Επωφεληθείτε από την εμπειρία βελτιστοποίησης μοντέλου σε πραγματικό κόσμο
Σε προβλήματα παρακολούθησης της κυκλοφορίας, η υπολογιστική υποδομή και οι συνδέσεις δικτύου είναι συχνά περιορισμένες, καθιστώντας την ανάπτυξη μοντέλων Τεχνητής Νοημοσύνης (ΤΝ) που είναι ταυτόχρονα ακριβή και αποτελεσματικά μια μεγάλη πρόκληση. Αυτός είναι επίσης ο λόγος για τον οποίο η Τεχνητή Νοημοσύνη (ΤΝ) στο Edge έχει γίνει μια αναπόφευκτη τάση. Αντί να στέλνονται όλα τα δεδομένα σε έναν κεντρικό διακομιστή για επεξεργασία, το μοντέλο τοποθετείται ακριβώς στη συσκευή συλλογής (όπως μια κάμερα), συμβάλλοντας στην ταχύτερη απόκριση, στη μείωση της καθυστέρησης, στην εξοικονόμηση εύρους ζώνης και στη διασφάλιση της ασφάλειας των δεδομένων, ειδικά σε συστήματα παρακολούθησης μεγάλης κλίμακας.
Σύμφωνα με τα αποτελέσματα που ανακοινώθηκαν στο AI City Challenge 2025, η ομάδα μηχανικών του VNPT κατέλαβε την πρώτη θέση, ξεπερνώντας εκατοντάδες ομάδες από μεγάλες εταιρείες τεχνολογίας, ερευνητικά ιδρύματα και πανεπιστήμια σε όλο τον κόσμο. Αυτό το επίτευγμα συμβάλλει στην ενίσχυση του οικοσυστήματος Τεχνητής Νοημοσύνης για την παρακολούθηση της κυκλοφορίας και την αστική ασφάλεια στη χώρα, όπου οι κάμερες εξαιρετικά ευρείας γωνίας αναπτύσσονται ευρέως για την επέκταση της περιοχής παρατήρησης, τη μείωση των τυφλών σημείων, τη μείωση του αριθμού των εγκατεστημένων συσκευών και τη βελτίωση της αποτελεσματικότητας των λειτουργιών των αστικών υποδομών. Με περισσότερα από επτά χρόνια εμπειρίας στην ανάπτυξη μοντέλων Τεχνητής Νοημοσύνης για την επεξεργασία εικόνας και την ανάπτυξή τους στην εγχώρια αγορά, η ομάδα μηχανικών του VNPT έχει συσσωρεύσει την ικανότητα να εξισορροπεί την ακρίβεια, την ταχύτητα και το λειτουργικό κόστος - παράγοντες που καθορίζουν την αποτελεσματικότητα της εφαρμογής της Τεχνητής Νοημοσύνης σε πραγματικά περιβάλλοντα.

Η ομάδα VNPT έχει αναπτύξει και τελειοποιήσει περισσότερα από 40 μοντέλα τεχνητής νοημοσύνης επεξεργασίας εικόνας.
Αυτή τη στιγμή, η ομάδα VNPT έχει αναπτύξει και τελειοποιήσει περισσότερα από 40 διαφορετικά μοντέλα τεχνητής νοημοσύνης επεξεργασίας εικόνας, όπως αναγνώριση πινακίδων κυκλοφορίας, μέτρηση ροής κυκλοφορίας, ανίχνευση κράνους, καθώς και μοντέλα ειδικά για το Βιετνάμ, όπως ανίχνευση οχημάτων που μεταφέρουν τρία άτομα, που μεταφέρουν ογκώδη εμπορεύματα ή ανίχνευση πυρκαγιών και όπλων στον τομέα της ασφάλειας και της αστικής επιτήρησης. Αυτά τα μοντέλα είναι βελτιστοποιημένα για να λειτουργούν σε μια ποικιλία υλικού, από GPU, CPU έως NPU, καλύπτοντας τις ποικίλες απαιτήσεις συστημάτων και πελατών.
Για να είναι δυνατή η αποτελεσματική ανάπτυξη σε μεγάλη κλίμακα, ειδικά στο μοντέλο on-premise και στα όρια με εκατοντάδες κάμερες ταυτόχρονα, οι μηχανικοί του VNPT έχουν επίσης δημιουργήσει βέλτιστες μεθόδους επεξεργασίας που επιτρέπουν την ταυτόχρονη λειτουργία εκατοντάδων ροών δεδομένων βίντεο . Αυτή η προσέγγιση καθιστά τις λύσεις τεχνητής νοημοσύνης εύκολες στην κλιμάκωση, εξοικονομεί πόρους και είναι κατάλληλη για συνθήκες υποδομής σε πολλές τοποθεσίες.
Εφαρμόζοντας αυτήν την εμπειρία στο AI City Challenge 2025, η ομάδα εφάρμοσε έναν συνδυασμό τεχνικών όπως η συμπίεση μοντέλου για τη μείωση του μεγέθους και των πόρων επεξεργασίας, η βελτιστοποίηση της ροής επεξεργασίας εικόνας για τη μείωση της καθυστέρησης και η βελτίωση της γλώσσας προγραμματισμού και της δομής κώδικα για να διαμορφώσει τη συνολική αλυσίδα επεξεργασίας για την υψηλότερη απόδοση. Αυτή η προσέγγιση βοηθά το μοντέλο να διατηρεί την ακρίβεια, αυξάνοντας παράλληλα την ταχύτητα εξαγωγής συμπερασμάτων και την ανάπτυξη σε συσκευές edge με περιορισμούς υλικού.
Πολυεπιστημονική πλατφόρμα έρευνας βαθιάς μάθησης για την τεχνητή νοημοσύνη
Όχι μόνο διαθέτει μια ομάδα νεαρού, ταλαντούχου προσωπικού και ισχυρή υπολογιστική υποδομή, αλλά και μια από τις σημαντικές προϋποθέσεις για να διαθέτει το VNPT ένα ολοκληρωμένο οικοσύστημα προϊόντων Τεχνητής Νοημοσύνης που να πληροί τα διεθνή πρότυπα και να κερδίζει υψηλά βραβεία σε διαγωνισμούς κύρους, είναι η εις βάθος πλατφόρμα έρευνας για την Τεχνητή Νοημοσύνη σε πολλούς τομείς.
Όσον αφορά τις εφαρμογές Τεχνητής Νοημοσύνης στην επεξεργασία εικόνας, εκτός από τα έξυπνα αστικά συστήματα και τα συστήματα κυκλοφορίας, το VNPT προωθεί επίσης ερευνητικές εφαρμογές στον ιατρικό τομέα. Τον Σεπτέμβριο του 2025, η ομάδα ανακοίνωσε επιστημονική έρευνα στο MICCAI 2025 - το κορυφαίο παγκοσμίως συνέδριο για την Τεχνητή Νοημοσύνη και την υπολογιστική όραση στην ιατρική. Η έρευνα επικεντρώθηκε στις εφαρμογές Τεχνητής Νοημοσύνης στη διάγνωση του καρκίνου του θυρεοειδούς, η οποία διεξήχθη με δεδομένα από σχεδόν 10.000 ασθενείς σε 3 περιοχές της χώρας για διάστημα 4 ετών. Το έργο διαδραματίζει θεμελιώδη ρόλο στην ανάπτυξη αυτόματων συστημάτων υποστήριξης διάγνωσης κατάλληλων για τα χαρακτηριστικά του πληθυσμού και τις ιατρικές παθήσεις της χώρας, συμβάλλοντας στη βελτίωση της ακρίβειας, στη μείωση του χρόνου διάγνωσης, στη μείωση του φόρτου εργασίας για τους γιατρούς και στην επέκταση της πρόσβασης σε υψηλής ποιότητας ιατρικές υπηρεσίες σε επίπεδο βάσης.
Η ομάδα μηχανικής τεχνητής νοημοσύνης του VNPT δημοσίευσε έρευνα σε πολλά έγκριτα επιστημονικά συνέδρια.
Στον τομέα της επεξεργασίας γλώσσας και ομιλίας, το VNPT ανακοίνωσε επίσης έρευνα στο EMNLP 2025 - ένα συνέδριο Τεχνητής Νοημοσύνης με κατάταξη A* για την επεξεργασία φυσικής γλώσσας, και στο ICASSP 2025 - ένα συνέδριο με κατάταξη A1 για την επεξεργασία ομιλίας. Αυτές οι εργασίες εφαρμόζουν προηγμένες τεχνικές μηχανικής μάθησης στην ανάπτυξη μεγάλων γλωσσικών μοντέλων (LLM) και γενετικής Τεχνητής Νοημοσύνης, με στόχο τη βελτίωση της ικανότητας των μοντέλων Τεχνητής Νοημοσύνης να κατανοούν το βιετναμέζικο πλαίσιο, τα συναισθήματα και τις αποχρώσεις - που είναι πολύπλοκοι παράγοντες και σπάνια μοντελοποιούνται σε διεθνή σώματα κειμένων. Χάρη σε αυτό, η βιετναμέζικη γλώσσα είναι ολοένα και πιο παρούσα στην παγκόσμια ερευνητική κοινότητα NLP, ανοίγοντας τη δυνατότητα δημιουργίας ισχυρών, μοναδικών και κατάλληλων γλωσσικών μοντέλων για τους Βιετναμέζους.
Πηγή: https://vnpt.com.vn/gioi-thieu/tin-tuc/nhom-ky-su-tre-viet-nam-hai-nam-lien-tiep-dung-dau-san-choi-ai-toan-cau.html






Σχόλιο (0)