Vietnam.vn - Nền tảng quảng bá Việt Nam

Το CMC κατατάσσεται μεταξύ των 12 κορυφαίων παγκοσμίως στην αναγνώριση κειμένου.

Το μοντέλο CATI-VLM (Οπτική Κατανόηση Εγγράφων) που αναπτύχθηκε από το Ινστιτούτο Εφαρμοσμένης Τεχνολογίας CMC (CMC ATI) έχει ξεπεράσει πολλούς διεθνείς ανταγωνιστές, φτάνοντας στην πρώτη 12άδα παγκοσμίως και στην πρώτη θέση στο Βιετνάμ στην κατάταξη που ανακοινώθηκε πρόσφατα από τον Διαγωνισμό Robust Reading (RRC) τον Ιούνιο του 2025 στην κατηγορία Απαντήσεις Οπτικών Ερωτήσεων Εγγράφων (DocVQA).

Báo Nhân dânBáo Nhân dân02/07/2025

Κατάταξη του RRC στην κατηγορία DocVQA, Ιούνιος 2025.

Κατάταξη του RRC στην κατηγορία DocVQA, Ιούνιος 2025.

Εν μέσω του ραγδαίου ψηφιακού μετασχηματισμού και της υιοθέτησης της τεχνητής νοημοσύνης στο Βιετνάμ, η τεχνολογία OCR (Οπτική Αναγνώριση Χαρακτήρων) παίζει ολοένα και πιο σημαντικό ρόλο στην ψηφιοποίηση εγγράφων, την αυτοματοποίηση επιχειρηματικών διαδικασιών, την εξοικονόμηση κόστους και τη βελτιωμένη αποδοτικότητα της διαχείρισης. Ωστόσο, δεδομένων των μοναδικών χαρακτηριστικών της βιετναμέζικης γλώσσας, συμπεριλαμβανομένων των προφορών και της γραφής της, το πρόβλημα της αναγνώρισης υπερβαίνει την απλή «ανάγνωση» χαρακτήρων. Απαιτεί ένα μοντέλο ικανό να κατανοήσει πλήρως το πλαίσιο.

Πρόσφατα, το Ινστιτούτο Εφαρμοσμένης Τεχνολογίας CMC (CMC ATI) ανακοίνωσε το μοντέλο CATI-VLM (Visual Document Understanding - Οπτική Κατανόηση Εγγράφων) – που αναπτύχθηκε από την ερευνητική του ομάδα από μια μεγάλη αποθήκη δεδομένων 5TB – ξεπερνώντας πολλούς διεθνείς ανταγωνιστές και φτάνοντας στην πρώτη θέση παγκοσμίως και στην πρώτη θέση στο Βιετνάμ στην κατάταξη που δημοσιεύτηκε από τον Διαγωνισμό Robust Reading (RRC) τον Ιούνιο του 2025 στην κατηγορία Απαντήσεις Οπτικών Ερωτήσεων Εγγράφων (DocVQA).

Ο Διαγωνισμός Robust Reading (RRC) είναι ένας έγκριτος επιστημονικός διαγωνισμός (https://rrc.cvc.uab.es/) που διοργανώνεται από το Κέντρο Όρασης Υπολογιστών (CVC) του Αυτόνομου Πανεπιστημίου της Βαρκελώνης (UAB) στην Ισπανία, ένα παγκοσμίου φήμης ερευνητικό ίδρυμα στον τομέα της όρασης υπολογιστών.

Ο διαγωνισμός, που ξεκίνησε το 2011, διεξάγεται ετησίως στο πλαίσιο του Διεθνούς Συνεδρίου Ανάλυσης και Αναγνώρισης Κειμένου (ICDAR) – ενός από τα κορυφαία φόρουμ παγκοσμίως στον τομέα της υπολογιστικής όρασης. Ο διαγωνισμός προσελκύει πολυάριθμους ερευνητές και μηχανικούς από πανεπιστήμια, ερευνητικά ιδρύματα και μεγάλες τεχνολογικές εταιρείες όπως το Πανεπιστήμιο Tsinghua, η Hyundai Motor Group και η Tencent. Τα προβλήματα RRC έχουν σχεδιαστεί για να προωθήσουν την τεχνολογική πρόοδο, η οποία συνδέεται στενά με πρακτικά προβλήματα που κυμαίνονται από τη μετάφραση και τη διαχείριση επιχειρηματικών δεδομένων έως την αστική ανάλυση και την επεξεργασία ιστορικών εγγράφων.

Ο Δρ. Dang Minh Tuan, Διευθυντής του CMC ATI, δήλωσε: «Είμαστε ενθουσιασμένοι που οι ερευνητικές ικανότητες της ομάδας του CMC έχουν επιβεβαιωθεί μέσω ενός διεθνούς διαγωνισμού υψηλού κύρους όπως ο RRC. Σε σύντομο χρονικό διάστημα, η ερευνητική ομάδα έχει επιτύχει υψηλή κατάταξη, επιδεικνύοντας διεθνή ανταγωνιστικότητα με μεγάλα ονόματα από ανεπτυγμένες χώρες. Το πιο σημαντικό είναι ότι αυτό αποτελεί σαφή απόδειξη της ικανότητάς μας να κατακτούμε την τεχνολογία για την επίλυση συγκεκριμένων προβλημάτων που σχετίζονται με τη βιετναμέζικη γλώσσα και εξειδικευμένους τομείς στο Βιετνάμ».

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg

Δρ Dang Minh Tuan, Διευθυντής της CMC ATI.

Το CATI-VLM διαφέρει από την παραδοσιακή OCR στο ότι όχι μόνο εξάγει χαρακτήρες αλλά κατανοεί και πολλαπλά επίπεδα πληροφοριών: περιεχόμενο κειμένου, μη κειμενικά στοιχεία (πλαίσια επιλογής, πλαίσια ελέγχου, γραφήματα, υπογραφές, τύποι), διάταξη (δομή σελίδας, πίνακες, φόρμες) και στυλ (γραμματοσειρές, επισήμανση κ.λπ.). Το μοντέλο μπορεί να απαντήσει σε οπτικά ερωτήματα που τίθενται σε εικόνες εγγράφων, παρόμοια με το ChatGPT, χωρίς να χρειάζεται να μάθει κανείς κάθε συγκεκριμένη φόρμα εκ των προτέρων.

Αξίζει να σημειωθεί ότι στην κατάταξη RRC, το CATI-VLM, με μόνο 3 δισεκατομμύρια παραμέτρους, πέτυχε την υψηλότερη ακρίβεια σε 4 από τα 7 σύνολα δεδομένων, ξεπερνώντας πολλά μοντέλα μεγάλων τεχνολογικών εταιρειών όπως το Deepseek (27 δισεκατομμύρια παράμετροι), το GPT-4 Vision Turbo + Amazon Textract OCR (κορυφαία 34) και το Baidu (κορυφαία 22).

Το επίτευγμα καταδεικνύει επίσης μια πρακτική προσέγγιση, η οποία εστιάζει στην τελειοποίηση των βασικών τεχνολογιών και στη βελτιστοποίηση των μοντέλων ώστε να ταιριάζουν στις συνθήκες υποδομής του Βιετνάμ, αντί να κυνηγά παραμέτρους επεκτασιμότητας.

εικόνα-2.jpg

Παράδειγμα αίτησης εισαγωγής στο πανεπιστήμιο

εικόνα-3.jpg

Το κείμενο έχει αναγνωριστεί από τον χειρόγραφο χαρακτήρα στην παραπάνω εικόνα.

Ο κ. Nguyen Trung Chinh, Πρόεδρος του Διοικητικού Συμβουλίου και Εκτελεστικός Πρόεδρος του CMC Technology Group, τόνισε: «Αυτό είναι το αποτέλεσμα περισσότερων από μιας δεκαετίας συνεχών επενδύσεων στην έρευνα και ανάπτυξη (Ε&Α) τεχνολογίας. Τα υψηλά επιτεύγματα της CMC στον διεθνή τεχνολογικό χώρο επιβεβαιώνουν τη στρατηγική μας για την τελειοποίηση της βιετναμέζικης τεχνολογίας, σε συνδυασμό με τον προσανατολισμό μας προς τον μετασχηματισμό της Τεχνητής Νοημοσύνης και την επέκταση στην παγκόσμια αγορά. Πιστεύουμε ότι η βιετναμέζικη νοημοσύνη είναι πλήρως ικανή να ανταγωνιστεί τις παγκόσμιες μεγάλες τεχνολογικές εταιρείες, δημιουργώντας μια αξιόλογη θέση στον παγκόσμιο τεχνολογικό χάρτη».

Το CATI-VLM θα εφαρμοστεί στο οικοσύστημα προϊόντων C.OpenAI, συμπεριλαμβανομένων: του εικονικού βοηθού CLS για την αναθεώρηση νομικών εγγράφων, του CMC SmartDoc - μιας πλατφόρμας ψηφιακού μετασχηματισμού εγγράφων, του συστήματος διαχείρισης γνώσης CMC KMS, ενός αυτοματοποιημένου συστήματος αναφοράς για έξυπνα γραφεία και εφαρμογών Agentic Documents επόμενης γενιάς.

ΚΟΥΑΝΓΚ ΧΟΥΙ

Πηγή: https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


Ετικέτα: CMCCMC Corp

Σχόλιο (0)

Αφήστε ένα σχόλιο για να μοιραστείτε τα συναισθήματά σας!

Στο ίδιο θέμα

Στην ίδια κατηγορία

Από τον ίδιο συγγραφέα

Κληρονομία

Εικόνα

Επιχειρήσεις

Τρέχοντα Θέματα

Πολιτικό Σύστημα

Τοπικός

Προϊόν

Happy Vietnam
Αγγίξτε για να καταλάβετε και να αγαπήσετε τον θείο Χο περισσότερο.

Αγγίξτε για να καταλάβετε και να αγαπήσετε τον θείο Χο περισσότερο.

Βιετνάμ

Βιετνάμ

Ευτυχισμένοι μαζί μέχρι τα βαθιά γεράματα.

Ευτυχισμένοι μαζί μέχρι τα βαθιά γεράματα.