Όταν η Τεχνητή Νοημοσύνη ξέρει πώς να επαληθεύσει την αλήθεια: Νέα πρόοδος από την Τεχνητή Νοημοσύνη της Viettel στο NAACL 2025

Στο NAACL 2025, ένα από τα κορυφαία συνέδρια τεχνητής νοημοσύνης (AI) στον κόσμο που πραγματοποιήθηκε στις Ηνωμένες Πολιτείες, η Viettel AI παρουσίασε το VeGraph - μια μέθοδο επαλήθευσης πληροφοριών που βοηθά στην αύξηση της ακρίβειας έως και 5% σε σύγκριση με τις υπάρχουσες μεθόδους.

Tạp chí Doanh Nghiệp•19/05/2025

Λεζάντα φωτογραφίας

Το VeGraph βελτιώνει την ακρίβεια κατά 2-5% σε σχέση με τις υπάρχουσες μεθόδους.

Το NAACL 2025 (Ετήσιο Συνέδριο των Εθνών της Αμερικής, Παράρτημα του Συνδέσμου Υπολογιστικής Γλωσσολογίας) είναι το κορυφαίο παγκοσμίως επιστημονικό φόρουμ με κύρος στον τομέα της επεξεργασίας φυσικής γλώσσας και της υπολογιστικής γλωσσολογίας.

Σύμφωνα με πληροφορίες από τον Viettel το απόγευμα της 16ης Μαΐου, η έκρηξη του Διαδικτύου και των κοινωνικών δικτύων έχει κάνει το περιεχόμενο που δημιουργείται από τους χρήστες ολοένα και πιο δημοφιλές. Ταυτόχρονα, έχει οδηγήσει σε ένα κύμα ψευδών ειδήσεων και ανεπίσημων ειδήσεων που διαδίδονται ευρέως. Αυτές οι ψευδείς πληροφορίες όχι μόνο προκαλούν σύγχυση σε άτομα σε ευαίσθητους τομείς όπως η υγεία, οι φυσικές καταστροφές, η δημόσια τάξη... αλλά οδηγούν και σε σοβαρές συνέπειες όπως: οικονομική ζημία, μείωση της φήμης των οργανισμών και απειλή για την εθνική ασφάλεια.

«Στο παρελθόν, αυτές οι πληροφορίες είχαν αντίκτυπο μόνο σε μια συγκεκριμένη χρονική στιγμή και σε ένα συγκεκριμένο εύρος, τώρα γίνονται ολοένα και πιο επικίνδυνες όταν γίνονται μέρος των δεδομένων εισόδου για συστήματα τεχνητής νοημοσύνης (AI). Κατά τη διαδικασία αναζήτησης και συλλογής πληροφοριών για την απάντηση στους χρήστες, συστήματα όπως τα chatbot και οι εικονικοί βοηθοί είναι απολύτως ικανά να χρησιμοποιούν, να δημιουργούν ή να διαδίδουν ψευδείς πληροφορίες εάν δεν έχουν τη δυνατότητα αυτοεπαλήθευσης», δήλωσε ένας εκπρόσωπος της Viettel.

Ο έλεγχος γεγονότων είναι η διαδικασία επαλήθευσης της αλήθειας ή της αναλήθειας μιας πληροφορίας. Για παράδειγμα, ο στόχος του ελέγχου γεγονότων της δήλωσης «Η NASA βρήκε ζωή στον Άρη» είναι να ελεγχθεί εάν οι πληροφορίες βασίζονται σε δημοσιευμένα γεγονότα μέσω αξιόπιστων πηγών όπως εφημερίδες, επιστημονικά δεδομένα ή βάσεις γνώσεων. Για την αυτοεπαλήθευση πληροφοριών, τα συστήματα τεχνητής νοημοσύνης πρέπει να είναι σε θέση να κατανοούν την πρόταση, να βρίσκουν σχετικές πληροφορίες και να εξάγουν λογικά συμπεράσματα με βάση αντικειμενικά δεδομένα.

Το VeGraph (Verify-in-the-Graph) είναι μια μέθοδος επαλήθευσης πληροφοριών που ερευνήθηκε, αναπτύχθηκε και παρουσιάστηκε από μια ομάδα μηχανικών στο Viettel AI Data Services and Artificial Intelligence Center (Viettel AI) στο NAACL 2025 - ένα από τα τρία πιο έγκριτα διεθνή συνέδρια για την επεξεργασία φυσικής γλώσσας. Πειραματικά αποτελέσματα σε δύο δημοφιλή σύνολα δεδομένων επαλήθευσης, το HoVer και το FEVEROUS, δείχνουν ότι το VeGraph βελτιώνει την ακρίβεια κατά 2-5% σε σύγκριση με τις υπάρχουσες μεθόδους.

Σύμφωνα με τους ειδικούς της Τεχνητής Νοημοσύνης της Viettel, οι περισσότερες τρέχουσες μέθοδοι επαλήθευσης πληροφοριών εξακολουθούν να δυσκολεύονται να χειριστούν διφορούμενες, μεταφορικές ή πολυεπίπεδες δηλώσεις, οι οποίες συχνά χρησιμοποιούνται για να «μεταμφιέσουν» ψευδείς πληροφορίες. Ταυτόχρονα, δεν μπορούν να εξηγήσουν με σαφήνεια γιατί ένα περιεχόμενο θεωρείται ψευδές, γεγονός που δυσκολεύει τους χρήστες να εμπιστευτούν τα αποτελέσματα. Πολλές μέθοδοι βασίζονται επίσης κυρίως σε μεγάλα γλωσσικά μοντέλα (LLM) χωρίς τη δυνατότητα διασταύρωσης με επίσημες πηγές γνώσης, γεγονός που οδηγεί στον κίνδυνο δημιουργίας ψευδών συμπερασμάτων ή στο λεγόμενο φαινόμενο «παραίσθησης».

Σε αντίθεση με τα εργαλεία που κάνουν μόνο εσωτερικές συμπερασματολογικές αναλύσεις εντός του μοντέλου, το VeGraph διαχωρίζει προληπτικά το αίτημα επαλήθευσης πληροφοριών σε μικρές ρήτρες και στη συνέχεια το συγκρίνει με αξιόπιστες αναφορές, όπως νομικά έγγραφα, κυβερνητικές βάσεις δεδομένων , εξειδικευμένα έγγραφα κ.λπ. Ολόκληρη η διαδικασία επαλήθευσης συστηματοποιείται σε σαφή βήματα, διευκολύνοντας την παρακολούθηση και τον έλεγχο από τους χρήστες, αυξάνοντας την ακρίβεια και τη διαφάνεια - έναν ολοένα και πιο σημαντικό παράγοντα στις εφαρμογές Τεχνητής Νοημοσύνης. Αυτή η λειτουργία επιτρέπει επίσης στους οργανισμούς να προσαρμόζουν και να βελτιώνουν γρήγορα το σύστημα όταν χρειάζεται.

Στοχεύοντας σε ένα διαφανές και ασφαλές ψηφιακό περιβάλλον, το VeGraph εκτιμάται ιδιαίτερα για την πρακτική του εφαρμογή. Εκτός από τη δυνατότητα ενσωμάτωσης σε συστήματα Τεχνητής Νοημοσύνης για την αύξηση της ακρίβειας και της αξιοπιστίας, αυτή η τεχνολογία μπορεί να εξελιχθεί σε ένα σύστημα επαλήθευσης πληροφοριών σε πολλούς τομείς όπως η υγειονομική περίθαλψη, η δημοσιογραφία, το δίκαιο ή η διαχείριση του κράτους... Χάρη σε αυτό, οι άνθρωποι μπορούν να επαληθεύσουν μόνοι τους σημαντικές πληροφορίες που απαιτούν υψηλή αυθεντικότητα, όπως τρέχοντα νέα, πληροφορίες για φάρμακα, εμβόλια, φαρμακευτικά προϊόντα ή νομικούς κανονισμούς...

Στο μέλλον, το VeGraph θα επεκταθεί ώστε να χειρίζεται ποικίλες μορφές δεδομένων όπως εικόνες, βίντεο, ήχο κ.λπ., να αναγνωρίζει σύνθετες γλωσσικές μορφές όπως μεταφορές, υπονοούμενα και να ενσωματώνει πρόσθετα γραφήματα γνώσης για τη βελτίωση των δυνατοτήτων συλλογισμού.

Φέτος, το NAACL 2025 προσέλκυσε έναν αριθμό ρεκόρ δημοσιεύσεων, φτάνοντας τις 3.000, με ένα πολύ ανταγωνιστικό ποσοστό αποδοχής για πρωτογενείς δημοσιεύσεις (περίπου 22%), συγκεντρώνοντας την πιο πρωτοποριακή έρευνα. Το NAACL 2025 επικεντρώνεται ειδικά στις πρωτοποριακές εξελίξεις στην ανάπτυξη μεγάλων γλωσσικών μοντέλων, στην διαπολιτισμική και πολύγλωσση επεξεργασία φυσικής γλώσσας, στις αναδυόμενες δυνατότητες εξαγωγής συμπερασμάτων και στην υπεύθυνη Τεχνητή Νοημοσύνη.

Σύμφωνα με την εφημερίδα News and People

Πηγή: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067