Διεπαφή v7, ενσωματωμένο πληκτρολόγιο AI. Φωτογραφία: NVCC . |
Μοιραζόμενος πληροφορίες με τον Tri Thuc - Znews , ο Tri Duc (γεννημένος το 2003) μίλησε για την ιδέα της εφαρμογής της τεχνητής νοημοσύνης για να αλλάξει ο τρόπος εισαγωγής βιετναμέζικων. Το εργαλείο πληκτρολόγησης v7, το φοιτητικό του έργο, έχει πλέον εξελιχθεί σε ερευνητική εργασία και έχει γίνει δεκτό στο IJCAI 2025, ένα έγκριτο συνέδριο για την Τεχνητή Νοημοσύνη.
Παρά το γεγονός ότι είναι δημοφιλής εδώ και δεκαετίες, η πληκτρολόγηση Telex ή VNI εξακολουθεί να έχει πολλούς περιορισμούς στην εμπειρία χρήστη. Επομένως, το v7 γεννήθηκε για να γίνει ένα ελαφρύ εργαλείο πρόβλεψης, συμβάλλοντας στη μείωση του χρόνου πληκτρολόγησης στα Βιετναμέζικα χάρη στην ενσωμάτωση της Τεχνητής Νοημοσύνης.
Πάθος για τις γλώσσες και την τεχνολογία
Η αγάπη του για τις γλώσσες και την τεχνολογία τον οδήγησε σε σπουδές στην Εφαρμοσμένη Τεχνητή Νοημοσύνη στο Τεχνολογικό Πανεπιστήμιο της πόλης Χο Τσι Μινχ.
Κατά τη διάρκεια των σπουδών του, προσέγγισε έργα όπως ένα μεγάλο γλωσσικό μοντέλο (LLM) για Βιετναμέζικα, ένα λογισμικό για τη μετάφραση γλωσσών εθνοτικών μειονοτήτων ή ένα chatbot για την υποστήριξη των εισαγωγών. «Αυτές οι εμπειρίες με βοήθησαν να συσσωρεύσω μια στέρεη βάση γνώσεων, να καλλιεργήσω το πάθος και την επιθυμία μου να εφαρμόσω την Τεχνητή Νοημοσύνη για να δημιουργήσω χρήσιμα προϊόντα για την κοινότητα», μοιράστηκε.
Η Tri Duc θέλει να προσφέρει αξία στην εφαρμογή της Τεχνητής Νοημοσύνης. Φωτογραφία: NVCC. |
Επιπλέον, με γνώσεις μανδαρινικών και καντονέζικων, ο Duc αναγνώρισε τη συσχέτιση του pinyin/jyutping με τη βιετναμέζικη ορθογραφία. Αυτός ο παράγοντας σας κάνει επίσης να καταλάβετε ότι, σε αντίθεση με την πολυπλοκότητα των ιερογλυφικών, το κινεζικό σύστημα πληκτρολόγησης pinyin απαιτεί μόνο την πληκτρολόγηση «yn» για να πάρει το όνομα της χώρας μας με κινεζικούς χαρακτήρες. Ενώ το Telex ή το VNI απαιτούν 10 πλήκτρα για να πάρει τη λέξη «Βιετνάμ».
Μέσα από τις παρατηρήσεις του, ο Duc συνειδητοποίησε ότι όταν επικοινωνούν γρήγορα, οι χρήστες συχνά συντομεύουν κρατώντας το πρώτο σύμφωνο, όπως το «hs» για το «student». «Εάν οι άνθρωποι μπορούν εύκολα να κατανοήσουν αυτό το στυλ γραφής, η Τεχνητή Νοημοσύνη μπορεί να το καταλάβει πλήρως εάν εκπαιδευτεί με τα σωστά δεδομένα», είπε σχετικά με τις συνθήκες που οδήγησαν στην ιδέα.
Αντί να χρειάζεται να γράψετε ολόκληρο τον χαρακτήρα και στη συνέχεια να προσθέσετε τόνους όταν χρησιμοποιείτε παραδοσιακά εργαλεία πληκτρολόγησης όπως το Telex ή το VNI, τα οποία ακολουθούν τον μηχανισμό πρόσθεσης, το v7 χρησιμοποιεί Τεχνητή Νοημοσύνη για να προτείνει τη λέξη που θέλετε να γράψετε. Η τεχνολογία θα προβλέψει με ακρίβεια ολόκληρη τη λέξη με τα λιγότερα δυνατά πλήκτρα.
Στη βιετναμέζικη ορθογραφική δομή, μια λέξη αποτελείται από αρχικό σύμφωνο, ομοιοκαταληξία και τόνο. Για παράδειγμα, η λέξη «Nguyen» αποτελείται από τα «ng», «uyen» και έναν φθίνοντα τόνο. Με βάση αυτήν την αρχή, η μηχανή πληκτρολόγησης v7 έχει σχεδιαστεί για να προβλέπει ολόκληρες λέξεις μόνο με αρχικό σύμφωνο και τόνο, γεγονός που βοηθά στη σημαντική μείωση του αριθμού των πλήκτρων, διατηρώντας παράλληλα την ακρίβεια.
Η πρόκληση της διδασκαλίας Βιετναμέζικων με Τεχνητή Νοημοσύνη
Σύμφωνα με τον Duc, η μεγαλύτερη πρόκληση είναι η διδασκαλία της Τεχνητής Νοημοσύνης για την «κατανόηση» των Βιετναμέζικων, ώστε να χρησιμεύσει ως εργαλείο πληκτρολόγησης. Δοκίμασε πολλά μοντέλα πριν επιλέξει το GPT-2 ως βάση, με την αρχιτεκτονική Transformers για καλή κατανόηση του περιβάλλοντος και ακριβή πρόβλεψη λέξεων.
Αφού επέλεξε την υποκείμενη αρχιτεκτονική, ο Duc αντικατέστησε πλήρως τον Tokenizer (κωδικοποιητή λεξιλογίου) με ένα βιετναμέζικο λεξιλόγιο που έφτιαξε ο ίδιος. Ο μηχανικός φιλτράρισε όλες τις έγκυρες, σωστά γραμμένες βιετναμέζικες λέξεις για να εξασφαλίσει ολοκληρωμένη επεξεργασία, προβλέποντας οποιαδήποτε λέξη ήθελε να γράψει ο χρήστης.
Μια άλλη πρόκληση έγκειται στην εξισορρόπηση της προγνωστικής απόδοσης και της ταχύτητας απόκρισης, διασφαλίζοντας ότι το μοντέλο μπορεί να εκτελείται σε πραγματικό χρόνο τόσο σε υπολογιστές όσο και σε τηλέφωνα, αλλά να είναι αρκετά ισχυρό ώστε να κάνει τις καλύτερες προβλέψεις. Μετά από 2 μήνες συνεχών δοκιμών, η τρέχουσα έκδοση φέρνει σωστά σχεδόν το 70% των λέξεων που πληκτρολογούν οι χρήστες στην κορυφή, με καθυστέρηση μόλις 0,03 δευτερολέπτων.
Όσον αφορά τη μέθοδο εισαγωγής του πληκτρολογίου, σύμφωνα με πολλές μελέτες που ο Duc συμβουλεύτηκε από τους γλωσσολόγους Cao Xuan Hao ή Henri Maspero, τα βιετναμέζικα δεν έχουν μόνο 6, αλλά 8 τόνους. Για να αξιοποιήσει αυτό το χαρακτηριστικό, το v7 χρησιμοποιεί ένα σύστημα 8 τόνων αντί για τους συνήθεις 6 (συμπεριλαμβανομένου ενός επίπεδου τόνου και 5 τονισμένων τόνων: οξύς, επίπεδος, ερωτηματικός, φθίνων, βαρύς). Σε αυτό το πληκτρολόγιο, όταν πληκτρολογείτε "v7", το μοντέλο θα προτείνει τη λέξη "Viet". Αυτή είναι και η ιδέα για το όνομα του προϊόντος.
Αφού κοινοποίησε την έκδοση 7 στα μέσα κοινωνικής δικτύωσης, ο Duc είπε ότι ήταν πολύ χαρούμενος και έκπληκτος όταν το μοντέλο έλαβε προσοχή, υποστήριξη και επιθυμία να το δοκιμάσει. «Αυτό μου έδωσε μια σαφή αίσθηση για την ανάγκη για ένα πιο έξυπνο και γρήγορο εργαλείο πληκτρολόγησης για τα βιετναμέζικα», είπε.
Η ομάδα των συγγραφέων του επιστημονικού ερευνητικού άρθρου. Από αριστερά προς τα δεξιά: Nhat Khang, Hieu Nghia και Tri Duc. Φωτογραφία: NVCC. |
Προς το παρόν, το πληκτρολόγιο βρίσκεται ακόμη στο στάδιο του πρωτοτύπου, με ανοιχτό κώδικα στο GitHub για να τον δοκιμάσουν και να τον συνεισφέρουν προγραμματιστές ή χρήστες τεχνολογίας. Αναπτύσσεται επίσης μια ολοκληρωμένη έκδοση εφαρμογής για Windows και macOS για εύκολη εγκατάσταση και χρήση από τους κοινούς χρήστες.
Στο μέλλον, η κορυφαία προτεραιότητα για την έκδοση 7 είναι η έκδοση πληκτρολογίου στο iPhone, για να βελτιωθεί ο τρόπος εισαγωγής βιετναμέζικου κειμένου σε smartphone. Επιπλέον, το μοντέλο θα βελτιωθεί σε ακρίβεια μέσω της εκπαίδευσης σε δεδομένα καθημερινών συνομιλιών, βοηθώντας την Τεχνητή Νοημοσύνη να κατανοήσει καλύτερα τα κοινά συμφραζόμενα.
Το ταξίδι του Duc έχει συμβάλει σε μια ανάσα δημιουργικότητας, καλύπτοντας τις τεχνολογικές τάσεις στο πλαίσιο του Βιετνάμ που επενδύει σημαντικά σε υποδομές τεχνητής νοημοσύνης. Μια στιγμή που τον κάνει περήφανο είναι όταν το v7 δημιούργησε για πρώτη φορά μια ολοκληρωμένη πρόταση. «Τότε ήταν που ένα μικρό μοντέλο, πιθανώς μόνο στο 1/10.000 του μεγέθους του ChatGPT σήμερα, μπορούσε ακόμα να σκέφτεται σαν άνθρωπος», είπε ο Duc.
Πηγή: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
Σχόλιο (0)