Μπαίνοντας στο λόμπι του αεροδρομίου, μέσα στη φασαρία των ανθρώπων που επέστρεφαν από ένα επαγγελματικό ταξίδι, ο Χο Μινχ Ντουκ σταμάτησε για λίγα δευτερόλεπτα όταν άκουσε μια γνώριμη, απαλή γυναικεία φωνή να διαβάζει μια ανακοίνωση στο σύστημα.
Το προσωπικό της Vbee εργάζεται στα κεντρικά γραφεία της εταιρείας στο Ανόι - Φωτογραφία: NVCC
Χαμογέλασε, νιώθοντας ανακούφιση και χαρά, σαν να είχε συναντήσει έναν συγγενή. Αυτός ο «συγγενής» ήταν μία από τις 20 φωνές Τεχνητής Νοημοσύνης με τις οποίες ο Ντουκ και η ομάδα του Vbee είχαν «τρώει και κοιμάται» για πολλές μέρες και μήνες, δίνοντας όλη τους την καρδιά σε κάθε ηχητική γραμμή, φροντίζοντας κάθε απόχρωση της φωνής για να την κάνει πιο φυσική και ανθρώπινη.
Ανώμαλη εκκίνηση
Δεν ξέρω πόσες φορές ο Διευθύνων Σύμβουλος Χο Μινχ Ντουκ και ο Τεχνικός Διευθυντής Νγκουγιέν Θι Θου Τρανγκ - οι δύο ιδρυτές της Vbee Data Solutions and Services Joint Stock Company - έχουν βιώσει ένα τέτοιο αίσθημα χαράς και υπερηφάνειας.
Συνάντησαν «ξεχωριστές γνωριμίες» σε πολλές διαφορετικές καταστάσεις: καθαρές φωνές σε σχολικά συστήματα μεγαφώνων, ζεστές φωνές σε κτίρια ή επαγγελματικές φωνές από τα αυτόματα τηλεφωνικά κέντρα πολλών επιχειρήσεων.
Τα πνευματικά παιδιά του Vbee δεν είναι πλέον απλώς αποτέλεσμα αλγορίθμων και κωδίκων, αλλά στην πραγματικότητα μπαίνουν στη ζωή, κάνοντας σιωπηλή αλλά ισχυρή συμβολή σε πολλούς τομείς.
Από παρουσιάσεις βιβλίων και μεταγλώττιση ταινιών μέχρι αυτοματοποιημένες ανακοινώσεις σε τηλεφωνικά κέντρα, το Vbee δίνει νέα πνοή στην τεχνολογία φωνής.
Ως η «μητέρα» της βασικής τεχνολογίας TTS, η Δρ. Nguyen Thi Thu Trang φιλοδοξεί πάντα να προσφέρει προϊόντα από την τεχνολογία σύνθεσης ομιλίας στα βιετναμέζικα - την τεχνολογία στην οποία έχει αφιερώσει πολλή προσπάθεια από την εκπόνηση της διδακτορικής της διατριβής στο Πανεπιστήμιο Paris 11 - σε πραγματικούς χρήστες.
Οι πρώτες μέρες του Vbee ήταν δύσκολες. Παρά το γεγονός ότι ήταν δωρεάν για τα πρώτα δύο χρόνια, το εργαλείο μετατροπής κειμένου σε ομιλία (TTS) προσέλκυσε μόνο ένα μικρό κοινό. Αλλά στη συνέχεια η COVID-19 μετατράπηκε σε ένα απροσδόκητο σημείο καμπής.
Αντιμέτωπες με αυστηρούς κανονισμούς για την κοινωνική αποστασιοποίηση, επιχειρήσεις όπως η FE Credit, η Momo, η Viet Credit, η Sacombank ... έπρεπε να βρουν τρόπους να προσεγγίσουν χιλιάδες πελάτες. Τότε δόθηκε η ευκαιρία στην Vbee: από υπενθυμίσεις χρέους έως αυτόματες απαντήσεις, τα προϊόντα τους έγιναν αμέσως η βέλτιστη λύση. Εκείνη την εποχή, οι εικονικοί βοηθοί και τα εικονικά τηλεφωνικά κέντρα απέφεραν έως και το 80% των εσόδων της Vbee.
Όταν πέρασε η πανδημία και η παγκόσμια οικονομία κατέρρευσε, το Vbee αντιμετώπισε μια νέα πρόκληση. Το κύμα των τάσεων στην γενετική τεχνητή νοημοσύνη (GenAI) και το ψηφιακό περιεχόμενο αναβίωσε το εργαλείο TTS. Σήμερα, από το TikTok μέχρι το YouTube, το Facebook, οι φωνές τεχνητής νοημοσύνης του Vbee είναι παντού.
«Αυτή τη στιγμή παρέχουμε πολύ περιεχόμενο σε μορφή TTS», μοιράστηκε με υπερηφάνεια ο κ. Ho Minh Duc. Αυτή τη στιγμή, ο αριθμός των πραγματικών χρηστών του Vbee έχει ξεπεράσει τα 2 εκατομμύρια και αυτός ο αριθμός εξακολουθεί να αυξάνεται σταθερά κατά 20% κάθε μήνα.
Η Vbee έχει εκπαιδεύσει πάνω από 20 εταιρικές φωνές υψηλής ποιότητας και, αν υπολογίσουμε και τις προσαρμοσμένες φωνές, έχουν δημιουργήσει πάνω από 200 διαφορετικές φωνές τεχνητής νοημοσύνης.
Με τη νέα τεχνολογία μεταγραφής φωνής που ερευνήθηκε και δοκιμάστηκε πρόσφατα, μια νέα φωνή χρειάζεται πλέον μόνο 3 λεπτά ηχογραφημένων δεδομένων για εκπαίδευση αντί για 4 έως δεκάδες ώρες ηχογράφησης όπως πριν από δύο χρόνια.
Διευθύνων Σύμβουλος Ho Minh Duc και Διευθύντρια Τεχνολογίας Nguyen Thi Thu Trang - δύο ιδρυτές της Vbee Data Solutions and Services Joint Stock Company - Φωτογραφία: NVCC
«Καταλαβαίνουμε καλύτερα τα Βιετναμέζικα»
Στον αγώνα δρόμου για την τεχνολογία σύνθεσης ομιλίας, ο Διευθύνων Σύμβουλος Χο Μινχ Ντουκ βλέπει μια εποχή που οι προσπάθειες τεχνολογικής καινοτομίας θα φτάσουν σταδιακά στα όριά τους.
Σύμφωνα με τον ίδιο, το Vbee όχι μόνο αναπτύσσει βασική τεχνολογία για την επεξεργασία του βιετναμέζικου λόγου, αλλά κατασκευάζει επίσης ένα τεχνολογικό σύστημα ικανό να κατανοήσει σε βάθος τη βιετναμέζικη γλώσσα - με όλες τις λεπτές αποχρώσεις, τους τόνους και τη μοναδική κουλτούρα που μόνο οι αληθινοί Βιετναμέζοι μπορούν να κατανοήσουν πλήρως.
Ως η κορυφαία εταιρεία στην αγορά TTS στο Βιετνάμ, οι δύο ηγέτες της Vbee πιστεύουν ότι το εργαλείο τους έχει γίνει το πρότυπο για την ανάγνωση φωνής με τεχνητή νοημοσύνη για τους Βιετναμέζους. Οι χρήστες όχι μόνο εκτιμούν την ακρίβεια, αλλά και νιώθουν το «συναίσθημα» σε κάθε φωνή που αναπτύσσεται από την Vbee.
Στα βιετναμέζικα, για παράδειγμα, η λέξη «alley» έχει πολλά διαφορετικά ονόματα ανάλογα με την περιοχή, όπως «hèm», «kiệt», «xếc» - κάθε λέξη έχει μια διαφορετική απόχρωση που πρέπει να κατανοήσει η Τεχνητή Νοημοσύνη.
Για να το πετύχει αυτό, η Vbee έχει επενδύσει σημαντικά στη συλλογή δειγματοληπτικών συνόλων δεδομένων, καθώς και σε ισχυρά συστήματα διακομιστών για εκπαίδευση στην Τεχνητή Νοημοσύνη.
«Για να βοηθήσουμε την Τεχνητή Νοημοσύνη να κατανοήσει και να επεξεργαστεί σωστά κάθε περιφερειακή λεπτομέρεια, έπρεπε να δημιουργήσουμε αμέτρητα σύνολα δειγμάτων και το κόστος του διακομιστή επεξεργασίας ήταν επίσης πολύ υψηλό», δήλωσε ο Διευθύνων Σύμβουλος Ho Minh Duc.
Η Δρ. Nguyen Thi Thu Trang έχει αφιερώσει περισσότερα από 15 χρόνια στην έρευνα της βασικής τεχνολογίας TTS του Vbee για την αποκωδικοποίηση των μοναδικών τόνων και της γραμματικής των βιετναμέζων. Για εκείνη, η μητρική της γλώσσα είναι ένας ανεπαίσθητος κόσμος γεμάτος εκφραστικές αποχρώσεις.
«Η βιετναμέζικη γλώσσα μου είναι πολύ περίπλοκη και ενδιαφέρουσα, οι τόνοι είναι οι πιο δύσκολοι και διαφορετικοί από πολλές άλλες δημοφιλείς γλώσσες στον κόσμο. Όσο περισσότερο καταλαβαίνω τη γλώσσα, τόσο πιο ακριβές θα είναι το μοντέλο μου», εξήγησε.
Το Vbee σταδιακά ισχυρίζεται ότι θα αποτελέσει αναπόσπαστο μέρος εργαλείων και συσκευών με ενσωματωμένο λογισμικό επεξεργασίας βιετναμέζικων γλωσσών στην τεχνολογική εποχή.
Σε κάθε λέξη, σε κάθε φωνή, η ομάδα της Vbee όχι μόνο ερευνά και αναπτύσσει τεχνολογία, αλλά προσπαθεί επίσης να δημιουργήσει ένα πραγματικά «βιετναμέζικο συναίσθημα» στις φωνές τεχνητής νοημοσύνης.
Το όνομα Vbee είναι συντομογραφία της φράσης "Vietnam BE your Eyes", η οποία προέρχεται από την αρχική μου επιθυμία να δημιουργήσω ένα εργαλείο που θα γίνει τα "μάτια" για άτομα με προβλήματα όρασης. Αλλά με την τρέχουσα τάση ανάπτυξης, όταν πολλοί άνθρωποι θέλουν να στραφούν στην ακρόαση περισσότερο από την όραση, πιστεύουμε ότι το Vbee θα γίνει επίσης τα "μάτια" όλων.
Δρ. Nguyen Thi Thu Trang (Λέκτορας, Σχολή Πληροφορικής, Πανεπιστήμιο Επιστήμης και Τεχνολογίας του Ανόι, Ιδρύτρια και Διευθυντής Τεχνολογίας της εταιρείας Vbee)
Συνάντηση λάτρεις των ηχητικών βιβλίων
Το Vbee γεννήθηκε από τη σχέση μεταξύ της Δρ. Nguyen Thi Thu Trang και της κοινότητας των τυφλών. Από τα φοιτητικά της χρόνια, έχει συμμετάσχει στην ηχογράφηση ηχητικών βιβλίων και στη δημιουργία ενός βιετναμέζικου αναγνωστικού για την υποστήριξη των τυφλών.
Αυτές οι εμπειρίες την ενέπνευσαν να αναπτύξει λογισμικό ανάγνωσης βιετναμέζικων - τον προκάτοχο του Vbee. Το 2018, αυτή και ο κ. Ho Minh Duc - ένας συμμαθητής του στο Πανεπιστήμιο Επιστήμης και Τεχνολογίας του Ανόι με εμπειρία από το έργο Socbay.com και την ψηφιοποίηση ηχητικών βιβλίων - ίδρυσαν το Vbee, μια πρωτοπόρο εταιρεία στον τομέα της μετατροπής κειμένου σε ομιλία στο Βιετνάμ.
Τα εξαιρετικά επιτεύγματα του Vbee
- Πρώτο βραβείο στον διαγωνισμό καινοτομίας Qualcomm Vietnam Innovation Challenge 2024
- Ειδικό Βραβείο Tuoi Tre Start-up Award 2023
- Νικήτρια νεοσύστατη επιχείρηση στο πρόγραμμα επιτάχυνσης Grab Venture Ignite 2020
- Πρώτο βραβείο Βιετναμέζικου Ταλέντου 2018, δεύτερο βραβείο Βιετναμέζικου Ταλέντου 2020
- Πιστοποιητικό Βασικής Τεχνολογίας Βιετνάμ στο Εθνικό Πρόγραμμα Ψηφιακού Μετασχηματισμού 2025 - 2030 του Υπουργείου Πληροφοριών και Επικοινωνιών
- Νικητήριο έργο στα Βραβεία Ψηφιακών Μέσων του Βιετνάμ 2018 και Vingroup Fund 2019.
Περιφερειακό όραμα
Αφού επιβεβαίωσε τη θέση της στην αγορά του Βιετνάμ, η Vbee στοχεύει στην επέκταση στη Νοτιοανατολική Ασία με σχέδια να φέρει την τεχνολογία TTS σε χώρες όπως το Λάος, η Ταϊλάνδη, η Καμπότζη και οι Φιλιππίνες έως το 2026.
Σύμφωνα με τον Δρ. Nguyen Thi Thu Trang, η ραγδαία πρόοδος της τεχνολογίας σήμερα με την εμφάνιση πολυγλωσσικών μοντέλων θα διευκολύνει την ανάπτυξη εργαλείων TTS για άλλες γλώσσες.
Αυτή τη στιγμή, ερευνά τεχνολογίες ομιλίας για τα Ταϊλανδέζικα, τα Κινέζικα και τα Αγγλικά, ανοίγοντας νέα βήματα για την Vbee στη διεθνή αγορά.
[διαφήμιση_2]
Πηγή: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm
Σχόλιο (0)