Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

Δρ. Ντάο Ντουκ Μινχ: «Η κατανόηση των βιετναμέζικων δεδομένων είναι το πρώτο βήμα στην ανάπτυξη και την κατανόηση της βιετναμέζικης τεχνολογίας»

Báo Thanh niênBáo Thanh niên27/05/2024

εικόνα Έχοντας εργαστεί για έναν μεγάλο οργανισμό τεχνητής νοημοσύνης στις ΗΠΑ, γιατί αποφασίσατε να επιστρέψετε στο Βιετνάμ για να ενταχθείτε στην VinBigdata; Ενώ εργαζόμουν στις ΗΠΑ, αν και συμμετείχα σε πολλά μεγάλα κυβερνητικά έργα, τα αποτελέσματα που πέτυχα ήταν συχνά μόνο μερικά βήματα σε μια μεγάλη διαδικασία επεξεργασίας. Πολλές φορές, λόγω των πολύ αυστηρών διαδικασιών εμπιστευτικότητας των έργων, δεν γνώριζα καν πώς χρησιμοποιούνταν οι λύσεις που είχα αναπτύξει. Το 2017, επέστρεψα στο Βιετνάμ όταν το Βιετνάμ βρισκόταν στο στάδιο της ανάπτυξης και υπήρχαν πολλά προβλήματα που σχετίζονταν με τα μεγάλα δεδομένα και την τεχνητή νοημοσύνη που έπρεπε να επιλυθούν. Δέχτηκα την πρόσκληση του καθηγητή Vu Ha Van για να υλοποιήσουμε από κοινού τον στόχο της ανάπτυξης βιετναμέζικων τεχνολογικών λύσεων για την εξυπηρέτηση της ζωής του λαού του Βιετνάμ. Θεωρώ την επιστροφή μου στο Βιετνάμ πολύ πιο ουσιαστική, επειδή θα μπορώ να εργαστώ σε προβλήματα με μεγαλύτερο αντίκτυπο.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

Ο Δρ. Ντάο Ντουκ Μινχ σε ένα εργαστήριο

NVCC

Στη στρατηγική ανάπτυξης της τεχνητής νοημοσύνης, ποιος είναι ο ρόλος και η επιρροή των μεγάλων δεδομένων, κύριε; Τα δεδομένα παίζουν πολύ σημαντικό και πολύτιμο ρόλο στην εκπαίδευση της τεχνητής νοημοσύνης. Για να εκπαιδεύσουμε ένα μοντέλο τεχνητής νοημοσύνης υψηλής ποιότητας, συχνά ξεκινάμε εκπαιδεύοντας μια μεγάλη βάση δεδομένων. Επομένως, για να έχουμε ποιοτική τεχνητή νοημοσύνη, πρέπει πρώτα να έχουμε καλά δεδομένα. Τα καλά δεδομένα πρέπει να πληρούν τα πρότυπα όσον αφορά την ποσότητα και την κλίμακα, την ποιότητα, την ποικιλομορφία και την καθολικότητα. Η διαδικασία συλλογής και επεξεργασίας χιλιάδων ωρών δεδομένων από το βήμα καθαρισμού των ακατέργαστων δεδομένων έως τη δημιουργία δεδομένων υψηλότερης ποιότητας για την τροφοδοσία του μοντέλου τεχνητής νοημοσύνης είναι πολύ ακριβή και περίπλοκη. Αντίθετα, για την ανάλυση μεγάλων δεδομένων, πρέπει να χρησιμοποιήσουμε τεχνητή νοημοσύνη για να διασφαλίσουμε την ικανότητα ακριβούς επεξεργασίας δεδομένων σε μεγάλη κλίμακα, δημιουργώντας έτσι πιο αποφασιστικά ή προγνωστικά αποτελέσματα. Για παράδειγμα, κατά τη διαδικασία ανάπτυξης ενός προϊόντος εικονικού βοηθού για Βιετναμέζους (ViVi), έπρεπε να συλλέξουμε και να επεξεργαστούμε δεκάδες χιλιάδες ώρες δεδομένων ήχου υψηλής ποιότητας, από εκατοντάδες χιλιάδες φωνές από διαφορετικές περιοχές, διαφορετικές ηλικίες και φύλα, με περιεχόμενο που εκτείνεται σε εκατοντάδες τομείς... Ή πιο πρόσφατα, η κυκλοφορία του ViGPT - "Η πρώτη βιετναμέζικη έκδοση του ChatGPT για τελικούς χρήστες" που αναπτύχθηκε από ένα μοντέλο Big Language που ανήκει εξ ολοκλήρου στην VinBigdata. Αυτό το μοντέλο εκπαιδεύτηκε με βάση 600 GB επεξεργασμένων βιετναμέζικων δεδομένων από πολλούς διαφορετικούς τομείς. Με την κατανόηση των βιετναμέζικων δεδομένων και της γλώσσας, βρήκαμε μια νέα προσέγγιση για να μειώσουμε τον χρόνο κυκλοφορίας του ViGPT σε μόλις 9 μήνες μετά τη γέννηση του ChatGPT. Αυτή είναι η συνοχή μεταξύ των μεγάλων δεδομένων και της τεχνητής νοημοσύνης.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.
Ποια είναι η άποψή σας σχετικά με τη σύνδεση της έρευνας με την πρακτική αξία για την εξυπηρέτηση της κοινότητας; - Πιστεύω ότι η τεχνολογική έρευνα είναι πραγματικά επιτυχημένη μόνο όταν εισέρχεται στην πράξη, λύνει κοινωνικά προβλήματα και βελτιώνει τη ζωή των ανθρώπων. Για να δημιουργήσουμε πρακτικά εμπορικά προϊόντα και να λύσουμε επιχειρηματικά και κοινωνικά προβλήματα, πρέπει πάντα να δίνουμε προσοχή και να θέτουμε το ερώτημα: ποια αξία θα φέρουν τα δεδομένα στη ζωή; Μέχρι σήμερα, έχουμε ερευνήσει μια ποικιλία προϊόντων και λύσεων σε διάφορους κλάδους και τομείς, συνήθως το ViGPT, το VinDr - που παρέχει λύσεις Τεχνητής Νοημοσύνης στη διάγνωση ιατρικής απεικόνισης, το VinBase - μια πλατφόρμα για τεχνητή νοημοσύνη, ή το Vizone - ένα σύνολο έξυπνων λύσεων ανάλυσης εικόνας.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

Με βασικά στελέχη της VinBigdata σε εκδήλωση της Vingroup Corporation

NVCC

Η 4η βιομηχανική επανάσταση λαμβάνει χώρα δυναμικά σε παγκόσμια κλίμακα. Ποια πλεονεκτήματα πιστεύετε ότι έχει το Βιετνάμ; Σε σύγκριση με προηγούμενες επαναστάσεις, πιστεύω ότι το Βιετνάμ έχει πολλά πλεονεκτήματα να αξιοποιήσει σε αυτήν την βιομηχανική επανάσταση 4.0, συμβάλλοντας στη βελτίωση της θέσης της χώρας στον παγκόσμιο χάρτη. Τα δύο κλειδιά για την επίτευξη αυτού του στόχου είναι τα δεδομένα και οι άνθρωποι. Το Βιετνάμ έχει σήμερα σχεδόν 100 εκατομμύρια κατοίκους, εκ των οποίων ένα υψηλό ποσοστό νέων χρησιμοποιεί τηλέφωνα και προσωπικούς υπολογιστές. Επιπλέον, έχουμε αναγνωρισμένους ειδικούς στην τεχνητή νοημοσύνη και νέο, υψηλής ποιότητας προσωπικό στην τεχνολογία των πληροφοριών και έχουμε πολύ καλή βάση στα μαθηματικά. Τι γίνεται λοιπόν με τους περιορισμούς; Ο πρώτος περιορισμός που μπορεί να παρατηρηθεί είναι ότι παρά το γεγονός ότι έχουμε μεγάλο πληθυσμό, εξακολουθούμε να αντιμετωπίζουμε δυσκολίες στην διαχείριση των δεδομένων, ειδικά στην τυποποίηση και τον συγχρονισμό δεδομένων σε εγκαταστάσεις, επιχειρηματικές μονάδες και διοικήσεις. Επιπλέον, αντιμετωπίζουμε και άλλους περιορισμούς, όπως περιορισμένους επενδυτικούς πόρους, ιδίως επενδύσεις σε υποδομές υπολογιστών υψηλής απόδοσης.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.
Κατά τη γνώμη σας, πόσο σημαντική είναι η γνώση των βιετναμέζικων δεδομένων στο ταξίδι της δημιουργίας και της αξιοποίησης της τεχνολογίας για την εξυπηρέτηση της ζωής των Βιετναμέζικων; Επί του παρόντος, υπάρχουν πολλά κορυφαία προϊόντα τεχνητής νοημοσύνης στον κόσμο, συνήθως προϊόντα εφαρμογών τεχνητής νοημοσύνης που δημιουργούνται με βάση μεγάλα γλωσσικά μοντέλα, όπως το ChatGPT από την OpenAI ή το Bard από την Google. Ωστόσο, τα βιετναμέζικα δεν είναι η βασική γλωσσική ομάδα για την ανάπτυξη αυτών των προϊόντων. Επομένως, η ποιότητα του περιεχομένου που σχετίζεται με τα βιετναμέζικα και επιστρέφεται στους χρήστες επηρεάζεται λίγο πολύ και έχει υψηλή πιθανότητα σφαλμάτων, και το πιο επικίνδυνο, σφαλμάτων στις βασικές γνώσεις. Ως Βιετναμέζοι, έχουμε το πλεονέκτημα της πρόσβασης στις δικές μας πηγές δεδομένων. Μόνο εμείς έχουμε την ικανότητα να κατανοούμε τα χαρακτηριστικά των βιετναμέζικων δεδομένων, τις ανάγκες και τα χαρακτηριστικά των Βιετναμέζων. Επομένως, η γνώση των βιετναμέζικων δεδομένων είναι πραγματικά το κλειδί για την κατανόηση των βασικών τεχνολογιών, οι οποίες είναι επίσης οι τεχνολογίες που θα εξυπηρετήσουν τους Βιετναμέζους.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

Εσωτερική εκπαίδευση για μέλη της VinBigdata

NVCC

Πώς να αποκτήσετε πρόσβαση σε συγκεκριμένες πηγές δεδομένων, ειδικά όταν οι περισσότεροι Βιετναμέζοι σήμερα χρησιμοποιούν ιστότοπους κοινωνικής δικτύωσης από το εξωτερικό; Στην πραγματικότητα, η μεγαλύτερη πηγή ανθρώπινων δεδομένων σήμερα (όχι μόνο οι Βιετναμέζοι) είναι το διαδίκτυο και τα κοινωνικά δίκτυα. Ωστόσο, μπορούμε ακόμα να έχουμε πρόσβαση και να συλλέγουμε δεδομένα από διαφορετικές πηγές, με βάση την κατανόηση των χαρακτηριστικών των βιετναμέζικων δεδομένων, ανάλογα με τα χαρακτηριστικά που ορίζει κάθε έργο. Για παράδειγμα, τα μοντέλα GPT της OpenAI έχουν εκατοντάδες, ακόμη και τρισεκατομμύρια παραμέτρους, εκπαιδεύονται σε τεράστιες ποσότητες δεδομένων και κοστίζουν δισεκατομμύρια δολάρια. Σε σύγκριση με αυτά, έχουμε επιλέξει μια εντελώς διαφορετική κατεύθυνση με βάση την έρευνα, τις δυνατότητες και τους πόρους μας: δηλαδή, τη δημιουργία ενός μοντέλου βιετναμέζικης γλώσσας με αρχιτεκτονική μόνο μερικών δισεκατομμυρίων παραμέτρων, εκπαιδευμένο σε ένα σύνολο 600 GB βιετναμέζικων δεδομένων που συλλέξαμε και βελτιστοποιήσαμε οι ίδιοι, αλλά έχει την ίδια ικανότητα επεξεργασίας βιετναμέζικων. Τα αποτελέσματα δείχνουν ότι η αυτοαναπτυγμένη αρχιτεκτονική μας μπορεί να αυτοβελτιστοποιηθεί, να συντομεύσει τον χρόνο εκπαίδευσης του γλωσσικού μοντέλου, να μειώσει το κόστος, διασφαλίζοντας παράλληλα την ποιότητα του μοντέλου. Ποιες είναι οι προκλήσεις που αντιμετωπίσατε εσείς και η ομάδα σας στη διαδικασία έρευνας και ανάπτυξης προϊόντων τεχνητής νοημοσύνης; Η πρώτη πρόκληση είναι σίγουρα ο χρόνος. Το κύμα της τεχνολογίας τεχνητής νοημοσύνης έρχεται πολύ γρήγορα και βρίσκεται σε μια περίοδο έκρηξης. Στον κόσμο, κορυφαίες εταιρείες τεχνολογίας έχουν λανσάρει γρήγορα εξαιρετικά ολοκληρωμένα προϊόντα που ενημερώνονται και βελτιώνονται συνεχώς. Αν είμαστε αργοί και δεν λανσάρουμε προϊόντα εγκαίρως, σίγουρα θα μείνουμε πίσω. Από την άλλη πλευρά, αν θέλουμε να δημιουργήσουμε προϊόντα που μπορούν να εφαρμοστούν και να λύσουν πρακτικά κοινωνικά προβλήματα, πρέπει επίσης να εξετάσουμε την εύρεση και την ανάπτυξη των εξαιρετικών, ειδικών και μοναδικών χαρακτηριστικών του προϊόντος.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

Παρουσίαση στην Ημέρα Τεχνητής Νοημοσύνης του Βιετνάμ (AI4VN 2023)

NVCC

Στην πραγματικότητα, πολλά άτομα και οργανισμοί στο Βιετνάμ και σε όλο τον κόσμο έχουν υποστεί μεγάλες απώλειες από διαρροές δεδομένων. Πώς βλέπετε το ζήτημα της ασφάλειας των δεδομένων; Μπορεί να ειπωθεί ότι κάθε εφαρμογή σήμερα προέρχεται από δεδομένα. Όταν εργαζόμαστε με δεδομένα, αφενός, πρέπει να διασφαλίσουμε τον στόχο της εφαρμογής δεδομένων για τη δημιουργία της καλύτερης τεχνολογίας για μια ζωή, και αφετέρου, πρέπει να διασφαλίσουμε την ασφάλεια των δεδομένων για τα άτομα και τους οργανισμούς. Ο ανθρώπινος παράγοντας είναι ένας πολύ σημαντικός κρίκος στη διαδικασία διασφάλισης της ασφάλειας των δεδομένων. Σε αυτούς περιλαμβάνονται οι προγραμματιστές, οι χρήστες προϊόντων και οι χρήστες. Για τους προγραμματιστές, η επίγνωση της ασφάλειας των δεδομένων πρέπει να υπάρχει από την αρχή της συλλογής και επεξεργασίας δεδομένων. Συχνά, όταν δεν προκύπτει πρόβλημα, δεν γνωρίζουμε τη σημασία της ασφάλειας των δεδομένων. Αλλά εάν συμβεί διαρροή δεδομένων, η ζημιά μπορεί να είναι τεράστια. Παραβιάσεις δεδομένων μπορεί να προκληθούν λόγω τεχνικών προβλημάτων ή σκόπιμων επιθέσεων κλοπής δεδομένων. Όταν παραβιάζονται δεδομένα, άτομα ή οργανισμοί μπορούν να χρησιμοποιήσουν τις πληροφορίες τους για παράνομους σκοπούς από κακοποιούς, ενώ οι επιχειρήσεις μπορούν να υποστούν οικονομικές απώλειες για την επίλυση σχετικών προβλημάτων, ακόμη και ζημιά στην επωνυμία τους.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

Ο Δρ. Ντάο Ντουκ Μινχ και η ομάδα της VinBigdata σε μια εκδήλωση

NVCC

Μετά την επιδίωξη της τελειοποίησης της τεχνολογίας για την εξυπηρέτηση του Βιετναμέζικου λαού, πρέπει να γίνουν βήματα για την παγκόσμια πρόοδο; Κάθε οργανισμός ή επιχείρηση που θέλει να φέρει τα προϊόντα της στη διεθνή αγορά πρέπει να συμμορφώνεται με τα διεθνή πρότυπα. Η VinBigdata έχει πλεονεκτήματα σε λύσεις και τεχνολογία, επομένως ο καθορισμός ενός οράματος για την κατάκτηση του κόσμου είναι φυσικός. Φυσικά, για την ανάπτυξη πολλών διαφορετικών προϊόντων και εφαρμογών, είναι απαραίτητο να υπάρχει η συντροφιά διεθνών μονάδων με πολυετή εμπειρία και κατανόηση των χρηστών σε όλο τον κόσμο. Ευχαριστούμε!

Thanhnien.vn

Πηγή: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

Σχόλιο (0)

No data
No data

Στο ίδιο θέμα

Στην ίδια κατηγορία

2 δισεκατομμύρια προβολές στο TikTok ονομάστηκε ο Le Hoang Hiep: Ο πιο καυτός στρατιώτης από το A50 έως το A80
Στρατιώτες αποχαιρετούν με συγκίνηση το Ανόι μετά από περισσότερες από 100 ημέρες εκτέλεσης της αποστολής A80
Παρακολουθώντας την πόλη Χο Τσι Μινχ να λάμπει από φώτα τη νύχτα
Με παρατεταμένους αποχαιρετισμούς, οι κάτοικοι της πρωτεύουσας αποχαιρέτησαν τους στρατιώτες της A80 που έφευγαν από το Ανόι.

Από τον ίδιο συγγραφέα

Κληρονομία

Εικόνα

Επιχείρηση

No videos available

Νέα

Πολιτικό Σύστημα

Τοπικός

Προϊόν