
Οι τεχνολογικοί γίγαντες στρέφονται σε σύγχρονα, ενεργειακά αποδοτικά μοντέλα τεχνητής νοημοσύνης
Τα τελευταία χρόνια, η βιομηχανία τεχνητής νοημοσύνης (AI) ακολουθεί σε μεγάλο βαθμό την αρχή «όσο μεγαλύτερο τόσο καλύτερο»: περισσότερα δεδομένα, περισσότερες παράμετροι, περισσότεροι υπολογισμοί. Ωστόσο, νέα έρευνα από την Google, το MIT και το Stanford δείχνει μια εντελώς διαφορετική κατεύθυνση.
Τα σύγχρονα μοντέλα μπορούν να εκπαιδευτούν αποτελεσματικά με λιγότερα δεδομένα, να καταναλώνουν λιγότερη ενέργεια και να επιτυγχάνουν υψηλή απόδοση. Αυτό όχι μόνο μειώνει το κόστος και τον χρόνο εκπαίδευσης, αλλά ανοίγει επίσης τις εφαρμογές Τεχνητής Νοημοσύνης σε μικρές ερευνητικές ομάδες και μεσαίες επιχειρήσεις, οι οποίες προηγουμένως δυσκολεύονταν να έχουν πρόσβαση σε τεχνολογία μεγάλης κλίμακας.
Οι τεχνολογικές εξελίξεις συμβάλλουν στην καθιέρωση της τεχνητής νοημοσύνης ως «μικρής αλλά ισχυρής»
Σύμφωνα με την έρευνα της Tuoi Tre Online, στη δοκιμή επεξεργασίας διαφημίσεων, η Google μείωσε τα δεδομένα εκπαίδευσης από 100.000 δείγματα σε λιγότερα από 500 δείγματα, ενώ παράλληλα αύξησε τη συμβατότητα με τους ειδικούς κατά 65%.
Παράλληλα, μια ολοκληρωμένη έρευνα για την εκπαίδευση με αποδοτικότητα δεδομένων δείχνει ότι «η ποιότητα των δεδομένων, η έξυπνη δειγματοληψία και οι τεχνικές «απόσταξης» καθορίζουν την απόδοση», όχι απλώς η αύξηση του αριθμού των δεδομένων.
Θεωρητικά, οι «νόμοι κλιμάκωσης» έχουν υποδηλώσει ότι η αύξηση των παραμέτρων του μοντέλου, των δεδομένων και των υπολογισμών θα βοηθήσει, αλλά ειδικοί όπως ο Yann LeCun, Διευθυντής Τεχνητής Νοημοσύνης στη Meta, τονίζουν: «Δεν μπορείτε απλώς να αυξήσετε τα δεδομένα και τους υπολογισμούς και να κάνετε την Τεχνητή Νοημοσύνη αυτόματα πιο έξυπνη».
Αυτό σημαίνει ότι αντί να χρειάζεται να δημιουργούν και να επισημαίνουν εκατομμύρια έως δισεκατομμύρια δείγματα, οι ερευνητικές ομάδες επιδιώκουν να επαναχρησιμοποιήσουν δεδομένα, να δημιουργήσουν συνθετικά δεδομένα, να χρησιμοποιήσουν μικρότερα μοντέλα και να επικεντρωθούν σε αλγόριθμους που είναι πιο ενεργειακά αποδοτικοί και αποδοτικοί ως προς τα δεδομένα.
Για παράδειγμα, η τεχνική της «απόσταξης γνώσης» επιτρέπει τη μεταφορά γνώσης από έναν «δάσκαλο» (ένα μεγάλο μοντέλο δασκάλου) σε έναν «μαθητή» (ένα συμπαγές μοντέλο μαθητή) διατηρώντας παράλληλα πολλές δυνατότητες. Οι ερευνητές στο Stanford HAI τονίζουν ότι αυτή η τάση είναι τόσο υπολογιστικά αποδοτική όσο και φιλική προς το περιβάλλον, ενώ παράλληλα ανοίγει ευκαιρίες για μικρές ερευνητικές ομάδες ή μικρές και μεσαίες επιχειρήσεις να εφαρμόσουν αποτελεσματικά την Τεχνητή Νοημοσύνη.
Αυτές οι εξελίξεις επιτρέπουν στα μοντέλα Τεχνητής Νοημοσύνης να χρησιμοποιούν λιγότερα δεδομένα, να εκτελούνται πιο γρήγορα, να καταναλώνουν λιγότερη ενέργεια, να μειώνουν το κόστος, να αυξάνουν τη βιωσιμότητα και να επεκτείνουν τις εφαρμογές σε περιβάλλοντα με περιορισμένους πόρους, ώστε να κινούνται προς την έξυπνη βελτιστοποίηση, να μαθαίνουν πιο γρήγορα, να καταναλώνουν λιγότερους πόρους και παράλληλα να διασφαλίζουν την ποιότητα.
Πρακτικές εφαρμογές και προκλήσεις της εκπαίδευσης στην Τεχνητή Νοημοσύνη με αποτελεσματική χρήση δεδομένων
Στην πραγματικότητα, η εκπαίδευση της Τεχνητής Νοημοσύνης με λιγότερα δεδομένα και ισχύ έχει ευρύ αντίκτυπο. Για τις μικρές επιχειρήσεις ή τις ερευνητικές ομάδες στις αναπτυσσόμενες χώρες, η «χρήση εκατομμυρίων δειγμάτων και τεράστιων διακομιστών» δεν είναι εφικτή. Όταν κάποιος μπορεί να εκπαιδεύσει ένα μοντέλο με μερικές χιλιάδες δείγματα και συνηθισμένους υπολογιστές, οι εφαρμογές της Τεχνητής Νοημοσύνης θα είναι πιο κοντά στους τελικούς χρήστες και σε πραγματικά περιβάλλοντα.
Για παράδειγμα, στα παράθυρα διαλόγου εποπτείας διαφημίσεων, η Google καταδεικνύει ότι η επιλογή ενός δείγματος δεδομένων "αξίας" είναι καλύτερη από εκατοντάδες χιλιάδες τυχαία δείγματα, μειώνοντας την ποσότητα των δεδομένων που απαιτούνται, ενώ παράλληλα επιτυγχάνονται αποτελέσματα.
Ωστόσο, η πρόκληση παραμένει: Όταν τα δεδομένα είναι σπάνια, το μοντέλο είναι επιρρεπές σε υπερπροσαρμογή, κακή γενίκευση και δυσκολία χειρισμού αλλαγών στο περιβάλλον. Η έρευνα σχετικά με τη μάθηση οπτικής μεταφοράς δείχνει ότι όταν τα δεδομένα εισόδου είναι πολύ περιορισμένα, η απόσταξη είναι πιο αποτελεσματική, αλλά όταν τα δεδομένα είναι αρκετά μεγάλα, η παραδοσιακή μέθοδος εξακολουθεί να κερδίζει.
Όσον αφορά την κατανάλωση ενέργειας και το κόστος, η μείωση των δεδομένων σημαίνει επίσης μείωση των υπολογιστικών πόρων, των διακομιστών και της ηλεκτρικής ενέργειας, κάτι που είναι σημαντικό στο πλαίσιο των μεγάλων μοντέλων τεχνητής νοημοσύνης (LLM) που κοστίζουν εκατομμύρια δολάρια ανά εκπαίδευση.
Σύμφωνα με έκθεση του Stanford HAI, η τάση της τεχνητής νοημοσύνης που εξοικονομεί δεδομένα και ενέργεια θεωρείται ως «μεγάλος μετασχηματισμός» το 2025.
Έτσι, για τους δημοσιογράφους και το ευρύ κοινό, αξίζει να σημειωθεί ότι όταν η Τεχνητή Νοημοσύνη δεν θα είναι πλέον μόνο για «τεχνολογικούς γίγαντες» αλλά θα μπορεί να δημιουργηθεί από μικρές ομάδες με λιγότερα δεδομένα και χαμηλότερο κόστος, θα εμφανιστούν πολλές νέες εφαρμογές, από τη διαχείριση μικρών επιχειρήσεων, τις περιφερειακές ιατρικές εφαρμογές έως την εξατομικευμένη μάθηση.
Αλλά οι χρήστες θα πρέπει επίσης να είναι προσεκτικοί, καθώς το μοντέλο «δεδομένων» μπορεί να είναι λιγότερο ακριβές και πιο ευάλωτο σε μεροληψία, εάν δεν ελέγχεται καλά.
Πηγή: https://tuoitre.vn/ai-khong-con-can-du-lieu-khong-lo-cuoc-dua-huan-luyen-ai-tiet-kiem-nang-luong-20251031115025169.htm






Σχόλιο (0)