Οι εταιρείες τεχνητής νοημοσύνης επιδιώκουν να επωφεληθούν αδρά από «μικρά γλωσσικά μοντέλα».

[διαφήμιση_1]

Η Apple, η Microsoft, η Meta και η Google κυκλοφόρησαν πρόσφατα νέα μοντέλα τεχνητής νοημοσύνης με λιγότερες «παραμέτρους» αλλά εξακολουθούν να έχουν ισχυρές δυνατότητες. Αυτή η κίνηση αποτελεί μια προσπάθεια αυτών των τεχνολογικών ομάδων να ενθαρρύνουν τις επιχειρήσεις με περιορισμένο προϋπολογισμό να εξακολουθούν να μπορούν να χρησιμοποιούν την τεχνητή νοημοσύνη.

Οι εταιρείες επιδιώκουν μεγάλα κέρδη από μικρά γλωσσικά μοντέλα (Σχήμα 1). — Φωτογραφία εικονογράφησης: FT

Γενικά, όσο μεγαλύτερος είναι ο αριθμός των παραμέτρων, τόσο καλύτερη είναι η απόδοση του λογισμικού Τεχνητής Νοημοσύνης και τόσο πιο περίπλοκες και λεπτομερείς γίνονται οι εργασίες του. Το τελευταίο μοντέλο GPT-4o της OpenAI και το Gemini 1.5 Pro της Google, που ανακοινώθηκαν και τα δύο αυτή την εβδομάδα, εκτιμάται ότι έχουν πάνω από 1 τρισεκατομμύριο παραμέτρους. Εν τω μεταξύ, η Meta εκπαιδεύει μια έκδοση 400 δισεκατομμυρίων παραμέτρων του μοντέλου Llama ανοιχτού κώδικα.

Οι ανησυχίες σχετικά με την ευθύνη για δεδομένα και πνευματικά δικαιώματα έχουν επίσης οδηγήσει μεγάλες εταιρείες τεχνολογίας όπως η Meta και η Google να κυκλοφορήσουν μικρότερα γλωσσικά μοντέλα με μόνο μερικά δισεκατομμύρια παραμέτρους που είναι φθηνότερα, πιο ενεργειακά αποδοτικά, προσαρμόσιμα, απαιτούν λιγότερη ενέργεια για εκπαίδευση και λειτουργία και μπορούν επίσης να αποτρέψουν την παραβίαση ευαίσθητων δεδομένων.

«Επιτυγχάνοντας τόσο υψηλή ποιότητα με χαμηλότερο κόστος, θα έχετε στην πραγματικότητα περισσότερες εφαρμογές στις οποίες θα έχουν πρόσβαση οι πελάτες...», δήλωσε ο Eric Boyd, αντιπρόεδρος της πλατφόρμας τεχνητής νοημοσύνης Azure της Microsoft, η οποία πουλάει μοντέλα τεχνητής νοημοσύνης σε επιχειρήσεις.

Οι Google, Meta, Microsoft και η γαλλική νεοσύστατη εταιρεία Mistral έχουν επίσης κυκλοφορήσει μικρότερα γλωσσικά μοντέλα, αλλά εξακολουθούν να παρουσιάζουν δυνατότητες βελτίωσης και μπορούν να επικεντρωθούν καλύτερα σε συγκεκριμένες εργασίες.

Ο Nick Clegg, πρόεδρος παγκόσμιων υποθέσεων στην Meta, δήλωσε ότι το νέο μοντέλο 8 δισεκατομμυρίων παραμέτρων του Llama 3 είναι συγκρίσιμο με το GPT-4. Η Microsoft δήλωσε ότι το μικρότερο μοντέλο Phi-3, με 7 δισεκατομμύρια παραμέτρους, έχει καλύτερη απόδοση από το GPT-3.5, την προηγούμενη έκδοση του μοντέλου OpenAI.

Τα μικρότερα μοντέλα μπορούν επίσης να χειρίζονται εργασίες τοπικά στη συσκευή αντί να στέλνουν πληροφορίες στο cloud, κάτι που θα μπορούσε να προσελκύσει πελάτες που ενδιαφέρονται για την προστασία της ιδιωτικής ζωής και θέλουν να διασφαλίσουν ότι οι πληροφορίες διατηρούνται στο εσωτερικό τους δίκτυο.

Η Charlotte Marshall, διοικητική υπάλληλος στη δικηγορική εταιρεία Addleshaw Goddard, λέει ότι «μία από τις προκλήσεις που πιστεύω ότι έχουν αντιμετωπίσει πολλοί από τους πελάτες μας» κατά την υιοθέτηση προϊόντων γενετικής τεχνητής νοημοσύνης είναι η συμμόρφωση με τις νομικές απαιτήσεις για την επεξεργασία και τη μετάδοση δεδομένων. Λέει ότι τα μικρότερα μοντέλα προσφέρουν «μια ευκαιρία στις επιχειρήσεις να ξεπεράσουν» νομικές και οικονομικές ανησυχίες.

Τα μικρότερα μοντέλα επιτρέπουν επίσης την εκτέλεση λειτουργιών τεχνητής νοημοσύνης σε συσκευές όπως τα κινητά τηλέφωνα. Το μοντέλο "Gemini Nano" της Google είναι ενσωματωμένο στα πιο πρόσφατα τηλέφωνα Pixel και στο πιο πρόσφατο smartphone S24 της Samsung.

Η Apple αποκάλυψε επίσης ότι αναπτύσσει μοντέλα τεχνητής νοημοσύνης για να λειτουργούν στο iPhone με τις μεγαλύτερες πωλήσεις. Τον περασμένο μήνα, ο γίγαντας της Silicon Valley κυκλοφόρησε το μοντέλο OpenELM, ένα μικρό μοντέλο σχεδιασμένο για την εκτέλεση εργασιών που βασίζονται σε κείμενο.

Ο Μπόιντ της Microsoft δήλωσε ότι οι μικρότερες συσκευές θα οδηγήσουν σε «συναρπαστικές εφαρμογές, μέχρι τηλέφωνα και φορητούς υπολογιστές».

Ο διευθυντής της OpenAI, Σαμ Άλτμαν, δήλωσε τον Νοέμβριο ότι παρέχουν επίσης μοντέλα τεχνητής νοημοσύνης ποικίλων κλιμάκων στους πελάτες και «εξυπηρετούν διαφορετικούς σκοπούς». Είπε: «Υπάρχουν ορισμένα πράγματα που μικρότερα μοντέλα θα κάνουν πολύ καλά. Είμαι πολύ ενθουσιασμένος γι' αυτό».

Ωστόσο, ο Άλτμαν πρόσθεσε ότι το OpenAI θα παραμείνει επικεντρωμένο στην κατασκευή μεγαλύτερων, κλιμακώσιμων μοντέλων Τεχνητής Νοημοσύνης, ικανών για συλλογισμό, σχεδιασμό και εκτέλεση εργασιών, επιτυγχάνοντας τελικά νοημοσύνη ανθρώπινου επιπέδου.

Χοάνγκ Χάι (σύμφωνα με τους FT)

[διαφήμιση_2]
Πηγή: https://www.congluan.vn/cac-cong-ty-ai-dang-tim-kiem-loi-nhuan-lon-tu-cac-mo-hinh-ngon-ngu-nho-post296219.html