Η OpenAI ανακοίνωσε στις 5 Αυγούστου δύο μοντέλα ανοιχτής γλώσσας με στάθμιση για πρώτη φορά από την κυκλοφορία του GPT-2 το 2019.
Ένα μοντέλο τεχνητής νοημοσύνης θεωρείται ανοιχτού βάρους εάν οι παράμετροί του, δηλαδή οι παράγοντες που βοηθούν στη βελτίωση της απόδοσης και οι προβλέψεις κατά την εκπαίδευση, είναι δημόσια διαθέσιμες.
Τα μοντέλα ανοιχτής στάθμισης μπορούν να παρέχουν διαφάνεια και έλεγχο, αλλά διαφέρουν από τα μοντέλα ανοιχτού κώδικα, τα οποία καθιστούν ολόκληρο τον πηγαίο κώδικα διαθέσιμο για χρήση και τροποποίηση από οποιονδήποτε.
Η OpenAI αναφέρει ότι αυτά τα μοντέλα μόνο για κείμενο, που ονομάζονται gpt-oss-120b και gpt-oss-20b, έχουν σχεδιαστεί για να παρέχουν σε προγραμματιστές, ερευνητές και εταιρείες επιλογές χαμηλότερου κόστους που είναι εύκολες στη λειτουργία και την προσαρμογή.
Και τα δύο νέα μοντέλα της OpenAI μπορούν να χειριστούν προηγμένες εργασίες συμπερασματολογίας, χρήσης εργαλείων και νευρωνικής επεξεργασίας. Έχουν σχεδιαστεί για να εκτελούνται οπουδήποτε, από υλικό καταναλωτών έως πλατφόρμες cloud και εφαρμογές σε συσκευές.
Το OpenAI αναφέρει ότι οι χρήστες μπορούν να εκτελέσουν το gpt-oss-20b σε φορητό υπολογιστή και να το χρησιμοποιήσουν ως προσωπικό βοηθό που μπορεί να αναζητά αρχεία και να γράφει.
Η εταιρεία έχει συνεργαστεί με τις Nvidia, Advanced Micro Devices (AMD), Cerebras και Groq για να διασφαλίσει ότι αυτά τα μοντέλα θα λειτουργούν καλά σε μια ποικιλία τσιπ.
Η κυκλοφορία των ανοιχτών μοντέλων στάθμισης από την OpenAI ήταν ιδιαίτερα αναμενόμενη, εν μέρει επειδή η εταιρεία έχει επανειλημμένα καθυστερήσει την κυκλοφορία, καθώς χρειάζεται περισσότερο χρόνο για να διεξάγει πρόσθετες δοκιμές ασφαλείας και να εξετάσει περιοχές υψηλού κινδύνου.
Η OpenAI δήλωσε στις 5 Αυγούστου ότι είχε διεξάγει εκτεταμένη εκπαίδευση και δοκιμές ασφάλειας των μοντέλων ανοιχτού βάρους της. Η εταιρεία φιλτράρισε επιβλαβή χημικά, βιολογικά, ραδιολογικά και πυρηνικά δεδομένα κατά τη φάση προ-εκπαίδευσης και προσομοίωσε τον τρόπο με τον οποίο κακόβουλοι παράγοντες ενδέχεται να προσπαθήσουν να βελτιώσουν τα μοντέλα για κακόβουλους σκοπούς.
Η OpenAI δήλωσε επίσης ότι συνεργάστηκε με τρεις ανεξάρτητες ομάδες εμπειρογνωμόνων για να λάβει σχόλια σχετικά με την αξιολόγησή της σχετικά με αυτήν την κακόβουλη διαδικασία τροποποίησης.
Τα τελευταία χρόνια, αρκετές άλλες εταιρείες τεχνολογίας, όπως η Meta, η Mistral AI που υποστηρίζεται από τη Microsoft και η κινεζική νεοσύστατη εταιρεία DeepSeek, έχουν επίσης κυκλοφορήσει μοντέλα ανοιχτής στάθμισης.
Πηγή: https://www.vietnamplus.vn/openai-lan-dau-phat-hanh-mo-hinh-ai-trong-so-mo-ke-tu-nam-2019-post1054037.vnp
Σχόλιο (0)