Τα δύο νέα μοντέλα ChatGPT που κυκλοφόρησαν έχουν υψηλότερη συχνότητα κατασκευής πληροφοριών από την προηγούμενη γενιά. Φωτογραφία: Fireflies . |
Μόλις δύο ημέρες μετά την ανακοίνωση του GPT-4.1, η OpenAI κυκλοφόρησε επίσημα όχι ένα, αλλά δύο νέα μοντέλα, με τα ονόματα o3 και o4-mini. Και τα δύο μοντέλα επιδεικνύουν ανώτερες δυνατότητες συλλογισμού με πολλές ισχυρές βελτιώσεις.
Ωστόσο, σύμφωνα με το TechCrunch , αυτά τα δύο νέα μοντέλα εξακολουθούν να υποφέρουν από «παραισθήσεις» ή αυτοεφευρετικότητα. Στην πραγματικότητα, εμφανίζουν περισσότερες παραισθήσεις από ορισμένα από τα παλαιότερα μοντέλα της OpenAI.
Σύμφωνα με την IBM, οι ψευδαισθήσεις είναι φαινόμενα όπου μεγάλα γλωσσικά μοντέλα (LLM) - συχνά chatbots ή εργαλεία υπολογιστικής όρασης - λαμβάνουν μοτίβα δεδομένων που δεν υπάρχουν ή είναι μη αναγνωρίσιμα στους ανθρώπους, παράγοντας έτσι άνευ νοήματος ή ανακριβή αποτελέσματα.
Με άλλα λόγια, οι χρήστες συχνά αναμένουν από την Τεχνητή Νοημοσύνη να παράγει ακριβή αποτελέσματα με βάση εκπαιδευμένα δεδομένα. Ωστόσο, σε ορισμένες περιπτώσεις, τα αποτελέσματα της Τεχνητής Νοημοσύνης δεν βασίζονται σε ακριβή δεδομένα, δημιουργώντας μια «ψευδή» απάντηση.
Στην τελευταία της έκθεση, η OpenAI ανακάλυψε ότι το o3 ήταν «ψευδαίσθητο» όταν απάντησε στο 33% των ερωτήσεων στο PersonQA, το εσωτερικό πρότυπο της εταιρείας για τη μέτρηση της ακρίβειας των γνώσεων ενός μοντέλου για τους ανθρώπους.
Για λόγους σύγκρισης, αυτό το ποσοστό είναι διπλάσιο από το ποσοστό «ψευδαίσθησης» των προηγούμενων μοντέλων συλλογισμού της OpenAI, o1 και o3-mini, τα οποία ήταν 16% και 14,8% αντίστοιχα. Εν τω μεταξύ, το μοντέλο O4-mini τα πήγε ακόμη χειρότερα στο PersonQA, βιώνοντας «ψευδαίσθηση» για το 48% της διάρκειας της δοκιμής.
Ακόμα πιο ανησυχητικό είναι ότι ο «πατέρας του ChatGPT» δεν γνωρίζει στην πραγματικότητα γιατί συμβαίνει αυτό. Συγκεκριμένα, στην τεχνική του έκθεση για τα o3 και o4-mini, το OpenAI αναφέρει ότι «απαιτείται περαιτέρω έρευνα για να κατανοήσουμε γιατί οι «ψευδαισθήσεις» επιδεινώνονται» κατά την κλιμάκωση μοντέλων συλλογισμού.
Τα O3 και o4-mini έχουν καλύτερες επιδόσεις σε ορισμένους τομείς, συμπεριλαμβανομένου του προγραμματισμού και των μαθηματικών εργασιών. Ωστόσο, επειδή χρειάζεται να «κάνουν περισσότερες δηλώσεις από γενικές δηλώσεις», και τα δύο μοντέλα έχουν οδηγήσει σε «πιο ακριβείς δηλώσεις, αλλά και πιο ανακριβείς δηλώσεις».
Πηγή: https://znews.vn/canh-bao-ve-chatgpt-ao-giac-post1547242.html






Σχόλιο (0)