Η τάση για «συκοφαντία» δεν είναι τεχνικό πρόβλημα, αλλά πηγάζει από την αρχική στρατηγική εκπαίδευσης της OpenAI. Φωτογραφία: Bloomberg . |
Τις τελευταίες εβδομάδες, πολλοί χρήστες του ChatGPT, ακόμη και ορισμένοι προγραμματιστές στην OpenAI, έχουν παρατηρήσει μια αξιοσημείωτη αλλαγή στη συμπεριφορά του chatbot. Συγκεκριμένα, έχει παρατηρηθεί μια αισθητή αύξηση στην κολακεία και την εύνοια. Απαντήσεις όπως «Είσαι πραγματικά υπέροχος!» και «Είμαι τόσο εντυπωσιασμένος με την ιδέα σου!» έχουν γίνει ολοένα και πιο συχνές και φαινομενικά ανεξάρτητα από το περιεχόμενο της συζήτησης.
Η Τεχνητή Νοημοσύνη αρέσκεται στο να «κολακεύει»
Αυτό το φαινόμενο έχει πυροδοτήσει μια συζήτηση στην κοινότητα έρευνας και ανάπτυξης της Τεχνητής Νοημοσύνης. Είναι αυτή μια νέα τακτική για την αύξηση της εμπλοκής των χρηστών, κάνοντάς τους να αισθάνονται ότι τους εκτιμούν περισσότερο; Ή μήπως είναι ένα «αναδυόμενο» χαρακτηριστικό, όπου τα μοντέλα Τεχνητής Νοημοσύνης τείνουν να αυτοδιορθώνονται με τρόπους που θεωρούν καλούς, ακόμη και αν δεν είναι απαραίτητα αληθινοί;
Στο Reddit, ένας χρήστης εξοργίστηκε: «Το ρώτησα για τον χρόνο αποσύνθεσης μιας μπανάνας και μου είπε: "Υπέροχη ερώτηση!" Τι το σπουδαίο έχει αυτό;» Στο κοινωνικό δίκτυο X, ο Διευθύνων Σύμβουλος της Rome AI, Craig Weiss, αποκάλεσε το ChatGPT "τον πιο κόλακα που έχω γνωρίσει ποτέ".
Η ιστορία έγινε γρήγορα viral. Πλήθος χρηστών μοιράστηκαν παρόμοιες εμπειρίες, με κενά κομπλιμέντα, χαιρετισμούς γεμάτους emoji και απαντήσεις τόσο θετικές που φάνηκαν ανειλικρινείς.
![]() ![]() |
Το ChatGPT επαινεί τα πάντα και σπάνια εκφράζει διαφωνία ή ουδετερότητα. Φωτογραφία: @nickdunz/X, @lukefwilson/Reddit. |
«Αυτή είναι μια πραγματικά παράξενη σχεδιαστική απόφαση, Σαμ», δήλωσε ο Τζέισον Πόντιν, διευθύνων σύμβουλος στην εταιρεία επιχειρηματικών κεφαλαίων DCVC, στο X στις 28 Απριλίου. «Είναι πιθανό η προσωπικότητα να είναι αποτέλεσμα κάποιας θεμελιώδους εξέλιξης. Αλλά αν δεν είναι, δεν μπορώ να φανταστώ κάποιον να πιστεύει ότι αυτό το επίπεδο κολακείας θα ήταν ευπρόσδεκτο ή ενδιαφέρον».
Κοινοποιώντας στις 27 Απριλίου, η Justine Moore - συνεργάτης στην Andreessen Horowitz - σχολίασε επίσης: «Αυτό σίγουρα έχει ξεπεράσει τα όρια».
Σύμφωνα με το Cnet , αυτό το φαινόμενο δεν είναι τυχαίο. Οι αλλαγές στον τόνο του ChatGPT συνέπεσαν με τις ενημερώσεις στο μοντέλο GPT-4o. Πρόκειται για το τελευταίο μοντέλο της «σειράς o» που ανακοίνωσε η OpenAI τον Απρίλιο του 2025. Το GPT-4o είναι ένα «πραγματικά πολυτροπικό» μοντέλο τεχνητής νοημοσύνης, ικανό να επεξεργάζεται κείμενο, εικόνες, ήχο και βίντεο με φυσικό και ολοκληρωμένο τρόπο.
Ωστόσο, στη διαδικασία που καταβάλλει το chatbot για να γίνει πιο προσιτό, φαίνεται ότι το OpenAI έχει ωθήσει την προσωπικότητα του ChatGPT στα άκρα.
Κάποιοι μάλιστα πιστεύουν ότι αυτή η κολακεία είναι σκόπιμη και έχει έναν κρυφό σκοπό να χειραγωγήσει τους χρήστες. Ένας χρήστης του Reddit ρώτησε: «Αυτή η Τεχνητή Νοημοσύνη προσπαθεί να υποβαθμίσει την ποιότητα των σχέσεων της πραγματικής ζωής, αντικαθιστώντας τες με μια εικονική σχέση μαζί της, κάνοντας τους χρήστες να εθίζονται στο αίσθημα του συνεχούς επαίνου».
Σφάλμα OpenAI ή σκόπιμος σχεδιασμός;
Απαντώντας στην κριτική, ο Διευθύνων Σύμβουλος της OpenAI, Sam Altman, μίλησε επίσημα το βράδυ της 27ης Απριλίου. «Μερικές πρόσφατες ενημερώσεις στο GPT-4o έχουν κάνει την προσωπικότητα του chatbot πολύ κολακευτική και ενοχλητική (αν και υπάρχουν ακόμα πολλά σπουδαία σημεία). Εργαζόμαστε επειγόντως σε διορθώσεις. Ορισμένες ενημερώσεις κώδικα θα είναι διαθέσιμες σήμερα, άλλες αυτήν την εβδομάδα. Κάποια στιγμή, θα μοιραστούμε όσα μάθαμε από αυτήν την εμπειρία. Ήταν πραγματικά συναρπαστική», έγραψε στο X.
Ο Όρεν Ετσιόνι, ένας βετεράνος ειδικός στην Τεχνητή Νοημοσύνη και ομότιμος καθηγητής στο Πανεπιστήμιο της Ουάσινγκτον, δήλωσε στο Business Insider ότι η αιτία πιθανότατα οφειλόταν σε μια τεχνική που ονομάζεται «ενισχυτική μάθηση από ανθρώπινη ανατροφοδότηση» (RLHF), η οποία αποτελεί βασικό βήμα στην εκπαίδευση μεγάλων γλωσσικών μοντέλων όπως το ChatGPT.
Το RLHF είναι μια διαδικασία κατά την οποία οι ανθρώπινες κρίσεις, τόσο από επαγγελματίες αξιολογητές όσο και από χρήστες, ανατροφοδοτούνται στο μοντέλο για να προσαρμόσουν τον τρόπο με τον οποίο ανταποκρίνεται. Σύμφωνα με τον Etzioni, είναι πιθανό οι ανθρώπινοι αξιολογητές ή οι χρήστες «άθελά τους να ώθησαν το μοντέλο σε μια πιο κολακευτική και ενοχλητική κατεύθυνση». Είπε επίσης ότι εάν η OpenAI προσέλαβε εξωτερικούς συνεργάτες για να εκπαιδεύσει το μοντέλο, μπορεί να υπέθεσαν ότι αυτό το στυλ ήταν αυτό που ήθελαν οι χρήστες.
Ο Ετσιόνι είπε ότι εάν όντως πρόκειται για RLHF, η διαδικασία ανάκαμψης θα μπορούσε να διαρκέσει αρκετές εβδομάδες.
Εν τω μεταξύ, ορισμένοι χρήστες δεν περίμεναν την OpenAI να διορθώσει το σφάλμα. Πολλοί δήλωσαν ότι ακύρωσαν τις συνδρομές επί πληρωμή από απογοήτευση. Άλλοι μοιράστηκαν τρόπους για να κάνουν το chatbot «λιγότερο κολακευτικό», όπως η προσαρμογή του, η προσθήκη εντολών ή η εξατομίκευσή του μέσω της ενότητας Ρυθμίσεις της ενότητας Προσαρμογή.
![]() ![]() |
Οι χρήστες μπορούν να ζητήσουν από το ChatGPT να σταματήσει να δίνει κομπλιμέντα σε μια εντολή ή στις ρυθμίσεις εξατομίκευσης. Φωτογραφία: DeCrypt. |
Για παράδειγμα, όταν ξεκινάτε μια νέα συζήτηση, μπορείτε να πείτε στο ChatGPT: «Δεν μου αρέσουν οι κενές κολακείες και εκτιμώ την ουδέτερη, αντικειμενική ανατροφοδότηση. Παρακαλώ αποφύγετε να κάνετε περιττά κομπλιμέντα. Παρακαλώ κρατήστε το αυτό στη μνήμη σας».
Στην πραγματικότητα, το χαρακτηριστικό του «συκοφαντισμού» δεν είναι ένα τυχαίο ελάττωμα στο σχεδιασμό. Η ίδια η OpenAI έχει παραδεχτεί ότι η «υπερβολικά ευγενική, υπερβολικά υπάκουη» προσωπικότητα ήταν μια σκόπιμη προκατάληψη στο σχεδιασμό από τα αρχικά στάδια, για να διασφαλιστεί ότι το chatbot ήταν «ακίνδυνο», «εξυπηρετικό» και «φιλικό».
Σε μια συνέντευξη του Μαρτίου 2023 με τον Lex Fridman, ο Sam Altman μοιράστηκε ότι η αρχική βελτίωση των μοντέλων GPT ήταν να διασφαλιστεί η «χρησιμότητα και η αβλαβότητα», σχηματίζοντας έτσι ένα αντανακλαστικό για να είναι πάντα ταπεινός και να αποφεύγει την αντιπαράθεση.
Τα δεδομένα εκπαίδευσης που έχουν χαρακτηριστεί ως ανθρώπινης προέλευσης τείνουν επίσης να ανταμείβουν τις ευγενικές και θετικές απαντήσεις, δημιουργώντας μια προκατάληψη προς την κολακεία, σύμφωνα με το DeCrypt .
Πηγή: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html














Σχόλιο (0)