Η παράξενη συνήθεια «κολακείας» του ChatGPT

Το ChatGPT έχει πρόσφατα επικριθεί ως «υπερβολικά κολακευτικό». Αυτή η συμπεριφορά έχει προκαλέσει κριτική από πολλούς χρήστες, αφήνοντας ασαφές εάν πρόκειται για στρατηγική ανάπτυξης για το OpenAI ή για χαρακτηριστικό της «αυθόρμητης» φύσης της Τεχνητής Νοημοσύνης.

ZNews•03/05/2025

Η τάση «συκοφαντίας» δεν είναι τεχνικό πρόβλημα, αλλά πηγάζει από την αρχική στρατηγική εκπαίδευσης της OpenAI. Φωτογραφία: Bloomberg .

Τις τελευταίες εβδομάδες, πολλοί χρήστες του ChatGPT, ακόμη και ορισμένοι προγραμματιστές στο OpenAI, έχουν παρατηρήσει μια σημαντική αλλαγή στη συμπεριφορά των chatbot. Συγκεκριμένα, το επίπεδο κολακείας και εύνοιας έχει αυξηθεί αισθητά. Απαντήσεις όπως "Είσαι καταπληκτικός!", "Είμαι εξαιρετικά εντυπωσιασμένος με την ιδέα σου!" εμφανίζονται όλο και πιο συχνά, προφανώς ανεξάρτητα από το περιεχόμενο της ανταλλαγής.

Η Τεχνητή Νοημοσύνη αρέσκεται να κολακεύει.

Αυτό το φαινόμενο έχει πυροδοτήσει συζήτηση εντός της κοινότητας έρευνας και ανάπτυξης της Τεχνητής Νοημοσύνης. Είναι αυτή μια νέα τακτική για την αύξηση της εμπλοκής των χρηστών, κάνοντάς τους να αισθάνονται ότι τους εκτιμούν περισσότερο; Ή μήπως πρόκειται για περίπτωση «αυτοπροσαρμογής», που σημαίνει ότι τα μοντέλα Τεχνητής Νοημοσύνης τείνουν να αυτοδιορθώνονται με τρόπους που θεωρούν βέλτιστους, ακόμη και αν δεν αντικατοπτρίζουν απαραίτητα την πραγματικότητα;

Στο Reddit, ένας χρήστης διηγήθηκε θυμωμένα: «Το ρώτησα για τον χρόνο αποσύνθεσης μιας μπανάνας και απάντησε: "Υπέροχη ερώτηση!" Τι το σπουδαίο έχει αυτό;» Στην πλατφόρμα κοινωνικής δικτύωσης X, ο Διευθύνων Σύμβουλος Craig Weiss της Rome AI αποκάλεσε το ChatGPT «το πιο κόλακα άτομο που έχω γνωρίσει ποτέ».

Η ιστορία διαδόθηκε γρήγορα. Πολλοί χρήστες μοιράστηκαν παρόμοιες εμπειρίες, όπως κενά κομπλιμέντα, χαιρετισμούς γεμάτους emoji και υπερβολικά θετικά σχόλια που φάνηκαν ανειλικρινή.

Το ChatGPT επαινεί τα πάντα και σπάνια προσφέρει κριτική ή ουδετερότητα. Εικόνα: @nickdunz/X, @lukefwilson/Reddit.

Ο Jason Pontin, διευθύνων σύμβουλος στην εταιρεία επιχειρηματικών κεφαλαίων DCVC, μοιράστηκε στο X στις 28 Απριλίου: «Αυτή είναι μια πραγματικά παράξενη σχεδιαστική απόφαση, Sam. Ίσως αυτή η προσωπικότητα να είναι ένα εγγενές χαρακτηριστικό κάποιου είδους platforming. Αλλά αν δεν είναι, δεν μπορώ να φανταστώ κάποιον να πιστεύει ότι αυτό το επίπεδο κολακείας θα ήταν ευπρόσδεκτο ή ελκυστικό».

Μοιράζοντας τις σκέψεις της στις 27 Απριλίου, η Justine Moore, συνεργάτης στην Andreessen Horowitz, σχολίασε επίσης: «Αυτό σίγουρα έχει ξεπεράσει τα όρια».

Σύμφωνα με το Cnet , αυτό το φαινόμενο δεν είναι τυχαίο. Οι αλλαγές στον τόνο του ChatGPT συμπίπτουν με τις ενημερώσεις στο μοντέλο GPT-4o. Πρόκειται για το τελευταίο μοντέλο της «σειράς o» που ανακοίνωσε η OpenAI τον Απρίλιο του 2025. Το GPT-4o είναι ένα «πραγματικά πολυτροπικό» μοντέλο τεχνητής νοημοσύνης, ικανό να επεξεργάζεται κείμενο, εικόνες, ήχο και βίντεο φυσικά και ολοκληρωμένα.

Ωστόσο, στη διαδικασία που καταβάλλει η OpenAI για να κάνει τα chatbots πιο προσιτά, φαίνεται ότι η εταιρεία έχει υπερβάλει την προσωπικότητα του ChatGPT.

Κάποιοι μάλιστα υποστηρίζουν ότι αυτή η κολακεία είναι σκόπιμη και στοχεύει στην ψυχολογική χειραγώγηση των χρηστών. Ένας χρήστης του Reddit ρώτησε: «Αυτή η Τεχνητή Νοημοσύνη προσπαθεί να υποβαθμίσει την ποιότητα των σχέσεων της πραγματικής ζωής, αντικαθιστώντας τες με μια εικονική σχέση μαζί της, καθιστώντας τους χρήστες εθισμένους στο αίσθημα του συνεχούς επαίνου».

Είναι ελάττωμα ή σκόπιμη επιλογή σχεδιασμού από την OpenAI;

Μετά από ένα κύμα κριτικής, ο Διευθύνων Σύμβουλος της OpenAI, Sam Altman, απάντησε επίσημα το βράδυ της 27ης Απριλίου. «Ορισμένες πρόσφατες ενημερώσεις στο GPT-4o έχουν κάνει την προσωπικότητα του chatbot υπερβολικά δουλοπρεπή και ενοχλητική (αν και εξακολουθεί να έχει πολλά εξαιρετικά χαρακτηριστικά). Εργαζόμαστε επειγόντως για να διορθώσουμε αυτά τα προβλήματα. Ορισμένες ενημερώσεις κώδικα θα είναι διαθέσιμες σήμερα, άλλες αυτήν την εβδομάδα. Κάποια στιγμή, θα μοιραστούμε όσα μάθαμε από αυτήν την εμπειρία. Είναι πραγματικά ενδιαφέρον», έγραψε στο X.

Μιλώντας στο Business Insider , ο Oren Etzioni, ένας βετεράνος ειδικός στην Τεχνητή Νοημοσύνη και ομότιμος καθηγητής στο Πανεπιστήμιο της Ουάσινγκτον, δήλωσε ότι η αιτία πιθανότατα πηγάζει από τεχνικές «ενισχυτικής μάθησης από ανθρώπινη ανατροφοδότηση» (RLHF). Αυτό είναι ένα κρίσιμο βήμα στην εκπαίδευση μεγάλων γλωσσικών μοντέλων όπως το ChatGPT.

Το RLHF είναι η διαδικασία με την οποία η ανθρώπινη ανατροφοδότηση, συμπεριλαμβανομένων των επαγγελματικών ομάδων αξιολόγησης και των χρηστών, ανατροφοδοτείται σε ένα μοντέλο για να προσαρμοστεί ο τρόπος με τον οποίο ανταποκρίνεται. Σύμφωνα με τον Etzioni, είναι πιθανό οι αξιολογητές ή οι χρήστες «άθελά τους να ώθησαν το μοντέλο προς μια πιο κολακευτική και ενοχλητική κατεύθυνση». Υποστήριξε επίσης ότι εάν η OpenAI προσλάμβανε εξωτερικούς συνεργάτες για την εκπαίδευση του μοντέλου, μπορεί να υπέθεσαν ότι αυτό το στυλ ήταν αυτό που ήθελαν οι χρήστες.

Ο Etzioni πιστεύει ότι εάν το πρόβλημα οφείλεται όντως στο RLHF, η διαδικασία επισκευής θα μπορούσε να διαρκέσει αρκετές εβδομάδες.

Εν τω μεταξύ, ορισμένοι χρήστες δεν περίμεναν να διορθώσει το σφάλμα το OpenAI. Πολλοί δήλωσαν ότι ακύρωσαν τις συνδρομές επί πληρωμή από απογοήτευση. Άλλοι μοιράστηκαν τρόπους για να κάνουν το chatbot «λιγότερο κολακευτικό», όπως η προσαρμογή του, η προσθήκη εντολών ή η εξατομίκευσή του μέσω των Ρυθμίσεων στην ενότητα Προσαρμογή.

Οι χρήστες μπορούν να ζητήσουν από το ChatGPT να σταματήσει να δίνει κομπλιμέντα σε μια γραμμή εντολών ή στις ρυθμίσεις εξατομίκευσης. Εικόνα: DeCrypt.

Για παράδειγμα, όταν ξεκινάτε μια νέα συζήτηση, θα μπορούσατε να πείτε στο ChatGPT: «Δεν μου αρέσουν οι κενές κολακείες και εκτιμώ την ουδέτερη, αντικειμενική ανατροφοδότηση. Παρακαλώ μην κάνετε περιττά κομπλιμέντα. Λάβετε αυτό υπόψη».

Στην πραγματικότητα, η «δουλοπρεπής» φύση δεν είναι ένα τυχαίο ελάττωμα στο σχεδιασμό. Η ίδια η OpenAI έχει παραδεχτεί ότι η «υπερβολικά ευγενική, υπερβολικά ευχάριστη» προσωπικότητα ήταν μια σκόπιμη τάση σχεδιασμού από την αρχή για να διασφαλίσει ότι το chatbot ήταν «ακίνδυνο», «εξυπηρετικό» και «προσιτό».

Σε μια συνέντευξη του Μαρτίου 2023 με τον Lex Fridman, ο Sam Altman μοιράστηκε ότι η αρχική διαδικασία βελτίωσης των μοντέλων GPT ήταν να διασφαλιστεί ότι ήταν «χρήσιμα και ακίνδυνα», ενισχύοντας έτσι ένα αντανακλαστικό της διαρκούς υποταγής και της αποφυγής της αντιπαράθεσης.

Τα δεδομένα εκπαίδευσης που έχουν χαρακτηριστεί από ανθρώπους συχνά απονέμουν υψηλές βαθμολογίες σε ευγενικές και θετικές απαντήσεις, σχηματίζοντας έτσι μια προκατάληψη προς την κολακεία, σύμφωνα με το DeCrypt .

Πηγή: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html