
Όσο ισχυρότερο είναι το μοντέλο, τόσο πιο αδύναμη είναι η «σκέψη»;
Σε μια πρόσφατα δημοσιευμένη έκθεση, οι ερευνητές της Apple αξιολόγησαν την απόδοση των Μεγάλων Μοντέλων Συλλογιστικής (LRM) στον χειρισμό λογικών προβλημάτων αυξανόμενης δυσκολίας, όπως ο Πύργος του Ανόι ή το πρόβλημα της Διάσχισης του Ποταμού .
Τα αποτελέσματα ήταν σοκαριστικά: όταν αντιμετώπιζαν εξαιρετικά πολύπλοκα προβλήματα, η ακρίβεια των προηγμένων μοντέλων τεχνητής νοημοσύνης όχι μόνο επιδεινώθηκε, αλλά «κατέρρευσε εντελώς».
Ακόμα πιο ανησυχητικό είναι ότι πριν η απόδοση καταρρεύσει, τα μοντέλα άρχισαν... να μειώνουν την προσπάθεια συλλογισμού τους, μια συμπεριφορά αντίθετη με τη διαίσθηση, καθώς θα έπρεπε να απαιτείται περισσότερη σκέψη όταν αντιμετωπίζεται ένα δύσκολο πρόβλημα.
Σε πολλές περιπτώσεις, ακόμη και όταν τους δίνεται ο σωστός αλγόριθμος, τα μοντέλα εξακολουθούν να μην παρέχουν λύση. Αυτό αποκαλύπτει σοβαρούς περιορισμούς στην ικανότητά τους να προσαρμόζονται και να εφαρμόζουν κανόνες σε νέα περιβάλλοντα.
Η πρόκληση της «γενικής θεωρίας»
Απαντώντας σε αυτήν την έρευνα, ο Αμερικανός ακαδημαϊκός Γκάρι Μάρκους, μία από τις φωνές που ήταν σκεπτικές σχετικά με τις πραγματικές δυνατότητες της Τεχνητής Νοημοσύνης, χαρακτήρισε τα ευρήματα της Apple «αρκετά καταστροφικά».
Στο προσωπικό του ενημερωτικό δελτίο για το Substack, δήλωσε: «Όποιος πιστεύει ότι τα μεγάλα γλωσσικά μοντέλα (LLM) αποτελούν άμεσο δρόμο προς την AGI, εξαπατά τον εαυτό του».
Συμφωνώντας με αυτή την άποψη, ο Άντριου Ρογκόισκι, ειδικός στο Ινστιτούτο Τεχνητής Νοημοσύνης με επίκεντρο τον άνθρωπο (Πανεπιστήμιο του Σάρεϊ, Ηνωμένο Βασίλειο), πιστεύει ότι αυτό το εύρημα υποδηλώνει την πιθανότητα η βιομηχανία τεχνολογίας να οδεύει σε «αδιέξοδο»: «Όταν τα μοντέλα αποδίδουν καλά μόνο με απλά και μέτριας δυσκολίας προβλήματα, αλλά αποτυγχάνουν εντελώς σε αυξανόμενη δυσκολία, είναι σαφές ότι υπάρχει πρόβλημα με την τρέχουσα προσέγγιση».
Ένα συγκεκριμένο σημείο που επισημαίνεται από την Apple είναι η έλλειψη ικανότητας «γενικής συλλογιστικής», δηλαδή η ικανότητα επέκτασης της κατανόησης από μια συγκεκριμένη κατάσταση σε παρόμοιες καταστάσεις.
Όταν η γνώση δεν μπορεί να μεταφερθεί με τον τρόπο που συνήθως μεταδίδουν οι άνθρωποι, τα τρέχοντα μοντέλα εύκολα εμπίπτουν σε μια κατάσταση «μηχανικής μάθησης»: ισχυρά σε επαναλαμβανόμενα μοτίβα, αλλά αδύναμα στη λογική σκέψη ή την επαγωγή.
Επιπλέον, η έρευνα έχει διαπιστώσει ότι τα μοντέλα συλλογισμού μεγάλης κλίμακας καταναλώνουν υπολογιστικούς πόρους εκτελώντας επανειλημμένα τα σωστά βήματα για απλά προβλήματα, αλλά επιλέγοντας από την αρχή τη λάθος προσέγγιση για ελαφρώς πιο σύνθετα προβλήματα.
Η έκθεση εξέτασε μια σειρά από κορυφαία μοντέλα, συμπεριλαμβανομένων των o3 της OpenAI, Gemini Thinking της Google, Claude 3.7 Sonnet-Thinking και DeepSeek-R1. Ενώ οι Anthropic, Google και DeepSeek δεν έχουν ακόμη απαντήσει, η OpenAI αρνήθηκε να σχολιάσει.
Η έρευνα της Apple δεν αρνείται τα επιτεύγματα της Τεχνητής Νοημοσύνης στη γλώσσα, την απεικόνιση ή τα μεγάλα δεδομένα. Ωστόσο, υπογραμμίζει ένα τυφλό σημείο που παραβλέπεται: την ικανότητα γνήσιας συλλογιστικής, η οποία βρίσκεται στον πυρήνα της επίτευξης πραγματικής νοημοσύνης.
Πηγή: https://baovanhoa.vn/nhip-song-so/ai-suy-luan-kem-dan-khi-gap-bai-toan-phuc-tap-141602.html








Σχόλιο (0)