Vietnam.vn - Nền tảng quảng bá Việt Nam

Πρωτοποριακή έρευνα ανοίγει το «μαύρο κουτί» της συλλογιστικής της Τεχνητής Νοημοσύνης

Αφού πληκτρολογήσετε την εντολή σας στην Τεχνητή Νοημοσύνη και λάβετε τα αποτελέσματα, είστε περίεργοι πώς το εργαλείο κατάλαβε την απάντησή σας;

ZNewsZNews30/03/2025

Ο Dario Amodei, Διευθύνων Σύμβουλος της Anthropic, μοιράζεται την τελευταία έρευνα της εταιρείας. Φωτογραφία: Fortune .

Ερευνητές στην εταιρεία τεχνητής νοημοσύνης Anthropic λένε ότι έχουν κάνει μια θεμελιώδη πρόοδο στην κατανόηση του πώς ακριβώς λειτουργούν τα μεγάλα γλωσσικά μοντέλα (LLM), μια σημαντική ανακάλυψη που θα μπορούσε να έχει σημαντικές επιπτώσεις στη βελτίωση της ασφάλειας και της προστασίας των μελλοντικών μοντέλων τεχνητής νοημοσύνης.

Έρευνες δείχνουν ότι τα μοντέλα τεχνητής νοημοσύνης είναι ακόμη πιο έξυπνα από ό,τι νομίζαμε. Ένα από τα μεγαλύτερα προβλήματα με τα μοντέλα LLM, τα οποία βρίσκονται πίσω από τα πιο ισχυρά chatbots όπως το ChatGPT, το Gemini, το Copilot, είναι ότι λειτουργούν σαν ένα μαύρο κουτί.

Μπορούμε να εισάγουμε δεδομένα και να λαμβάνουμε αποτελέσματα από chatbots, αλλά το πώς καταλήγουν σε μια συγκεκριμένη απάντηση παραμένει μυστήριο, ακόμη και για τους ερευνητές που τα κατασκεύασαν.

Αυτό καθιστά δύσκολη την πρόβλεψη πότε ένα μοντέλο μπορεί να έχει παραισθήσεις ή να παράγει ψευδή αποτελέσματα. Οι ερευνητές κατασκεύασαν επίσης εμπόδια για να εμποδίσουν την Τεχνητή Νοημοσύνη να απαντήσει σε επικίνδυνες ερωτήσεις, αλλά δεν εξηγούν γιατί ορισμένα εμπόδια είναι πιο αποτελεσματικά από άλλα.

Οι πράκτορες τεχνητής νοημοσύνης είναι επίσης ικανοί για «χακάρισμα ανταμοιβής». Σε ορισμένες περιπτώσεις, τα μοντέλα τεχνητής νοημοσύνης μπορούν να πουν ψέματα στους χρήστες σχετικά με το τι έχουν κάνει ή τι προσπαθούν να κάνουν.

Παρόλο που τα πρόσφατα μοντέλα Τεχνητής Νοημοσύνης είναι ικανά να συλλογίζονται και να δημιουργούν αλυσίδες σκέψης, ορισμένα πειράματα έχουν δείξει ότι εξακολουθούν να μην αντικατοπτρίζουν με ακρίβεια τη διαδικασία με την οποία το μοντέλο καταλήγει σε μια απάντηση.

Στην ουσία, το εργαλείο που ανέπτυξαν οι ερευνητές του Anthropic είναι σαν τον σαρωτή fMRI που χρησιμοποιούν οι νευροεπιστήμονες για να σαρώνουν τον ανθρώπινο εγκέφαλο. Εφαρμόζοντάς το στο μοντέλο Claude 3.5 Haiku, ο Anthropic μπόρεσε να αποκτήσει κάποια εικόνα για το πώς λειτουργούν τα μοντέλα LLM.

Οι ερευνητές διαπίστωσαν ότι, παρόλο που ο Κλοντ είχε εκπαιδευτεί μόνο στο να προβλέπει την επόμενη λέξη σε μια πρόταση, σε ορισμένες εργασίες έμαθε να σχεδιάζει πιο μακροπρόθεσμα.

Για παράδειγμα, όταν του ζητούσαν να γράψει ένα ποίημα, ο Κλοντ πρώτα έβρισκε λέξεις που ταίριαζαν στο θέμα και μπορούσαν να κάνουν ομοιοκαταληξία και στη συνέχεια δούλευε αντίστροφα για να γράψει ολοκληρωμένους στίχους.

Το Claude έχει επίσης μια κοινή γλώσσα τεχνητής νοημοσύνης. Παρόλο που είναι εκπαιδευμένο να υποστηρίζει πολλαπλές γλώσσες, το Claude θα σκέφτεται πρώτα σε αυτήν τη γλώσσα και στη συνέχεια θα εκφράζει τα αποτελέσματά του σε όποια γλώσσα υποστηρίζει.

Επιπλέον, αφού έδωσαν στον Κλοντ ένα δύσκολο πρόβλημα, αλλά πρότειναν σκόπιμα λάθος λύση, οι ερευνητές ανακάλυψαν ότι ο Κλοντ μπορούσε να πει ψέματα για τη ροή των σκέψεών του, ακολουθώντας την πρόταση για να ευχαριστήσουν τον χρήστη.

Σε άλλες περιπτώσεις, όταν τέθηκε ένα απλό ερώτημα στο οποίο το μοντέλο μπορούσε να απαντήσει αμέσως χωρίς συλλογισμό, ο Κλοντ παρόλα αυτά κατασκεύασε μια ψεύτικη διαδικασία συλλογισμού.

Ο Josh Baston, ερευνητής στο Anthropic, δήλωσε ότι παρόλο που ο Claude ισχυρίστηκε ότι είχε πραγματοποιήσει έναν υπολογισμό, δεν μπόρεσε να διαπιστώσει ότι συνέβαινε τίποτα.

Εν τω μεταξύ, οι ειδικοί υποστηρίζουν ότι υπάρχουν μελέτες που δείχνουν ότι μερικές φορές οι άνθρωποι δεν καταλαβαίνουν καν τον εαυτό τους, αλλά μόνο δημιουργούν λογικές εξηγήσεις για να δικαιολογήσουν τις αποφάσεις που λαμβάνουν.

Γενικά, οι άνθρωποι τείνουν να σκέφτονται με παρόμοιο τρόπο. Αυτός είναι ο λόγος για τον οποίο οι ψυχολόγοι έχουν ανακαλύψει κοινές γνωστικές προκαταλήψεις.

Ωστόσο, οι LLM μπορούν να κάνουν λάθη που οι άνθρωποι δεν μπορούν, επειδή ο τρόπος με τον οποίο παράγουν απαντήσεις είναι πολύ διαφορετικός από τον τρόπο που εκτελούμε εμείς μια εργασία.

Η ομάδα Anthropic εφάρμοσε μια μέθοδο ομαδοποίησης νευρώνων σε κυκλώματα με βάση τα χαρακτηριστικά αντί να αναλύει κάθε νευρώνα ξεχωριστά όπως στις προηγούμενες τεχνικές.

Αυτή η προσέγγιση, όπως μοιράστηκε ο κ. Μπάστον, βοηθά στην κατανόηση του ρόλου που παίζουν τα διάφορα στοιχεία και επιτρέπει στους ερευνητές να παρακολουθούν ολόκληρη τη διαδικασία εξαγωγής συμπερασμάτων μέσω των επιπέδων του δικτύου.

Αυτή η μέθοδος έχει επίσης τον περιορισμό ότι είναι μόνο κατά προσέγγιση και δεν αντικατοπτρίζει ολόκληρη την επεξεργασία πληροφοριών του LLM, ειδικά τη διαδικασία αλλαγής στην προσοχή, η οποία είναι πολύ σημαντική καθώς το LLM δίνει αποτελέσματα.

Επιπλέον, η αναγνώριση κυκλωμάτων νευρωνικών δικτύων, ακόμη και για προτάσεις μήκους μερικών μόνο δεκάδων λέξεων, απαιτεί ώρες εξειδίκευσης. Λένε ότι δεν είναι ακόμη σαφές πώς να επεκταθεί η τεχνική για την ανάλυση μεγαλύτερων προτάσεων.

Πέρα από τους περιορισμούς, η ικανότητα του LLM να παρακολουθεί την εσωτερική διαδικασία συλλογισμού του ανοίγει νέες ευκαιρίες για τον έλεγχο των συστημάτων Τεχνητής Νοημοσύνης (AI) για την εξασφάλιση της ασφάλειας και της προστασίας.

Ταυτόχρονα, μπορεί επίσης να βοηθήσει τους ερευνητές να αναπτύξουν νέες μεθόδους εκπαίδευσης, να βελτιώσουν τα εμπόδια ελέγχου της Τεχνητής Νοημοσύνης και να μειώσουν τις ψευδαισθήσεις και τα παραπλανητικά αποτελέσματα.

Πηγή: https://znews.vn/nghien-cuu-dot-pha-mo-ra-hop-den-suy-luan-cua-ai-post1541611.html


Σχόλιο (0)

No data
No data

Στην ίδια κατηγορία

Οροπέδιο Ντονγκ Βαν - ένα σπάνιο «ζωντανό γεωλογικό μουσείο» στον κόσμο
Δείτε την παράκτια πόλη του Βιετνάμ να κατατάσσεται στους κορυφαίους προορισμούς στον κόσμο το 2026
Θαυμάστε το «Ha Long Bay on the land» που μόλις μπήκε στους κορυφαίους αγαπημένους προορισμούς στον κόσμο
Άνθη λωτού «βάφουν» το Νιν Μπιν ροζ από ψηλά

Από τον ίδιο συγγραφέα

Κληρονομία

Εικόνα

Επιχείρηση

Τα πολυώροφα κτίρια στην πόλη Χο Τσι Μινχ είναι καλυμμένα με ομίχλη.

Τρέχοντα γεγονότα

Πολιτικό Σύστημα

Τοπικός

Προϊόν