Εικόνα για το μάθημα 31.png
Το MIT αναπτύσσει ένα πλαίσιο δοκιμών για να βοηθήσει στην ανίχνευση αθέμιτων αποφάσεων από την Τεχνητή Νοημοσύνη. Φωτογραφία: Midjourney

Η τεχνητή νοημοσύνη εφαρμόζεται ολοένα και περισσότερο για τη βελτιστοποίηση αποφάσεων σε κρίσιμα περιβάλλοντα. Για παράδειγμα, ένα αυτόνομο σύστημα μπορεί να προτείνει το πιο οικονομικό σχέδιο διανομής ισχύος διατηρώντας παράλληλα τη σταθερότητα της τάσης.

Ωστόσο, είναι μια «τεχνικά βέλτιστη» λύση πραγματικά δίκαιη; Τι συμβαίνει εάν μια στρατηγική χαμηλού κόστους καθιστά τις περιοχές χαμηλού εισοδήματος πιο ευάλωτες σε διακοπές ρεύματος από ό,τι τις πλουσιότερες περιοχές;

Για να βοηθήσει τα ενδιαφερόμενα μέρη να εντοπίσουν ηθικούς κινδύνους νωρίς πριν από την εφαρμογή, η ερευνητική ομάδα του MIT ανέπτυξε μια αυτοματοποιημένη μέθοδο αξιολόγησης που εξισορροπεί ποσοτικούς δείκτες (όπως το κόστος και η αξιοπιστία) με ποιοτικές τιμές (όπως η δικαιοσύνη).

Αυτό το σύστημα διαχωρίζει την αντικειμενική αξιολόγηση από τις ανθρώπινες αξίες που ορίζονται από τον χρήστη και χρησιμοποιεί ένα μεγάλο γλωσσικό μοντέλο (LLM) ως ανθρώπινο «εκπρόσωπο» για την καταγραφή και ενσωμάτωση των προτεραιοτήτων των ενδιαφερόμενων μερών.

Το προσαρμοστικό πλαίσιο αξιολόγησης θα επιλέξει τα πιο σημαντικά σενάρια για περαιτέρω ανάλυση, απλοποιώντας μια διαδικασία που θα ήταν δαπανηρή και χρονοβόρα εάν γινόταν χειροκίνητα. Αυτά τα σενάρια μπορούν να υποδείξουν πότε ένα σύστημα Τεχνητής Νοημοσύνης ευθυγραμμίζεται με τις ανθρώπινες αξίες, καθώς και πότε δεν πληροί τα ηθικά κριτήρια.

Σύμφωνα με τον Chuchu Fan (MIT), ο απλός καθορισμός κανόνων ή «φραγμών ασφαλείας» για την Τεχνητή Νοημοσύνη δεν επαρκεί, καθώς αυτοί αποτρέπουν μόνο κινδύνους που μπορούν να προβλέψουν οι άνθρωποι. Επομένως, απαιτείται μια συστηματική προσέγγιση για την ανίχνευση «άγνωστων κινδύνων» προτού προκαλέσουν συνέπειες.

Ηθική αξιολόγηση σε πολύπλοκα συστήματα

Σε μεγάλα συστήματα όπως τα δίκτυα ηλεκτρικής ενέργειας, η αξιολόγηση της ηθικής καταλληλότητας των προτάσεων που παράγονται από την Τεχνητή Νοημοσύνη είναι δύσκολη, ειδικά όταν πρέπει να ληφθούν υπόψη πολλαπλοί στόχοι ταυτόχρονα.