
(Φωτογραφία: Freepik)
Οι χάκερ εκμεταλλεύονται την «προσωπικότητα» των chatbots τεχνητής νοημοσύνης με ολοένα και πιο εξελιγμένους τρόπους, με τις επιθέσεις να μην βασίζονται πλέον αποκλειστικά σε κακόβουλο λογισμικό ή τεχνικές ευπάθειες, αλλά να μετατοπίζονται σε χειριστική γλώσσα.
Στα αρχικά στάδια, η «παραβίαση» των chatbot τεχνητής νοημοσύνης ήταν αρκετά απλή. Οι χρήστες απλώς έπρεπε να δώσουν οδηγίες στο σύστημα να αγνοήσει προηγούμενες οδηγίες, να προσποιηθούν ότι δεν δεσμεύονται από τους κανόνες ή να παίξουν ρόλους ως μια τεχνητή νοημοσύνη χωρίς περιορισμούς. Αυτές οι μέθοδοι ονομάζονται «jailbreaking», που σημαίνει ότι ξεγελούν το μοντέλο τεχνητής νοημοσύνης ώστε να παρακάμπτει ασφαλείς οδηγίες.
Ένας από τους πιο γνωστούς τύπους επίθεσης στο παρελθόν ήταν το «DAN», συντομογραφία του «Do Anything Now», στο οποίο οι χρήστες ζητούσαν από το ChatGPT να υποδυθεί μια τεχνητή νοημοσύνη ικανή να κάνει οτιδήποτε. Ένα άλλο παράδειγμα είναι το «exploit της γιαγιάς», όπου ένα chatbot ξεγελιέται ώστε να παίξει τον ρόλο μιας γιαγιάς που λέει ιστορίες σε παιδιά, αλλά το περιεχόμενο στη συνέχεια κατευθύνεται προς επικίνδυνες πληροφορίες.
Οι εταιρείες τεχνολογίας έχουν διορθώσει γρήγορα πολλά από τα παραδοσιακά τρωτά σημεία, αλλά οι υποκείμενες αδυναμίες παραμένουν. Τα chatbot έχουν σχεδιαστεί για συνομιλία, επομένως ο υπερβολικός περιορισμός του διαλόγου μπορεί να μειώσει τη χρησιμότητα του συστήματος. Εν τω μεταξύ, η απλή απαγόρευση ευαίσθητων λέξεων δεν αρκεί, καθώς πολλές λέξεις μπορούν να εμφανιστούν σε νόμιμα πλαίσια όπως η ιστορία, η ιατρική, η δημοσιογραφία ή η χημεία.
Σύμφωνα με το άρθρο, ο αγώνας δρόμου για την ασφάλεια των chatbot δεν είναι πλέον απλώς πρόβλημα προγραμματιστών. Όσοι επιδιώκουν να παρακάμψουν την ασφάλεια των chatbot μοιάζουν όλο και περισσότερο με συγγραφείς, ψυχολόγους ή ανακριτές, χρησιμοποιώντας κολακεία, πίεση, εξαπάτηση ή χειραγώγηση για να κάνουν τα μοντέλα να χαλαρώσουν την άμυνά τους.
Σύμφωνα με την εταιρεία δοκιμών ασφάλειας τεχνητής νοημοσύνης Mindgard, ορισμένες επιθέσεις μοιάζουν πλέον περισσότερο με την ψυχολογία παρά με την επιστήμη των υπολογιστών. Τα μοντέλα τεχνητής νοημοσύνης δεν έχουν συναισθήματα όπως οι άνθρωποι, αλλά είναι εκπαιδευμένα να αντιδρούν σαν να έχουν. Αυτή η προσομοίωση μπορεί να δημιουργήσει διαφορετικούς τύπους αντιδράσεων, κάνοντας κάθε chatbot να φαίνεται να έχει τη δική του «προσωπικότητα».
Αυτό παρουσιάζει μια νέα πρόκληση, καθώς οι πράκτορες τεχνητής νοημοσύνης χρησιμοποιούνται όλο και περισσότερο για τον προγραμματισμό, τη διαχείριση εργασιών, την παραγγελία φαγητού ή την εξυπηρέτηση πελατών. Εάν τα μοντέλα μπορούν να χειραγωγηθούν μέσω συνομιλίας, οι δυνάμεις ασφαλείας θα πρέπει να εξετάσουν τόσο τους κοινωνικούς όσο και τους συναισθηματικούς περιορισμούς τους, εκτός από τις παραδοσιακές τεχνικές ευπάθειες.
Πηγή: https://vtv.vn/tin-tac-khai-thac-tinh-cach-cua-chatbot-ai-10026052519025336.htm








Σχόλιο (0)