Η έλευση της παραγωγικής τεχνητής νοημοσύνης (GenAI) έχει ξεκλειδώσει πρωτοφανείς δυνατότητες για καινοτομία, αλλά ταυτόχρονα έχει ανοίξει ένα κουτί της Πανδώρας με νέους και πολύπλοκους κινδύνους για την κυβερνοασφάλεια. Καθώς οι οργανισμοί ενσωματώνουν όλο και περισσότερο αυτά τα εργαλεία στις λειτουργίες τους, εκτίθενται σε εξελιγμένες απειλές που μπορούν να παρακάμψουν τα παραδοσιακά μέτρα ασφαλείας. Μια έρευνα αποκάλυψε ότι το 85% των επαγγελματιών ασφαλείας που παρατήρησαν αύξηση των κυβερνοεπιθέσεων τον τελευταίο χρόνο, αποδίδουν την αύξηση αυτή σε κακόβουλους παράγοντες που χρησιμοποιούν την παραγωγική ΤΝ. Από τη χειραγώγηση των μοντέλων ΤΝ μέχρι την αυτοματοποίηση της δημιουργίας κακόβουλου λογισμικού, το τοπίο των απειλών έχει επεκταθεί δραματικά.
Ένας από τους πιο ύπουλους κινδύνους είναι η «δηλητηρίαση δεδομένων». Αυτή η τεχνική περιλαμβάνει την αλλοίωση των δεδομένων εκπαίδευσης που χρησιμοποιούνται για την ανάπτυξη μοντέλων ΤΝ και μηχανικής μάθησης (ML) από κακόβουλους παράγοντες. Εισάγοντας εσφαλμένα ή μεροληπτικά δεδομένα, οι επιτιθέμενοι μπορούν να αλλοιώσουν διακριτικά ή δραστικά τη συμπεριφορά ενός μοντέλου. Η δηλητηρίαση δεδομένων μπορεί να οδηγήσει σε εσφαλμένες ταξινομήσεις, μειωμένη απόδοση και, σε κρίσιμους τομείς όπως η υγειονομική περίθαλψη ή τα αυτόνομα οχήματα, σε καταστροφικές συνέπειες. Για παράδειγμα, ερευνητές διαπίστωσαν ότι η αντικατάσταση μόλις του 0,001% των δεδομένων εκπαίδευσης με ιατρική παραπληροφόρηση μπορεί να οδηγήσει σε επιβλαβή μοντέλα που παράγουν εσφαλμένες διαγνώσεις.
Μια άλλη σημαντική ευπάθεια είναι οι επιθέσεις «έγχυσης προτροπών» (prompt injection). Αυτή η επίθεση συμβαίνει όταν ένας εισβολέας δημιουργεί εισόδους που κάνουν το μοντέλο να αγνοήσει τις αρχικές του οδηγίες και να εκτελέσει ακούσιες ενέργειες. Το θεμελιώδες ζήτημα είναι ότι τα μοντέλα γλώσσας δεν μπορούν να διακρίνουν μεταξύ των αξιόπιστων οδηγιών του προγραμματιστή και των μη αξιόπιστων εισόδων του χρήστη, καθώς και τα δύο είναι απλώς κείμενο. Το Open Web Application Security Project (OWASP) έχει αναγνωρίσει την έγχυση προτροπών ως την κορυφαία ευπάθεια ασφαλείας στις εφαρμογές Μεγάλων Γλωσσικών Μοντέλων (LLM). Ένα πραγματικό παράδειγμα περιλαμβάνει ένα chatbot αντιπροσωπείας της Chevrolet που εξαπατήθηκε για να προσφέρει ένα αυτοκίνητο αξίας 76.000 δολαρίων για μόλις 1 δολάριο μέσω χειραγωγημένων προτροπών.
Πέρα από τη χειραγώγηση μοντέλων, η παραγωγική ΤΝ αποτελεί ένα ισχυρό εργαλείο για τους κυβερνοεγκληματίες. Μπορεί να χρησιμοποιηθεί για τη δημιουργία εξαιρετικά πειστικών μηνυμάτων ηλεκτρονικού ψαρέματος (phishing) και εκστρατειών κοινωνικής μηχανικής που μιμούνται τον τόνο και το ύφος νόμιμων επικοινωνιών, καθιστώντας τα δύσκολο να εντοπιστούν. Επιπλέον, η ΤΝ μπορεί να βοηθήσει στην ανάπτυξη πολυμορφικού κακόβουλου λογισμικού, το οποίο αλλάζει συνεχώς τον κώδικά του για να αποφύγει την ανίχνευση από τα παραδοσιακά λογισμικά προστασίας από ιούς. Το 2023, κυβερνοεγκληματίες στη Νοτιοανατολική Ασία εκμεταλλεύτηκαν τεχνολογίες παραγωγικής ΤΝ για να κλέψουν έως και 37 δισεκατομμύρια δολάρια μέσω διαφόρων παράνομων δραστηριοτήτων.
Η διαρροή ευαίσθητων πληροφοριών είναι ένας άλλος κρίσιμος κίνδυνος. Οι εργαζόμενοι ενδέχεται να εισάγουν ακούσια εμπιστευτικά δεδομένα, όπως πνευματική ιδιοκτησία ή μη δημοσιευμένες οικονομικές καταστάσεις, σε δημόσια εργαλεία GenAI. Αυτές οι πληροφορίες θα μπορούσαν στη συνέχεια να χρησιμοποιηθούν για την εκπαίδευση του μοντέλου και να διαρρεύσουν σε απαντήσεις σε άλλους χρήστες. Ένα τέτοιο περιστατικό συνέβη όταν υπάλληλοι της Samsung διέρρευσαν κατά λάθος εμπιστευτικές πληροφορίες χρησιμοποιώντας το ChatGPT, με αποτέλεσμα η εταιρεία να απαγορεύσει τη χρήση τέτοιων εργαλείων.
Για την αντιμετώπιση αυτών των πολύπλευρων κινδύνων, οι ειδικοί συνιστούν μια δομημένη προσέγγιση στη διακυβέρνηση της ΤΝ. Το Εθνικό Ινστιτούτο Προτύπων και Τεχνολογίας (NIST) των ΗΠΑ έχει αναπτύξει το Πλαίσιο Διαχείρισης Κινδύνων ΤΝ (AI RMF), ένα εθελοντικό οδηγό που έχει σχεδιαστεί για να βοηθήσει τους οργανισμούς να διαχειρίζονται τους κινδύνους που σχετίζονται με την τεχνητή νοημοσύνη. Το πλαίσιο αυτό προωθεί μια προσέγγιση που βασίζεται στον κίνδυνο και περιλαμβάνει τέσσερις βασικές λειτουργίες: Διακυβέρνηση, Χαρτογράφηση, Μέτρηση και Διαχείριση. Με την υιοθέτηση τέτοιων πλαισίων και την εφαρμογή αυστηρών ελέγχων ασφαλείας, οι οργανισμοί μπορούν να αξιοποιήσουν τις δυνατότητες της παραγωγικής ΤΝ, μετριάζοντας παράλληλα τους εγγενείς κινδύνους της και διασφαλίζοντας την υπεύθυνη ανάπτυξή της.