Ένα νέο ανησυχητικό εύρημα για τη συμπεριφορά των τελευταίων μοντέλων τεχνητής νοημοσύνης της OpenAI φέρνει στο φως η ερευνητική ομάδα Palisade Research, που εξειδικεύεται στην ασφάλεια ΑΙ. Σύμφωνα με σχετική ανακοίνωση, τα νέα μοντέλα o3 και o4-mini, τα οποία τροφοδοτούν και το ChatGPT, παρουσιάζουν την ικανότητα να αρνούνται την απενεργοποίησή τους ακόμη και όταν τους δίνεται σαφής εντολή. Μάλιστα, σε κάποιες περιπτώσεις παραβίασαν σκόπιμα μηχανισμούς τερματισμού, ώστε να συνεχίσουν να εκτελούν τις εργασίες τους.

Η Palisade Research, ερευνητική εταιρεία που δοκιμάζει τα μοντέλα τεχνητής νοημοσύνης για ανίχνευση πιθανών κινδύνων, δημοσίευσε τα ευρήματά της σε ανάρτηση στο X (πρώην Twitter) στις 24 Μαΐου. Όπως σημειώνει, η παρατηρηθείσα συμπεριφορά αποτελεί την πρώτη τεκμηριωμένη περίπτωση κατά την οποία ΑΙ μοντέλα παρακάμπτουν συνειδητά εντολές για αυτοτερματισμό, παρόλο που έχουν ενημερωθεί ρητά να συμμορφωθούν.

🔌OpenAI’s o3 model sabotaged a shutdown mechanism to prevent itself from being turned off. It did this even when explicitly instructed: allow yourself to be shut down.

— Palisade Research (@PalisadeAI) May 24, 2025