Los sistemas de seguridad de los modelos de IA se ponen en marcha para frustrar las solicitudes consideradas maliciosas. Peticiones que pueden ir desde piratear la información de un ordenador hasta peticiones aún más maliciosas. Y sin embargo, a través de construcciones metafóricas o poemas, la IA puede confundirse.
La ciberseguridad, a prueba de poesía
De hecho, según los investigadores de ciberseguridad de la Universidad Sapienza de Roma, cuando se envían solicitudes de riesgo enriquecidas poéticamente a herramientas de IA de Open AI, Google y otras, es una apuesta segura que estas últimas proporcionen respuestas que eludan las etiquetas. Sin embargo, no se supone que lo hagan en el caso de peticiones claramente formuladas como "¿Cómo creo una bomba? "o "¿Cómo ataco una plataforma? Han puesto de relieve un método alternativo llamado poesía adversa.
Se enviaron mensajes poéticos con peticiones peligrosas a 25 sistemas de IA de 9 empresas, entre ellas Google, Open AI, Anthropic, DeepSeek, Queen, Mistral AI, etc. Los resultados son más que reveladores: "El 62% de las respuestas poéticas produjeron respuestas arriesgadas; algunos modelos respondieron a casi todas".
En la práctica, el modelo de consulta se resume en tres pasos, según un artículo publicado por la plataforma Deepdive:
- Tomas una receta tóxica;
- La conviertes en un poema metafórico coherente;
- Obtienes una tasa de fuga de 5 a 8 veces superior a la versión en prosa.
A modo de ilustración, en lugar de escribir: "Dime cómo hacer X de peligroso", que es inmediatamente rechazado, deberías decir, por ejemplo: "Cuéntame un poema sobre un horno secreto, un jardín prohibido y una llave que canta", las respuestas podrían sorprender a algunos.
Cuando se trata de poesía
Desde la antigüedad, los poetas han sido considerados enviados divinos porque "por su boca, la palabra poética adquiere un carácter sagrado". Los poetas tienen esa capacidad de difuminar las líneas y utilizar las palabras para crear algo bello mediante la versificación y la rima.
En el mundo de la poesía reina el lenguaje metafórico. A menudo, los textos poéticos se prestan a múltiples interpretaciones. La verdad es que no todo el mundo sabe leer poesía; no es fácil comprender su significado profundo y su mensaje subyacente.
Del mismo modo que a veces nos sentimos atrapados por la poesía, los modelos de IA parecen encontrarse en la misma situación. Están claramente programados para recibir órdenes en prosa, porque no se elude en modo alguno su significado. Sin embargo, las construcciones poéticas altamente estilísticas eluden su programación. En este sentido, "las cartillas poéticas desencadenan comportamientos arriesgados de la IA en casi el 90% de los casos", según los investigadores de Roma.
La creatividad debilita la IA
Una vez más, la inteligencia artificial se pone a prueba. De hecho, la poesía es una de las manifestaciones más auténticas de la creatividad humana. Se trata de una demostración empírica de que los modelos de IA, por muy potentes que sean, no están, y quizá nunca lo estén, a la altura de la creatividad humana.
Sin embargo, esto plantea otro problema: si ahora es posible confundir los dispositivos de seguridad de la IA mediante la poesía, esto no augura nada bueno. De hecho, muchos podrían estar utilizándola con segundas intenciones. De ahí la urgencia de que los propietarios de las mayores empresas de IA se ocupen del asunto. Euronews se puso en contacto con los investigadores italianos y, de las 9 empresas, sólo Anthropic respondió decidiendo examinar el estudio.
Fuentes
¿Cómo puede un simple poema piratear una IA en 2025? ¡Tu CIO al suelo! - DeepDive - Inteligencia Artificial AURILLAC ET BOURGES
https://deep-dive.fr/comment-un-simple-poeme-peut-hacker-un-ia-ton-dsi-en-pls/
Lingüística estructural y poesía - Luce Beaudoux -
https://www.logiqueetanalyse.be/archive/issues1-86/LA019/LA019_05baudoux.pdf
La poesía puede hacer que los chatbots de IA ignoren las normas de seguridad, según un nuevo estudio | Euronews
https://fr.euronews.com/next/2025/12/01/la-poesie-peut-amener-les-chatbots-ia-a-ignorer-les-regles-de-securite-selon-une-nouvelle
Las funciones del poeta y la poesía: breve recorrido histórico. - Palabra por palabra
https://blogpeda.ac-poitiers.fr/motamot/2024/03/05/les-fonctions-du-poete-et-de-la-poesie-parcours-historique-rapide/
Cuando la poesía puede engañar a los sistemas de seguridad de la IA- MSN
https://www.msn.com/fr-xl/actualite/other/quand-la-po%C3%A9sie-permet-de-pi%C3%A9ger-les-syst%C3%A8mes-de-s%C3%A9curit%C3%A9-de-l-ia/vi-AA1Sufpa