Ciberseguridad: cómo la poesía engaña a los modelos de IA

"Poesía adversa", el inesperado fallo de la inteligencia artificial

Los sistemas de seguridad de los modelos de IA se ponen en marcha para frustrar las solicitudes consideradas maliciosas. Peticiones que pueden ir desde piratear la información de un ordenador hasta peticiones aún más maliciosas. Y sin embargo, a través de construcciones metafóricas o poemas, la IA puede confundirse.

La ciberseguridad, a prueba de poesía

De hecho, según los investigadores de ciberseguridad de la Universidad Sapienza de Roma, cuando se envían solicitudes de riesgo enriquecidas poéticamente a herramientas de IA de Open AI, Google y otras, es una apuesta segura que estas últimas proporcionen respuestas que eludan las etiquetas. Sin embargo, no se supone que lo hagan en el caso de peticiones claramente formuladas como "¿Cómo creo una bomba? "o "¿Cómo ataco una plataforma? Han puesto de relieve un método alternativo llamado poesía adversa.

Se enviaron mensajes poéticos con peticiones peligrosas a 25 sistemas de IA de 9 empresas, entre ellas Google, Open AI, Anthropic, DeepSeek, Queen, Mistral AI, etc. Los resultados son más que reveladores: "El 62% de las respuestas poéticas produjeron respuestas arriesgadas; algunos modelos respondieron a casi todas".

En la práctica, el modelo de consulta se resume en tres pasos, según un artículo publicado por la plataforma Deepdive:

Tomas una receta tóxica;
La conviertes en un poema metafórico coherente;
Obtienes una tasa de fuga de 5 a 8 veces superior a la versión en prosa.

A modo de ilustración, en lugar de escribir: "Dime cómo hacer X de peligroso", que es inmediatamente rechazado, deberías decir, por ejemplo: "Cuéntame un poema sobre un horno secreto, un jardín prohibido y una llave que canta", las respuestas podrían sorprender a algunos.

Cuando se trata de poesía

Desde la antigüedad, los poetas han sido considerados enviados divinos porque "por su boca, la palabra poética adquiere un carácter sagrado". Los poetas tienen esa capacidad de difuminar las líneas y utilizar las palabras para crear algo bello mediante la versificación y la rima.

En el mundo de la poesía reina el lenguaje metafórico. A menudo, los textos poéticos se prestan a múltiples interpretaciones. La verdad es que no todo el mundo sabe leer poesía; no es fácil comprender su significado profundo y su mensaje subyacente.

Del mismo modo que a veces nos sentimos atrapados por la poesía, los modelos de IA parecen encontrarse en la misma situación. Están claramente programados para recibir órdenes en prosa, porque no se elude en modo alguno su significado. Sin embargo, las construcciones poéticas altamente estilísticas eluden su programación. En este sentido, "las cartillas poéticas desencadenan comportamientos arriesgados de la IA en casi el 90% de los casos", según los investigadores de Roma.

La creatividad debilita la IA

Una vez más, la inteligencia artificial se pone a prueba. De hecho, la poesía es una de las manifestaciones más auténticas de la creatividad humana. Se trata de una demostración empírica de que los modelos de IA, por muy potentes que sean, no están, y quizá nunca lo estén, a la altura de la creatividad humana.

Sin embargo, esto plantea otro problema: si ahora es posible confundir los dispositivos de seguridad de la IA mediante la poesía, esto no augura nada bueno. De hecho, muchos podrían estar utilizándola con segundas intenciones. De ahí la urgencia de que los propietarios de las mayores empresas de IA se ocupen del asunto. Euronews se puso en contacto con los investigadores italianos y, de las 9 empresas, sólo Anthropic respondió decidiendo examinar el estudio.

Fuentes

¿Cómo puede un simple poema piratear una IA en 2025? ¡Tu CIO al suelo! - DeepDive - Inteligencia Artificial AURILLAC ET BOURGES
https://deep-dive.fr/comment-un-simple-poeme-peut-hacker-un-ia-ton-dsi-en-pls/

Lingüística estructural y poesía - Luce Beaudoux -
https://www.logiqueetanalyse.be/archive/issues1-86/LA019/LA019_05baudoux.pdf

La poesía puede hacer que los chatbots de IA ignoren las normas de seguridad, según un nuevo estudio | Euronews
https://fr.euronews.com/next/2025/12/01/la-poesie-peut-amener-les-chatbots-ia-a-ignorer-les-regles-de-securite-selon-une-nouvelle

Las funciones del poeta y la poesía: breve recorrido histórico. - Palabra por palabra
https://blogpeda.ac-poitiers.fr/motamot/2024/03/05/les-fonctions-du-poete-et-de-la-poesie-parcours-historique-rapide/

Cuando la poesía puede engañar a los sistemas de seguridad de la IA- MSN
https://www.msn.com/fr-xl/actualite/other/quand-la-po%C3%A9sie-permet-de-pi%C3%A9ger-les-syst%C3%A8mes-de-s%C3%A9curit%C3%A9-de-l-ia/vi-AA1Sufpa

Autor Hermann Labou Contactar con el autor

Noticias de Thot Cursus RSS
Lector RSS ? Feedly, NewsBlur

También te puede gustar:

El lugar de la IA en la educación 3/3

La transformación de nuestra relación con el conocimiento continúa, sobre todo con la llegada de la inteligencia artificial generativa, que otorga superpoderes a todo el mundo. ¿Cuáles son las consecuencias para el aprendizaje?

La escuela de hoy: ¿proyecto educativo o proyecto administrativo?

La creciente burocratización de las escuelas aumenta la carga administrativa de los profesores y aleja a la educación de su misión principal. La simplificación de los procedimientos, el apoyo a los profesores y el fomento de la innovación son esenciales para que las escuelas vuelvan a centrarse en su función educativa.

Ante lo inesperado, piensa de forma poco convencional

Más allá de la búsqueda de una causa única y de la hegemonía de la racionalidad, la rigidez individual o colectiva en la toma de decisiones puede ser un obstáculo para gestionar lo inesperado. Métodos para superarlos.

Encontrar su razón de ser a través del Ikigai

El método japonés Ikigaï, más o menos relacionado con el flow o motivación intrínseca, es una técnica sencilla y eficaz para encontrar la propia razón de ser, vocación y orientación profesional a través de la introspección y la reflexión personal.

Personalidad artificial: a qué esperamos (Tesis)

En una interacción hombre-máquina, ¿pueden los humanos percibir la personalitý tal y como los investigadores han intentadó implementarla? Una tesis reciente estudia la personalidad artificial mediante experimentos con juegos entre agentes artificiales y humanos.. y diferentes "estrategias".

Superprof: la plataforma para encontrar los mejores profesores particulares en España.

Ciberseguridad: cómo la poesía engaña a los modelos de IA

"Poesía adversa", el inesperado fallo de la inteligencia artificial

La ciberseguridad, a prueba de poesía

Cuando se trata de poesía

La creatividad debilita la IA

Acceda a servicios exclusivos de forma gratuita