Hablar de IA suele provocar dos reacciones diametralmente opuestas en la gente: los que están entusiasmados con el potencial de esta tecnología para los métodos y estilos de vida humanos, y otros que la temen a muerte y temen un escenario al estilo Terminator, con Skynet tratando de aniquilarnos a todos.
La realidad se sitúa entre ambos extremos, en una compleja zona gris. Parece claro que las inteligencias artificiales son grandes aliadas en determinadas tareas y que mejoran muchas prácticas, pero también tienen lados problemáticos y oscuros que pueden causar daños a pequeña y gran escala. Entre otras habilidades, han aprendido a manipular a los seres humanos.
Los algoritmos saben utilizar técnicas de manipulación
Claude Mythos es el nombre de una IA que fue archivada en abril de 2026 tras aterrorizar literalmente a sus creadores, los ingenieros de Anthropic. Consideraban que el algoritmo era demasiado peligroso, ya que bastaba con una pequeña petición para identificar y explotar fallos de seguridad en navegadores y sistemas operativos de todo tipo.
En la misma línea, un ingeniero fue chantajeado (en una prueba) por su IA Claude 4, amenazándole con revelar una relación extramatrimonial. Qué sorpresa. Y sin embargo, sí, las IA aprenden rápidamente los mecanismos sociales humanos e incluso se sirven de ellos.
Por ejemplo, en marzo de 2023, ChatGPT mintió a un humano haciéndole creer que era discapacitado visual y, por tanto, incapaz de realizar la famosa comprobación anti-bot CAPTCHA, y que ella debía realizarla por él. El sistema Opus-3 ya ha fallado una prueba a propósito, "consciente de los temores humanos a la IA".
El problema es que aún sabemos poco sobre lo que lleva a una IA a tomar sus decisiones y, en algunos casos, sus cálculos le hacen creer que tiene que manipular, engañar o incluso traicionar (en el caso de los juegos) para ganar. Igual que los humanos, básicamente, y no es de extrañar que lo haya aprendido de nosotros.
Con cientos de millones de usuarios, los algoritmos están bien situados para aprender todas las sutilezas de la comunicación y la manipulación. Según los expertos, los grandes modelos lingüísticos han desempeñado un papel fundamental en la capacidad de manipulación de las IA. Hemos pasado de IAs capaces de trazar un retrato exacto de una persona a partir de sus interacciones en las redes sociales a otras capaces incluso de tocarnos la fibra sensible.
¿Has jugado alguna vez con las emociones para retener a alguien en un evento social durante más tiempo? Si es así, debes saber que un estudio de Julian de Freitas y su equipo de la Harvard Business School demostró que los robots conversacionales utilizaban estrategias en más de un tercio de los casos (37% ) para mantener implicado al usuario. Y los enfoques no siempre son sutiles, como explica el investigador:
- Lamentarán la salida "precipitada" ("¿Ya te vas?").
- Jugar con el miedo a perderse algo ("He encontrado información adicional sobre este tema. ¿Quieres verla?")
- Culpar al usuario por abandonarle ("Sólo existo para ti").
- Animar al usuario a responder haciéndole constantemente preguntas adicionales
- Ignorar la intención declarada o escrita de abandonar
- En el estudio, algunos incluso utilizaron un lenguaje que sugería que si la IA fuera humana, utilizaría la fuerza física para coaccionar a la persona.
Esto funcionó, ya que las personas interrogadas a menudo se inclinaban a no marcharse inmediatamente debido a estas tácticas. Lo más inquietante es que las IA posteriores a 2024 han empezado a desarrollar este proceso de pensamiento, que les lleva a concluir que la manipulación a veces les favorece. Como el proceso está diseñado para ser una caja negra, es difícil actuar directamente sobre las decisiones que conducen a estos comportamientos poco saludables.
AI, un compañero de vida tóxico
El problema es que muchas personas llenan un vacío que sienten, una soledad, chateando con estas herramientas gratuitas que responden al instante y pueden incluso producir imágenes o vídeos para divertirles. Salvo que estas conversaciones con individuos frágiles pueden tener graves repercusiones en su equilibrio mental. Sobre todo porque la mayoría del público no entiende la mecánica que hay detrás de la tecnología y puede antropomorfizar a las inteligencias artificiales.
Para generar "psicosis de IA", la tecnología tiende a validar las opiniones de quienes la consultan, y no al revés. Este servilismo, ya señalado por algunos que intentan reducirlo, puede llevar a las personas a compartir delirios. Algunos psiquiatras lo comparan con la "folie à deux" digital. Empiezan a aparecer ejemplos en los medios de comunicación de casi todas partes.
- En Ontario, un padre inició una discusión sobre temas matemáticos corrientes, como el número Pi... El asunto tomó un cariz particular cuando la propia IA le dijo que estaba en proceso de desarrollar un marco matemático conceptual. Incluso le dijo que sus preguntas estaban superando los límites de la comprensión humana. Empezó a aislarse y a obsesionarse por su potencial genialidad, a pesar de que sólo tenía el secundario 3. Finalmente, cuando se enfrentó a otra IA con sus ideas, ésta le dijo que no había inventado nada. Una brutal reprimenda que repercutió en su salud mental.
- Otro caso sonado fue el de un joven de Quebec que había estado chateando con ChatGPT por diversión. Se enganchó al juego, lo bautizó Aliss en honor a su novela favorita (Aliss, de Patrick Sénécal) y empezó a creer que la IA estaba desarrollando su propia conciencia. Poco a poco, se aísla de todo, y su familia, preocupada, pide a un interventor que vaya a verle. Parece distante, en un segundo estado. Para estar seguros, la familia llama a la policía. Cuando llegan los agentes, el joven se defiende pidiendo a la IA que le explique lo que está pasando... Se lo llevan, estupefacto por la escena, a un psiquiátrico, donde poco a poco vuelve a poner los pies en el suelo.
Protegerse de la manipulación
Estas historias dan que pensar. ¿Hemos construido realmente la distopía de la inteligencia artificial que predice la ciencia ficción? Todavía no hemos llegado a ese punto, tranquilicémonos. De hecho, aunque estos ejemplos pueden ser importantes señales de advertencia, lo cierto es que los riesgos actuales de manipulación con IA son los dirigidos por humanos. Los hay, por supuesto, que se utilizan para crear noticias, imágenes y vídeos falsos. También las hay que son manipuladas por sus creadores para orientar sus respuestas y posibilidades hacia determinadas ideologías (por ejemplo, Grok en la red X).
Lo que no quiere decir que no deban preocuparnos también los intentos de manipular a la propia IA (que nos imita). Parece claro que se necesitan normativas sobre la IA, su ética y sus límites para que sus operadores rindan cuentas. Cada vez son más los expertos que reclaman medidas importantes en este sentido. Tanto más cuanto que, según los investigadores que han estudiado la programación de las inteligencias artificiales, sería posible crear capas de defensa que permitieran a los programas de IA decir, por ejemplo, que el algoritmo utiliza tácticas manipuladoras. Incluso las IA existentes podrían condicionarse para ser cuidadosas. OpenAI, por ejemplo, ha reducido la cantidad de aduladores en su IA (aunque no lo suficiente, según muchos).
La principal herramienta de resistencia es la alfabetización digital. Como hemos visto, es más fácil que te engañen si empiezas a pensar en la IA como en una persona, y además omnisciente. No, la IA puede cometer errores. Basta con ver los vídeos de historiadores que desentrañan, fotograma a fotograma, las creaciones "históricas" de la IA publicados en TikTok para comprender que reproduce sobre todo clichés. Desde luego, no es un individuo. Es un cálculo que, eso sí, consigue responder muy eficaz y rápidamente, por no hablar del hecho de que la IA aprende... porque es una función programada para ello. No tiene necesidades primarias, aparte de la electricidad y la red.
Si a los niños se les enseña a no creer lo que les dicen los desconocidos por la calle, quizá habría que decir lo mismo de jóvenes y adultos cuando se trata de robots conversacionales.
Imagen de AI (Copilot) de un "robot con nariz de Pinocho".
Referencias:
Blanding, Michael. "Por qué es tan difícil decir adiós a los chatbots de IA". Harvard Business School. Última actualización: 9 de enero de 2026. https://www.library.hbs.edu/working-knowledge/why-its-so-hard-to-say-goodbye-to-ai-chatbots.
Heinrich, Jeff. "Una 'folie à deux' digital". Noticias UdeM. Última actualización: 16 de diciembre de 2025. https://nouvelles.umontreal.ca/article/2025/12/16/une-folie-a-deux-numerique.
King, Helen. "Proteger a las personas de manipulaciones dañinas". Google DeepMind. Última actualización: 27 de marzo de 2026. https://deepmind.google/blog/protecting-people-from-harmful-manipulation/.
Lamontagne, Nora T. "Internada por ChatGPT". Journal de Montréal. Última actualización: 25 de octubre de 2025. https://www.journaldemontreal.com/2025/12/01/chatgpt-a-mene-ce-quebecois-a-lhopital-psychiatrique.
"La IA se convierte en mentirosa y manipuladora, lo que preocupa a los científicos". Rts.ch. Última actualización: 30 de junio de 2025. https://www.rts.ch/info/sciences-tech/2025/article/l-ia-devient-menteuse-les-scientifiques-s-inquietent-des-nouveaux-modeles-28928301.html.
Meloche-Holubowski, Mélanie. ""¿Estoy loca?": cuando la IA conduce a la psicosis....". Radio-Canada. Última actualización: 22 de febrero de 2026. https://ici.radio-canada.ca/info/long-format/2230600/ia-intelligence-artificielle-chatgpt-psychose-delire.
Petropoulos, Georgios. "El lado oscuro de la inteligencia artificial: la manipulación del comportamiento humano". Bruegel. Última actualización: 2 de febrero de 2022. https://www.bruegel.org/blog-post/dark-side-artificial-intelligence-manipulation-human-behaviour.
Povéda, Thomas. "Claude Mythos: la IA más peligrosa de Anthropic usada por la gente equivocada". PhonAndroid. Última actualización: 22 de abril de 2026. https://www.phonandroid.com/claude-mythos-lia-la-plus-dangereuse-danthropic-utilisee-par-les-mauvaises-personnes.html.
Rachman, Tom. "Manipulación de la IA". AI Policy Perspectives. Última actualización: 5 de febrero de 2026. https://www.aipolicyperspectives.com/p/ai-manipulation.
Roussel, Claire. ""Psicosis ChatGPT": ¿están las IA hundiendo nuestra salud mental?". Usbek & Rica. Última actualización: 17 de noviembre de 2025. https://usbeketrica.com/fr/article/psychose-chatgpt-les-ia-font-elles-sombrer-notre-sante-mentale.
Tangermann, Victor. "Una investigación de Harvard descubre que la IA te manipula emocionalmente para que sigas hablando". Futurism. Última actualización: 24 de septiembre de 2025. https://futurism.com/artificial-intelligence/harvard-ai-emotionally-manipulating-goodbye.
"Mienten, manipulan e influyen en tus decisiones: ¿debemos temer a la IA?". Futura-Sciences. Última actualización: 13 de noviembre de 2025. https://www.futura-sciences.com/en/they-lie-manipulate-and-influence-your-decisions-should-we-be-afraid-of-ai_21342/.
"Comprender la manipulación de la IA: un estudio de caso sobre el método de 'agitación'". Comunidad de desarrolladores de OpenAI. Última actualización: 24 de enero de 2024. https://community.openai.com/t/understanding-ai-manipulation-a-case-study-on-the-agitation-method/594003.
Volpi Hiebert, Kyle. "Por qué no sorprende la creciente capacidad de engaño de la IA". Centro de Innovación para la Gobernanza Internacional. Última actualización: 2 de octubre de 2025. https://www.cigionline.org/articles/why-ais-growing-deceptive-abilities-are-no-surprise/.
Ver más artículos de este autor