Cuando una máquina aprende a reconocer un gato
Enseñar a una máquina a reconocer un gato es como enseñarle millones de álbumes de fotos. Se le presenta una multitud de imágenes: algunas etiquetadas como "gato", otras como "no gato". El algoritmo mira cada imagen, sugiere una respuesta y luego se le dice si ha acertado o no.
Cada vez que se equivoca, ajusta sus cálculos para hacerlo mejor la próxima vez. Este vaivén se repite millones de veces hasta que la máquina detecta, por sí misma, las pistas que suelen aparecer cuando hay un gato: dos orejas puntiagudas, pupilas verticales, ojos brillantes, dibujos de pelaje.
En realidad, la máquina no entiende qué es un gato. Lo que hace es detectar regularidades estadísticas en los píxeles: zonas de color, contrastes, formas que a menudo se repiten juntas. Se trata de un aprendizaje puramente visual, sin contexto ni experiencia. Si el gato está de espaldas, en un dibujo o borroso, el sistema puede equivocarse. A veces basta con cambiar la textura del pelaje para que vea otra cosa. Así que el algoritmo "reconoce", pero no sabe. No percibe el calor corporal, ni los maullidos, ni la curiosidad de un animal vivo. En realidad, la máquina no aprende, sino que categoriza.
Cómo aprende un humano qué es un gato
Un niño no necesita millones de imágenes. Ve un gato, lo acaricia, le arañan, oye un maullido. Poco a poco, asocia la palabra "gato" a una serie de experiencias sensoriales: la suavidad del pelaje, el movimiento flexible, el calor del cuerpo, la reacción a la voz.
El aprendizaje humano es corporal, es decir, se produce a través del cuerpo, las emociones y las relaciones. También es social: le decimos "eso es un gato", le contamos historias, le enseñamos a distinguir entre un gato y un perro, un tigre o un dibujo animado. Los humanos aprenden rápido porque entienden el significado. No se limitan a sumar imágenes: conectan, generalizan e inventan.
Pueden reconocer un gato en un dibujo de sombras, en el dibujo de un niño o en una escultura abstracta. Saben que un gato es un ser vivo, que come, duerme y juega. Lo que aprenden no es una apariencia, sino una presencia, una forma de existir. El ser humano contextualiza, mientras que la máquina descontextualiza para identificar detalles clasificatorios.
Similitudes engañosas, diferencias fundamentales
A primera vista, los humanos y los algoritmos hacen lo mismo: reconocer formas. Pero ahí acaban las similitudes.
- La máquina clasifica por frecuencia, el humano entiende por experiencia.
- La máquina suma ejemplos, el ser humano teje significados.
- La máquina necesita grandes cantidades de imágenes, el ser humano aprende de unos pocos encuentros.
- La máquina permanece atrapada en el marco de sus datos; el humano se adapta, interpreta e improvisa.
Sobre todo, la máquina no reconoce en el sentido humano de la palabra: clasifica. No tiene memoria, ni emoción, ni responsabilidad. No ve un ser, ve un patrón que corresponde a una etiqueta. Aprender y vivir son estrictamente sinónimos; la máquina no tiene acceso a lo vivo, por lo que el término aprendizaje para un algoritmo es un abuso del lenguaje.
Lo que esta diferencia nos dice sobre el aprendizaje
Esta diferencia arroja luz sobre lo que realmente significa "aprender". Aprender no es sólo detectar regularidades: es dar sentido a una experiencia. El ser humano aprende emocionándose, sorprendiéndose y conmoviéndose. La máquina ajusta sus cálculos, pero no siente nada. Y sin embargo, en educación, son a menudo estas dimensiones sensibles las que anclan el conocimiento: la curiosidad, el miedo, la alegría de comprender, el encuentro con un ser vivo.
En la práctica, los algoritmos son poderosos: pueden ordenar miles de millones de imágenes, detectar patrones invisibles para el ojo humano, ayudar a diagnosticar una enfermedad o clasificar documentos. Pero cuando se trata de interpretar, sentir o contextualizar, el ojo humano sigue siendo insustituible.
Lo mismo ocurre con el aprendizaje: ninguna inteligencia artificial puede experimentar por nosotros el asombro o la emoción de un descubrimiento. Los humanos cuentan historias, los algoritmos cuentan números.
Una cuestión ética y delicada
Confiar a la máquina la tarea del reconocimiento significa también delegar en ella el poder de prestar atención. Decide por nosotros lo que merece ser visto, clasificado y conservado. Pero este poder se basa en datos construidos por humanos: pueden ser sesgados, incompletos o parciales.
Si un algoritmo sólo ha visto gatos blancos, no reconocerá los negros. Si las imágenes proceden de un único entorno cultural, pasará por alto otros contextos. Así que la cuestión no es sólo técnica: es ética y política. ¿Quién elige las imágenes? ¿Quién decide qué es "un gato"?
Para que la tecnología siga siendo una herramienta de emancipación, debemos conservar el control sobre lo que se aprende, sobre cómo la máquina devuelve los datos y sobre cómo los utilizamos. La transparencia de los modelos, la trazabilidad de los datos y la diversidad de las fuentes se convierten en exigencias democráticas.
Cultivar una diferencia fructífera
La diferencia entre algoritmos y humanos no es un defecto: es una complementariedad que hay que orquestar. Uno clasifica, el otro comprende. Uno calcula, el otro siente. Juntos, pueden ampliar nuestra perspectiva. El futuro de la educación y el trabajo no está en la sustitución, sino en el co-aprendizaje: aprender a ver con las máquinas, sin dejar de ver por uno mismo.
Sin embargo, esta cohabitación requiere vigilancia: cuanto más confiamos nuestras percepciones a los dispositivos automatizados, más nos arriesgamos a perder la finura de nuestro discernimiento sensible. Al dejar que la máquina reconozca por nosotros, podríamos olvidar cómo reconocer realmente, es decir, cómo emocionarnos con lo que vemos con nuestros propios sentidos.
La tentación de la pareidolia
Existe un fenómeno fascinante conocido como pareidolia: nuestra tendencia a ver caras en las nubes, en la luna o en el tronco de un árbol. Ilustra nuestra arraigada necesidad de dar forma y conexión.
Proyectamos significados sobre el mundo para hacerlo habitable. Los algoritmos también hacen a veces "pareidolia digital": creen ver un gato en un patrón de pelaje o una cara en un grupo de píxeles. La diferencia es que los humanos podemos verlo.
En el fondo, sabemos que la nube no tiene cara, y es esta conciencia la que hace que nuestro error sea motivo de asombro. El algoritmo no tiene dudas. Tampoco sueña. Quizá el reto para los próximos años sea mantener viva esta brecha entre cálculo y significado, entre reconocimiento y asombro.
Aprender a aprender con las máquinas significa aprender a no ser como ellas, a preservar nuestra capacidad de atención, imaginación y conexión.
Ilustración: Vilius Kukanauskas - Pixabay
Referencias
CNIL. (2017). Cómo permitir que los humanos mantengan el control? Los desafíos éticos de los algoritmos y la inteligencia artificial. París: Commission nationale de l'informatique et des libertés.
Geirhos, R., Rubisch, P., Michaelis, C., Bethge, M., Wichmann, F. A., & Brendel, W. (2019). Las CNN entrenadas en ImageNet están sesgadas hacia la textura; aumentar el sesgo de forma mejora la precisión y la robustez. Conferencia internacional sobre el aprendizaje de representaciones (ICLR).
Immordino-Yang, M. H., & Damasio, A. (2007). We feel, therefore we learn: The relevance of affective and social neuroscience to education. Mente, cerebro y educación, 1(1), 3-10.
Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). Clasificación de ImageNet con redes neuronales convolucionales profundas. Advances in Neural Information Processing Systems (NeurIPS), 25, 1097-1105.
Lake, B. M., Ullman, T. D., Tenenbaum, J. B. y Gershman, S. J. (2017). Construyendo máquinas que aprenden y piensan como personas. Ciencias del comportamiento y del cerebro, 40, e253.
LeCun, Y., Bengio, Y., y Hinton, G. (2015). Deep learning (Aprendizaje profundo). Nature, 521(7553), 436-444.
Villani, C. (2018). Donner un sens à l'intelligence artificielle: Pour une stratégie nationale et européenne. París: La Documentation française.
Varela, F. J., Thompson, E., & Rosch, E. (1993). L'inscription corporelle de l'esprit: sciences cognitives et expérience humaine. París: Seuil.
Ver más artículos de este autor