Aprender um gato

O que o algoritmo vê, o que o ser humano entende

Quando uma máquina aprende a reconhecer um gato

Ensinar uma máquina a reconhecer um gato é um pouco como mostrar-lhe milhões de álbuns de fotografias. É-lhe apresentada uma multiplicidade de imagens: algumas com a etiqueta "gato", outras "não gato". O algoritmo olha para cada imagem, sugere uma resposta e depois é-lhe dito se estava certo ou errado.

Sempre que comete um erro, ajusta os seus cálculos para fazer melhor da próxima vez. Este vai-e-vem repete-se milhões de vezes até que a máquina detecta, por si só, as pistas que surgem frequentemente quando há um gato: duas orelhas pontiagudas, pupilas verticais, olhos brilhantes, padrões de pelo.

Na realidade, a máquina não compreende o que é um gato. A máquina identifica as regularidades estatísticas nos pixéis: áreas de cor, contrastes, formas que se repetem frequentemente. Trata-se de uma aprendizagem puramente visual, sem contexto ou experiência. Se o gato estiver de costas, num desenho, ou desfocado, o sistema pode cometer um erro. Por vezes, basta mudar a textura do pelo para que o sistema veja outra coisa. Portanto, o algoritmo "reconhece", mas não sabe. Não percebe o calor do corpo, o miar ou a curiosidade de um animal vivo. Na realidade, a máquina não aprende, categoriza.

Como é que um humano aprende o que é um gato

Uma criança não precisa de milhões de imagens. Ela vê um gato, acaricia-o, é arranhada, ouve um miado. Associa gradualmente a palavra "gato" a uma série de experiências sensoriais: a suavidade do pelo, o movimento flexível, o calor do corpo, a reação à voz.

A aprendizagem humana é incorporada, ou seja, tem lugar através do corpo, das emoções e das relações. É também social: dizemos-lhe "isto é um gato", contamos-lhe histórias, ensinamo-lo a distinguir entre um gato e um cão, um tigre ou um desenho animado. Os seres humanos aprendem rapidamente porque compreendem o significado. Não se limitam a somar imagens: ligam, generalizam e inventam.

É capaz de reconhecer um gato num desenho de uma sombra, num desenho de uma criança ou numa escultura abstrata. Sabem que um gato é um ser vivo, que come, dorme e brinca. O que aprendem não é uma aparência, mas uma presença, uma forma de existir. O humano contextualiza enquanto a máquina descontextualiza para identificar pormenores de classificação.

Semelhanças enganadoras, diferenças fundamentais

À primeira vista, os humanos e os algoritmos fazem a mesma coisa: reconhecem formas. Mas é aí que a semelhança acaba.

A máquina classifica por frequência, o ser humano compreende por experiência.
A máquina soma exemplos, o ser humano tece significados.
A máquina precisa de grandes quantidades de imagens, o ser humano aprende com alguns encontros.
A máquina fica presa ao quadro dos seus dados, o homem adapta-se, interpreta e improvisa.

Acima de tudo, a máquina não reconhece no sentido humano da palavra: classifica. Não tem memória, não tem emoção, não tem responsabilidade. Não vê um ser; vê um padrão que corresponde a uma etiqueta. Aprender e viver são estritamente sinónimos; a máquina não tem acesso ao vivo, pelo que o termo aprender para um algoritmo é uma utilização incorrecta da linguagem.

O que é que esta diferença nos diz sobre a aprendizagem

Esta diferença esclarece o verdadeiro significado de "aprendizagem". Aprender não é apenas detetar regularidades: é dar sentido a uma experiência. Os seres humanos aprendem quando são tocados, surpreendidos e comovidos. A máquina ajusta os seus cálculos, mas não sente nada. E, no entanto, na educação, são muitas vezes estas dimensões sensíveis que ancoram o conhecimento: a curiosidade, o medo, a alegria de compreender, o encontro com um ser vivo.

Em termos práticos, os algoritmos são poderosos: podem ordenar milhares de milhões de imagens, detetar padrões invisíveis ao olho humano, ajudar a diagnosticar uma doença ou classificar documentos. Mas quando se trata de interpretar, sentir ou contextualizar, o olho humano continua a ser insubstituível.

O mesmo acontece com a aprendizagem: nenhuma inteligência artificial pode sentir o espanto ou a emoção de uma descoberta por nós. Os humanos contam histórias, os algoritmos contam números.

Uma questão ética e sensível

Confiar à máquina a tarefa de reconhecimento significa também delegar-lhe o poder de prestar atenção. Ela decide por nós o que merece ser visto, selecionado e guardado. Mas este poder baseia-se em dados construídos por humanos: podem ser tendenciosos, incompletos ou parciais.

Se um algoritmo só viu gatos brancos, não conseguirá reconhecer os gatos pretos. Se as imagens forem provenientes de um único ambiente cultural, não reconhecerá outros contextos. Assim, a questão não é apenas técnica: é ética e política. Quem escolhe as imagens? Quem decide o que é "um gato"?

Para que a tecnologia continue a ser uma ferramenta de emancipação, temos de manter o controlo sobre o que é aprendido, como a máquina devolve os dados e como os utilizamos. A transparência dos modelos, a rastreabilidade dos dados e a diversidade das fontes tornam-se exigências democráticas.

Cultivar uma diferença frutuosa

A diferença entre algoritmos e humanos não é um defeito: é uma complementaridade que precisa de ser orquestrada. Um classifica, o outro compreende. Um calcula, o outro sente. Juntos, podem alargar a nossa perspetiva. O futuro da educação e do trabalho não está na substituição, mas na co-aprendizagem: aprender a ver com as máquinas, sem deixar de ver por si próprio.

No entanto, esta coabitação exige vigilância: quanto mais confiarmos as nossas percepções a dispositivos automatizados, mais nos arriscamos a perder a delicadeza do nosso discernimento sensível. Ao deixarmos que a máquina reconheça por nós, podemos esquecer-nos de reconhecer verdadeiramente, ou seja, de nos sentirmos tocados por aquilo que vemos com os nossos próprios sentidos.

A tentação da pareidolia

Há um fenómeno fascinante conhecido como pareidolia: a nossa tendência para ver rostos nas nuvens, na lua ou no tronco de uma árvore. Ilustra a nossa necessidade profunda de dar forma e ligação.

Projectamos significado no mundo para o tornar habitável. Os algoritmos também fazem, por vezes, "pareidolia digital": pensam que vêem um gato num padrão de pelo ou um rosto num conjunto de píxeis. A diferença é que os humanos conseguem ver isso.

No fundo, sabemos que a nuvem não tem rosto, e é essa consciência que faz do nosso erro uma ocasião para nos maravilharmos. O algoritmo não tem dúvidas. Nem sonha. Talvez o desafio para os próximos anos seja manter vivo este fosso entre o cálculo e o significado, entre o reconhecimento e o espanto.

Aprender a aprender com as máquinas significa aprender a não ser como elas, a preservar a nossa capacidade de atenção, imaginação e ligação.

Ilustração: Vilius Kukanauskas - Pixabay

Referências

CNIL. (2017). Como permitir que os humanos mantenham o controlo? Os desafios éticos dos algoritmos e da inteligência artificial. Paris: Comissão Nacional da Informática e das Liberdades.

Geirhos, R., Rubisch, P., Michaelis, C., Bethge, M., Wichmann, F. A., & Brendel, W. (2019). CNNs treinados em ImageNet são tendenciosos em relação à textura; aumentar o viés de forma melhora a precisão e a robustez. Conferência Internacional sobre Representações de Aprendizagem (ICLR).

Immordino-Yang, M. H., & Damasio, A. (2007). We feel, therefore we learn: The relevance of affective and social neuroscience to education. Mente, Cérebro e Educação, 1(1), 3-10.

Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). Classificação do ImageNet com redes neurais convolucionais profundas. Avanços em sistemas de processamento de informações neurais (NeurIPS), 25, 1097-1105.

Lake, B. M., Ullman, T. D., Tenenbaum, J. B., & Gershman, S. J. (2017). Construindo máquinas que aprendem e pensam como pessoas. Ciências do Comportamento e do Cérebro, 40, e253.

LeCun, Y., Bengio, Y., & Hinton, G. (2015). Aprendizagem profunda. Nature, 521(7553), 436-444.

Villani, C. (2018). Donner un sens à l'intelligence artificielle: Pour une stratégie nationale et européenne. Paris: La Documentation française.

Varela, F. J., Thompson, E., & Rosch, E. (1993). L'inscription corporelle de l'esprit: sciences cognitives et expérience humaine. Paris: Seuil.

Veja mais artigos deste autor