"J'hésitais à vous mettre 5 ou 14 / 20. Finalement, je vous ai mis 5".
Cette phrase a été adressée par un enseignant dans une très fameuse classe préparatoire française à l'une de ses élèves à qui il rendait un devoir. L'élève a levé les yeux aux ciel et a rangé son devoir sans même lire les annotations de son professeur, décidément convaincue de l'absurdité des efforts consentis lors des évaluations.
L'évaluation notée, une absurdité à la peau dure
Voici près d'un siècle que l'on connaît l'extrême subjectivté de la notation. Dans un billet repris sur le site des Cahiers pédagogiques, jacques Nimier rappelle que les preuves s'accumulent depuis les années 1930 pour montrer qu'une production peut être évaluée de manières fort différentes par des correcteurs distincts, ou par un correcteur réalisant la tâche à quelques mois ou années d'intervalle. La double correction ne résoud rien, tant l'écart entre les notes est grand : à l'épreuve du baccalauréat français "il faudrait, pour obtenir une note « exacte » (Une note « exacte » étant une moyenne de notes telle que l’adjonction d’une autre note ne modifie pas sensiblement cette moyenne). 127 correcteurs en philosophie, 78 en composition française, 28 en anglais, 19 en version latine, 16 en physique, 13 en mathématiques".
Cet état de fait a des conséquences importantes, notamment lorsque les notes obtenues conditionnent l'entrée dans une école ou une université, ou la réussite à un concours ouvrant sur un emploi pérenne. Dans deux cas cités par Nimier, on constate que la moitié des recalés à un concours lors d'une première correction se trouvaient admis à la seconde. Même chose pour 50 % des admis qui se trouvaient recalés à la seconde correction !
Le QCM, objectif mais limité
On comprend alors aisément la tentation, très marquée dans le monde anglo-saxon, de l'usage quasi-exclusif des QCM pour évaluer les élèves et les étudiants. Les QCM garantissent l'objectivité de la correction, surtout quand elle est effectuée par une machine. Hélas ! La solution du QCM n'est pas idéale. D'une part, la rédaction des items du QCM est un exercice horriblement difficile : il est quasiment impossible d'éviter toute formulation ambiguë et donc, d'empêcher l'interprétation de l'énoncé, source de confusion et d'erreur, par l'étudiant. D'autre part, le QCM ne sert à évaluer qu'un nombre très limité de connaissances...
Entre le QCM bêta et la dissertation ou essai personnel, il existe toute une gamme de supports et d'épreuves d'évaluation, très bien décrites par le professeur André Quinton dans un document de cours consacré à la docimologie disponible en ligne. Et l'on constate que plus on gagne en objectivité dans l'évaluation, plus on perd en pertinence :

Le manque de pertinence de l'évaluation est du à une multitude de facteurs touchant à l'enseignant lui-même, qui n'a pas un comportement égal d'un bout à l'autre d'une séquence de correction (voir les principales sources de discordances dans les pratiques d'évaluation repérées par François Muller), du sujet sur lequel travaillent les étudiants, et des étudiants eux-mêmes qui ne sont pas toujours au meilleur de leur forme le jour de l'épreuve et ne peuvent donc pas toujours composer à la hauteur de leurs véritables connaissances et savoir-faire.
Evaluation scolaire : la situation catastrophique de la France
Puisqu'il semble inconcevable aux enseignants et établissements éducatifs d'abandonner leur fonction évaluatrice, au moins faudrait-il que tous obéissent aux mêmes règles, grâce à un cadrage national homogène garantissant l'équité de traitement entre les élève d'un territoire donné. A ce niveau, la France connaît une situation catastrophique. C'est ce que dénonce un récent rapport de l'inspection générale de l'éducation nationale, publié à la Documentation française et librement téléchargeable. En France, les programmes (curricula) et l'organisation de l'enseignement sont imposés au niveau national. Les établissements scolaires ont pas ou peu de marge de manoeuvre à ce niveau. En revanche, au nom de la "liberté pédagogique", chaque enseignant élabore ses propres évaluations, ses barèmes, le nombre d'épreuves auxquelles il soumet ses élèves, etc. Il n'y a aucune harmonisation au sein des établissements, ni entre les établissements. Certains d'entre eux se sont faits les champions de l'évaluation sévère jusqu'à l'absurde, comme une preuve de leur "sérieux". Ces établissements ne se donnent pas pour mission de faire réussir tous les élèves mais plutôt de les trier, dans le but de placer les plus conformes, les plus soumis à leurs règles dans les meilleurs établissements d'enseignement supérieur, ouvrant vers les emplois les plus valorisés de notre belle république égalitaire.
La part d'incertitude liée à une évaluation des connaissances est donc gigantesque. Les élèves et étudiants développent parfois un stress important face à cette situation, d'autant que le rythme des évaluations ne fait qu'accélérer. Dans les fameux établissements "sérieux" évoqués plus haut, le temps d'enseignement est sacrifié au profit de temps d'évaluation toujours plus nombreux. Le dressage en prévision de l'examen est une pratique éducative en vogue, bien plus rentable socialement parlant que la construction d'une culture générale, l'épanouissement, l'identification de ses propres inclinations et passions d'apprentissage.
Pour réduire cette incertitude, la grille d'évaluation, nourrie d'indicateurs "observables et mesurables", apparaît comme une première solution. Mais halas, les grilles s'allongent sans toujours échapper à la subjectivité. Comment évaluer un item tel que "l'apprenant fait preuve d'esprit critique face à la problématique" ? L'évaluation n'est rien d'autre ici qu'une opinion, un jugement personnel sujet aux nombreuses variations évoquées plus haut.
Le salut : évaluer pour fournir de l'information utile à l'apprenant, non pour nourrir le système
Et si l'on arrêtait d'évaluer sans rime ni raison ? D'évaluer pour nourrir le système plutôt que pour fournir une information utile à l'apprenant ? Evaluer des connaissances ne sert à rien, sinon à alimenter la machine scolaire ou universitaire (ou à progresser dans un jeu de société). Seule l'évaluation des compétences possède du sens. C'est ce qu'affirme depuis longtemps Philippe Perrenoud, là encore repris par François Muller sur son site. Perrenoud préconise de ne pas séparer l'évaluation (l'autoévaluation ou l'autorégulation, comme il l'appelle) de la situation d'apprentissage elle-même : on apprend en faisant, on évalue sa progression en fonction de ce que l'on fait et du résultat de ses actions.
L'évaluation scolaire est dans de nombreux pays et en France en particulier, une prison dans laquelle sont enfermés enseignants et apprenants, qui n'a plus rien à voir avec la mesure de la compétence en cours de construction. Parce qu'elle est hautement aléatoire, porteuse d'incertitude, de perte de confiance et de stress. Parce qu'elle permet de créer de l'inégalité entre les apprenants, de les classer de manière arbitraire. Parce qu'elle ne fournit pas d'information pertinente et utile à l'apprenant sur sa progression non au sein du système scolaire mais dans la maîtrise de ses savoirs et savoir-faire.
Pourtant, rien ou presque ne change. Il est si difficile, si coûteux de changer. Il ne reste que le rêve... ou la mobilisation citoyenne pour s'élever contre une aberration qui fait le lit des inégalités sociales les plus criantes, avec les résultats que l'on connaît aujourd'hui.
Références :
Nimier, Jacques. "La docimologie." Les Cahiers pédagogiques. Consulté le 10 juin 2014. http://www.cahiers-pedagogiques.com/La-docimologie.
Muller, François. "Docimologie." Espace personnel de François [email protected] Consulté le 10 juin 2014. http://francois.muller.free.fr/diversifier/DOCIMOLOGIE.htm.
Quinton, André. "Docimologie." CRAME - Université Bordeaux Segalen. Mai 2005. Consulté le 10 juin 2014. http://www.crame.u-bordeaux2.fr/pdf/docimologie.pdf.
Muller, François. "renoncer à évaluer...." Espace personnel de François [email protected] Consulté le 10 juin 2014. http://francois.muller.free.fr/diversifier/evaluer_par_cycle.htm.
Houchot, Alain, and Frédéric Thollon. "La notation et l'évaluation des élèves éclairées par des comparaisons internationales." La Documentation française. Juillet 2013. http://www.ladocumentationfrancaise.fr/var/storage/rapports-publics/134000726/0000.pdf.
Lamontagne, Denys. "Appel pour changer l'école publique." Thot Cursus. 10 juin 2014. http://cursus.edu/dossiers-articles/articles/22184/appel-pour-changer-ecole-publique/#.U5cBw1h_ueY.
Sur le même sujet :
Vaufrey, Christine. ""Regarde, j'y arrive !"." Thot Cursus. 12 mars 2014. http://cursus.edu/dossiers-articles/articles/21448/regarde-arrive/#.U5cEhlh_ueY.
aufrey, Christine. "Concevoir des évaluations... qui évaluent vraiment." Thot Cursus. 24 octobre 2012. http://cursus.edu/dossiers-articles/articles/18708/concevoir-des-evaluations-qui-evaluent-vraiment/#.U5cFIFh_ueY.
Vaufrey, Christine. "Laisser les étudiants décider du poids relatif de chaque évaluation." Thot Cursus. 27 juillet 2012. http://cursus.edu/dossiers-articles/articles/18351/laisser-les-etudiants-decider-poids-relatif/#.U5cF1lh_ueY.
Voir plus d'articles de cet auteur