Articles

Les données en éducation, instruments d'aide à la décision

S'inspirer des exemples d'utilisation des données, dans la data-science et le data-journalisme.

Par Federica Minichiello , le 10 février 2015 | Dernière mise à jour de l'article le 13 juin 2019

Les données ouvertes et massives en éducation élargissent les champs du possible : personnalisation, ajustement aux besoins, pilotage par les données. 

Les connaissances statistiques  semblent être une nouvelle compétence clé pour tout éducateur, décideur ou citoyen. Mais l’accès aux données peut être très déroutant: où puise-t-on des exemples quand on ne sait pas par où commencer ?

Voici quelques sources d'inspiration.

Explorer les données par sérendipité

Une question récurrente en éducation est « Comment choisir une école ?». Les comparateurs d’écoles proposent des réponses en réutilisant les statistiques d’évaluation d’élèves. Un exemple intéressant est l'initiative néerlandaise 10.000 scholen, qui s'appuie sur une gamme particulièrement riche de données (dont les résultats scolaires), comme le type de pédagogie, l’âge moyenne des enseignants, le nombre d’étudiants bénéficiant de subventions scolaires etc.

Dépasser la logique "sectorielle" représente probablement l'un des défis de l'analyse des données.  L'exploration par sérendipité peut conduire à des croisements inédits. Dans les comparateurs d'écoles, on pourrait présenter chaque établissement dans ses synergies possibles avec les acteurs et les infrastructures locaux. Les rythmes scolaires, en France, sont un exemple récent de la richesse de réponse contenue dans ce type de données.

Une initiative intéressante en cours de développement est Skills Route, l'un des projets lauréats de l'Education Open Data Challenge, au Royaume-Uni : les élèves peuvent visualiser, en fonction de leurs résultats scolaires, leurs perspectives futures en termes d’éducation post-secondaire  et d'insertion sur le marché de l'emploi.  Nous sommes désormais dans la personnalisation : pas de données anonymisées, parents et élèves bénéficient d'un accès réservé aux données issues du National Pupil Database.

De nouveaux métiers, de nouveaux savoir-faire

Dans les données, deux nouvelles professions ont le vent en poupe :  les data-scientists et les data-journalistes. Ces secteurs sont encore relativement jeunes, mais on peut déjà y trouver des expériences intéressantes.

Nos premiers exemples sont du côté de la data-science : l’Université de Chicago organise des sessions d’été Data Science for Social Good, pour former des data-scientists en herbe sur des cas d’utilité publique.  Plusieurs projets ont retenu notre attention : dans le Comté de Montgomery (Maryland), des étudiants ont travaillé à la construction d’un modèle pour anticiper les situations de difficulté scolaire, sur la base des notes des étudiants, les statistiques de fréquentation, etc. Un autre exemple, réalisé pour la municipalité de Chicago : un système de prévision du taux d’inscription, pour pallier au décalage entre les décisions d’affectation budgétaire (au printemps) et la rentrée scolaire (en septembre). 

En data-journalisme, une histoire d’éducation connue est « Le fossé des opportunités » de l’organisation ProPublica. À partir de données du Département de l’éducation américain, des journalistes ont étudié la distribution géographique de l’accès à l’éducation et révélé à quel point la pauvreté est un facteur déterminant, en termes d’accès à l’éducation supérieure. Une partie de la méthodologie est décrite dans le Guide du data journalisme; on y évoque aussi les "dessous" de la scène : nettoyage des données, collecte et vérification d’informations inexactes etc.

Les données que l’on veut utiliser, sont rarement prêtes à l’emploi !

Comment devenir un data-scientist  ?

L’analyse de données arrive jusqu’en salle de classe, où tout reste à découvrir: mettre en relation les résultats avec le temps consacré à la recherche de ressources et à la formation en ligne, le pourcentage d’étudiants ayant recours à des cours particuliers, le temps consacré à des activités extrascolaires, etc...

Reste à savoir comment se former. Nous vous signalons trois MOOCs en cours :

Doing Journalism with Data . Ouvert jusqu’en mars 2015, ce MOOC ne requiert pas de connaissances statistiques et couvre tout le cycle d’analyse de données :  recherche, collecte, analyse sur Excel et Open Refine et visualisation de données. Adapté pour de petits volumes de données.

Statistiques : Analyse des données multidimensionnelles :  un MOOC d’AgroCampus Ouest, conçu pour des non-statisticiens, pour découvrir l'analyse statistique dans plusieurs secteurs d'activité.

La spécialisation en neuf modules Data Science. On y utilise le logiciel R, pour des données massives. Des connaissances de base en statistiques et programmation sont nécessaires, mais les trois premiers modules sont possibles sans (expérience personnelle).

Vous y découvrirez, par exemple, comment trois lignes de code peuvent harmoniser des formats disparates de date, dispersés dans 300 fichiers Excel distincts.

Enfin, Best 41 Data Science Courses in 2019, détaille une quarantaine de cours en ligne (en anglais) dans le domaine.

Bienvenus dans la puissance de la data science.

Illustration :  ra2studio, Shutterstock.com  

Références

1. Initiatives 10.000 Scholen http://10000scholen.nl/ et Skills Route http://www.skillsroute.com/ (consultés le 10 février 2015)

2. Reynald Fléchaux. Recruter un data scientist ? Bienvenue au Far-West. Novembre 2014. http://www.silicon.fr/recruter-data-scientist-bienvenue-far-west-102533.html (consulté le 10 février 2015)

3. Projets 2014 Data Science for Social Good :
Early Warning Systems for Struggling Students. Novembre 2014. http://dssg.uchicago.edu/2014/11/20/early-warning-systems-for-struggling-students/ (consulté le 10 février 2015)
Anticipating Back to School Numbers, Before Summer Vacations. Juillet 2014. http://dssg.uchicago.edu/2014/07/23/anticipating-back-to-school-numbers-before-summer-vacation/ (consulté le 10 février 2015)

4. Guide du data-journalisme. Le fossé des opportunités (ProPublica). http://jplusplus.github.io/guide-du-datajournalisme/pages/0401.html (consulté le 10 février 2015)

5. Doing Journalism with Data : https://www.canvas.net/courses/doing-journalism-with-data
Analyse des données multidimensionnelles : http://www.france-universite-numerique.fr/agrocampus-ouest.html
Data Science Specialization : https://www.coursera.org/specialization/jhudatascience/1
Best 41 Data Science Courses in 2019 : https://www.guru99.com/data-science-courses.html

 

Avez-vous apprécié cette page?

Voir plus d'articles de cet auteur

Accédez à des services exclusifs gratuitement

Inscrivez-vous et recevez des infolettres sur :

De plus, indexez vos ressources préférées dans vos propres dossiers et retrouvez votre historique de consultation.

M’abonner
Je suis déja abonné