Articles

Y a t-il une place pour le métier de data-scientist de l'apprentissage ?

Des données et des gens...

Par Denis Cristol , le 30 janvier 2017 | Dernière mise à jour de l'article le 01 mars 2017

De quoi parle-t-on?

Big data et datas scientist font les manchettes des médias. Ces magiciens des données paraissent capables de prévoir l'évolution des événements, le déplacement de population grâce à l'analyse des connexions de portable, l'apparition d'une épidémie de grippe, des stratégie électorale qui gagnent et bien d'autres possibilités.

Nous subissons leur art avec les spéculations financières, nous angoissons devant leur anticipation des scènes de crime les plus probables. Le feuilleton américain "Chiffres" ou le film Minority report  romancent des possibilités bien réelles de resserrer les actes criminels. 10% d’économie sur la politique sécuritaire d'une ville US en exploitant les données disponibles. Ou la prévision par la gendarmerie de cambriolages en France en sélectionnant et analysant 15 facteurs sociodémographiques sur 687 disponibles. 

Et si l'exploitation des données profitait aussi à l'apprentissage ? Et si l'on pouvait utiliser les algorithmes pour améliorer nos façons d'enseigner et d'apprendre ? Une révolution serait en marche pour aider la supervision des apprentissages.  Il est désormais question d'apprentissage adaptatif dont la vertu principale serait la personnalisation qui va bien au-delà de l'ordonnancement de niveaux de difficulté ou de l'enseignement programmé des années 60.

Depuis quand se développent les learning analytics?

Les learning analytics se développent depuis les années 2010 et possèdent aussi un outil de diffusion de la recherche le "Journal of learning analytics" qui fédère une communauté de chercheurs. Ils font partie de la branche du data mining auquel nous préférerons l'expression "forage de données".

Les educational learning analytics embarquent des notions proches telles que learning at scale et quantified self. Ces expressions renvoient aux analyses de contenus, de discours, de réseaux sociaux ou bien encore des dispositions des apprenants dans leur rapport au savoir.

Google scholar recense 13 600 articles à partir de  cette expression, dont 3 390 rien que pour l'année 2016, c'est dire si la promesse  et les attentes sont fortes. Il serait possible de modéliser des savoirs, des styles d'apprenants et d'en déduire des chemins d'apprentissage optimum pour chacun. Les recherches s'intéressent à la construction sociale des savoirs à la façon dont les individus apprennent au sein des réseaux.

Quels sont les enjeux des learning analytics pour la formation? 

Si l'on s'appuie sur l'idée qu'apprendre est une interaction permanente avec son environnement, alors on pourrait imaginer modéliser ces interactions, et essayer de repérer des régularités et des enchaînements signifiant. Cela paraît à portée de main tellement la puissance de calcul et l'agrégation et le traitement d'un monceau de données sociales, individuelles, techniques est devenu possible, notamment grâce à l'expansion des formations en ligne et la fréquentation de MOOC qui laissent de nombreuses traces grâce aux clics effectués. Les premiers résultats pourraient bien concerner les dispositifs en ligne qui offrent de nombreuses traces et matériaux d'analyse

Enjeu 1 - S'adapter aux besoins des apprenants

Le concept de Productive educational dialogue  rend compte de cette recherche des interactions efficientes dans un cadre d'apprentissage en ligne par exemple un MOOC. Partant de là, créer un système expert et des tableaux de bord sont les pistes pour créer un apprentissage adaptatif.

La création d'une typologie des interactions (soutien, question, conseil, évaluation) permet de mesurer des liens dans des réseaux, et l'identification de leader d'apprentissage sur lesquels s'appuyer, du type d'interaction ou séquence favorable, ou encore le type de tutorat à activer, ou activités connaissant le plus fort engouement.

Enjeu 2 - Géolocaliser les bons lieux de formation

En étendant le pouvoir d'analyse des données, il est aussi possible de déduire les formations les plus adaptées et les localisations les plus pertinentes. Le choix d'une localisation des formations par une analyse des territoires et un rapprochement avec les lieux d'habitation, et moyens de transport disponibles.

Les variables telles que la distance kilométrique au centre de formation, les historiques d'abandon, des variables sociodémographiques seront étudiées. Le choix d'implantation de lieux et leur géolocalisation concerne déjà les tiers lieux.

Enjeu 3 - Choisir les formations les plus pertinentes

Les études marketing pour répondre au choix des formations à promouvoir sur un bassin d'emplois sont des traitements de données qui intéressent les décideurs publics pour des besoins de territorialisation et d'aménagement du territoire..

Enjeu 4 - Anticiper le décrochage scolaire

Les learning analytics peuvent aider à anticiper le repérage des décrocheurs et mieux orienter les budgets publics disponibles pour du rattrapage scolaire

Les limites des learning analytics

Limite 1 - La question éthique

Les learning analytics vont aussi poser des questions éthiques : quel apprenant  aider quand aucun signe tangible ne justifie des choix? Comment éviter des effets auto-prédictifs ? Comment les analystes vont-ils éviter de tomber amoureux de leurs modèles statistiques et tordre la réalité des chiffres pour qu'elle les respecte? Comment respecter la vie privé des apprenants? À-t-on le droit de savoir à leur insu des choses sur les apprenants?

Limite 2 - Le management algorithmique

Il semble difficile de réduire un acte d'apprentissage à la mesure d'algorithmes comportementaux basés sur des traces observables, car apprendre est la rencontre d'une intériorité avec d'autres intériorités celles de professeurs ou celles d'autres élèves qui participent par une variété de rôles, de réactions, d'apport de contradictions à la construction d'un savoir et la motivation pour le creuser.

Cependant, les learning analytics peuvent apporter des indices et aider à prendre des décisions ou à améliorer l'évaluation des activités proposées ou à repérer les écueils rencontrés. Elles révèlent des comportements et permettent de visualiser des architectures invisibles.

Limite 3 - Le comportementalisme numérique

Le cerveau humain reste encore un mystère, le risque comportementalisme existe de donner un sens trop précis à des traces numériques auxquelles ne sauraient être réduit un être humain. L'homme de Lascaux est bien plus que la marque de sa paume sur la paroi, de même l'apprenant digital est habité de croyances et de représentations qui dépasse l'intelligible et l'empreinte de ses doigts sur un clavier.

Il s'agira donc dans les années à venir de développer nos capacités à interpréter des données quantitatives et les mettre en lien avec des données sensibles. Cela préfigure sûrement d'un nouveau métier ou tout du moins de nouvelles fonctions à faire grandir.

C'est déjà ce que propose la société Domoscio qui vante un apprentissage adaptatif intelligent combinant learning analytics et neurosciences. Ou bien la société Knewton qui vise une personnalisation. Ou enfin Céro qui s'intéresse aux arbres de réponse et à l'orientation vers des fiches de renforcement. Les grands acteurs des logiciels (par exemple Adobe) proposent des outils pour tirer profit des possibilités qui se présentent

Les compétences du data-scientist de l'apprentissage

Au travers de ces offres,  les compétences à maîtriser apparaissent nombreuses :

  • maîtrise des statistiques;
  • analyse des réseaux sociaux;
  • business intelligence;
  • web analytics ex google analytics;
  • recherche opérationnelle pour bâtir les modèles mathématiques pertinents et identifier les bonnes variables;
  • croisement de l'intelligence artificielle et du forage de données;
  • infographie pour rendre compte des découvertes.
     

Un immense chantier se profile qu'il nous reste à saisir.

Sources :

Définition  https://fr.m.wikipedia.org/wiki/Analyse_de_l’apprentissage

Forage de données https://fr.m.wikipedia.org/wiki/Exploration_de_données

Analyse des réseaux sociaux https://fr.m.wikipedia.org/wiki/Analyse_des_réseaux_sociaux

Penetrating the Fog: Analytics in Learning and Education - Siemens, George - ERIC
https://eric.ed.gov/?id=EJ950794

Exploring the relationship of ethics and privacy in learning analytics and design: implications for the field of educational technology - Educational Technology Research and Development, October 2016
http://link.springer.com/article/10.1007/s11423-016-9480-3

Des données au savoir : big data et data mining - Pierre-Alain FOUR  - M3
http://www.millenaire3.com/dossiers/digital-humanities/des-donnees-au-savoir-big-data-et-data-mining

The connected learning analytics toolkit - ACM Digital Library http://dl.acm.org/citation.cfm?id=2883881

Du MOOC à l’apprentissage adaptatif : le problème de la personnalisation - Matthieu Ciseil - Blog EducPros http://blog.educpros.fr/matthieu-cisel/2015/01/12/du-mooc-a-lapprentissage-adaptatif-tuteurs-intelligents-et-personnalisation/

Tendance lourde : l’apprentissage adaptatif - Digital Leaning Academy
https://digital-learning-academy.com/tendance-lourde-lapprentissage-adaptatif/

Learning Analytics: From Big Data to Meaningful Data - Agathe Merceron, Paulo Blikstein, George Siemens - Journal of learning analytics http://epress.lib.uts.edu.au/journals/index.php/JLA/article/download/4814/5175

Avez-vous apprécié cette page?

Voir plus d'articles de cet auteur

Accédez à des services exclusifs gratuitement

Inscrivez-vous et recevez des infolettres sur :

De plus, indexez vos ressources préférées dans vos propres dossiers et retrouvez votre historique de consultation.

M’abonner
Je suis déja abonné