Analyse des annuaires de MOOC : quelques réflexions méthodologiques

http://www.dreamstime.com/stock-photo-3d-small-people-complicated-question-image19385560J’aimerais aujourd’hui vous glisser quelques mots sur une approche méthodologique que j’ai suivie dans le cadre de ma thèse pour esquisser les contours du phénomène MOOC à l’échelle internationale comme à l’échelle française : l’analyse d’annuaires. Au cours de l’introduction de ma thèse, j’essaie de donner au lecteur quelques pistes pour se représenter l’offre de cours : importance relative des différentes plates-formes en termes de nombre diffusés, éleclectisme. Comme un certain nombre de billets du blog Educpros renvoient à ces résultats, il m’est apparu opportun de préciser brièvement la méthodologie adoptée dans ce blog personnel. Je ne pense pas que l’auditoire d’Educpros serait passionné par ces questions de méthodologie. Grosso modo, je me base sur deux annuaires : le premier est Class Central, il recense près de 4000 dispositifs, dont un certain nombre de tombent pas sous ma définition de MOOC. Le second est MOOC List, il comporte moins de MOOC, mais rapporte plus d’informations par cours. Il existe un certain nombre d’autres annuaires, mais ceux là sont parmi les plus exhaustifs.

Les données de Class Central ont été trouvées en ligne ; elles correspondent à la mise à jour de novembre 2015. J’ai pu rencontrer le fondateur du site à New York dans le cadre d’un colloque organisé à Columbia et c’est lui qui m’a parlé de ces données. C’était un jeu d’enfant de les analyser. Du coup je me suis amusé à regarder d’autres annuaires, et j’ai récolté en octobre 2015 les données de MOOC List par le processus dit de webscrapping cette fois, après obtention d’un accord informel. Pour faire vite, un programme explore les pages d’intérêt et extraie les informations jugées utiles. Je m’interesse notamment à la charge de travail hebdomadaire estimée par les concepteurs sur la page de présentation du cours ; lorsqu’ils fournissent une valeur minimale et une valeur maximale, je calcule la moyenne. Si les concepteurs annoncent un investissement hebdomadaire de 2-3 heures, la charge de travail hebdomadaire moyenne correspond donc à 2,5 heures par semaine. La charge de travail totale de la formation correspond au produit du nombre de semaines de cours et de la charge de travail hebdomadaire moyenne.

Les deux annuaires MOOC List et Class Central adoptent une définition plus large du terme MOOC que celle que nous avons adoptée au cours de ce manuscrit. La plate-forme américaine Udacity est notamment recensée dans Class Central comme hébergeur de MOOC, tandis que Saylor.org l’est sur MOOC-list ; je les ai exclues. Du fait de ce biais, je cantonne mon analyse à un nombre réduit de plates-formes sur lesquelles reposent des dispositifs qui tombent sous le coup de ma définition de MOOC. Par ailleurs, je me concnetre sur celles dont les institutions partenaires peuvent être considérées comme des établissements d’enseignement supérieur. Certaines plates-formes de taille sont absentes des annuaires, probablement pour des raisons linguistiques ; sont ainsi exclues les plates-formes chinoises, bien qu’elles disposent d’une offre conséquente, ou la plate-forme française Unow, qui n’est que très partiellement représentée.

On notera par ailleurs que l’évolution des modèles pédagogiques, en particulier l’essor du format atemporel au cours de l’année 2015, soit l’absence de date de début et de date de fin à la formation, complexifie la définition du périmètre de l’analyse. Je n’ai pas éliminé ces cours de l’analyse des annuaires, dans la mesure où ils représentent approximativement 15 % de l’offre des plates-formes Coursera et edX au moment de la dernière extraction des données, en novembre 2015. Néanmoins, toute analyse portant sur la durée de la formation les exclue, par définition. Si un cours a été organisé à plusieurs reprises, seule la dernière itération est prise en compte lors d’une analyse temporelle. Enfin, la discipline et la sous-discipline du cours a été identifiée par les auteurs de ces annuaires. A des fins de comparaison, j’ai classifié manuellement les cours de FUN sur la base des thématiques et sous-thématiques utilisées dans ces annuaires. Quand un cours se situe à l’intersection de plusieurs disciplines, je choisis la discipline dominante, choix qui implique nécessairement une part d’arbitraire.

A ce jour, aucune étude rigoureuse sur la question de l’offre mondiale de MOOC n’a été publiée dans la littérature scientifique, les quelques publications présentes dans la littérature grise (Shah, 2015) sont fragmentaires et adoptent une définition très large du terme MOOC. Les données présentées dans les paragraphes qui suivent constituent donc une des premières analyses de la question. Concernant mon travail sur le contexte français, les données relatives à la structure des dispositifs de FUN ont été récoltées au format JSON via un accès à une API dédiée. Un programme a été élaboré pour extraire automatiquement de ces données JSON les informations qui seront présentées dans les paragraphes qui suivent. Là encore, les quelques travaux effectués à ce jour sur les dispositifs de MOOC (Margaryan et al., 2014, Toven-Lindsay et al., 2015) se basent tout au plus sur quelques dizaines de MOOC, dont le fonctionnement a été analysé de manière manuelle. Les travaux doctoraux de Jordan (2014, 2015) ne prennent pas en compte qu’une soixantaine de MOOC et ne prend en considération que la longueur du cours et le mode d’évaluation. Avec ma méthodo de collecte automatisée de données sur les dispositifs, je peux nécessairement aller beaucoup plus loin que ce que l’on peut faire humainement en suivant les méthodologies suivies par ces auteurs.

Bref, j’espère vous avoir mis l’eau à la bouche. Maintenant, si vous voulez les résultats effectifs de ce travail, il va falloir aller lire les billets dédiés dans mon blog Educpros. Il y a pas mal de résultats intéressants, comme vous ne manquerez pas de le constater.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>