Cet article fait suite à mon Dossier sur les critères de validité en sciences humaines et sociales. Cet ensemble d’articles est destiné à des étudiants dans l’optique de leur fournir des bases utiles à la réalisation d’un travail à portée scientifique. Dans le texte ci-dessous, je vulgarise plusieurs de ses notions pour des élèves du secondaire (supérieur).
Pourquoi apprendre la méthodologie des sciences en secondaire ?
Avant de présenter quelques idées d’activités didactiques à réaliser avec des élèves, j’ai envie d’expliquer en quoi cette démarche me semble importante. Très concrètement, l’apprentissage à l’école passe en grande partie par l’étude des « résultats » des expériences ou des réflexions de différents auteurs. Ceci est très intéressant, et en même temps cela me semble lacunaire, voire problématique, surtout dans un contexte où des propos pseudoscientifiques sont parfois présentés sur le même pied que des thèses qui font consensus au sein des milieux de chercheurs.
A ce titre, il me semble qu’au lieu d’inculquer des théories parfois absurdes ou désuètes aux élèves, on pourrait leur montrer comment celles-ci sont construites (et donc peuvent être déconstruites). Il s’agirait de pouvoir leur donner des moyens de « séparer le bon grain de l’ivraie » et donc de faire la part des choses par eux-mêmes. De manière plus générale, la méthodologie des sciences peut à mon sens contribuer à forger un esprit d’analyse rigoureux et à contrer les raisonnements fallacieux, généralisations abusives, réductionnismes et autres biais cognitifs (ceci va rejoint également le propos de mon article La logique face aux mauvais arguments).
Dans l’activité présentée ci-après, je me concentre sur la notion de « représentativité » en sciences sociales : « dans quelle mesure une affirmation sur base d’observations particulières peut-elle être généralisée ? ».
Echantillon et population : comprendre la notion de représentativité
La tâche initiale est simple. Il s’agit de proposer aux élèves de faire une moyenne arithmétique des âges des personnes dans la classe (élèves et professeur).
S’il y a 20 élèves de 16 ans et un professeur de 40 ans, la moyenne sera d’à peu près 17 ans.
Ensuite, un questionnement est proposé aux élèves : ce résultat est-il représentatif de la population nationale belge, par exemple ?
A ce stade, les notions de population et d’échantillon peuvent être introduites. L’échantillon observé (ici, la classe) n’est pas représentatif de la population belge au niveau de l’âge.
Or, lorsqu’un échantillon n’est pas représentatif, j’ai pu observer que mes étudiants, notamment, remettent rapidement en cause sa taille : « il aurait fallu observer une plus grande quantité d’individus ». C’est une bonne chose, et en même temps, nous voyons ici que ce n’est pas tout : nous pourrions en effet observer toutes les classes de toutes les écoles secondaires, cela ne nous donnerait pas pour autant une idée de la moyenne d’âge de la population nationale belge. Autrement dit, il n’est pas question que de la quantité d’individus dans l’échantillon, mais du fait qu’il représente ou non correctement la population que l’on veut observer.
On peut mentionner la « méthode des quotas » utilisée dans les recensions et enquêtes par sondages, basées en partie sur cette notion. Cette répartition est néanmoins arbitraire dans la mesure où elle postule que des caractéristiques comme l’âge et le sexe, notamment, sont des catégories premières pour permettre de comprendre le social, mais c’est une autre question. Un lecteur me fait remarquer à raison son désaccord avec cette dernière affirmation : « La pertinence des quotas utilisés dépend de la variable que l’on cherche à observer et on suppose surtout que cette dernière est fortement liées aux quotas ». Sans entrer dans les détails et de façon un peu caricaturale, cette manière d’opérer en sciences sociales est néanmoins remise en cause, notamment par Pierre Mercklé dans Sociologie des réseaux sociaux, dans la mesure où il estime que les catégories telles que l’âge, le sexe et d’autres caractéristiques individuelles que l’on utilise pour catégoriser les gens ne font au final que s’auto-conforter comme catégories d’analyse, alors que les interactions entre les individus sont plus significatives pour expliquer et comprendre les comportements. Ceci peut bien entendu faire l’objet d’un débat, mais il s’agit déjà de nuances complexes.
On constate par ailleurs que l’observation dépend de ce que l’on veut observer.
Si on avait voulu observer la moyenne d’âge des élèves de 5e secondaire dans l’école, cela ne posait pas autant problème de prendre une classe au hasard et de la considérer comme un échantillon représentatif de la population.
Mais on peut pousser l’expérience plus loin, comme le fait remarquer judicieusement un lecteur : « est-ce que se contenter d’un échantillon aussi petit ne pose pas problème ? Il se trouve que non, pas trop, mais pour une raison bien spécifique : dans une même classe, les âges ne varient que très peu, d’où le fait de pouvoir s’autoriser un petit échantillon ». A ce titre, il ajoute que « prendre des exemples proches des étudiants pour faire des mini-sondages pose toujours cette difficulté : on se retrouve avec des tailles d’échantillon très petites et bien en-dessous de ce qu’on juge acceptable pour une bonne étude en sciences humaines et sociales ». Il souligne que la taille de l’échantillon est en tant que telle un critère de scientificité. Autre problème soulevé par le lecteur : « est-ce qu’on ne risque pas de tomber sur une classe aux caractéristiques particulières vis-à-vis de l’âge ? Exemple : des classes avec des options bien vues des parents (latin…) auront des chances de sur-représenter des élèves jeunes ayant sauté une classe ».
Être au clair avec ce que l’on observe est une étape primordiale dans la recherche scientifique : d’abord, se mettre d’accord à propos de quoi l’on parle. Ensuite, quand le sujet est bien défini, on peut choisir comment l’observer, quelles données on va sélectionner et comment on va les traiter.
> La notion de représentativité invite à réfléchir à la fois à la structure de l’échantillon et à sa taille. Pour approfondir la question de manière un peu plus technique, du point de vue d’un statisticien.
Du particulier au général : comment discerner les inductions « valides » ?
Ensuite, en sciences sociales comme en sciences de la nature, un problème majeur consiste à passer d’observations particulières / spécifiques à des affirmations générales. C’est très différent de dire « j’ai observé 500 corbeaux noirs » (observations particulières) et d’en inférer que « tous les corbeaux sont noirs » (affirmation générale). C’est un raisonnement que l’on appelle l’induction.
La notion de représentativité est un critère d’une induction « valide ». Le nombre d’observations (et donc la taille de l’échantillon), par exemple, contribue à asseoir solidement une généralisation. Néanmoins, l’induction n’est pas un raisonnement logique « pur ». Très concrètement, il faudrait observer tous les corbeaux pour effectivement pouvoir affirmer que « tous les corbeaux ont telle caractéristique ». Observer tous les corbeaux, ça veut dire absolument tous les corbeaux. Y compris les corbeaux qui sont morts. Y compris les corbeaux qui ne sont pas encore nés. Dans le tas, s’il y a un seul corbeau non-noir (et il y en a), cela rend fausse l’affirmation selon laquelle « tous les corbeaux sont noirs ».
Nous pouvons faire cela avec l’affirmation « tous les humains sont mortels » : en fait, nous ne pouvons pas totalement observer la mortalité de tous les humains qui ne sont pas encore morts, et encore moins celle de ceux qui ne sont pas encore nés.
Cette partie de la réflexion est plus complexe et il faut prendre garde à ne pas aboutir à une forme de remise en cause naïve de toute affirmation à prétention générale. Ces réflexions nous montrent simplement le caractère « faillible » d’une généralisation et par conséquent l’importance de sans cesse requestionner les faits particuliers, les observations spécifiques, et ce dans leurs contextes.
Application cadrée (imaginée ou réelle)
A la suite de ces réflexions, plusieurs prolongements seraient intéressants. On pourrait délimiter un sujet (et un « angle ») spécifique avec les élèves, de manière un peu plus complexe. Par exemple : à quel âge un individu obtient-il son CESS en Belgique francophone. Comment peut-on observer cela ? A-t-on accès à des données relatives à la population ? On peut ensuite appliquer avec eux des outils statistiques plus poussés qu’une moyenne simple, comme la variance, l’écart-type, etc.
Dans le cadre d’entretiens, de questionnaires et autres méthodes plus « compréhensives », j’invite à considérer que des méthodes plus axées sur du « qualitatif » ne doivent pas être un prétexte pour s’autoriser moins de rigueur, au contraire (on peut par exemple parler de saturation de l’échantillon, qui consiste à considérer que quand un entretien ouvert n+1 n’apporte aucune information supplémentaire au chercheur que les n entretiens précédents, alors son échantillon peut être considéré comme valide, ce uniquement par rapport à certains domaines de recherches bien spécifiques). Dans quelle mesure des observations basées sur des données déclarées (quelque chose qu’une personne dit) peuvent-elles être généralisées ?