0% ont trouvé ce document utile (0 vote)
1K vues20 pages

Cours de Docimologie Et Pedagogie

Le document traite de la docimologie, la science de l'évaluation des examens en pédagogie, en soulignant les biais et limites des méthodes d'évaluation traditionnelles. Il explore les sources d'erreurs dans la notation, notamment l'influence des enseignants, du système scolaire et des élèves, ainsi que les effets de contexte sur les résultats. La docimologie critique vise à sensibiliser aux difficultés d'évaluation sans proposer de solutions immédiates, tout en mettant en lumière l'évolution historique de cette discipline.

Transféré par

Luc Edgar
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
1K vues20 pages

Cours de Docimologie Et Pedagogie

Le document traite de la docimologie, la science de l'évaluation des examens en pédagogie, en soulignant les biais et limites des méthodes d'évaluation traditionnelles. Il explore les sources d'erreurs dans la notation, notamment l'influence des enseignants, du système scolaire et des élèves, ainsi que les effets de contexte sur les résultats. La docimologie critique vise à sensibiliser aux difficultés d'évaluation sans proposer de solutions immédiates, tout en mettant en lumière l'évolution historique de cette discipline.

Transféré par

Luc Edgar
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

COURS DE DOCIMOLOGIE ET PEDAGOGIE

PREAMBULE
C’est la science qui est consacrée à l’étude des épreuves, au déroulement et évaluation des
examens en pédagogie. Elle se consacre à la façon dont sont attribuée les notes par les
correcteurs aux différents examens scolaires et universitaires.

CHAPITRE I : ÉLÉMENTS DE DOCIMOLOGIE


1-1L'histoire de la problématique
L'école est un lieu dans lequel l'évaluation est omniprésente. Il semble même parfois à
certains que l'élève fréquente davantage l'école pour récolter des notes que pour apprendre
véritablement quelque chose. Avec la massification et la démocratisation de l'accès à tous les
niveaux scolaires, il faut pouvoir comptabiliser échecs et succès à travers un système de
notation de façon à rendre un "verdict" en fin d'année. La notation est ainsi une réponse à la
division du travail et à l'unicité de l'élève et du temps: il doit être possible de prendre, à un
moment donné, une décision relative à chaque élève, ce qui implique la prise en compte
d'informations provenant de sources multiples. Si donc l'école a vu se systématiser et se
professionnaliser "l'art de bien enseigner" à travers la didactique, elle a connu le même
développement de "l'art de bien évaluer" à travers la docimologie. Dans la suite du texte, nous
envisagerons principalement les travers de l'évaluation classique des élèves, nous en
pointerons les limites, en suivant les chemins de la docimologie critique. Nous ne
développerons donc pas les solutions et les remèdes. D'autres cours existent dans le cursus des
étudiants - principalement de ceux qui suivront la formation de la licence en sciences de
l'éducation - qui leur permettent d'envisager les améliorations possibles. Ce chapitre ne
constitue donc qu'une introduction critique à la docimologie pratique, la problématique étant
d'être conscient et attentif aux difficultés rencontrées lors de l'évaluation. Les développements
de la docimologie et de la mise en cause des notes scolaires remontent au début du vingtième
siècle. Dès les années 1910, les Etats-Unis firent confiance aux QCM dans les tests de
sélection, par souci d’objectivité et en réponse à la difficulté de noter. A partir de 1922, en
France, Henri Piéron s’attaque aux problèmes posés par la subjectivité de la note. Dès 1929, il
attire l’attention en ces termes : « C’est un principe général que, pour être reçu à un examen, il
faut avoir la moyenne, …dès lors, …pour un grand nombre de candidats, ce sera …le hasard
qui décidera de leur admission ou de leur recalage. En effet, on sait que… c’est dans la région
moyenne qu’ils se massent… ». (Piéron, 1963, p.9) Aux USA, en Angleterre, et même en
Belgique, diverses expériences mettent en évidence le manque de fiabilité des notes scolaires.
Piéron (1963, p. 13) cite notamment les travaux menés à ce sujet, en 1931, par Andréa
Jadoulle, la célèbre psychopédagogue du Laboratoire de pédagogie d’Angleur2 . En France,
Laugier et Weinberg étudient ce même phénomène dès 1927. C’est en 1931 qu’une impulsion
déterminante sera donnée par la subsidiation, par la Carnegie Corporation de New York,
d’une recherche pilotée par l’International Institute of Education du Teacher’s College de
l’université Columbia, et fonctionnant via des commissions nationales : américaine, anglaise,
écossaise, finlandaise, française, suisse et allemande (cette dernière étant arrêtée par la
nazification de 1933). La commission française utilisa des copies notées lors du fameux
baccalauréat. En 1934 fut publié, par la commission française, le rapport « Etudes
docimologiques » (Laugier, Piéron, Pieron, Toulouse et Weinberg, 1934). Le baccalauréat
offrait une situation exceptionnelle puisque les mêmes questions sont posées à de très
nombreux étudiants, durant de véritables examens, et sont collectées et corrigées par de
nombreux correcteurs sélectionnés. A travers cette situation, complètement externe (encart 1),
l'équipe française met en évidence de nombreux biais de notation. On se doute que la guerre
interrompit ce processus de recherche sur le continent européen. Encart 1 - Epreuves internes
et épreuves externes.

Le terme "docimologie" apparaît quant à lui en 1929 sous la plume d'Henry Piéron et est
popularisé par celui-ci dans son ouvrage intitulé "Examens et docimologie", en 1963. Ce mot
puise sa racine dans le grec (examiner, épreuve). A ses débuts, la docimologie est surtout
critique ou négative: elle met en évidence les problèmes, sans les résoudre, du moins de
manière pratique, au niveau où le problème se pose, c'est-à-dire au niveau des enseignants
chargés de procéder à l'évaluation. Progressivement cependant, les chercheurs s'attachent à
proposer des solutions qui permettent de limiter au mieux le caractère subjectif de la notation.
Comme nous allons le voir par la suite, ce caractère subjectif n'est pas à imputer uniquement
au maître chargé de noter l'élève, il relève de mécanismes souvent complexes et qui mettent
en jeu enseignants, élèves et système éducatif. Les méthodes employées pour étudier les biais
de notation reposent sur différentes procédures, selon le type de biais à mettre en évidence.
On peut ainsi utiliser, de manière expérimentale, les approches suivantes: (a) Une même série
de copies est corrigée plusieurs fois par le même correcteur, à des moments différents, sans
que celui-ci s’en rendre compte, ce qui permet de mesurer la stabilité intra-correcteurs; (b)
Une même série de copies est corrigée par plusieurs correcteurs différents, ce qui permet de
mesurer la concordance inter-correcteurs; (c) Une même copie est placée dans un ensemble de
copies dans des positions différentes (précédée de copies meilleures ou plus faibles), ce qui
permet de mesurer l’effet de contraste, ou de séquence; (d) Une même copie est placée dans
un ensemble de copies dont les valeurs sont plus ou moins dispersées largement (tantôt parmi
des copies ayant toutes reçu la même note lors d'une évaluation préalable, tantôt parmi des
copies très variées en qualité); etc. (e) Une même copie est corrigée par plusieurs groupes de
correcteurs auxquels on fournit des informations complémentaires différentes sur l'élèves, ses
notes antérieures…

1-2 Les trois sources « d’erreur »


Si l’on cherche à identifier les sources d’erreurs ou de biais qui entachent la notation par les
enseignants, pour conserver une approche comparable à celle adoptée par la théorie classique
des tests, les chercheurs identifient au moins trois sources principales : les enseignants, le
système scolaire et les élèves. Nous allons aborder successivement ces trois sources. Nous
montrerons combien il importe d’envisager un problème qui semble assez singulier, donner
une note à un élève particulier, à travers un ensemble beaucoup plus large de déterminants et
d’interactions (Perrenoud, 1989, 1998)
1-3 Le système scolaire
La première source de biais que l’on doit prendre en considération est l’influence du contexte
scolaire sur les procédures d’évaluation en général. Ainsi, la classe dans laquelle se trouve
l’élève peut être déterminante. Les conclusions tirées notamment par Grisay sur « l’effet
Posthumus » au début des années quatre-vingt – et de nombreuses fois vérifiées et
commentées par la suite (Grisay, 1984 ; Crahay, 1996 ; Demeuse, 2002) – offrent un très large
aperçu sur les interférences que peut avoir le contexte d’une « classe particulière » sur
l’évaluation des élèves qui la composent : avec les mêmes performances, et toute autre chose
restant égale par ailleurs, un élève est jugé par son professeur comme un « bon élève » dans
une classe alors qu’il peut se voir contraint de doubler son année scolaire dans une autre !
Tout dépend non pas des performances particulières de l’élève dans l’absolu mais bien de ses
performances par rapport à celles de ses condisciples. Le hasard du microcosme de la classe
dans laquelle se trouve les élèves est donc primordiale puisque le professeur est fréquemment
poussé à établir des différences de performance entre eux, et ce même si ceux-ci sont très
proches, c'est-à-dire à adopter une attitude plus normative que critériée. De ce fait, leurs
résultats en fin d’année sont souvent distribués selon une courbe de Gauss (quelques élèves «
faibles », quelques élèves « forts », et la grande majorité dans la « moyenne ») (Perrenoud,
1995 [1984] ; Crahay, 1996 ; Merle, 1998). Cependant si la classe dans laquelle est placé un
élève plutôt que dans une autre et son influence sur l’évaluation finale est importante,
l’établissement scolaire l’est parfois tout autant. Alors que de nombreux travaux – notamment
américains– et leurs diverses interprétations avaient pu laisser sous-entendre dans la foulée
des Golden sixties (Coleman et al., 1966 ; Jencks, 1979 [1972]), que l'école a peu d'impact sur
les résultats des élèves, le « school can make a difference » est actuellement reconnu, aussi
bien au niveau des résultats effectifs des élèves que de l'évaluation de ceux-ci. Il semble toute
fois que l’effet-classe que nous venons d'évoquer soit bien plus important que l’effet-
établissement (Bressoux, 1994 ; id., 1995), même si l’influence de ce dernier est pourtant
indéniable. Cette différence entre établissements peut résulter d’une stratégie délibérée
destinée à pratiquer une sélection par écrémage et/ou à médiatiser une certaine image de
l’excellence dont la « fameuse réputation » de certaines écoles d’élite est la concrétisation
(Duru-Bellat et Mingat, 1993 ; Merle, 1998). Et quant bien même la complexité du contexte
de l’école et de la classe ne suffirait pas à laisser entrevoir toute l’incertitude, la non-
objectivité dont est déjà empli à ce stade l’acte évaluatif de l’enseignant, des biais bien plus
élémentaires peuvent démontrer que la note est encore parfois influencée par d’autres
déterminants totalement extérieurs au travail de l’élève en soi : depuis longtemps par exemple
la docimologie a pu montrer qu’une même copie est notée différemment par l’enseignant
selon son ordre de correction, selon qu’elle se trouve parmi les premières ou parmi les
dernières feuilles de la pile que l’enseignant doit corriger (Bonniol, 1965) ; et dans le même
ordre d’idée, qu’une même copie sera jugée différemment selon qu’elle suit une copie jugée «
très bonne » ou « très faible » par l’enseignant (Bonniol et Piolat, 1971). Bon nombre
d’enseignants n’hésitent d’ailleurs pas à déclarer qu’ils établissent leur barème de notation
seulement après avoir lu plusieurs copies, et que celui-ci peut être appliqué différemment
selon les élèves et selon la succession des résultats, copie après copie (Chevallard, 1991 ;
Nicaise, 2001)
.2. Les étudiants
A côté de ce contexte de scolarisation, des particularités intrinsèques à l’élève peuvent
également influencer subjectivement le jugement professoral : dans la foulée des premières
sociologies dénonciatrices des années soixante et septante (Bourdieu et Passeron, 1964 ; id.,
1970 ; Baudelot et Establet, 1971 ; Boudon, 1973), on pensera avant toute autre chose à
l’origine sociale des élèves et aux stéréotypies diverses qui peuvent y être associées : ainsi,
certains correcteurs ont parfois tendance à attribuer de meilleures notes aux enfants issus des
milieux les plus favorisés (Pourtois et al., 1978) alors que dans d’autres circonstances, ce sont
justement les élèves issus des milieux défavorisés qui sont « surcotés », notamment pour des
raisons de « paternalisme bienveillant » et de correction – si minime soit-elle – volontaire des
inégalités sociales et scolaires (Dardenne, 1999 ; Nicaise, 2001). Le même type de
conclusions a également pu être tiré dans ce sens avec des déterminants comme l’apparence
physique ou le genre sexuel des élèves : parfois les élèves jugés « plus beaux » ou « plus
proches des idéaux médiatiques » par les enseignants peuvent être mieux cotés (Leyens et
Yzerbit, 1997 ; Merle, 1998) et, dans le même ordre d’idée, il semble que les filles ont à
souffrir plus fréquemment que les garçons quant à leur notation, notamment suite
auxphénomènes de « menace stéréotypique » et de reproduction des inégalités sociales en
matière de genre sexuel (Dardenne, 1999). Par contre, il peut apparaître également dans
d’autres circonstances que les mêmes filles sont habituellement mieux évaluées parce qu’elles
font preuve d’un « meilleur comportement » en classe et maîtrisent mieux les règles et
exigences du « métier d’élève » – soit donc qu’elles sont plus proches que leurs pendants
masculins d’un comportement idéalement attendu par le professeur (Felouzis, 1993 ; Duru-
Bellat, 1995). Par là, on peut constater que l’évaluation des enseignants porte tout autant sur
les « savoir être » que sur les plus classiques savoirs et savoir-faire (Bourdieu et Passeron,
1970 ; Crahay, 2000), et que le même incitant peut influencer celle-ci dans des sens
totalement opposés. Comme le complexe « scolarité », le complexe « élève » est très influent
et la relation ne cesse de se complexifier encore un peu plus lorsque entrent en jeu des
caractéristiques qui sont simultanément dépendantes des deux : pensons par exemple au
niveau scolaire de l’élève (les résultats de ses évaluations précédentes, notamment ceux
présentés dans son bulletin scolaire) et au statut de sa classe (la réputation, l’image véhiculée
par la classe qu’il fréquente, notamment celle présentée lors des conseils de classe). Par un
comportement proche d’un classique phénomène de réduction de la dissonance cognitive
(Festinger, 1957), un enseignant peut parfois être tenté de minimiser la différence qui
apparaîtrait entre sa propre attente quant aux résultats de l’élève et les résultats effectivement
obtenus. L’habituel « premier de classe » peut se voir ainsi tiré vers le haut alors que les
performances réalisées ne correspondent pas à ce que l’enseignant attendait de lui comme à
l’accoutumée (Caverni, Fabre et Noizet, 1975, Merle, 1998). Le complexe « élève » peut être
vu comme une mise en commun d’une multitude d’effets d’attente qui se rapportent tous, de
près ou de loin, à la thèse devenue classique aujourd’hui de « Pygmalion à l’école » de
Rosenthal et Jacobson . Selon ce modèle, certains déterminants (origine sociale, sexe, niveau
scolaire, etc.) amènent l’enseignant à développer rapidement des attentes diverses vis-à-vis de
ses élèves (notamment sur leurs résultats scolaires futurs) et à différentier peu à peu, son
propre comportement - verbal comme non-verbal, conscient comme inconscient. Il a tendance
à orienter ses élèves vers le résultat scolaire attendu : qu’elle soit positive ou négative, la
prédiction peut alors se révéler fortement créatrice d'effets (Rosenthal et Jacobson, 1969 ;
Good, 1987)
2-1 Les enseignants
Comme nous l’avons souligné précédemment, l’existence et l’interférence de nombreux biais
dans la procédure évaluative peut encore être exacerbée puisque, dans ce domaine tout du
moins, la liberté du maître au sein de sa classe est presque totale : il administre les épreuves
comme il l’entend, il choisit la matière et le sujet des interrogations, il choisit leur forme, leur
moment, leur durée, leur importance sur la note finale, il choisit les critères et les normes qui
détermineront son jugement professoral, ... puis c'est lui qui applique le modèle d'évaluation
aux productions de ses élèves qui s'avèrent, d'une certaine manière, le reflet de son propre
travail d'enseignant. La quête de l’objectivité de la note est donc semée d’embûches majeures.
Dépassant par là la vision mécaniste du maître simple notateur dans l’absolu, il faut
appréhender que l’acte évaluatif passe également au travers de nombreux « filtres interactifs »
avant que la note finale puisse être arrêtée. Donc, outre les biais classiques que nous avons
présentés, le fait de noter un élève est également une action proprement rationnelle qui trouve
ses fondements – pour reprendre le raisonnement de Weber (1971) – à la fois dans les intérêts
et les valeurs propres de l’enseignant. Ainsi, si le jugement professoral peut être dépendant de
l’origine sociale des élèves, de leur âge, de leur sexe ou du type d’établissement fréquenté, il
l’est tout autant – comme le souligne très judicieusement Merle (Merle, 1996) – d’un
ensemble quotidien « d’arrangements » et de « bricolage » des notes, intentionnels ou non3 .
Dès lors, la compréhension des actes évaluatifs nécessite d’une vision ultra-systémique
(Perrenoud, 1995, 1998), mais se double de l’exigence d’une approche ultra-individuelle et
biographique de chaque sujet évaluateur particulier.
2-2 Les arrangements internes
Le premier type de « bricolages », de modifications plus ou moins licite des procédures
d’évaluation, est destiné directement à la classe in vivo et aux élèves qui la composent. Il peut
servir à entretenir un bon climat de travail, à encourager les élèves qui éprouvent des
difficultés ou qui ont des problèmes d’ordre extrascolaire (dans ce cas, les notes sont revues «
à la hausse »), à restaurer l’autorité concrète ou symbolique du maître en sanctionnant certains
comportements (les notes sont alors revues « à la baisse »), à sauvegarder une moyenne de
points habituelle, à amener un élève vers une orientation future plutôt qu’une autre, à céder
aux éventuelles « pressions » diverses des élèves, etc. Habituellement, ces comportements ne
« sortent » pas de la classe, ils ne sont pas délibérément cachés par le maître mais celui-ci s’en
vante rarement car ils font partie de sa propre « cuisine interne », de ses procédures
personnelles (Merle, 1996). L’apposition d’une note relève donc bien également de la
transaction, et constitue un moment particulier – mais essentiel – d’un processus beaucoup
plus large, celui d’une véritable « négociation didactique » entre l’enseignant et ses élèves
(Chevallard, 1991).
2-3 Les arrangements externes
Les arrangements dits externes prennent la même forme que les précédents, mais ils sont
destinés à la direction de l’école, à l’administration, aux collègues, aux parents d’élèves, bref,
à toute personne qui ne participe pas directement au quotidien de la classe, mais qui interagit
néanmoins avec elle. Il s’agit souvent pour l’enseignant de présenter une image de sa classe
qui satisfasse au mieux ces personnes extérieures : qu’adviendrait-il si trop d’élèves étaient en
échec ? Qu’adviendrait-il si tous avaient des résultats exceptionnels ? La réputation et le «
statut » prêté à l’enseignant pourrait être mis à mal et il en serait de même pour celui de
l’établissement. Ce type d’arrangements est évidemment lié très étroitement au précédent
(Merle, 1996) : si par exemple une interrogation écrite est particulièrement mal exécutée par
l’ensemble de la classe et que le professeur décide de ne pas en tenir compte, la finalité d’un
tel acte est double car celui-ci a des conséquences internes, mais aussi externes à la classe
considérée comme le seul groupe d'élèves. Au travers de ces interactions, une évaluation trop
sévère apparaît très vite comme injuste, mais une évaluation trop généralement favorable
s'apparente à du laxisme et celui-ci nuit inévitablement à la réputation de l’enseignant et de
l’établissement (Perrenoud, 1998). Un difficile équilibre doit donc s'établir. Ainsi,
l’enseignant tente souvent de ne pas s’écarter de ses moyennes et des distributions habituelles
des notes (Grisay, 1984 ; Crahay, 1996). Il montre ainsi à quiconque qu’il « tient » sa classe
(Chevallard, 1991). Sur l’importance de ces arrangements externes – soit pour l’essentiel «
intéressés » –, Grisay montre que de nombreux enseignants, une minorité il est vrai, avouent
prendre en considération des éléments « illégitimes » très diversifiés pour établir leur décision
finale – de réussite ou de doublement – pour certains de leurs élèves. Ainsi, les instituteurs
peuvent être influencés par lesinsistances répétées des parents, par le risque que ceux-ci
retirent leur enfant de l’établissement si celui-ci venait à doubler, par le fait que la réussite –
ou le doublement – d’un élève provoque l’ouverture ou la fermeture d’une classe à la future
rentrée scolaire, par le fait que le prochain enseignant de l’élève sera prêt à l’aider et le
soutenir plus qu’à l’accoutumée, par le fait également que l’école accorde ou non une grande
importance à sa « réputation », etc. (Grisay, 1991 [1986]). Il est évident qu’ici encore les
enseignants qui usent de ces pratiques ont de grandes réticences à les dévoiler expressément :
« faire part de sa "cuisine" évaluative et partager ses doutes nécessitent de dévoiler les limites
de son propre jugement et de se mettre en cause professionnellement » (Merle, 1996 : 86).
.2-4 Les arrangements pour soi
Ce troisième type « d’arrangements évaluatifs » est fréquemment ignoré dans de nombreuses
études et ceci principalement à cause de la difficulté de les appréhender et de les regrouper au
sein de types-idéaux exploitables puisqu’ils dépendent directement de l’histoire et de la
personnalité même du sujet-correcteur. Ils sont pris à l’égard de soi-même et peuvent
dépendre d’une foule de représentations personnelles, chacune plus difficilement saisissable
que l’autre : « l’idéal pédagogique » de l’enseignant, sa conception général de l’éducation,
son propre parcours scolaire, son origine sociale, ses engagements politiques et associatifs
particuliers, etc. Les normes de justice scolaire auxquelles peut adhérer, parfois avec force,
l’enseignant sont également déterminantes : l’égalité des chances, l’égalité de traitement ou
l’égalité de résultat, le besoin de l’élève, sa contribution et son mérite, le refus de doublement,
etc. (Barrère, 2000 ; Nicaise, 2001). Il en est de même avec les conceptions générales sur les
écoliers : sont-ce d’abord des élèves à scolariser ou des enfants à éduquer et à socialiser que
l’on a en face de soi ? – (Dubet et Martuccelli, 1996). Tous ces facteurs, tous ces sens donnés
aux pratiques par le sujet selon ses représentations interviennent évidemment de façon
conjointe.

3- En bref…
Ces différentes pratiques montrent donc bien que l’évaluation des élèves, avant d’être une
simple apposition d’une note que l’on croit encore parfois être « vraie », « relève de processus
et de procédures au croisement des contraintes sociales et des biographies des élèves et des
maîtres » (Merle, 1996, p. 306). Ainsi, le processus d’évaluation est dépendant d’un triple
rapport entre le professeur et ses élèves, le professeur et ses contraintes externes, et le
professeur et son passé, son intériorité, lorsqu’il s’engage personnellement dans son travail.
La procédure évaluative n’est donc pas un acte identiquement posé par chaque enseignant.
L’objectivité n’y est pas une norme. Ses règles et ses critères, même les plus généraux, ne
sont d’ailleurs que trop rarement définis et arrêtés au préalable, comme ce peut être le cas
d’une procédure juridique par exemple.
4. Quelques exemples de biais mis en évidence par la docimologie critique
4-1. La distribution forcée
On attribue assez généralement à Posthumus, enseignant hollandais en poste en Indonésie
durant la seconde guerre mondiale et interné dans un camp japonais durant celle-ci, la
paternité d'une loi formulée de la manière suivante par De Landsheere (1992, p. 242): « Un
enseignant tend à ajuster le niveau de son enseignement et ses appréciations des performances
des élèves de façon à conserver, d’année en année, approximativement la même distribution
(gaussienne) de notes5 . » Cette "loi de Posthumus" indique que la distribution des notes
résulte d'une sorte de prototype, communément admis: il existe peu d'élèves exceptionnels
(très faibles ou très brillants), mais beaucoup d'élèves relativement moyens. Lorsque l'on se
place dans la situation d'une épreuve interne, c'est assez souvent ce type de distribution qui est
mise en évidence, alors même que des épreuves externes, appliquées aux mêmes élèves,
indiquent des niveaux moyens très variables et des dispersions différentes, d'une classe à
l'autre. De Landsheere (1992, p. 36), explique ce phénomène de la manière suivante : « Un
professeur qui enseigne de façon non individualisée dans une classe où les élèves ne sont pas
spécialement sélectionnés donne normalement à son cours un degré de difficulté adapté à la
majorité du groupe. Si l’ajustement est correct, il y aura donc beaucoup de résultats moyens,
peu de très bons et peu de très mauvais. La distribution de ces résultats s’approchera de la
courbe gaussienne. Cette distribution, dite normale, est à l’image de beaucoup de qualités
humaines, telles qu’elles se répartissent dans des groupes nombreux, pris au hasard. » Le
même auteur dénonce ce qu’il appelle le dangereux mythe de la courbe de Gauss : « Dans les
sciences humaines, la courbe en cloche de Gauss joue un rôle considérable, parce qu’elle est
l’image même de la répartition de bien des aptitudes et des qualités : les individus moyens
abondent, mais les génies et les idiots, les géants et les nains sont rares. Comme les tests
mesurent souvent des aptitudes, des traits de personnalité ou des performances de vastes
populations, et servent à classer les individus en les comparant les uns aux autres, il est
naturel que ces épreuves soient étalonnées selon la répartition gaussienne : en gros, 70 % de
moyens, 13 % de bons, 13 % de médiocres, 2 % d’excellents, 2 % de très mauvais. » Mais,
l'école n'a pas, en principe, pour visée première, la sélection. Il convient donc de s'interroger
sur la fatalité de la répartition gaussienne des résultats, d'autant que le traitement réservé à
chaque élève dépend, dans ce modèle, de sa position relative initiale dans le groupe
d'apprentissage (Crahay, 1996, 2000). De l'intériorisation de cette distribution forcée
découlent deux phénomènes particuliers:
a) L’effet de tendance centrale :

b) La surprenante stabilité des taux de réussite et d'échec d’année en année.


Certains enseignants sont fiers d’une telle stabilité, preuve pour eux que « l’ordre des
choses » (la courbe de Gauss et un score de passage toujours fixé au même endroit) est «
respecté ». Hutmacher (1993), à Genève, a développé une version de cette théorie adaptée
à l’enseignement primaire, ce qu’il appelle l’hypothèse socio-arithmétique selon laquelle
les maîtres ont dans la tête le nombre « normal » d’échecs (redoublements) par classe : 2
élèves, et font en sorte que ce résultat soit observé. Ce qui débouche sur la conséquence
paradoxale que plus la classe est petite (10 élèves par exemple), plus le taux d’échecs est
élevé (20% pour 10 élèves, 10% pour 20 élèves).
4.2. Les biais résultant de l'interaction entre le correcteur et l'étudiant ou la copie
évaluée
Dans le cas des évaluations internes, menées par l'enseignant lui-même, un certain nombre
d'effets indésirables peuvent résulter de la connaissance que l'enseignant a de l'élève et de
l'idée qu'il se fait de ses compétences, a priori.
4.2.1. Effet de stéréotype ou d’inertie
Le premier type de "parasitage" de la note peut résulter d'une sorte d'effet d'inertie: le
correcteur a tendance à attribuer à un étudiant une note comparable à celles que celui-ci a
acquises auparavant. « La connaissance des résultats antérieurs d’un élève – même
inconnu - tend à influencer l’évaluateur. On assiste à une sorte d’imitation par contagion...
Par stéréotypie, on entend une immuabilité plus ou moins accusée qui s’installe dans le
jugement porté sur l’élève », comme le précise De Landsheere (1992, pp. 47-48). Caverni,
Fabre et Noizet (1975) ont mené l’étude suivante. A des professeurs de sciences de
l’enseignement secondaire, ils ont demandé de noter (sur 20) chacun les 4 mêmes copies,
accompagnées de « 5 notes censées avoir été obtenues précédemment par l’auteur de la
copie ». Chaque série de 5 notes avait deux caractéristiques : sa moyenne (élevée = 13/20
ou faible = 7/20) et sa dispersion, exprimée par la Marge de Variation (MV), c'est-à-dire
l’écart entre les notes extrêmes (MV forte = 10 ; MV faible = 2). De Landsheere (1992, p.
47) commente : « La moyenne exprimait le niveau moyen de l’élève, tandis que la
dispersion exprimait la régularité ou l’irrégularité de ses performances. Un autre
descripteur aurait (encore) pu être utilisé : la succession des notes peut marquer un progrès
(ce qui était le cas ici pour toutes les copies) ou, au contraire, une régression. » Le tableau
ci-dessous indique le résultat obtenu pour chacune des 4 copies (a, b, c et d) dans deux
situations particulières : l'information sur les résultats préalables faisait apparaître une
moyenne forte (13/20) et une marge de variation faible (2 points), dans le premier cas, et
l'inverse (moyenne faible et marge de variation forte), dans le second cas. Comme on peut
le constater, la seconde situation est plus défavorable que la première.

Mais, comme le précise De Landsheere (1992, p. 48) : « On aurait tort de croire que la
stéréotypie influence uniquement les évaluations à base subjective accusée... Elle atteint
des exercices aussi « objectifs » que la dictée orthographique. L’expérience suivante
(inspirée de Zillig, 1967) en témoigne. Un professeur de langue maternelle fait
régulièrement des dictées. Bientôt, il connaît les élèves qui réussissent habituellement le
mieux et le moins bien cet exercice. Si l’on détermine la fréquence des fautes « oubliées »,
non perçues par le correcteur, on constate que les oublis en faveur des bons élèves sont
significativement plus élevés que pour les élèves faibles. Dans le premier cas, le maître
s’attend à ne pas rencontrer d’erreurs ; dans le second, il les guette. » Noizet et Caverni
(1978, p.141) notent : « Il est probable que les premiers indices recueillis, qu’ils soient
positifs ou négatifs, vont… guider le recueil des indices… l’évaluateur cherchant
davantage des indices susceptibles de confirmer ses premières inférences que des indices.
susceptibles de les remettre en question ». Et De Landsheere (1992, p. 54) poursuit : «
Bref, il semble que s’il doit faire des fautes, l’élève a intérêt à les faire dans la seconde
moitié de son examen. C’est… ce qu’une expérience rapportée par Noizet et Caverni
(p.142) confirme. »
4.2.2. Effet de halo
Un autre type de "parasitage" de la note résulte de l'influence de celle-ci par des aspects
non pertinents. Dans ce cas, par exemple, la note est influencée (« contaminée ») par des
caractéristiques de l’étudiant comme son aspect physique, sa présentation vestimentaire,
sa prononciation ou son accent, etc. « L’effet de halo présente un caractère affectif accusé.
Souvent, on surestime les réponses d’un élève de belle allure, au regard franc, à la diction
agréable…Soit pour des raisons de lisibilité, soit pour des raisons nettement affectives,
l’écriture peut aussi influencer le correcteur. » (De Landsheere, 1992, p. 49). Dans cet
ordre d'idée, Chase (1968) a montré que la mauvaise qualité de l’écriture fait baisser le
score. Weiss (1969), de son côté, a fait l’expérience suivante (rapportée par De
Landsheere, 1992, p. 50) : Deux rédactions dactylographiées ont été soumises à 2 groupes
de 46 instituteurs de 4° primaire. Au groupe 1, il dit « Le travail 1 est l’œuvre d’un élève
moyen qui aime lire des BD ; son père et sa mère sont employés. Le travail 2 a été fait par
un enfant doué ; son père est rédacteur d’un quotidien connu ». Pour le groupe 2, les
commentaires ont été inversés. Trois aspects (orthographe, Style, Fond) devaient être
jugés indépendamment, en plus d’une « note Globale », chaque fois sur une échelle à 5
niveaux (1 = TB ; 5 = insuffisant). Comme le précise De Landsheere (1971, p. 35), dont
nous reproduisons la figure inspirée des résultats de Weiss, « Pour les quatre aspects
considérés, les notes attribuées au travail pour lequel on a créé un préjugé favorable ont
été significativement supérieures aux autres. Pour l'orthographe, qui semblait le plus
devoir échapper à l'effet œdipien de la prédiction6 , on observe qu'au travail de l'élève
présenté comme doué, 16% des correcteurs accordent la note très bien et aucun la note
insuffisant; si le même élève est présenté comme moyen, les correcteurs n'accordent
aucun très bien, mais 11% notent insuffisant ».
4.3. Effets de contraste entre copies ou entre étudiants
Plusieurs effets parasites peuvent être identifiés comme relevant de l'interaction entre
copies successives. On les qualifient d'Effets de contraste ou de séquence : la copie qui
suit une copie brillante risque d’être désavantagée et inversement. De Landsheere (1992,
p. 52) décrit ce phénomène de la manière suivante: « Les élèves rompus aux examens ont
depuis longtemps découvert l’importance des contrastes : passer immédiatement après un
candidat brillant se révèle défavorable ; succéder à plus faible que soi peut être
avantageux, à condition que la médiocrité des réponses que l’interrogateur vient d’obtenir
ne l’ait pas mis de trop méchante humeur. » De manière à mettre le phénomène en
évidence, Bonniol (1972) a présenté une série de devoirs à corriger par deux groupes de 9
correcteurs. Ce sont les mêmes devoirs, mais ils sont présentés dans l'ordre inverse dans
les deux groupes. Il observe que les différences (importantes) entre les deux groupes «
sont plutôt imputables aux deux ordres de correction qu’aux différences de critères dont
les examinateurs font état ». A partir de cette observation, il a décidé d’introduire
systématiquement après le premier tiers et après le deuxième tiers de la séquence des
copies initiales des copies aux propriétés (valeurde la note) connues : faibles ou très
bonnes. Bonniol appelle ces copies des ancres. Il définit le concept d'ancre de la manière
suivante: « un stimulus privilégié qui joue comme un stimulus de référence, soit parce
qu’il est présent plus fréquemment que les autres, soit parce qu’il est situé dans une
position particulière, soit parce qu’il est signalé d’une manière ou d’une autre à l’attention
du sujet ». Il appelle Ancre Haute une copie meilleure que les autres, et Ancre Basse une
copie moins bonne que les autres. Pour lui est une Ancre Lourde la succession de trois
ancres du même type. Pour De Landsheere (1992, p. 53), « On émet deux hypothèses :
l’introduction des ancres exercera des effets de contraste, se traduisant par des
déplacements dans l’échelle d’évaluation par surestimation ou sous-estimation des travaux
succédant à l’ancre dans la série, et par modification de l’étendue de l’échelle utilisée. » Il
rapporte que dans sa série d’expériences, Gjorgjevski a extrait de ses 100 copies, 12
jugées « TRES BIEN » (échelon 4) 12 jugées « MEDIOCRE » (échelon 2). Dans chacun
de ces groupes de 12, il a glissé 3 copies jugées « BONNES » (échelon 3). Dans le
premier groupe, les trois copies ont vu leur moyenne passer de 3 à 2,4 et dans l’autre
groupe, de 3 à 3,87. Ce qui confirme les deux hypothèses signalées par De Landsheere.
4.4. L'instabilité d'un même correcteur
Les effets de séquence, de contraste, etc. mais aussi des variations internes au correcteur
(fatigue ou distraction momentanée, hasard..) font qu’un même correcteur peut, à des
moments différents, donner des notes différentes à une même copie. Avec quelles
conséquences pour les candidats, se demandera-t-on dans une perspective pratique ?
Comme le rappelle De Landsheere (1992, p. 45), « Hartog et Rhodes (1935, p. 15) ont
demandé à 14 historiens de noter une deuxième fois 15 compositions 12 à 19 mois après
les avoir notées une première fois. Toute trace de correction avait été effacée. Les
professeurs accordaient non seulement des points, mais indiquaient la réussite globale ou
l’échec. Dans 92 cas sur 210, soit près de la moitié des cas, le verdict a été différent d'une
fois à l’autre. »
4.5. Les différences entre correcteurs
On peut mettre en évidence, en faisant corriger la même copie par plusieurs correcteurs
qualifiés, des différences parfois fort importantes entre les notes attribuées à celle-ci. Ce
type d'études a été mené très tôt. Dans une expérience, rapportée par Piéron (1963, p.
123), une même composition française a été jugée par 76 professeurs de français. Voici la
distribution de leurs notes (NP = Nombre de correcteurs attribuant une note donnée) :

De manière à corriger ce phénomène, Laugier et Weinberg ont appelé valeur « vraie » la


moyenne d’un nombre assez grand de notations indépendantes, pensant qu’en multipliant
les correcteurs, on compensera leurs fluctuations (Piéron, 1963, p.22). Ils ont cherché à
déterminer le nombre minimum d’examinateurs compétents auxquels il faudrait faire
appel pour obtenir la notation méritant confiance. Dans ce but, ils ont utilisé la formule de
Spearman-Brown qui a été présentée dans la partie relative à l'accroissement de la fidélité
des tests en fonction de la longueur, selon la théorie classique. Pour rappel, la formule de
Spearman-Brown, qui a été décrite de manière générale pour tout allongement quelconque
d’un test par un coefficient m, peut s'écrire de la manière suivante :
Au départ de cette formule, les auteurs vont considérer la fidélité inter-correcteurs comme
la fidélité originale 11. Cette fidélité inter-correcteurs est établie sur la base de la
corrélation des notes remises par deux correcteurs confrontés aux mêmes copies. S'il
existe plus de deux correcteurs, on calculera la corrélation moyenne au départ de toutes les
corrélations calculables entre les notes transmises par chaque paire de correcteurs. La
valeur mm sera la fidélité inter-correcteurs qui résulterait de la multiplication du nombre
de correcteurs par m.

CHAPITRE II : LE TRAVAIL PERSONNEL DES ETUDIANTS


TOUT AU LONG DE CE cours, nous allons faire des propositions que je sais être
surprenantes, voire choquantes, comme j’ai pu le constater nombre de fois lors de mes ateliers
de formation. Voici la première d’entre elles : je vous conseille de changer votre
autodéfinition en tant qu’enseignant-chercheur : cessez d’être « transmetteur d’informations »
et devenez « facilitateur d’apprentissage » (Kemp & Keefe, 2003) ! Un transmetteur
d’informations est un enseignant qui considère que ce que les étudiants n’apprennent pas dans
son cours ils ne l’apprendront jamais. Il est donc primordial pour lui de leur communiquer et
leur faire retenir le plus grand nombre d’informations et de connaissances requises. Cela
l’oblige à faire un travail considérable de préparation pour faciliter celui des étudiants : il
structure le matériel, simplifie les informations en ne retenant que les plus pertinentes, et
n’utilise que rarement des textes écrits dans ses cours (livres, chapitres, articles, internet, etc.),
car il juge que leur utilisation fait perdre trop de temps aux étudiants. L’examen de fin
d’année porte sur les informations présentées par l’enseignant. Mieux les étudiants sont
capables de reproduire ce que le professeur a dit en cours, meilleure sera leur note à l’examen.
De manière générale, un transmetteur d’informations pense que sa tâche en tant qu’enseignant
est avant tout de transmettre un maximum de connaissances. Un enseignant qui se voit comme
« facilitateur d’apprentissage » est bien différent. Il aide les étudiants à apprendre par eux-
mêmes. Les étudiants acquièrent une grande partie des informations pertinentes à partir de
textes écrits ou d’exercices. Un facilitateur d’apprentissage passe une partie de son cours à
expliquer et approfondir des points obscurs de la lecture obligatoire et à illustrer ces points par
des démonstrations vivantes. L’enseignant donne aux étudiants de nombreux exercices qui ont
pour but de faciliter la mémorisation du matériel à apprendre. Les examens portent, au moins
en partie, sur la lecture obligatoire. De manière générale, un facilitateur d’apprentissage
pense, qu’en tant qu’enseignant, il est censé effectuer de multiples activités :
– transmettre des connaissances,
– trouver des textes écrits adaptés aux étudiants,
– enseigner des méthodes pour apprendre,
– trouver des exercices facilitant la mémorisation du matériel à étudier, – transmettre des
savoir-faire, – motiver et stimuler les étudiants,
– développer le sens critique des étudiants (Ferguson, 1990).
Nous reviendrons sur les différences entre transmetteur d’informations et facilitateur
d’apprentissage, mais un aspect devrait d’emblée retenir notre attention : un enseignement est
plus « efficace1 » s’il implique les étudiants par du travail personnel en dehors du cours.
Comme nous le verrons, ce travail personnel consiste souvent à lire des textes en relation avec
le cours. Ce chapitre porte sur le travail personnel des étudiants et le choix des lectures
obligatoires et conseillées. La plupart des chercheurs en sciences de l’éducation sont d’accord
sur le fait que la charge de travail que les enseignants peuvent donner à leurs étudiants doit
dépendre de leur niveau (Cross & Steadman, 1996). La règle suivante est souvent proposée :

Pour un cours hebdomadaire de deux heures destiné à des étudiants en L2, l’enseignant
devrait donc donner un travail qui peut être accompli par l’étudiant moyen en deux heures
environ. Il est évident que ce chiffre est à diminuer pour les étudiants ayant de nombreuses
heures de cours par semaine. Je reviendrai plus tard sur ce point important. La Commission
européenne considère que l’on peut demander aux étudiants à temps plein en licence de
travailler entre 1 500 et 1 800 heures par an (voir le ECTS User’s Guide, téléchargeable en
ligne). Si l’on considère que l’étudiant moyen obtient 60 crédits ECTS par année
universitaire, un crédit ECTS devrait correspondre à 25 à 30 heures de travail (présentiel et
travail personnel). Par « travail personnel », on entend toute activité académique que
l’étudiant effectue en dehors du cours, seul ou en groupe. Dans la plupart des cas, l’enseignant
demande à ses étudiants de lire des textes en relation avec le cours, par exemple un manuel
d’introduction ou des articles scientifiques. Étant donné la place importante de la lecture dans
le travail des étudiants, une grande partie de ce chapitre porte sur la lecture obligatoire et la
lecture conseillée. Mais le travail personnel peut aussi comprendre d’autres activités telles que
les exercices, les dissertations, la préparation d’une présentation en classe, la recherche de
littérature pertinente, la réalisation d’une expérience et de la programmation. Les recherches
montrent qu’un étudiant en licence apprendra plus s’il passe environ la moitié de son temps en
cours et l’autre moitié à effectuer du travail personnel (Zimmerman, 1998). Notons que le
rapport idéal entre temps passé en cours et temps passé à travailler en dehors du cours dépend
de la discipline en question. Dans certaines disciplines, par exemple, une grande partie de
l’enseignement consiste en une transmission de savoir-faire, souvent plus efficace sous la
surveillance d’un enseignant qu’en dehors du cours. Pour quelle raison les étudiants
apprennent-ils plus s’ils dédient environ la moitié de leur temps au travail personnel ? Tout
simplement parce que ce travail implique de l’apprentissage actif et requiert donc de la part de
l’étudiant une démarche d’évaluation et de choix (Allen & Tanner, 2005) : quelles sont les
informations pertinentes ? que conclure de cette étude ? la réponse trouvée à l’exercice est elle
satisfaisante ou convient-il de continuer à chercher ? L’utilité du travail personnel n’est pas à
sous-estimer. Dans une conversation récente, Aaron Brower, Décan de l’Enseignement à
l’université de Wisconsin (USA), m’a dit : « La quasi-totalité de l’attention des membres de
mon service est focalisée sur l’amélioration des conditions d’apprentissage en dehors du
cours. Cela fait 40 ans que nous travaillons sur la qualité de l’enseignement pendant les cours,
et nous avons fait des progrès énormes. Mais tout le monde semble avoir oublié qu’une
grande partie de l’apprentissage a lieu à l’extérieur des cours. Mes collaborateurs et moi nous
intéressons maintenant à la façon dont on peut rendre le temps de travail personnel plus
efficace. » Il m’a ensuite parlé des « communautés d’apprentissage » qu’il a mises en place,
ainsi que des réaménagements effectués dans les cités universitaires et les bibliothèques (voir
chapitre 11). Un bon moyen d’augmenter l’efficacité du travail personnel est d’enseigner aux
étudiants les méthodes de travail dont ils ont besoin (Weinstein, Acee & Jung, 2010). Les
cours de méthodologie du travail universitaire donnés dans de nombreuses universités
françaises sont loin d’être une perte de temps. Les étudiants y apprennent le fonctionnement
de la mémoire humaine, leur permettant de comprendre pourquoi certaines techniques de
mémorisation (ex : la « méthode des loci ») et méthodes d’apprentissage (ex : répétition à
intervalles croissants) sont particulièrement efficaces (Siebert, Gilpin, Karr, & Ritter, 2000).
Les étudiants y apprennent aussi des savoir-faire utiles, tels que la prise de notes ou des
méthodes de lecture permettant de maximiser le nombre d’informations retenues dans un
temps donné. Une méthode de lecture, appelée « EQLAT », est présentée en annexe de ce
livre. Comment rendre son enseignement plus efficace si l’on enseigne à des étudiants qui
ont 35 heures de cours par semaine ? Votre seule possibilité est d’« injecter » du travail
personnel dans vos cours (McEwen, Harris, Schmid, Vogel, Western, & Harrison, 2009).
Plutôt que de parler pendant deux heures, vous pouvez demander à vos étudiants d’effectuer
un travail personnel, seul ou en groupe, dans la salle de cours, pendant la moitié du temps
environ. Pendant ce temps, vous êtes dans la salle, disponible pour répondre aux questions,
mais vous restez relativement discret. Plus vous restez passif, plus le travail personnel
impliquera un apprentissage actif de la part des étudiants (Schank, Berman, & Macphearson,
1999) ! Finalement, encouragez le directeur d’UFR et son équipe de direction à réfléchir sur
le nombre idéal d’heures de cours. En considérant les recherches empiriques en pédagogie et
sciences de l’éducation, on se rend vite compte que 35 ou 40 heures de cours par semaine sont
une utilisation plutôt ineffi cace du temps des étudiants. Ceux-ci apprendraient plus s’ils
n’avaient que 20 à 25 heures de cours et 20 à 25 heures de travail personnel par semaine. En
discutant avec votre directeur d’UFR, il vous dira peut-être que les 40 heures de cours existent
avant tout pour permettre aux enseignants-chercheurs de remplir leur charge d’enseignement.
Dans certaines UFR de sciences dites « exactes », il y a un enseignant-chercheur pour 10
étudiants. Comme chaque enseignant doit faire 192 heures TP d’enseignement en France, la
seule solution est d’obliger les étudiants à suivre 40 heures de cours par semaine. Je ne sais
effectivement pas comment je m’y prendrais en tant que directeur d’une telle UFR, mais
soyons clairs sur un point : si certains étudiants ont 40 heures de cours par semaine, ce n’est
pas nécessairement dans le souci de leur don ner la meilleure formation possible. Si vous
souhaitez obtenir des informations supplémentaires, n’hésitez pas à consulter les
nombreuses publications sur l’enseignement des sciences dites « exactes »
1- La nécessité de la lecture obligatoire
Le travail personnel consiste dans la plupart du temps à lire des « lectures obligatoires », ainsi
que nous l’avons déjà évoqué. La lecture obligatoire concerne des textes écrits – extraits de
livres, articles scientifiques, sites web – que les étudiants doivent lire chaque semaine s’ils
veulent réussir dans votre cours, et ce quelle que soit la discipline concernée. Pourquoi la
lecture obligatoire donnée aux étudiants augmente-t-elle l’efficacité d’un enseignement ? Il y
a au moins cinq bonnes raisons à cela (Collins, 1977). ¾ Premièrement, la lecture obligatoire
facilite l’apprentissage actif. Rappelez-vous que les étudiants apprennent plus s’ils
participent activement au processus d’acquisition de connaissances. Un étudiant assis dans un
cours magistral classique et un étudiant avachi devant la télévision se ressemblent dans la
mesure où les deux subissent passivement le programme qui leur est fourni. La lecture d’un
texte nécessite déjà en soi des efforts de réflexion de la part de l’étudiant obligé de choisir
parmi les informations celles qui méritent d’être mémorisées, mais elle peut être transformée
en un exercice encore plus « actif » par les enseignants. Nombre d’entre eux donnent à leurs
étudiants des questions sur le texte à préparer pour le prochain cours (à l’oral ou par écrit), qui
peuvent prendre la forme suivante :
1. Quelles sont les différences les plus importantes entre le modèle A et le modèle B ?
2. Le chercheur C a reçu le prix Nobel pour ses travaux sur XYZ. Vu les travaux antérieurs
des chercheurs A et B, les travaux de C étaient-ils suffisamment novateurs/importants pour
mériter le prix Nobel ? Justifiez votre réponse.
3. Nommez les quatre conditions qui doivent être satisfaites pour que le processus X puisse
avoir lieu ?
4. L’auteur du texte affirme que les résultats des chercheurs D et E sont contradictoires. Le
sont-ils vraiment? Essayez de trouver un cadre théorique permettant d’expliquer les deux
résultats. 5. Quelle est la conclusion la plus importante que l’on peut tirer de la première
section du texte (pp. 34-37) ?
Certains manuels universitaires contiennent des questions de ce genre à la fin de chaque
chapitre. L’enseignant peut alors se limiter à communiquer aux étudiants les numéros des
questions qu’ils ont à préparer. Une autre méthode permettant de transformer la lecture d’un
texte en un exercice d’apprentissage actif est de demander de rédiger une dissertation courte
sur la lecture obligatoire (entre 1/2 page et 3 pages). Le thème de la dissertation peut être une
prise de position, un résumé, ou une discussion sur le thème abordé dans le texte. De manière
générale, il convient de convaincre les étudiants d’adopter une attitude active en lisant un
texte écrit (Satterlee & Lau, 2003). Un livre est un outil de travail et non pas une pièce de
musée. Il se lit donc avec un crayon à la main. Encouragez vos étudiants à « annoter » le texte
: les phrases importantes sont soulignées, les idées importantes sont identifiées avec des
points d’exclamation dans la marge, les argumentations peu conrogation… Les étudiants ne
doivent pas hésiter à écrire des commentaires dans les marges. Un texte annoté avec des « pas
vrai ! », « bon point », « mais voir chapitre 3 » est un texte qui a été travaillé activement et
non pas lu passivement. La méthode « EQLAT », présentée en annexe, est une autre méthode
de lecture qui favorise une attitude active et ainsi la mémorisation du matériel présenté.
Deuxièmement, vous préparez mieux vos étudiants à la vie professionnelle s’ils prennent
l’habitude d’apprendre à partir de textes écrits (Paris, Lipson, & Wixson, 1983). Dans un
monde professionnel en constante progression – il est estimé que les connaissances des
scientifiques doublent tous les vingt ans – chacun de vos étudiants rencontrera, au cours de sa
carrière professionnelle, une situation dans laquelle il devra se former à un thème nouveau.
Or, que va-t-il faire si, dans ses études, toutes les nouvelles connaissances lui ont été
transmises par un professeur, sous forme orale, et surtout sous forme simplifiée, présentées
sur un plateau d’argent, et administrées une à une, comme à la petite cuillère ? Un tel étudiant
n’aura même pas les savoir-faire pour trouver des textes pertinents (bibliothèque, internet,
etc.). Il n’aura jamais appris à extraire des informations importantes… Bref, il n’aura jamais
appris à se former lui-même à partir d’un texte écrit. Or, soyons réalistes : les personnes
exerçant une activité professionnelle nécessitant une formation universitaire doivent être
capables d’élargir leur champ de compétences en consultant des textes écrits. Une formation
universitaire complète doit leur transmettre ce savoir-faire.
« Donne un poisson à un homme, tu le nourris pour un jour. Apprends-lui à pêcher, il se
nourrira toute sa vie. » Lao Tseu
Troisièmement, l’utilisation de lectures obligatoires vous libère de l’obligation de ne rien
oublier. Plus tard, dans le chapitre 5, j’essaierai de vous convaincre de ne pas lire votre cours
magistral mais de développer des idées en parlant librement à partir de notes sommaires. Or,
qui de nous n’a pas connu cette expérience : oublier de dire des points importants lorsqu’il
parle librement? Combien de fois moi-même me suis-je tapé sur la tête quelques heures après
un cours en m’en rendant compte ? Tous ces oublis deviennent moins problématiques grâce à
la lecture obligatoire, véritable filet de sécurité. On pourrait même avancer l’idée selon
laquelle il serait tout à fait positif que les étudiants réalisent qu’ils ne pourront comprendre
entièrement vos explications que s’ils ont lu la lecture obligatoire avant de venir en cours.
Quatrièmement, la lecture obligatoire évite aux étudiants de tout noter pendant le cours. Un
cours magistral classique prend la forme suivante. Le professeur parle et les étudiants essaient
de prendre un maximum de notes. Certains étudiants ont même développé tout un système
d’abréviations leur P001-224-9782200254582.indd 22 20/05/11 permettant de noter un
maximum de mots prononcés par le professeur. Toute leur attention est focalisée sur la prise
de notes, c’est-à-dire qu’ils tentent de stocker le plus grand nombre d’informations auditives
dans leur mémoire à court terme pour pouvoir les noter quand le professeur respire ou change
de transparent. De manière simplifiée, on peut dire que les étudiants utilisent leurs ressources
cognitives pour effectuer des tâches dites superficielles, mais que le matériel n’est traité en
profondeur que lorsque les étudiants relisent leurs notes ou se préparent pour l’examen. Prise
de notes et compréhension sont des processus différents et séparés. En revanche, si les
étudiants acquièrent les informations pertinentes en lisant des textes, ils peuvent utiliser leurs
ressources cognitives pendant le cours magistral pour comprendre le matériel présenté, établir
des liens avec des connaissances déjà acquises, évaluer les preuves expérimentales ou les
arguments en faveur d’une théorie. Ainsi, le matériel est traité en profondeur au moment où le
professeur en parle, ce qui permet une meilleure mémorisation. Cela donne aussi aux
étudiants la possibilité de poser des questions tout de suite si quelque chose n’est pas clair. Si
vous faites partie des gens qui pensent que le fait de noter de nombreuses informations aide la
mémorisation, je vous conseille de faire ce petit test. Faites un cours magistral classique où
vous parlez rapidement et où les étudiants essaient de noter le maximum des informations que
vous énoncez ainsi que celles indiquées sur les transparents. À un moment donné, arrêtez-
vous et posez une question sur un point que vous avez traité cinq minutes auparavant. Vous
allez être surpris du faible niveau de compréhension de vos étudiants. Preuve en est que noter
un maximum d’informations et comprendre ces informations sont bien deux choses
différentes. En utilisant la lecture obligatoire vous permettez à vos étudiants de focaliser leur
attention sur la compréhension pendant qu’ils sont en cours.
Le cinquième et dernier argument en faveur de l’utilisation de la lecture obligatoire est peut-
être que de nombreuses méthodes pédagogiques présentées dans ce livre, et dont l’efficacité a
été prouvée par des recherches empiriques, ne peuvent être utilisées si les étudiants ont leur
professeur comme seule source d’informations (Marbach-Ad & Sokolove, 2000). Avant de
voir comment gérer les problèmes techniques et logistiques associés à l’utilisation de la
lecture obligatoire, abordons la question du type de textes à utiliser.
SYNTHESE
Dans ce chapitre nous avons essayé de vous convaincre de donner du travail personnel à vos
étudiants. Votre enseignement sera plus efficace si une partie de l’apprentissage se fait en
dehors du cours. Si vos étudiants ont beaucoup d’heures de cours, vous pouvez leur demander
d’effectuer du travail personnel pendant vos heures de cours. Attention, donner du travail
personnel aux étudiants n’implique pas un désinvestissement de l’enseignant. Au contraire, ce
travail personnel se doit d’être préparé, encadré, et suivi. Voici quelques tâches que
l’enseignant devra effectuer : choisir les lectures obligatoires appropriées, aider les étudiants à
lire les textes difficiles, préparer des questions sur les textes, développer les exercices qu’ils
devront faire chez eux, s’assurer qu’ils ont réellement lu la lecture obligatoire (ex : test QCM
en début du cours), corriger les exercices, trouver des activités pédagogiques leur permettant
d’utiliser lors du cours suivant les informations nouvelle ment acquises, les rencontrer afin
de discuter du plan de leur exposé, et ainsi de suite. Un facilitateur d’apprentissage ne
travaille pas moins qu’un transmetteur d’informations, il travaille juste différemment.

CHAPITRE III : LES EXAMENS


LES ÉVALUATIONS, examens et contrôles continus, sont un élément essentiel de
chaque enseignement. Ils remplissent une triple fonction (Angelo & Cross, 1993) :
1. classer les étudiants sur une échelle, qui détermine quels étudiants valident le cours et
peuvent passer au niveau supérieur ;
2. permettre aux étudiants d’identifier leurs points forts et leurs points faibles et de savoir
dans quel cours ils doivent investir plus de temps ;
3. permettre à l’enseignant de voir ce qui a été bien ou mal compris, lui donnant ainsi des
pistes sur la manière d’améliorer son enseignement. Signalons tout de suite une fonction
que les examens ne devraient pas remplir : celle de transmettre des connaissances et des
savoir-faire que les étudiants n’ont pas appris pendant leurs cours à l’université. Je
reviendrai sur ce point important plus tard. Avant d’aborder les avantages et les
inconvénients des différents types d’évaluation, permettez-moi d’aborder quelques aspects
techniques liés à la mesure de connaissances.
1-Mesurer les connaissances
De nombreux chercheurs en sciences sociales travaillent de manière empirique, c’est-à-
dire qu’ils récoltent des données pour confirmer ou infirmer leurs hypothèses. L’objectif
consiste alors à mesurer des concepts abstraits : la motivation, la délinquance, la mobilité,
l’intelligence et, dans le cas des sciences de l’éducation, les connaissances des étudiants.
Une grande partie du travail d’un chercheur en sciences sociales consiste alors à
s’interroger sur la qualité de ses instruments de mesure. Du fait de l’objet de leur mesure,
les processus mentaux, accessibles seulement de façon indirecte, les instruments de
mesure utilisés par les chercheurs en sciences sociales sont rarement aussi fiables et
valides que ceux utilisés par les chercheurs dans les sciences dites « dures ». Pour certains,
la faible qualité des instruments.
de mesure est une raison de dénigrer la recherche scientifique en sciences sociales. Pour
d’autres, dont je fais partie, cette faible qualité est perçue comme un défi. En effet,
comment démontrer scientifiquement des relations de cause à effet si l’on ne dispose que
d’instruments de mesure imparfaits ? Il n’est donc pas surprenant que nous, les chercheurs
en sciences sociales, dédiions une grande partie de notre temps à nous interroger sur nos
instruments de mesure dans l’optique de les améliorer. Nous nous posons des questions
telles que « Quel instrument capture le mieux ce que nous souhaitons mesurer ? » (validité
conceptuelle), « Quel instrument, si on l’utilise une deuxième fois auprès des mêmes
participants, donne des mesures identiques (ou du moins le plus similaires possible) à
celles obtenues la première fois ? » (fiabilité), et « Quel instrument permet de faire les
meilleures prédictions du comportement ultérieur ? » (validité prédictive). Certains
chercheurs en sciences sociales ont même abandonné l’étude des relations de cause à
effet, et consacrent toute leur activité au développement et au perfectionnement
d’instruments de mesure de bonne qualité. Pourquoi ai-je évoqué ces points ? Je voudrais
vous faire prendre conscience que la question de la mesure des connaissances des
étudiants n’a pas été prise à la légère par les chercheurs en sciences de l’éducation.
Trouver de bonnes méthodes d’évaluation des connaissances est un objectif qui préoccupe
un grand nombre de chercheurs (Hattie & Timperley, 2007 ; Ory & Ryan, 1993). Je
voudrais vous exposer brièvement un des résultats les plus importants de la recherche sur
cette question, essentiel pour comprendre le contenu de ce chapitre. Ce résultat est que
tout score observé à un examen est déterminé par trois variables : les vraies connaissances
de l’étudiant, les « erreurs systématiques » et les « erreurs aléatoires ». Les erreurs
systématiques sont les erreurs qui vont se reproduire de la même manière (ou de manière
très similaire) si l’on utilise le même instrument de mesure une deuxième fois avec les
mêmes étudiants. Les erreurs aléatoires sont les erreurs qui vont probablement ne pas se
reproduire de la même manière si l’on utilise le même instrument une deuxième fois.
2- SYNTHESE
Comme nos ressources de temps en tant qu’enseignants ne sont pas illimitées, nous sommes
souvent obligés de choisir un nombre restreint de méthodes d’évaluation. Mais comment les
choisir ? Un conseil est de privilégier les méthodes en adéquation avec les objectifs du cours.
Si le but de votre cours est que les étudiants mémorisent un grand nombre d’informations, les
tests avec des questions à choix multiples et des questions ouvertes à réponses très courtes
sont tout à fait appropriés. Si votre but est de transmettre des savoir faire (ex : programmer,
utiliser un instrument de mesure), les exercices individuels en classe et les projets de groupes
sont particulièrement adaptés. Si vous voulez favoriser l’esprit critique et analytique de vos
étudiants, les meilleures méthodes d’évaluation sont les dissertations longues et les tests avec
des questions ouvertes à réponses longues. Quel que soit l’objectif d’apprentissage du cours, il
est toujours conseillé d’utiliser au moins trois méthodes d’évaluation différentes (Sanders,
2001).
Un deuxième aspect important est de donner du feedback rapidement. Cela ne sert à rien de
rendre l’examen de milieu de semestre une semaine avant l’examen final. Chaque exercice
devrait être rendu avant que les étudiants commencent à travailler sur le suivant. Pareil pour
les dissertations courtes. Il est donc primordial pour vous de corriger rapidement les
productions des étudiants, et ceci pour trois raisons. Tout d’abord une correction rapide
augmente l’estime que les étudiants ressentent pour vous. Vous donnez l’impression d’être
bien organisé et compétent. De plus une correction rapide contribue au maintien des bonnes
relations entre vous et les étudiants, car ils souhaitent toujours connaître rapidement les notes
qu’ils ont obtenues. En corrigeant leurs copies rapidement, vous montrez que vous vous
souciez de leur bien-être. Enfin, une évaluation a pour fonction, entre autres, d’indiquer aux
étudiants si la quantité de travail qu’ils investissent dans votre cours est suffisante. Une
mauvaise note indique qu’ils doivent investir plus de temps ou travailler autrement. Mieux
vaut avoir ce genre de feedback le plus vite possible (Schultz & Weinstein, 1990). Un dernier
conseil est de prendre conscience des biais dont nous sommes victimes quand nous évaluons
les performances de nos étudiants. Je connais de nombreux collègues qui nient l’existence de
ces biais. J’ai entendu des phrases telles que « Moi, je ne suis pas influencé par l’écriture d’un
étudiant quand je corrige les copies » et « En tant qu’enseignant en physique, je ne me laisse
pas influencer par des caractéristiques non académiques de la personne faisant une
présentation, même s’il s’agit d’une étudiante jolie. » Ces collègues ne sont jamais influencés
par quoi que ce soit. Si les entreprises dépensent chaque année des millions d’euros pour la
publicité c’est pour les autres. Si les entreprises versent des sommes d’argent importantes aux
grandes surfaces pour que leurs produits soient présentés à hauteur des yeux, et non pas sur
l’étagère du bas, c’est pour les autres. J’ai un message pour ceux qui pensent que leurs
jugements sont libres de tout biais : arrêtez de vous mentir ! Des centaines d’études
empiriques montrent que nos jugements sont influencés par des variables non pertinentes
(Font et Brauer, 2012). Et cette influence n’est pas limitée aux débutants. Tout comme les
recruteurs professionnels sont influencés par l’attractivité physique et l’appartenance ethnique
de la personne quand ils évaluent des CV avec des photos (Amadieu, 2004), nos jugements
lors de la correction de copies ou de l’évaluation de présentations sont influencés par des
variables telles que nos attentes préalables, l’écriture, la qualité de la copie ou de la
présentation précédente, ou encore l’apparence physique. Plutôt que de nier l’existence de
biais de jugements, mieux vaut utiliser des méthodes qui minimisent ces biais. L’objectif de
ce chapitre était de vous donner des pistes de réflexion dans ce sens.

CONCLUSION
Nous l'avons précisé avant d'entamer ce cours, la docimologie critique a permis d'attirer
l'attention des correcteurs et des enseignants sur la nécessité d'un soin particulier quand aux
différents parasitages possibles de la notation. Les expériences nombreuses et déjà anciennes
qui sont mentionnées, et qui ne constituent qu'un petit échantillon de ce qui a pu être réalisé
entre les années 1920 et les années 1970, ne doivent pas conduire au rejet absolu de la
notation subjective. C'est impossible. Ces résultats ne doivent sans doute pas plus conduire au
rejet de toute forme d'évaluation en dehors de l'usage de questions à réponse fermée
(vrai/faux, QCM), mais faire réfléchir à des formules efficaces - la méthode d'examen doit
rester praticable dans des conditions normales - et justes. Ce second critère est essentiel car il
s'agit d'apprécier les compétences de sujets humains. Les examens décident de plus en plus,
quand il ne s'agit pas de concours, du sort de personnes. Il convient d'y être attentif. Et si cette
attention n'est pas nécessairement spontanée chez tous les examinateurs, le risque est grand de
voir intervenir de plus en plus d'autres acteurs dans la sphère scolaire à l'occasion de
l'évaluation. On constate en effet que la judiciarisation8 et la juridiciarisation9 sont deux
menaces importantes qui pèsent sur la liberté énorme, pour ne pas dire totale, qui avait
prévalu jusqu'il y a peu dans le domaine de l'évaluation scolaire. Pour s'en convaincre, il suffit
de se reporter au dossier d'information10 préparé pour la journée organisée conjointement par
l'Association pour le Développement des Méthodologie d'Evaluation en Education et
l'Association internationale de Pédagogie universitaire, le 4 décembre 2001 à Liège. On peut
notamment consulter l'article de V. De Landsheere sur "la responsabilité civile découlant de
l'enseignement dispensé" et qui est paru dans le Journal des procès du 30 décembre 1988 (n°
141, pp. 10-13). Ce dernier attire l'attention sur l'importance du phénomène de judiciarisation
aux Etats-Unis, il y a plus de quinze ans, et peut préfigurer ce qui pourrait se produire de plus
en plus chez nous, si on n'apporte pas un soin particulier aux évaluations.

BIBLIOGRAPHIE
Agazzi, A. (1967). Les aspects pédagogiques des examens. Strasbourg: Conseil de l'Europe.

Barrere, A. (2000). Sociologie du travail enseignant. L’Année sociologique, 50(2), 469-492.

Dieudonné Leclercq, Julien Nicaise et Marc Demeuse (2002).DOCIMOLOGIE CRITIQUE : DES


DIFFICULTÉS DE NOTER DES COPIES ET D’ATTRIBUER DES NOTES AUX ÉLÈVES

UPCRAFT, M. L. (1996). Teaching and today’s college students. In R. Menges, M. Weimer, &
Associates (eds.), Teaching on solid ground : Using scholarship to improve practice (pp. 21-41). San
Francisco, CA, US : Jossey-Bass.

Vous aimerez peut-être aussi