Mesure Et Évaluation Éducatives
Mesure Et Évaluation Éducatives
1
OBJECTIF DU COURS
Pour aider le stagiaire à acquérir les compétences nécessaires à la construction de tests et à l'interprétation des résultats.
résultat pour un enseignement de haute qualité
CONTENU DU COURS
Construction de tests ; importance de la validité et de la fiabilité des tests, différentes manières de les évaluer
validité et fiabilité des tests. Construction d'éléments de test ; lignes directrices pour l'information sur la réalisation.
éléments de test valides, test de la validité et de la fiabilité des éléments de test, préparation de la notation
schémas
indice de discrimination.
Interpréter les résultats des tests ; évaluation et notation, analyser les résultats des examens, rapporter
résultats des tests. Types et catégories d'évaluation ; évaluation formative, évaluation sommative
evaluation, placement evaluation, diagnostic evaluation.
2
Matériel et équipements pédagogiques
Projecteur
Évaluation de cours
Examen 70%
Évaluations continues (Exercices et Tests) 30%
Total 100%
Objectifs
À la fin de ce sujet, vous devriez être capable de :
Définir les termes utilisés dans la mesure et l'évaluation éducatives
Expliquez l'importance de la mesure et de l'évaluation dans l'éducation.
Identifier et expliquer les approches utilisées dans la mesure et l'évaluation éducatives
O Introduction
La mesure et l'évaluation éducatives sont l'étude des méthodes, des approches et des stratégies utilisées pour
mesurer, évaluer et apprécier dans le cadre éducatif. L'évaluation a été conçue soit comme le
évaluation du mérite et de la valeur des programmes éducatifs (Guba et Lincoln, 1981 ; Glatthorn,
1987 ; et Scriven, 1991), ou comme l'acquisition et l'analyse d'informations sur un domaine éducatif donné
programme dans le but de la prise de décision (Nevo, 1986; Shiundu & Omulando, 1992). Le cours
implique l'étude des tests, de la construction de tests et de la construction d'items ainsi que des procédures statistiques utilisées
analyser les tests et les résultats des tests.
Test : Une méthode pour déterminer la capacité d'un étudiant à réaliser certaines tâches ou à démontrer sa maîtrise.
d'une compétence ou d'une connaissance du contenu. Certains types seraient des tests à choix multiples, ou un hebdomadaire
test d'orthographe. Bien qu'il soit couramment utilisé de manière interchangeable avec évaluation, ou même évaluation,
peut être distingué par le fait qu'un test est une forme d'évaluation. Un test ou une évaluation
fournit des informations relatives à un objectif ou un but. Dans ce sens, nous testons ou évaluons pour déterminer
que l'objectif ou le but a été atteint ou non.
Évaluation : L'évaluation est un processus par lequel des informations sont obtenues par rapport à un certain connu
objectif ou but. L'évaluation est un terme large qui inclut les tests. Un test est une forme spéciale de
évaluation. Les tests sont des évaluations réalisées dans des circonstances artificielles, surtout afin que
peuvent être administrés. En d'autres termes, tous les tests sont des évaluations, mais toutes les évaluations ne sont pas des tests.
Une évaluation peut également inclure des méthodes telles que des observations, des entretiens, la surveillance des comportements,
etc. Nous testons à la fin d'une leçon ou d'une unité. Nous évaluons les progrès à la fin d'une année scolaire à travers
test, et nous évaluons les compétences verbales et quantitatives à travers des instruments tels que le SAT et
GRE. Que ce soit implicite ou explicite, l'évaluation est le plus utilement liée à un objectif ou
objectif pour lequel l'évaluation est conçue.
Le processus de collecte d'informations pour suivre les progrès et prendre des décisions éducatives
si nécessaire. L'évaluation est donc assez différente de la mesure et a des usages qui
suggérer des objectifs très différents.
L'évaluation de l'acquisition des compétences est plutôt simple. Soit la compétence existe à un niveau acceptable.
Le niveau ou il ne l'est pas. Les compétences sont facilement démontrables. L'évaluation de la compréhension est beaucoup plus
difficile et complexe. Les compétences peuvent être pratiquées ; les compréhensions ne le peuvent pas. Nous pouvons évaluer une personne.
11
la connaissance de différentes manières, mais il y a toujours un saut, une inférence que nous faisons à propos de
ce qu'une personne fait par rapport à ce que cela signifie sur ce qu'elle sait.
Évaluation : Procédures utilisées pour déterminer si le sujet (c'est-à-dire l'étudiant) répond à un critère prédéfini
critères, tels que la qualification pour des services d'éducation spécialisée. Cela utilise l'évaluation (rappelez-vous que
une évaluation peut être un test) pour déterminer la qualification conformément à une
critères prédéterminés. L'évaluation est peut-être le plus complexe et le moins compris des
Les termes. Inhérent à l'idée d'évaluation est "valeur". Lorsque nous évaluons, ce que nous faisons est
s'engager dans un processus conçu pour fournir des informations qui nous aideront à prendre une
jugement sur une situation donnée. En général, tout processus d'évaluation nécessite des informations sur
la situation en question. Quand nous évaluons, nous disons que le processus produira
informations concernant la valeur, la pertinence, la bonté, la validité, la légalité, etc.
quelque chose pour lequel une mesure ou une évaluation fiable a été faite.
Nous évaluons chaque jour. Les enseignants, en particulier, évaluent constamment les élèves, et cela est tel
les évaluations sont généralement effectuées dans le contexte de
comparaisons entre ce qui était prévu (apprentissage, progrès, comportement) et ce qui a été obtenu.
Lorsqu'il est utilisé dans un objectif d'apprentissage, la définition d'évaluer est : classer des objets, des situations,
les personnes, les conditions, etc., selon des critères de qualité définis. L'indication de la qualité doit être
donné dans les critères définis de chaque catégorie de classe.
La mesure fait référence au processus par lequel les attributs ou les dimensions d'un objet physique
les objets sont déterminés. Une exception semble être dans l'utilisation du mot mesure dans
déterminer le QI d'une personne, attitudes ou préférences.
Cependant, lorsque nous mesurons, nous utilisons généralement un instrument standard pour déterminer la taille.
grand, lourd, volumineux, chaud, froid, rapide, ou droit quelque chose est réellement. Instruments standard
se référer à des instruments tels que des règles, des balances, des thermomètres, des manomètres, etc. Nous mesurons pour
obtenir des informations sur ce qui est. Ces informations peuvent être utiles ou non, selon
la précision des instruments que nous utilisons et notre habileté à les utiliser.
Pour résumer, nous mesurons la distance, nous évaluons l'apprentissage et nous évaluons les résultats en termes de
un ensemble de critères. Ces trois termes sont certainement liés, mais il est utile d'en penser.
comme des idées et des processus séparés mais connectés
Évaluation : L'évaluation est un processus par lequel des informations sont obtenues par rapport à quelque chose de connu.
objectif ou but. L'évaluation est un terme large qui inclut les tests. Un test est une forme spéciale de
évaluation. Les tests sont des évaluations effectuées dans des circonstances artificielles, surtout afin qu'ils
peut être administré. En d'autres termes, tous les tests sont des évaluations, mais toutes les évaluations ne sont pas des tests.
Une évaluation peut également inclure des méthodes telles que des observations, des entrevues, et la surveillance du comportement.
etc. Nous testons à la fin d'une leçon ou d'une unité. Nous évaluons les progrès à la fin d'une année scolaire par le biais de
test, et nous évaluons les compétences verbales et quantitatives à travers des instruments tels que le SAT et
GRE. Qu'elle soit implicite ou explicite, l'évaluation est le plus utile lorsqu'elle est liée à un objectif ou à ...
objectif pour lequel l'évaluation est conçue.
Plus précisément, l'évaluation est une méthode que l'enseignant utilise pour prendre des décisions sur les apprenants.
progrès. C'est un processus essentiel dans l'enseignement et l'apprentissage car il permet au professeur d'évaluer
le niveau et l'étendue des réalisations des apprenants par rapport aux objectifs fixés.
12
ii. Détermine combien de connaissances les apprenants ont assimilées.
iii. Établit comment les apprenants ont maîtrisé les compétences enseignées et acquis des attitudes
iv. Détecte les difficultés et les défis auxquels les apprenants sont confrontés, ce qui constitue la base
pour l'enseignement de remédiation
Une bonne évaluation peut aider les étudiants à devenir des apprenants autonomes plus efficaces (Angelo
et Cross, 1993). Des stratégies d'évaluation bien conçues jouent également un rôle crucial dans l'éducation.
la prise de décision et est un élément vital des processus d'amélioration continue de la qualité à la
niveau de leçon, de cours et/ou de programme.
L'évaluation sommative est utilisée principalement pour prendre des décisions concernant les notes ou déterminer la préparation.
pour la progression. Typiquement, l'évaluation sommative a lieu à la fin d'une activité éducative et
est conçu pour évaluer la performance globale de l'apprenant. En plus de fournir la base pour
13
L'évaluation sommative est utilisée pour communiquer les capacités des étudiants à l'extérieur.
parties prenantes, par exemple, administrateurs et employeurs.
L'évaluation formelle a lieu lorsque les étudiants sont conscients que la tâche qu'ils effectuent est pour
des fins d'évaluation, par exemple, un examen écrit ou un OSCE. La plupart des évaluations formelles également
sont de nature sommative et ont donc tendance à avoir un impact motivationnel plus important et sont associées
avec une augmentation du stress. Étant donné leur rôle dans la prise de décision, les évaluations formelles devraient être
tenus à des normes plus élevées de fiabilité et de validité que les évaluations informelles.
L'évaluation finale (ou terminale) est celle qui a lieu uniquement à la fin d'une activité d'apprentissage.
est le plus approprié lorsque l'apprentissage ne peut être évalué que comme un tout complet plutôt que comme
parties constituantes. En général, l'évaluation finale est utilisée pour la prise de décision sommative. Évidemment,
En raison de son calendrier, l'évaluation finale ne peut pas être utilisée à des fins formatives.
14
Une évaluation convergente n'a qu'une seule réponse correcte (par élément). Les éléments des tests objectifs sont les
meilleur exemple et démontrer la valeur de cette approche dans l'évaluation des connaissances. Évidemment,
Les évaluations convergentes sont plus faciles à évaluer ou à noter que les évaluations divergentes.
Malheureusement, cette « facilité d'utilisation » conduit souvent à leur application généralisée de cette approche.
même lorsque cela va à l'encontre des bonnes pratiques d'évaluation.
CHAPITRE 2
OBJECTIFS INSTRUCTIONNELS
Objectifs
À la fin de ce sujet, vous devriez être en mesure de :
i. Formuler des objectifs d'enseignement
ii. Expliquez l'importance de la taxonomie de Bloom des objectifs éducatifs
2.0 Introduction
Les objectifs d'instruction sont des déclarations de ce qui doit être réalisé à la fin de l'instruction.
processus. Ils font donc l'objet d'évaluation et d'appréciation. Ce chapitre traite de
l'importance des objectifs d'enseignement et leur formulation.
16
OU
Sans utiliser de calculatrice, calculez la moyenne d'une liste de nombres.
Spécifiez les critères d'application - identifiez les niveaux de vitesse, de précision, de qualité, de quantité, etc. souhaités.
Par exemple : Étant donné une calculatrice, calculez les moyennes à partir d'une liste de nombres correctement, tout le temps.
OU
Étant donné un package tableur, calculez les variances à partir d'une liste de nombres arrondis à la seconde.
virgule décimale.
Examinez chaque résultat d'apprentissage pour vous assurer qu'il est complet, clair et concis.
Le domaine cognitif
Le domaine cognitif implique la connaissance et le développement des compétences mentales.
Il y a six niveaux qui sont listés du plus simple au plus complexe.
Connaissance
La connaissance peut être définie comme la collecte ou le rappel d'informations appropriées, précédemment
informations apprises. Cela inclut les rappels de terminologie et de faits spécifiques.
Les verbes à utiliser dans l'énoncé des objectifs d'instruction à ce niveau comprennent : définir,
décrire, énumérer, identifier, marquer, lister, apparier, nommer, lire, sélectionner, reproduire et énoncer.
Compréhension
La compréhension implique la compréhension des informations afin de pouvoir traduire,
percevoir et interpréter les instructions et les problèmes. Les apprenants devraient être capables de classer, de citer,
convert, describe, discuss, explain, give examples, paraphrase, restate in own words,
résumer, comprendre, distinguer et réécrire.
Application
L'application utilise des informations acquises précédemment dans de nouvelles situations pour résoudre des problèmes. Ceux-ci
expérimenter ce niveau d'apprentissage devrait montrer la capacité d'appliquer, de changer, de calculer, de modifier,
predict, prepare, relate, solve, show, use and produce.
Analyse
L'analyse fait référence à la capacité de décomposer les matériaux d'information en leurs parties constitutives.
examinez-les et comprenez la structure organisationnelle. Cela peut impliquer d'identifier des motivations ou
causes, tirant des conclusions ou trouvant des preuves pour soutenir une généralisation. À ce niveau, les apprenants
devrait être capable de décomposer, corréler, discriminer, différencier, distinguer, se concentrer, illustrer,
inférer, limiter, décrire, signaler, prioriser, reconnaître, séparer, subdiviser, sélectionner et comparer.
Synthèse
17
La synthèse fait référence à la construction de structures ou de motifs à partir de divers types d'éléments.
Les apprenants à ce niveau peuvent assembler des parties pour former un tout qui a une nouvelle signification ou structure.
Les mots-clés utilisés pour ce niveau d'apprentissage incluent des catégories
Évaluation
L'évaluation fait référence au processus de jugement sur l'information, sa valeur et sa qualité.
L'apprentissage et le niveau comprennent l'évaluation, la comparaison et le contraste, la défense, le jugement,
interpréter, justifier. Discriminer et évaluer
Le domaine affectif
Préoccupé par les émotions et les attitudes
A cinq niveaux
Recevoir - implique la prise de conscience et l'attention
Les mots-clés sont nom, choisir, pointer, sélectionner, utiliser, localiser, suivre, décrire
Répondre
Implique une participation active au processus d'apprentissage. L'apprenant réagit à ce qu'il a
reçu dans.
Les verbes de mesure incluent répondre, assister, aider, discuter, saluer, aider, étiqueter, performer,
pratiquer, présenter, lire, enregistrer, sélectionner et écrire.
Perception
C'est la capacité d'utiliser les sens pour guider l'activité motrice. Les individus vivant de l'apprentissage à
ce niveau devrait être capable de choisir, décrire, détecter, différencier, distinguer, identifier, isoler
sélectionner.
Ensemble
Cela indique la volonté d'agir. À ce niveau, les individus devraient être capables d'afficher, d'expliquer,
déplacer
Réponse guidée
18
Cela fait référence aux premières étapes de l'apprentissage d'une compétence complexe qui incluent l'imitation et l'essai.
Erreur. L'atteinte de cet objectif est réalisée par la pratique. L'apprentissage se démontre par la copie,
tracer, suivre, réagir et reproduire.
Mécanisme
Cela fait référence à l'étape intermédiaire de l'apprentissage d'une compétence complexe. Les réponses apprises devraient
devenir habituel, confiant et compétent. Les apprenants peuvent assembler, construire, démonter, fixer,
réparer, broyer, chauffer, mesurer, raccommoder, esquisser, organiser et calibrer.
Adaptation
Les individus ayant des expériences d'apprentissage à ce niveau possèdent des compétences bien développées et sont capables de faire
modifications pour s'adapter à des exigences spéciales. Les apprenants à ce niveau s'adaptent, modifient, changent, réorganisent
et réorganiser.
Origine
Ceci implique de la créativité. L'apprenant peut créer de nouveaux modèles de mouvement pour s'adapter à différents
situations. Les individus à ce niveau devraient démontrer la capacité à organiser, construire, combiner,
composer, construire, concevoir, initier et faire.
CHAPITRE 3
CONSTRUCTION DE TEST
Objectifs
À la fin de ce sujet, vous devriez être en mesure de :
i. Définir les termes de base
ii. Expliquez l'importance de la validité et de la fiabilité des tests
iii. Discuter des différentes manières de déterminer la validité et la fiabilité des tests
3.0 Introduction
La construction de tests est le processus de création d'un test. Pour qu'un test soit considéré comme bon, les tests
la fiabilité et la validité doivent être déterminées. Ce chapitre discute de la validité et de la fiabilité des tests.
20
le même groupe d'individus. Les scores des deux versions peuvent alors être corrélés afin de
évaluer la cohérence des résultats entre les versions alternatives.
Exemple : Si vous vouliez évaluer la fiabilité d'une évaluation de la pensée critique, vous
pourrait créer un grand ensemble d'éléments qui se rapportent tous à la pensée critique et ensuite diviser au hasard
les questions divisées en deux ensembles, qui représenteraient les formes parallèles. Les deux ci-dessus
nécessite deux administrations
3. La fiabilité entre évaluateurs est une mesure de fiabilité utilisée pour évaluer le degré auquel
les juges ou évaluateurs différents s'accordent dans leurs décisions d'évaluation. La fiabilité inter-évaluateurs est utile
parce que les observateurs humains n'interpréteront pas nécessairement les réponses de la même manière ; les évaluateurs peuvent
désaccord sur la manière dont certaines réponses ou matériaux démontrent la connaissance du concept
ou compétence évaluée.
La cohérence inter-évaluateurs peut être utilisée lorsque différents juges évaluent le degré
auxquels les portefeuilles artistiques répondent à certaines normes. La fiabilité inter-évaluateurs est particulièrement utile lorsque
les jugements peuvent être considérés comme relativement subjectifs. Ainsi, l'utilisation de ce type de fiabilité serait
probablement plus probable lors de l'évaluation d'œuvres d'art par rapport à des problèmes de mathématiques.
4. Fiabilité de la consistance interne. Il s'agit de déterminer comment tous les éléments du test se rapportent à tous les autres.
éléments. C'est une mesure de fiabilité utilisée pour évaluer le degré auquel différents éléments de test qui
sonder la même construction produit des résultats similaires.
A. La corrélation inter-éléments moyenne est un sous-type de fiabilité de cohérence interne. Elle est obtenue
en prenant tous les éléments d'un test qui examinent le même construit (par exemple, la compréhension de lecture),
déterminer le coefficient de corrélation pour chaque paire d'éléments, et enfin prendre la moyenne de
tous ces coefficients de corrélation. Cette étape finale donne la corrélation inter-éléments moyenne.
La fiabilité par moitié-split est un autre sous-type de la fiabilité de consistance interne. Le processus de
L'obtention de la fiabilité par moitié est commencée par "diviser en deux" tous les éléments d'un test qui sont destinés à
explorer la même zone de connaissance (par exemple, la Seconde Guerre mondiale) afin de former deux "ensembles" d'objets. Le
L'entiertest est administré à un groupe d'individus, le score total pour chaque "ensemble" est calculé,
et enfin la fiabilité par moitié divisée est obtenue en déterminant la corrélation entre les deux
total des scores "set". Nécessite une seule administration. Particulièrement approprié lorsque le test est très
long. La méthode la plus couramment utilisée pour diviser le test en deux est la stratégie des pairs et impairs.
Comme les tests plus longs tendent à être plus fiables, et comme la fiabilité à moitié séparée représente la fiabilité
d'un test seulement deux fois plus court que le test réel, une formule de correction doit être appliquée au
coefficient. Formule de prophétie de Spearman-Brown. La fiabilité par moitié divisée est une forme de fiabilité interne
cohérence fiabilité.
3.3 Validité
La validité fait référence à la mesure dans laquelle un test évalue ce qu'il prétend mesurer ou à quel point il le fait.
un test mesure ce qu'il est censé mesurer.
21
3.4 Types de validité
Validité du contenu
Quand nous voulons déterminer si l'ensemble du contenu du comportement/construct/zone est
représenté dans le test, nous comparons la tâche de test avec le contenu du comportement. C'est logique
méthode, pas une empirique. Exemple, si nous voulons tester les connaissances sur la géographie américaine, cela
il n'est pas juste d'avoir la plupart des questions limitées à la géographie de la Nouvelle-Angleterre.
2.Validité de façade :
En gros, la validité apparente se réfère au degré auquel un test semble mesurer ce qu'il est censé mesurer.
prétend mesurer. La validité apparente vérifie que la mesure semble évaluer le
construction prévue à l'étude. Les parties prenantes peuvent facilement évaluer la validité apparente. Bien que ceci soit
pas un type de validité très « scientifique », cela peut être un élément essentiel pour susciter la motivation
des parties prenantes. Si les parties prenantes ne croient pas que la mesure est une évaluation précise de la
capacité, ils peuvent devenir désengagés de la tâche.
Exemple : Si une mesure de l'appréciation artistique est créée, tous les éléments devraient être liés à cela.
différents composants et types d'art. Si les questions concernent des périodes historiques, avec
pas de référence à aucun mouvement artistique, les parties prenantes peuvent ne pas être motivées à donner le meilleur de leurs efforts
ou investir dans cette mesure parce qu'ils ne croient pas qu'il s'agit d'une véritable évaluation de l'appréciation de l'art.
3. Validité de construction.
La validité de construction est le degré auquel un test mesure un construit hypothétique prévu.
La validité de construction est le degré auquel un test mesure un construit hypothétique prévu.
utilisé pour garantir que la mesure mesure réellement ce qu'elle est censée mesurer (c'est-à-dire le
construction), et non d'autres variables. Utiliser un panel d'« experts » familiers avec la construction est un
la manière dont ce type de validité peut être évalué. Les experts peuvent examiner les éléments et décider
ce que cet élément spécifique est destiné à mesurer. Les étudiants peuvent être impliqués dans ce processus pour obtenir
leurs commentaires.
Un programme d'études féminines peut concevoir une évaluation cumulative de l'apprentissage
tout au long de la majeure. Les questions sont rédigées avec des termes et des formulations compliqués.
Cela peut faire en sorte que le test devienne par inadvertance un test de compréhension de lecture, plutôt qu'un
test des études sur les femmes. Il est important que la mesure évalue réellement ce qui est prévu
construction, plutôt qu'un facteur accessoire.
5. Validité formative
22
Lorsqu'il est appliqué à l'évaluation des résultats, il est utilisé pour évaluer dans quelle mesure une mesure est capable de
fournir des informations pour aider à améliorer le programme étudié. Exemple : Lors de la conception d'un
une grille d'évaluation pour l'histoire pourrait évaluer les connaissances des élèves dans la discipline. Si la mesure peut
fournir des informations selon lesquelles les étudiants manquent de connaissances dans un certain domaine, par exemple le Civil
Mouvement des droits, alors cet outil d'évaluation fournit des informations significatives qui peuvent être
utilisé pour améliorer les exigences du cours ou du programme.
6. Validité concurrente :
La validité concurrente est le degré selon lequel les scores d'un test sont liés aux scores sur
un autre test déjà établi, administré en même temps, ou à un autre critère valide
disponible en même temps. Par exemple, un nouveau test simple doit être utilisé à la place d'un ancien
encombrant, qui est considéré comme utile, des mesures sont obtenues sur les deux en même temps
temps. Logiquement, la validation prédictive et la validation concurrente sont les mêmes, le terme concurrent
la validation est utilisée pour indiquer qu'aucun temps ne s'est écoulé entre les mesures.
7. Validité de l'échantillonnage (similaire à la validité de contenu)
Veille à ce que la mesure couvre l'ensemble des domaines dans le concept étudié. Pas
tout peut être couvert, donc les éléments doivent être échantillonnés à partir de tous les domaines. Cela peut nécessiter
À compléter en utilisant un panel d'« experts » pour s'assurer que le domaine de contenu est correctement échantillonné.
De plus, un panel peut aider à limiter le biais « d'expert » (c'est-à-dire un test reflétant ce qu'un individu
personnellement ressentent comme les domaines les plus importants ou pertinents).
Lors de la conception d'une évaluation de l'apprentissage dans le département de théâtre, il ne serait pas
suffisant pour ne couvrir que les questions liées à la représentation. D'autres domaines du théâtre tels que l'éclairage, le son,
Les fonctions des régisseurs de scène doivent toutes être incluses. L'évaluation devrait refléter le contenu
zone dans son intégralité.
23
CHAPITRE 4
TYPE DE TESTS
Objectifs
À la fin de ce sujet, vous devriez être en mesure de :
1. Discuter des différents types de tests
2. Expliquer les tests d'intelligence
4.0 Introduction
Dans le chapitre un, un test a été défini comme une méthode pour déterminer la capacité d'un étudiant à compléter
certaines tâches ou démontrer la maîtrise d'une compétence ou la connaissance d'un contenu. Certains types seraient
des tests à choix multiples, ou un test d'orthographe hebdomadaire. Ce chapitre traite des types de tests ainsi que
les qualités d'un bon test.
24
4.1 Types de tests
Questions orales
Ce sont des questions que l'enseignant pose de manière continue pour évaluer les apprenants.
progrès pendant une leçon.
Quiz
Ce sont des questions à réponses courtes que l'enseignant utilise pour déterminer le niveau de
maîtrise de contenu spécifique
Tests et examens
Ce sont des tests élaborés par les enseignants qui sont utilisés pour évaluer les progrès des apprenants après un.
le nombre de sujets a été enseigné ou à la fin du trimestre ou de l'année scolaire. Les tests peuvent avoir
différents éléments de test tels que des questions à réponses courtes, des questions à dissertation, dissertation ouverte
questions fermées ou objectives. Les questions ouvertes sous forme d'essai sont utilisées pour déterminer
les réalisations des apprenants dans un contenu géographique plus exigeant. Les questions à choix multiples comprennent :
questions à choix multiples, éléments de complétion, éléments vrai/faux et picturaux
Éléments d'instruction/apprentissage. Ceux-ci sont utilisés par l'enseignant en fonction du niveau des apprenants.
et, l'objectif à atteindre et le temps de test disponible.
Observation
Certaines activités d'enseignement et d'apprentissage peuvent être mieux évaluées par l'observation. Celles-ci incluent
la participation des apprenants aux débats et discussions et au travail de groupe. L'enseignant peut utiliser des vérifications
listes et calendriers d'observation comme indiqué dans le tableau ci-dessous.
Nom Activité Comportement à être Observation faite
observé
Tabitha Neema Travail de groupe Préparation Affiché de manière adéquate
préparation en termes de
contenu
Volonté de Contribué de manière adéquate
contribuer
Attitude Attitude positive
Expression Inaudible et ordonné
Les informations tirées de telles observations constitueraient la base d'un parcours académique personnel.
conseil et orientation
Projets
L'enseignant doit attribuer des projets aux étudiants en tant qu'individus ou en tant que groupes. Lors de l'attribution
pour les projets, les apprenants doivent recevoir suffisamment d'informations concernant la portée du projet
et le mode de rapport des résultats ainsi que la source des matériaux. Bien que différent
les projets ont des objectifs différents, lors de l'évaluation, faites généralement attention à ;
Propreté
ii. Pertinence
iii. Précision
25
iv. Exhaustivité
Devoirs
Les devoirs sont des tâches ou des responsabilités données par l'enseignant aux apprenants à accomplir. L'enseignant
puis évalue les performances. Un certain nombre de sujets en géographie offrent l'opportunité d'assigner
tâches des apprenants qui peuvent être évaluées. Ces assignments incluent :
lecture de textes sélectionnés et de documents de référence
faire des notes guidées
rédaction de rapports sur des sujets spécifiques ou des visites de terrain
rédaction d'essais
Appariement Les articles peuvent être écrits rapidement. A Les compétences cognitives de niveau supérieur sont
une large gamme de contenus peut être difficile à évaluer.
évalué. Le scoring peut être effectué
efficientement.
Réponse courte ou plusieurs peuvent être administrées rapidement. Difficile d'identifier des critères défendables.
Achèvement temps. Relativement efficace pour les réponses correctes. Limité à
pour marquer. Relativement facile à écrire. questions auxquelles on peut répondre ou
achevé en très peu de mots.
Essai Peut être utilisé pour mesurer des ordres supérieurs. Prend du temps à administrer et
compétences cognitives. Relativement facile à score. Difficile d'identifier des sources fiables
écrire des questions. Difficile pour critères de notation. Seule une limite
Les répondants doivent obtenir la réponse correcte en fonction de l'éventail du contenu qui peut être échantillonné.
26
L'évaluation approche. Les examens peuvent être de grands motivateurs.
Pour ajouter de la variété à l'apprentissage des étudiants. Les examens sont une forme d'activité d'apprentissage. Ils
peuvent permettre aux étudiants de voir le matériel sous un autre angle. Ils aussi
fournir des retours que les étudiants peuvent ensuite utiliser pour améliorer leur compréhension.
Identifier les fautes et les corriger. Les examens permettent à la fois aux étudiants et aux instructeurs de
identifier les domaines du matériel enseigné qui ne sont pas bien compris. Cela
permet aux étudiants de demander de l'aide, et aux instructeurs d'aborder des domaines qui peuvent nécessiter plus
attention, permettant ainsi la progression et l'amélioration des étudiants.
Pour obtenir des retours. Vous pouvez utiliser des examens pour évaluer votre propre enseignement. Les étudiants
la performance à l'examen mettra en évidence les domaines où vous devriez passer plus de temps ou
changez votre approche actuelle.
Fournir des statistiques pour le cours ou l'institution. Les institutions souhaitent souvent des informations
sur la performance des étudiants. Combien réussissent et échouent, et quel est la moyenne
les réalisations en classe ? Les examens peuvent fournir cette information.
Accréditer des étudiants qualifiés. Certaines professions exigent que les étudiants démontrent le
acquisition de certaines compétences ou connaissances. Un examen peut fournir une telle preuve - pour
exemple.
assurer que les normes de progression sont respectées
27
devrait être capable d'identifier les caractéristiques d'une réponse satisfaisante et de comprendre le
l'importance relative de ces caractéristiques. Cela peut être réalisé de plusieurs manières ; vous
peut donner des retours sur les devoirs, décrire vos attentes en classe, ou poster un modèle
solutions sur un site web de cours.
Échelonné. Écartez les examens sur le semestre. Donner deux examens à une semaine d'intervalle ne fonctionne pas.
donnez aux étudiants suffisamment de temps pour recevoir et répondre aux commentaires fournis par le premier
examen. Lorsque cela est possible, planifiez les examens pour qu'ils s'intègrent logiquement dans le déroulement du cours
matériel. Il pourrait être utile de placer les tests à la fin des unités d'apprentissage importantes plutôt que
donnez simplement un examen de mi-semestre à mi-parcours du semestre.
Questions de révision
Qu'est-ce qu'un test ?
2. Pourquoi des tests sont-ils donnés ?
CHAPITRE 5
PRÉPARATION DU TABLEAU DES SPÉCIFICATIONS
Objectifs
À la fin de ce sujet, vous devriez être en mesure de :
i.Définir les termes de base
ii. Expliquez l'importance du tableau de spécifications.
iii.Décrire la préparation du tableau de spécifications
28
5.0 Introduction
Le tableau des spécifications est un plan pour la préparation d'un examen. Il sert de "carte".
ou guide pour attribuer le nombre approprié d'items aux sujets inclus dans le cours ou la matière.
Essentiellement, un tableau de spécifications est un tableau qui décompose les sujets qui seront abordés dans un
test et le nombre de questions du test ou le pourcentage de poids que chaque section aura sur le final
note de test.
Ce type de tableau est principalement utilisé par les enseignants pour aider à décomposer leur plan de test sur un
sujet spécifique. Certains enseignants utilisent ce tableau particulier comme leur ligne directrice d'enseignement. Pour beaucoup
enseignants, un tableau de spécifications fait à la fois partie du processus de construction de tests et d'un produit de
le processus de construction du test.
iii. Décidez du nombre d'articles que vous souhaitez que le test comporte. Disons
vous vouliez un test de 16 éléments ; le nombre d'éléments par sujet serait alors :
station météorologique
29
b. éléments de la météo – 37,5 % ---------- 6
c. l'atmosphère – 37,5 % ------------------- 6
Cela donne un total de 16 articles.
iv. Attribuez le type spécifique de question que vous aimeriez poser en fonction de ce que
compétence ou apprentissage cognitif, vous aimeriez souligner
La colonne de gauche 1 et 2 est les domaines de contenu spécifiques enseignés dans l'unité. Par exemple, le
Le contenu d'une unité de mathématiques pourrait être des nombres entiers et des décimales, l'addition et la soustraction, numérique
forme, et forme développée. Ce sont les domaines de contenu enseignés
La colonne trois du tableau est un résumé du nombre de questions pour chaque domaine de contenu.
et est complété après que les questions ont été rédigées ou déterminées à l'avance en fonction de
instruction en classe consacrée à chaque domaine de contenu.
La colonne quatre est le pourcentage de questions consacrées à chaque domaine de contenu. Cela est calculé
en prenant le nombre de questions par domaine et en le divisant par le nombre de questions sur l'ensemble
test.
Les colonnes 5 à 10 sont basées sur la taxonomie de Bloom. Le numéro de question est listé dans le
colonne et ligne qui décrivent le mieux le contenu et le niveau de réflexion critique requis pour répondre
la question.
Questions de révision
Qu'est-ce qu'un tableau de spécifications ?
2. Pourquoi les enseignants devraient-ils établir un tableau de spécifications ?
3. Énoncez les étapes pour construire un tableau de spécifications
CHAPITRE 6
CONSTRUCTION D'ITEMS DE TEST
Objectifs
À la fin de ce sujet, vous devriez être capable de :
Discuter des lignes directrices lors de la rédaction de différents types d'items de test
6.0 Introduction
Pour une rédaction efficace des tests, certaines directives sont nécessaires. La section suivante
examine les directives lors de la rédaction de différents éléments de test.
Les éléments d'évaluation à réponse sélectionnée (objective) sont très efficaces - une fois les éléments créés,
vous pouvez évaluer et noter une grande quantité de contenu assez rapidement. Notez que le terme objectif se réfère
au fait que chaque question a une réponse juste et une réponse fausse et qu'elles peuvent être impartiales
noté. En fait, la notation peut être automatisée si vous avez accès à un scanner optique pour la notation
tests papier ou un ordinateur pour des tests informatisés. Cependant, la construction de ces "objectifs"
Les éléments pourraient bien inclure des contributions subjectives de l'enseignant/créateur.
a) Choix multiples
Les questions à choix multiples se composent d'une amorce (question ou énoncé) avec plusieurs réponses.
choix (distracteurs). Les points importants lors de la construction de ces tests sont :
Tous les choix de réponse doivent être plausibles et
homogène.Exemple
Que signifie 'peaked' ?
31
A. était vif
B. était à son apogée
C. était montagneux
D. augmentait
Non-Exemple
.
Que signifie "peak".
A. était pâle
B. était à son apogée
C. avait chaud
D. était belle
32
D. Le canyon a été formé à partir de roches provenant d'autres endroits.
b) Correspondance
Les éléments appariés se composent de deux listes de mots, de phrases ou d'images (souvent appelées tiges et
Les étudiants examinent la liste des tiges et associent chacune à un mot, une phrase ou une image provenant de
la liste des réponses.
Points importants :
Les alternatives devraient être courtes, homogènes et organisées de manière logique.
commande.Exemple
Associez les équations suivantes (placez la lettre correspondante dans le blanc).
En règle générale, les tiges doivent être plus longues et les réponses doivent être
plus court. Exemple
Associez la description du drapeau à son pays.
33
Fond rouge avec croix blanche A. Autriche
Fond vert avec un grand cercle rouge B. Allemagne
_____ Deux bandes rouges et une bande blanche (au centre) C. Danemark
_____ Bande rouge (haut); bande blanche; bande verte (bas) D. Bangladesh
E. Hongrie
c) Éléments Vrai/Faux
Les questions vrai/faux peuvent sembler plus faciles à rédiger ; cependant, il est difficile d'écrire des questions efficaces.
Questions vrai/faux. De plus, la fiabilité des questions V/F n'est généralement pas très élevée en raison de la
haute possibilité de deviner. Dans la plupart des cas, les questions V/F ne sont pas recommandées.
Points importants :
Les déclarations doivent être complètement vraies ou complètement fausses.
Exemple
Le système métrique est utilisé de manière cohérente au Canada.
Vrai
Faux
Utilisez des déclarations simples et faciles à suivre.
Exemple
La botanique est une branche des sciences biologiques qui englobe l'étude des plantes et de la vie végétale.
Vrai
Faux
Évitez d'utiliser des négatifs - en particulier des doubles négatifs.
Il n'y a rien d'illégal à rester chez soi au lieu d'aller à l'école.
Vrai
Faux
Évitez les absolus tels que "toujours ; jamais."
Exemple
Les nouvelles et les informations publiées sur le site Web de CNN sont généralement précises.
Vrai
Faux
Non-Exemple
Les nouvelles et les informations publiées sur le site web de CNN sont toujours précises.
Vrai
Faux
d) Éléments à compléter
Les formes les plus simples de questions à réponse construite sont les questions à remplir ou les réponses courtes.
questions. Par exemple, la question peut prendre l'une des formes suivantes :
34
Qui était le seizième président des États-Unis ?
Le 16ème président des États-Unis était ___________________.
Ces évaluations sont relativement faciles à construire, pourtant elles ont le potentiel de tester la mémoire,
plutôt que simplement la reconnaissance. Ils contrôlent également les devinettes, ce qui peut être un facteur majeur,
surtout pour les questions V/F ou à choix multiples.
Lors de la création d'éléments à réponse courte, assurez-vous que la question est claire et qu'il n'y a qu'une seule
réponse correcte. Voici quelques directives, accompagnées d'exemples et de non-exemples
Posez une question directe qui a une réponse définitive.
Exemple
Mme Joyce dîne avec trois de ses amis. Les quatre amis décident de partager le coût également.
L'addition s'élève à 32,80 $, et les femmes prévoient de laisser un pourboire de 15 %. Combien Mme Joyce devrait-elle donner ?
payer sa part du dîner ? __________________
Non-Exemple
Mme Joyce dîne avec trois de ses amis. Les quatre amis décident de partager le coût également.
L'addition s'élève à 32,80 $, et les femmes prévoient de laisser un petit pourboire. Combien Mme Joyce devrait-elle donner ?
payer sa part du dîner ? ____________________
Si vous utilisez des éléments à remplir, utilisez un seul blanc par élément.
Exemple
Le sel se compose principalement de sodium et de _____________.
Non-exemple
_____________ se compose principalement de ____________ et ____________.
Si vous utilisez un texte à trous, placez le blanc près de la fin de la phrase.
Exemple
Une balle est lâchée d'une hauteur de 20 mètres au-dessus du sol. Alors que la balle tombe, elle augmente
en vitesse. L'énergie cinétique et l'énergie potentielle de la balle seront égales à __________ mètres.
Bien que les évaluations par réponses construites puissent plus facilement exiger des niveaux supérieurs de
penser, ils sont plus difficiles à marquer.
Les questions d'essai sont une version plus complexe des évaluations de réponse construite. Avec un essai
questions, il y a une question générale ou une proposition, et l'étudiant est invité à répondre en
écriture. Ce type d'évaluation est très puissant -- il permet aux étudiants de s'exprimer.
et démontrer leur raisonnement lié à un sujet. Les questions de dissertation exigent souvent l'utilisation de
des compétences de pensée de niveau supérieur, telles que l'analyse, la synthèse et l'évaluation.
Les questions d'essai peuvent sembler plus faciles à rédiger que les questions à choix multiples et d'autres types de questions, mais
Écrire des questions d'essai efficaces nécessite beaucoup de réflexion et de planification. Si un essai
la question est vague, il sera beaucoup plus difficile pour les étudiants de répondre et beaucoup plus
difficile pour l'instructeur de noter. Les questions d'essai bien rédigées possèdent les caractéristiques suivantes :
35
son histoire
ses caractéristiques intéressantes
pourquoi c'est un monument
Non-Exemple
Utilisant des détails et des informations provenant de l'article (La mer la plus salée d'Amérique : le Grand Sel
Lac), résumez les points principaux de l'article.
Exemple
Les scientifiques ont découvert que les océans peuvent influencer la température des terres avoisinantes. Côtière
Les masses terrestres ont tendance à avoir des températures plus modérées en été et en hiver que l'intérieur des terres.
mases terrestres à la même latitude.
En considérant l'influence des températures océaniques, expliquez pourquoi les températures intérieures varient.
en été et en hiver à un degré plus élevé que les températures côtières.
Les questions d'essai sont utilisées à la fois comme évaluations formatives (dans les salles de classe) et sommatives.
évaluations (sur des tests normalisés).
Il existe 2 grandes catégories de questions d'essai : les réponses courtes (également appelées restreintes)
oubrève) et réponse étendue.
a) Réponse courte
Les questions à réponse courte sont plus ciblées et limitées que les questions à réponse étendue.
Par exemple, une réponse courte pourrait demander à un étudiant de "donner un exemple," "lister trois raisons," ou
comparez et contrastez deux techniques. Les éléments de réponse courts de l'évaluation de la Floride
(FCAT) sont conçus pour prendre environ 5 minutes à compléter et l'élève est autorisé à utiliser jusqu'à 8 lignes
pour chaque réponse. Les réponses courtes sont notées selon un barème de 2 points. Une réponse complète et
Une réponse correcte vaut 2 points. Une réponse partielle vaut 1 point.
Exemple de question à réponse courte
(lecture de la forme 3)
Quelles sont les différences entre le geai riche et le moqueur ? Soutenez votre réponse avec des détails.
et informations de l'article.
b) Réponse étendue
Les réponses étendues peuvent être beaucoup plus longues et complexes que les courtes réponses, mais les étudiants devraient
soyez encouragé à rester concentré et organisé. Les étudiants ont 14 lignes pour chaque réponse à un
élément de réponse étendue, et on leur conseille de prévoir environ 10 à 15 minutes pour compléter
chaque élément. Les réponses étendues sont notées à l'aide d'un barème de notation à 4 points. Une réponse complète et
Une réponse correcte vaut 4 points. Une réponse partielle vaut 1, 2 ou 3 points.
Question de réponse étendue échantillon
(form 1 Science)
Robert conçoit une démonstration à présenter à la foire scientifique de son école. Il montrera comment
changer la position d'un point d'appui sur un levier modifie la quantité de force nécessaire pour soulever un
objet. Pour ce faire, Robert utilisera un morceau de bois comme levier et un bloc de bois pour agir comme un
point d'appui. Il prévoit de déplacer le point d'appui à différents endroits sur le levier pour voir comment cela
Le placement affecte la force nécessaire pour soulever un objet.
Partie A Identifiez au moins deux autres actions qui rendraient la démonstration de Robert meilleure.
36
Partie B : Expliquez pourquoi chaque action améliorerait la démonstration.
Questions de révision
1. Énoncez les directives pour la construction de questions à choix multiples
2. Quelles sont les caractéristiques des questions à items associés bien construits ?
3. Indiquer des points importants lors de la rédaction d'énoncés de test Vrai/Faux
4. Identifier 2 types d'éléments de test de type essai
5. Esquissez les caractéristiques de questions d'essai bien rédigées
CHAPITRE 7 :
ÉLABORATION DU BARÈME
Objectifs
À la fin de ce sujet, vous devriez être en mesure de :
Préparer des barèmes de notation pour différents types de tests
Expliquez la signification et l'objectif de la modération
Discuter de la manière de modérer les examens/évaluations
7.0 Introduction
Un barème est un ensemble de critères utilisés pour évaluer l'apprentissage des élèves.
37
erreur à plusieurs reprises. S'il y a une erreur faite tôt mais maintenue dans la réponse, vous ne devriez que
pénalisez-le une fois si le reste de la réponse est solide.
Revoir le barème de notation après l'examen. Une fois l'examen écrit, lire un
quelques réponses et examinez votre clé. Vous constaterez parfois que les étudiants ont interprété
votre question d'une manière différente de ce que vous aviez prévu. Les étudiants peuvent venir
avec d'excellentes réponses qui peuvent être légèrement en dehors de ce qui a été demandé. Considérez
attribuer des points partiels à ces étudiants.
Lors de la correction, faites des remarques sur les examens. Ces notes doivent indiquer clairement pourquoi vous avez donné
une note particulière. Si les examens sont rendus aux étudiants, vos notes les aideront
comprendre leurs erreurs et les corriger. Ils vous aideront également si les étudiants le souhaitent.
pour revoir leur examen longtemps après qu'il a été donné, ou s'ils font appel de leur note.
Bien que les questions d'essai soient des outils d'évaluation puissants, elles peuvent être difficiles à noter.
dans les essais, il n'y a pas de réponse unique et correcte et il est presque impossible d'utiliser un Scantron automatique
ou système basé sur ordinateur. Afin de minimiser la subjectivité et les préjugés qui peuvent survenir dans le
pour l'évaluation, les enseignants devraient préparer une liste de critères avant de noter les essais. Considérez, pour
exemple, la question suivante et les critères de notation :
38
total)
Organisation -- jusqu'à 3 points pour l'organisation de l'essai (par exemple, introduction, bien
points exprimés, conclusion
Brevité - jusqu'à 1 point pour une brièveté appropriée (c'est-à-dire, pas d'éléments superflus ou de 'remplissage')
information) Pas de pénalité pour les fautes d'orthographe, de ponctuation ou de grammaire.
En définissant les critères d'évaluation, les étudiants savent précisément comment ils seront évalués.
et où ils devraient concentrer leurs efforts. De plus, l'instructeur peut fournir
des retours moins biaisés et plus cohérents. Techniques supplémentaires pour évaluer les constructions
les éléments de réponse comprennent :
Ne regardez pas le nom de l'étudiant lorsque vous notez l'essai.
• Esquissez une réponse exemplaire avant d'examiner les réponses des étudiants.
Parcourez les réponses et recherchez les principales divergences dans les réponses -- cela
pourrait indiquer que la question n'était pas claire.
S'il y a plusieurs questions, notez la question n° 1 pour tous les étudiants, puis la question n° 2, etc.
Utilisez une grille de notation qui fournit des domaines de rétroaction spécifiques pour les étudiants.
Modération qualitative - Les notes unitaires issues de l'évaluation des étudiants sont modérées par
évaluation par les pairs selon les critères du système;
Modération statistique - Les scores des évaluations des étudiants dans les cours sont placés sur le
même échelle
La modération est nécessaire pour produire des certificats valides, crédibles et acceptables par le public.
dans un système d'évaluation.
La modération permet de comparer les normes entre les classes et les écoles.
39
Mais les étudiants ayant une performance moyenne verraient leurs scores tirés vers le bas.
C'est parce que l'examen interne est facile, et pour le rendre comparable, nous sommes
étirant leurs notes à la même plage. En conséquence, les bons performeurs continueraient
obtenir un score élevé. Mais les performers médiocres qui ont obtenu un meilleur score que celui qu'ils auraient eu dans un
les examens publics perdent.
Questions de révision
Qu'est-ce qu'un barème de notation ?
2. Pourquoi préparer un barème de notation ?
3. Expliquez les lignes directrices lors de l'élaboration des barèmes de notation.
4. Qu'est-ce que la modération des tests ?
5. Décrire le processus de modération des tests
CHAPITRE 8
ANALYSE DES ÉLÉMENTS DE TEST
Objectifs
À la fin de ce sujet, vous devriez être en mesure de :
1.Discutez comment déterminer l'indice de difficulté d'un test
2. Discutez de la manière de déterminer l'indice de discrimination d'un test.
40
8.0 Introduction
Après avoir créé vos éléments d'évaluation objective et donné votre test, comment pouvez-vous être sûr que
les éléments sont appropriés -- ni trop difficiles ni trop faciles ? Comment saurez-vous si le test
différencie efficacement les étudiants qui réussissent bien au test global et ceux qui ne réussissent pas.
Une analyse d'article est une procédure précieuse, mais relativement facile, que les enseignants peuvent utiliser pour répondre à la fois
de ces questions.
Question A B C D
#1 0 3 24* 3
#2 12* 13 3 2
* Dénote la réponse correcte.
Pour la question n°1, nous pouvons voir que A n'était pas un très bon distracteur - personne n'a choisi cette réponse.
Nous pouvons également calculer la difficulté de l'élément en divisant le nombre d'élèves qui choisissent
la réponse correcte (24) par le nombre total d'étudiants (30). En utilisant cette formule, la difficulté de
La question n°1 (appelée p) est égale à 24/30 ou 0,80. Une règle approximative est que si l'élément
la difficulté est supérieure à 0,75, c'est un élément facile ; si la difficulté est inférieure à 0,25, c'est un élément difficile.
Étant donné ces paramètres, cet élément pourrait être considéré comme modérément facile - beaucoup (80 %) d'étudiants ont réussi
c'est correct. En revanche, la Question n°2 est beaucoup plus difficile (12/30 = 0,40). En fait, pour la Question n°2,
plus d'élèves ont sélectionné une réponse incorrecte (B) que la réponse correcte (A). Cet élément
doit être soigneusement analysé pour garantir que B est un distracteur approprié.
41
répondre correctement à un élément spécifique plus souvent que les élèves ayant un score global plus bas.
Cependant, si vous constatez qu'un plus grand nombre d'élèves en difficulté a répondu correctement à un item spécifique, alors
l'élément a un indice de discrimination négatif (entre -1 et 0). Examinons un exemple.
Le tableau 2 présente les résultats de dix questions d'un quiz. Notez que les étudiants sont disposés avec
les meilleurs buteurs en haut du tableau.
Questions
Étudiant Total
Score (%)
1 2 3
Asif 90 1 0 1
Sam 90 1 0 1
Jill 80 0 0 1
Charlie 80 1 0 1
Sonya 70 1 0 1
Ruben 60 1 0 0
Argile 60 1 0 1
Kelley 50 1 1 0
Justin 50 1 1 0
Tonya 40 0 1 0
"1" indique que la réponse était correcte ; "0" indique qu'elle était incorrecte.
Suivez ces étapes pour déterminer l'Indice de Difficulté et l'Indice de Discrimination.
Après que les étudiants soient classés avec les scores globaux les plus élevés en haut, comptez le nombre de
étudiants du groupe supérieur et inférieur qui ont bien répondu à chaque question. Pour la question n°1, il y avait
4 étudiants dans la moitié supérieure qui l'ont eu correct, et 4 étudiants dans la moitié inférieure.
Déterminez l'indice de difficulté en divisant le nombre de personnes l'ayant correctement répondu par le total.
nombre d'étudiants. Pour la Question n°1, ce serait 8/10 ou p=.80.
Déterminez l'Indice de Discrimination en soustrayant le nombre d'élèves dans le
groupe inférieur qui a obtenu l'élément correct par rapport au nombre d'étudiants dans le groupe supérieur
qui a obtenu l'objet correct. Ensuite, divisez par le nombre d'élèves dans chaque groupe (dans ce)
cas, il y en a cinq dans chaque groupe). Pour la question n°1, cela signifie que vous devez soustraire 4
de 4, et diviser par 5, ce qui donne un indice de discrimination de 0.
Les réponses aux questions 1-3 sont fournies dans le tableau 2.
42
Question
4 4 .80 0
1
Question
0 3 .30 -0,6
2
Question
5 1 .60 0,8
3
Maintenant que nous avons rempli le tableau, que signifie-t-il ? Nous pouvons voir que la question n°2 avait une
index de difficulté de 0,30 (ce qui signifie que c'était assez difficile), et il avait également une discrimination négative
indice de -0,6 (ce qui signifie que les étudiants ayant de faibles performances étaient plus susceptibles de répondre à cet élément
correct). Cette question doit être soigneusement analysée, et probablement supprimée ou modifiée. Notre "meilleur"
La question globale est la question 3, qui avait un niveau de difficulté modéré (.60), et a discrimé.
extrêmement bien (0,8).
Une autre considération pour une analyse d'élément est le niveau cognitif qui est évalué. Par exemple,
vous pourriez catégoriser les questions en fonction de la taxonomie de Bloom (peut-être en regroupant les questions qui
adresse Niveau I et ceux qui traitent du Niveau II). De cette manière, vous seriez en mesure de déterminer si
l'indice de difficulté et l'indice de discrimination de ces groupes de questions sont appropriés. Pour
par exemple, vous pourriez remarquer que la majorité des questions qui demandent des niveaux de pensée plus élevés
les compétences sont trop difficiles ou ne discriminent pas bien. Vous pourriez alors vous concentrer sur l'amélioration de celles-ci
questions et concentrez vos stratégies d'enseignement sur des compétences de niveau supérieur.
Questions de révision
1. Qu'est-ce que l'analyse de test ?
2. Pourquoi l'analyse des tests est-elle importante
3. Différenciez l'indice de difficulté des tests et l'indice de discrimination des tests.
La discrimination positive désigne une politique ou une pratique qui favorise les individus d'un groupe marginalisé ou sous-représenté dans des situations de recrutement, d'admission ou d'accès à des opportunités afin de remédier à des inégalités historiques ou systémiques.
58
CHAPITRE 9
INTERPRÉTER LES RÉSULTATS DES TESTS
Objectifs
À la fin de ce sujet, vous devriez être en mesure de :
i. Discuter de l'évaluation et de la notation des tests
ii. Discuter de l'analyse des résultats d'examen
iii. Expliquer les résultats des tests de rapport s
13.0 Introduction
Le processus d'évaluation ne s'arrête pas à l'analyse, mais doit se poursuivre par l'interprétation de la
résultats analysés. Cette section examine ce processus.
Comparaisons de notation
Une sorte de comparaison est faite lors de l'attribution des notes. Par exemple, un instructeur
peut comparer la performance d'un élève à celle de ses camarades de classe, aux normes d'excellence
(c'est-à-dire, objectifs prédéterminés, contrats, normes professionnelles) ou à des combinaisons de chacun.
Quatre comparaisons courantes utilisées pour déterminer les notes et la majeure des collèges et universités.
Les avantages et les inconvénients de chacun sont discutés dans la section suivante.
En comparant la performance globale d'un étudiant dans le cours avec celle d'un groupe pertinent de
Les étudiants, l'instructeur attribue une note pour montrer le niveau d'accomplissement ou de classement de l'étudiant.
au sein de ce groupe. Un "A" pourrait ne pas représenter l'excellence dans l'acquisition de connaissances et de compétences si
Le groupe de référence dans son ensemble est quelque peu incompétent. Tous les étudiants inscrits dans un cours pendant une période donnée
le semestre ou tous les étudiants inscrits à un cours depuis sa création sont des exemples possibles de
groupes de comparaison. La nature du groupe de référence utilisé est la clé pour interpréter les notes sur la base de
70
sur des comparaisons avec d'autres étudiants.
1. Les individus dont les performances académiques sont exceptionnelles par rapport à leurs pairs
sont récompensés.
2. Le système est un système commun que de nombreux membres du corps professoral connaissent bien.
informations supplémentaires sur les étudiants, l'instructeur ou le département de l'université, notes de
le système peut être interprété facilement.
1. Peu importe la qualité exceptionnelle du groupe de référence d'élèves, certains recevront de faibles
notes ; peu importe à quel point la performance globale du groupe de référence est faible, certains étudiants
recevra des notes élevées. Les notes sont difficiles à interpréter sans informations supplémentaires
sur la qualité globale du groupe.
2. Les normes de notation dans un cours ont tendance à fluctuer en fonction de la qualité de chaque promotion d'étudiants.
Les normes sont élevées par la performance d'une classe brillante et abaissées par la performance de
un groupe d'élèves moins capables. Souvent, la note d'un élève dépend de qui était dans la classe.
3. Il est généralement nécessaire de développer des "normes" de cours qui tiennent compte de plus qu'un seul
performance de classe. Les étudiants d'un instructeur qui est nouveau dans le cours peuvent être à un
désavantage particulier puisque le groupe de référence sera nécessairement petit et très
possiblement atypique par rapport aux classes futures.
Les notes peuvent être obtenues en comparant la performance d'un étudiant avec des normes absolues spécifiées
plutôt qu'avec des critères relatifs tels que le travail des autres étudiants. Dans cette méthode de notation,
l'instructeur s'intéresse à indiquer combien d'un ensemble de tâches ou d'idées un étudiant connaît,
plutôt que le nombre d'autres étudiants qui ont maîtrisé plus ou moins de ce domaine. Un "C" dans un
un cours de statistiques introductif pourrait indiquer que l'étudiant a des connaissances minimales en descriptive
et statistiques inférentielles. Un niveau de réussite beaucoup plus élevé serait requis pour un "A." Remarque
les notes des étudiants dépendent de leur niveau de maîtrise du contenu ; ainsi, les niveaux de performance de
leurs camarades de classe n'ont aucune incidence sur la note finale du cours. Il n'y a pas de quotas dans chaque note
catégorie. Il est possible, dans une classe donnée, que tous les étudiants puissent recevoir un "A" ou un "B."
1. Les objectifs et normes du cours doivent nécessairement être définis clairement et communiqués à
les étudiants.
2. La plupart des étudiants, s'ils travaillent suffisamment dur et reçoivent un enseignement adéquat, peuvent obtenir
notes élevées. L'accent est mis sur l'atteinte des objectifs de cours, et non sur la compétition pour une note.
71
3. Les notes finales des cours reflètent l'atteinte des objectifs du cours. La note indique "quoi"
un étudiant sait plutôt que de savoir à quel point il ou elle a performé par rapport à
groupe de référence.
4. Les étudiants ne compromettent pas leur propre note s'ils aident un autre étudiant avec son travail de cours.
1. Il est difficile et long de déterminer quels devraient être les normes de cours pour chacun.
note de cours possible émise.
2. L'instructeur doit décider des attentes raisonnables envers les étudiants et des nécessaires
connaissances préalables pour les cours suivants. Les instructeurs inexpérimentés peuvent être à
un inconvénient à faire ces évaluations.
3. Une interprétation complète de la signification d'une note de cours ne peut être faite que si
les principaux objectifs du cours sont également disponibles.
Les deux comparaisons suivantes - avec amélioration et capacité - sont parfois utilisées par
instructeurs dans l'évaluation des étudiants. Il existe de telles questions philosophiques et méthodologiques sérieuses
des problèmes liés à ces comparaisons dont l'utilisation est très discutable pour la plupart des établissements éducatifs
situations.
Concernant l'Amélioration . . .
Les notes des étudiants peuvent être basées sur les connaissances et les compétences qu'ils possèdent à la fin d'un cours.
comparé à leur niveau de réussite au début du cours. De grands gains sont attribués
des notes élevées et de petits gains sont représentés par de faibles notes. Les étudiants qui entrent dans un cours avec
certaines connaissances préalables sont évidemment pénalisées ; elles ont moins à gagner d'un cours que
est un étudiant relativement naïf. Le score de gain du post-test par rapport au pré-test est plus chargé d'erreurs, à partir d'un
perspective de mesure, que l'un ou l'autre des scores dont elle est dérivée. Bien que la croissance soit
certainement important lors de l'évaluation de l'impact de l'instruction, il est moins utile comme base pour
déterminer les notes de cours que les compétences de fin de cours. La valeur des notes qui reflètent
la croissance dans un cours de niveau universitaire est probablement minimale.
Les notes de cours peuvent représenter la quantité que les étudiants ont apprise dans un cours par rapport à combien ils
pourraient être amenés à apprendre comme prévu en fonction de leur capacité académique mesurée. Les étudiants avec un niveau élevé
les scores de capacité (par exemple, les scores au Test d'Aptitude Scolaire ou au Test de Collège Américain) seraient
on s'attend à ce que les étudiants atteignent des scores d'examen final plus élevés que ceux ayant des scores de capacité inférieurs. Lorsque les notes
sont basés sur des comparaisons avec la capacité prédite, un "surperformant" et un "sous-performant" peuvent
recevoir la même note dans un cours particulier, pourtant leurs niveaux de compétence par rapport au cours
le contenu peut être très différent. Le premier étudiant peut ne pas être préparé à suivre un niveau plus avancé
cours, mais le deuxième étudiant peut l'être. Une note de cours peut, en partie, refléter la quantité d'efforts que
l'instructeur croit qu'un étudiant a investi dans un cours. Les étudiants à haut potentiel qui peuvent
72
satisfaire aux exigences du cours avec un effort minimal est pénalisé pour leur apparente "manque" de
effort. Puisque la seule note ne communique pas de telles informations, la valeur de
La notation basée sur les compétences ne justifie pas son utilisation.
Une seule note de cours ne devrait représenter qu'une des plusieurs comparaisons de notation notées.
au-dessus. S'attendre à ce qu'une note de cours reflète plus d'une de ces comparaisons est trop exigeant.
fardeau de communication. Les enseignants qui souhaitent communiquer plus que le classement relatif du groupe,
ou la compétence en matière de sujets ou le niveau d'effort, doivent trouver d'autres façons de fournir cela.
informations à chaque étudiant. Des suggestions pour ce faire sont notées près de la fin de la Section V de ce
brochure.
1. Les notes doivent être conformes aux pratiques de l'établissement dans lequel la notation a lieu.
2. Les composants de notation doivent donner des informations exactes. Des tests soigneusement rédigés et/ou
les devoirs notés (travaux à domicile, projets) sont des clés pour une notation précise.
3. Les plans de notation doivent être communiqués à la classe au début de chaque semestre.
en énonçant les procédures de notation au début d'un cours, l'instructeur est essentiellement
faire un "contrat" avec la classe sur la façon dont chaque élève sera évalué. Le
le contrat doit fournir aux étudiants une compréhension claire de l'instructeur
attentes afin que les étudiants puissent structurer leurs efforts de travail. Les étudiants devraient être
informé sur : quelles activités de cours seront prises en compte dans leur note finale ; le
importance ou poids des examens, des quiz, des devoirs, des travaux et des projets ; et lequel
Les sujets sont plus importants que d'autres.
4. Les plans de notation indiqués au début du cours ne doivent pas être modifiés sans
une réflexion approfondie et une explication complète aux étudiants. deux courants communs
Les plaintes trouvées dans les évaluations post-cours des étudiants concernent les procédures de notation énoncées.
au début du cours étaient soit suivis de manière incohérente, soit modifiés
sans explication ni même un avertissement avancé. On pourrait examiner la situation de modifier
ou suivre de manière incohérente le plan de notation étant analogue à jouer à un jeu
où les règles changent arbitrairement, parfois sans la connaissance des joueurs.
5. Le nombre de composants ou d'éléments utilisés pour attribuer les notes de cours doit être important
suffisant pour améliorer la haute précision dans la notation. D'un point de vue décisionnel, le
plus d'informations disponibles pour le décideur, plus on peut avoir confiance
avoir que la décision sera précise et appropriée. Ce même principe s'applique à la
processus d'attribution des notes. Si seule une note d'examen final est utilisée pour attribuer une note de cours, le
l'adéquation de la note dépendra de la manière dont le test a couvert tous les aspects pertinents de
contenu du cours et comment l'étudiant a généralement performé un jour spécifique pendant un 2-3
période d'heure.
73
étaient souvent mal compris.
Collectez des données numériques. Si vous avez des examens notés par machine, vous pouvez obtenir des statistiques sur
vos questions, telles que quelles questions ont été le plus souvent manquées ou quels distracteurs étaient
le plus souvent choisi. Dans d'autres cas, vous pouvez collecter un aperçu des notes.
Obtenez des retours d'étudiants. Vous pouvez laisser de l'espace spécifiquement pour des retours sur les examens, ou vous
peut obtenir des retours en classe après l'examen.
Réfléchissez aux informations recueillies. Revoir les résultats d'examen peut vous aider à
identifier des concepts et méthodes avec lesquels les étudiants ont des difficultés - des questions que
ont été manqués - ainsi que des concepts et des méthodes qui étaient bien compris - des questions
en général, bien répondu. Ou cela peut mettre en évidence des réponses bien conçues ou mal conçues -
question d'examen construite. Envisagez d'utiliser ces informations pour :
Changez la façon dont vous enseignez le reste du trimestre
Vérifiez les améliorations sur des sujets ou des méthodes spécifiques au cours d'un trimestre.
CHAPITRE 10
TYPES ET CATÉGORIES D'ÉVALUATION
Objectif
À la fin de ce sujet, vous devriez être en mesure de :
14.0 Introduction
Les définitions de l'évaluation éducative en général et de l'évaluation des cours en particulier abondent dans le
la littérature, mais seulement quelques-uns seront mis en avant. L'une des définitions les plus anciennes et les plus courantes de
l'évaluation est le processus de détermination dans quelle mesure les objectifs éducatifs sont atteints
en réalité réalisé" (Tyler, 1949, p. 69). L'évaluation a été conçue soit comme le
évaluation du mérite et de la valeur des programmes éducatifs (Guba et Lincoln, 1981;
Glatthorn, 1987 ; et Scriven, 1991), ou comme l'acquisition et l'analyse d'informations sur un donné
programme éducatif dans le but de la prise de décision (Nevo, 1986 ; Shiundu et Omulando,
1992 ; et Manuel de formation du cours de compétence des enseignants, 2007).
L'évaluation est un concept vital dans tout système éducatif. En fait, le succès ou l'échec de tout
le programme en éducation peut être attribué presque entièrement à la qualité et à la quantité d'évaluation
réalisée au début de, et pendant la mise en œuvre du programme. Pourtant, l'évaluation
reste l'un des aspects les moins développés de l'éducation formelle en général et du programme
particulier. Cela est très probablement dû aux conceptions souvent étroites et simplistes de cours
évaluation parmi la plupart des parties prenantes en éducation, y compris certains éducateurs professionnels. C'est,
il est donc très important de concevoir l'évaluation des cours dans son sens large.
L'évaluation sommative est effectuée à la fin d'un cours ou d'un programme. Elle concerne
objectifs et résultats du processus d'enseignement-apprentissage. Traditionnellement, l'évaluation sommative
75
évalue si les objectifs énoncés du programme ont été atteints. Le terminal
des examens tels que le Certificat Kenyane de l'Éducation Primaire (KCPE) et le Certificat Kenyane
les examens de l'Éducation Secondaire (KCSE) ne doivent pas être confondus avec l'évaluation sommative,
mais qu'ils contribuent de manière significative à ce type d'évaluation (Marsh & Willis 2007;
Cours de compétence des enseignants, 2007). D'un point de vue plus large, l'évaluation sommative inclut
l'évaluation de la performance de l'enseignant dans l'utilisation du curriculum, l'infrastructure,
ressources d'apprentissage/enseignement, allocation de temps, soutien administratif, le coût du programme,
et l'impact du programme. Les résultats de l'évaluation sommative peuvent conduire à des modifications du curriculum.
continuité, amélioration ou changement (Shiundu & Omulando, 1992).
Questions de révision
1. Qu'est-ce que l'évaluation
2. Expliquez ce que l'on entend par évaluation diagnostique
3. Différencier entre l'évaluation sommative et l'évaluation formative
77