|
La méthode des tests Gestion de l'emploi et évaluation des compétences par Gilbert et Thionville Sophie QUINTIN - Fiche 7
En ce qui concerne la méthode des tests et leur utilisation comme moyen d'évaluation, à visée pronostique, des compétences chez l'individu, nous nous référerons le plus souvent à la notion de compétences génériques. Elles représentent tous les acquis susceptibles de générer des compétences spécifiques requises par les situations de travail. Le test, quelle que soit sa forme d'utilisation, est normalement accompagné de la preuve qu'il mesure bien ce qu'il est censé mesurer et doit se prêter à une démarche continue de vérification et d'approfondissement de ce qu'il est censé mesurer.
LE TEST : UNE SITUATION STANDARDISÉE PERMETTANT DES COMPARAISONS
On appelle test mental une situation expérimentale standardisée servant de stimulus à un comportement. Ce comportement est évalué par une comparaison statistique avec celui d'autres individus placés dans la même situation, permettant ainsi de classer les sujets examinés soit quantitativement soit typologiquement.
une situation standardisée
La situation expérimentale, c'est-à-dire le milieu dans lequel se déroule la passation du test, le matériel utilisé, l'attitude et les consignes pour l'utilisation du matériel, soit parfaitement définie et reproduite dans tous les cas. L'observation et le codage (l'enregistrement) du comportement déclenché chez le sujet soient aussi précis et objectifs que possible. La technique de correction indique le critère de l'évaluation de la performance et définit comment attribuer une note. Les conditions physiologiques et psychologiques du sujet lors de la passation du test doivent être contrôlées (état de fatigue, motivation, anxiété, etc). Il doit en principe être dans un état "normal".
une évaluation par comparaison : l'étalonnage
Un score, ou une note, obtenu à un test ne prend de signification que par comparaison avec ceux obtenus par un groupe de référence. Il s'agit des procédures d'étalonnage.
âges en classes d'effectifs égaux
Il s'agit de situer rapidement un individu dans sa population de référence.
un exemple : le décilage
Il s'agit de classer les sujets du groupe de référence en 10 classes de telle façon qu'il y ait autant de personnes dans chaque classe (10 % des effectifs). Il faut procéder en ordonnant par valeur croissante les notes en y affectant l'effectif correspondant puis de calculer les pourcentages cumulés des effectifs par classe. Sachant que 10 % de l'effectif total constitue une classe, on calcule les bornes constituées de notes pour chaque classe comme suit : note maximale+0,5 moins note maximale-0,5, multiplié par l'effectif théorique cumulé de la classe-effectif cumulé de la note juste en-dessous, le tout divisé par la soustraction entre l'effectif cumulé de la note maximale de la tranche et l'effectif cumulé de la note juste en dessous. La note maximale correspond au premier nombre des effectifs cumulés qui soit supérieur à l'effectif cumulé théorique. La note qui est la borne correspond à la note maximale-0,5 plus le résultat trouvé.
les étalonnages en classes d'effectifs inégaux
Il s'agit de mieux rendre compte de la valeur entre 2 notes.
un exemple : l'étalonnage normalisé
La distribution des notes brutes suit la loi normale de Laplace-Gauss dont la caractéristique est une concentration autour de la moyenne. Cet étalement qui diffère d'une courbe à l'autre peut être évalué en calculant un indice de dispersion, l'écart-étalon ou écart-type. A partir de la moyenne et de l'écart-type, on peut calculer un étalonnage en constituant des classes à partir de la moyenne par addition et soustraction continues d'un intervalle de classe égal à l'écart-étalon (étalonnage en 5 points), au demi-écart-étalon (staninage) ou au quart de l'écart-étalon (tétronage).
Ces classements ont l'avantage de traduire des sauts de difficulté égaux lorsque l'on passe d'une classe à l'autre.
LA MÉTHODE DES TESTS : UNE DÉMARCHE EXPÉRIMENTALE DE VÉRIFICATION D'HYPOTHÈSES
Pour construire un test, il a fallu faire des hypothèses sur les bonnes questions à poser pour mesurer ce qu'on voulait mesurer puis vérifier que ces questions étaient pertinentes et en fournir la preuve et enfin s'assurer que les pronostics ou diagnostics que nous porterons à partir des notes ou des résultats aux tests correspondent bien à la réalité. Les différentes démarches de validation ont pour but de répondre à ces questions.
la validation "expérimentale-essayiste"
Le test construit par simulation de tâches réelles, sera validé par recherche des liaisons statistiques existantes entre les résultats au test et les performances obtenues dans la réalisationde ces tâches. Elle prend 2 formes différentes.
la validation concurrente (ou par diagnostic)
Dans ce plan de validation, on utilise habituellement une population d'individus reconnus bons dans le critère retenu et une population d'individus reconnus comme moins bons. On observe alors si le test différencie les bons et les moins bons.
Dans une phase d'élaboration du test, nous pouvons mener cette analyse au niveau de chaque composante (item) du test afin de ne retenir en final que les items produisant les différences les plus significatives, c'est-à-dire le diagnostic le plus sûr. Une contre-épreuve est pratiquée ensuite sur une population tout venant pour voir si l'on peut prédire à partir de leurs résultats au test quels sont les individus qui réussiront dans le critère, ce qui nous conduit à la validation par pronostic.
la validation prédictive (ou par pronostic)
Cette validation consiste à faire passer le test mis précédemment au point à une population tout venant puis de la suivre sur une période intermédiaire en regardant si les bons et les moins bons sont bien ceux que le test avait déclarés être bons ou moins bons.
Il convient de prendre quelques précautions lorsque le test mesure un critère susceptible d'entraînement. Il est aussi nocif de sur-sélectionner que de sous-sélectionner. Les gens aux capacités sous-utilisées peuvent être mécontents et chercher un autre emploi. Un contrôle par l'étude de la corrélation entre un échantillon de professionnels tout venant et les résultats pour chaque moyen sélectif reste donc nécessaire.
la validation de construction
Elle reflète l'accord constaté entre les observations effectuées grâce à l'outil et les hypothèses qui ont gouverné sa construction.
validité interne
Cette démarche repose sur l'étude des corrélations entre différents tests afin de découvrir les variables latentes, dénommées facteurs, qui seraient responsables de ces intercorrélations. Nous recherchons dans quelle mesure les résultats à un test peuvent être expliqués par un ou plusieurs facteurs de réussite à un ensemble plus ou moins étendu de tests. Il est alors possible de construire des tests mesurant essentiellement tel ou tel facteur.
facteur g : il rend compte de notre potentiel à créer des connaissances. Sa mesure prend en compte la mise en oeuvre de 3 processus : la perception de la situation, la compréhension de la relation unissant plusieurs éléments de la situation, la capacaté à découvrir l'élément qui entretient avec un ou d'autres éléments une relation de type donné. La mesure des 2 derniers processus a donné naissance à des tests qui reposent sur la loi de série.
facteur V de compréhension verbale qui correspond aux capacités concernant tous les types de communication verbale. Ce facteur sature les tests de compréhension verbale, de raisonnement verbal, d'indications d'analogies, de phrases à compléter, de lecture, etc.
facteur W de fluidité verbale qui représente la richesse de vocabulaire du sujet, la capacité d'évocation rapide de mots selon certaines caractéristiques de forme. exemple : citer en un laps de temps le maximum de mots comprenant le même nombre de lettres.
facteur N numérique, à savoir la capacité à manipuler des chiffres, à exécuter avec rapidité et exactitude des opérations arithmétiques simple. Cette capacité intervient dans tous les tests comportant des chiffres.
facteur R de raisonnement regroupe le facteur d'induction I ou aptitude à raisonnerdu particulier au général et le facteur inverse de déduction D. Ce facteur joue dans les tests de raisonnement abstrait, de raisonnement arithmétique, de séries de chiffres à compléter, d'analogies de figures, etc.
facteur M de mémoire représente une sorte de mémoire associative, la capacité de mémorisation de couples de stimulus sans signification.
facteur S spatial concerne la perception et la visualisation précises de formes et de relations géométriques, de configurations spatiales et la capacité à détecter leurs similitudes, leurs différences, etc. Ce facteur intervient dans les tests spatiaux et dans le dessin.
facteur P perceptif correspond à la rapidité de perception des détails visuels, de différences infimes et de leur comparaison, ainsi qu'à la capacité de distinguer une configuration donnée dans une autre très complexe.
validité hypothético-déductive
La validité repose sur la cohérence des résultats au test avec le modèle théori
|
|