Les candidats stressés lors de l'examen de fin d'études secondaires - Photo d'illustration : NAM TRAN
* Consultez rapidement les résultats de l'examen de fin d'études secondaires de 2025 ICI
En 2025, l'examen de fin d'études secondaires se déroulera avec un changement important : il n'utilisera plus une banque de questions standardisées, mais plutôt un format de test basé sur des experts.
Il s'agit d'une solution flexible dans le contexte de la transition vers le nouveau programme de formation générale. Cependant, la modification de la méthode d'élaboration des questions soulève également un avertissement important : la distribution des scores et les indicateurs statistiques de base de cet examen ne peuvent servir à évaluer la qualité de l'enseignement ni à planifier la politique éducative.
La distribution des scores n’est pas une mesure de la qualité du test.
Pour la première fois, lors de l'examen de fin d'études secondaires de 2025, le ministère de l'Éducation et de la Formation n'utilisera plus de questionnaire standardisé, mais adoptera une méthode d'élaboration manuelle des questions, menée par des experts. Ce changement aura non seulement une incidence sur la structure de l'examen, mais aussi sur la manière dont la qualité des questions et l'efficacité de l'enseignement sont analysées et évaluées.
Immédiatement après la fin de l'examen, la distribution des scores et les paramètres statistiques de base, tels que les scores moyens et médians, continuent d'être annoncés et attirent l'attention du public. Cependant, il est important de bien comprendre que la distribution des scores n'est qu'un outil statistique descriptif et non une mesure directe de la difficulté ou de la qualité de l'examen.
La distribution des scores peut aider à identifier certaines caractéristiques générales de l'examen, par exemple si les résultats du test sont biaisés à gauche ou à droite, concentrés à certains niveaux de score ou présentent des pics inhabituels.
Il ne s'agit cependant que d'indicateurs indirects, influencés par de nombreux facteurs extérieurs à l'examen tels que le niveau académique du candidat, son niveau de révision, son orientation vers la préparation à l'examen et des facteurs aléatoires pendant le test.
L’évaluation de la difficulté, de la précision et de la classification du test ne peut pas être basée uniquement sur la distribution des scores.
Pour avoir une conclusion scientifique , il est nécessaire d'analyser soigneusement la structure de l'examen, chaque question spécifique, le niveau de satisfaction des exigences du programme, et d'appliquer des indices approfondis tels que : Indice de difficulté : reflète le niveau de défi de chaque question ; Indice de discrimination : évalue la capacité à classer les bons et les faibles étudiants ; Coefficient de fiabilité : mesure la stabilité et la cohérence de l'ensemble de l'examen.
Dans le contexte de l'absence de standardisation de l'examen de 2025, l'utilisation de la distribution des notes pour refléter la qualité de l'examen ou pour déterminer sa facilité ou sa difficulté manque de fondement scientifique. La distribution des notes de cette année doit plutôt être considérée comme un outil statistique servant principalement aux admissions, et ne peut servir à évaluer la qualité de l'enseignement ou le niveau de satisfaction aux exigences du nouveau programme de formation générale.
La distribution des scores n'est valable que lorsque le test répond aux normes.
Les distributions de scores et les paramètres statistiques tels que les moyennes, les écarts types, les taux de réussite et les distributions de scores sont des outils importants pour l'analyse des résultats aux tests. En théorie, ils peuvent refléter le niveau de difficulté du test, la capacité à classer les élèves et même les tendances pédagogiques au fil du temps.
Cependant, la condition préalable à l'utilité de ces indicateurs est la suivante : le test doit être un outil de mesure standardisé. Cela implique : une matrice et des spécifications claires ; des questions dont la difficulté et la discrimination sont évaluées ; des données expérimentales issues de tests d'essai ; et un processus rigoureux de construction, de révision et d'acceptation.
Si le test n'est pas standardisé, quelle que soit la qualité de la distribution des scores, elle ne reflétera pas la réalité. Une distribution des scores biaisée à gauche (avec de nombreux scores élevés) ne signifie pas nécessairement que le test est facile, et une note moyenne faible ne signifie pas nécessairement que l'élève est faible ; tout dépend de la fiabilité du test.
Les examens sont réalisés à l'aide de méthodes expertes : flexibles mais ne se substituent pas à la normalisation
Le recours à des méthodes expertes pour créer des questions n'est pas rare dans l'enseignement. On y a souvent recours lorsque des réponses rapides sont nécessaires, lorsqu'on manque de temps pour constituer une banque de questions standardisée ou lors d'examens internes. Cependant, cette méthode manque d'objectivité et de stabilité par rapport à un système de questions standardisé.
Lors de la formulation des questions selon les experts : le niveau de difficulté dépend de la subjectivité du compilateur ; les questions n'ont pas été testées dans la pratique ; il n'existe pas de données de comparaison pour l'ajustement ; la répartition de la difficulté et des compétences est conçue sur la base de l'expérience plutôt que des données.
Par conséquent, la distribution des scores devient le produit d'une mesure non calibrée. L'utiliser pour tirer des conclusions sur les compétences des étudiants, la qualité de l'enseignement ou la pertinence du programme constituerait une grave erreur méthodologique.
Données peu fiables, conclusions inexactes, politiques inappropriées
Dans le contexte d'une réforme de l'éducation à un stade crucial, l'utilisation des données d'examen à des fins d'évaluation, de comparaison et de prise de décision est absolument nécessaire. Cependant, le plus dangereux est de s'appuyer sur des données peu fiables pour élaborer des politiques systématiques.
Si nous utilisons la distribution des notes des examens de lycée de 2025 - qui ne se base pas sur des questions de tests standardisées - pour évaluer la qualité de l'enseignement entre les régions, comparer les résultats par groupes d'élèves et analyser l'adéquation du nouveau programme d'enseignement, de telles analyses manquent de fondement scientifique, conduisent facilement à des malentendus sur la situation actuelle et introduisent des politiques contreproductives.
Un examen d’entrée ne peut pas être assimilé à un examen d’évaluation systématique.
Il est important de faire une distinction claire : un examen peut être suffisamment bon pour servir de critère d’obtention de diplôme ou d’admission, mais il n’est pas qualifié pour être un outil de mesure de la qualité du système éducatif.
L'examen de fin d'études secondaires de 2025, premier examen du nouveau programme d'enseignement général, peut pleinement remplir sa fonction d'examen d'entrée à l'université et de sélection des candidats. Cependant, il est irréaliste et méthodologiquement erroné de croire que la distribution des notes puisse évaluer la qualité de l'enseignement, l'efficacité du programme ou le niveau des élèves à l'échelle nationale.
Tests non standardisés → données peu fiables → ne peuvent pas être utilisés comme référence pour l’analyse de l’éducation ou l’élaboration des politiques.
Le sentiment organisationnel ne doit pas remplacer les principes scientifiques.
En éducation, comme dans tout domaine utilisant des données pour la prise de décision, le principe selon lequel « des données fiables proviennent d'outils de mesure fiables » doit être strictement respecté. L'attente de disposer de données ne peut être ignorée au point de négliger la nécessité de normaliser les outils de collecte de données.
L'organisation de l'examen de fin d'études secondaires de 2025 à l'aide de questions d'experts est une option organisationnelle acceptable au niveau opérationnel. Cependant, les résultats de cet examen ne doivent pas, et ne peuvent pas, servir à réaliser des évaluations systématiques ou des recommandations politiques.
La science de la mesure ne permet pas d'utiliser une mesure inexacte comme référence. L'éducation ne peut pas élaborer de politiques sur la base de données peu fiables.
Source: https://tuoitre.vn/khong-the-lay-pho-diem-lam-can-cu-danh-gia-chat-luong-giao-duc-20250716150343597.htm
Comment (0)