По словам г-на НТД, нынешний процесс разработки тестов слишком сильно зависит от личных ощущений и опыта. Несмотря на высокую квалификацию преподавателей, многим членам команды разработчиков не хватает опыта в тестировании, и они даже не знакомы с базовыми статистическими методами оценки сложности вопроса или эффективности вариантов вмешательства. Это превращает процесс разработки тестов в ручной, ненаучный процесс, вызывая споры об уровне сложности, простоте, краткости, продолжительности и потенциальных рисках.
![]() |
Кандидаты на выпускные экзамены по математике и английскому языку жаловались на трудности. Фото: Nhu Y. |
Следствием этого является «перцептивная» сложность: вопрос считается «сложным» или «лёгким» на основе субъективного восприятия экзаменуемого или опыта прошлых лет. Однако это восприятие может полностью отличаться от реальности применительно к десяткам тысяч кандидатов. Без таких показателей, как индекс сложности (p-значение), рассчитанный на основе реальных данных, мы не можем точно определить, насколько «сложным» или «лёгким» является вопрос в сравнении с общими способностями кандидатов.
Анализ дистракторов бесполезен. Без статистического анализа эффективности анализа дистракторов неправильные ответы могут стать слишком очевидными или, наоборот, слишком обманчивыми, чтобы отражать истинные способности. Это лишает вопрос дискриминационной силы, превращая его в вопрос наугад или простой тест на память.
В вопросе отсутствует дискриминация. Без этого индекса мы не можем определить, действительно ли вопрос хорошо фильтрует ответы. Вопрос, на который кому-то ответить слишком легко или слишком сложно, является плохим дискриминатором.
Задавая вопросы, основанные на личном опыте, составители тестов могут непреднамеренно включать вопросы, предвзятые по отношению к определённому аспекту знаний, с которым они знакомы, или использовать выражения, доступные только определённой группе кандидатов. Это подрывает справедливость экзамена и крайне рискованно.
Решение этой проблемы, по мнению г-на НТД, требует революционного подхода к разработке тестов, направленного на профессионализацию и научное применение. Это включает в себя углубленную подготовку в области тестирования, создание стандартизированного банка вопросов, профессиональный процесс разработки тестов и участие экспертов по статистике.
Переход от эмоций и переживаний к профессиональному процессу разработки тестов на основе статистических данных не только повышает качество тестовых вопросов, но и укрепляет доверие общества к справедливости и прозрачности вступительных экзаменов.
«Разбор» 4 причин
Доктор Тран Нам Ха, эксперт по экзаменам, проанализировал причины, по которым экзаменационные вопросы по некоторым предметам выпускного экзамена в средней школе 2025 года являются «абсолютно» сложными.
По словам доктора Нам Ха, первая причина — несоответствие между целями экзамена и его структурой. Значительную долю составляют вопросы прикладного и высокого уровня, в то время как вопросы на знание и понимание, которые являются «поддержкой» для обычных студентов, резко сократились. Эта предвзятость свидетельствует о том, что экзамен нацелен на классификацию, а не на выпуск.
Но что еще важнее, способы постановки вопросов и отбор материалов во многих академических предметах, которые являются глубокими, объемными и незнакомыми (особенно по литературе и английскому языку), заставляют студентов тратить много времени на чтение и понимание, оставляя им недостаточно энергии для выполнения основных требований.
Вторая проблема — ошибка в понимании и применении тестовой матрицы. Тестовая матрица, призванная обеспечить баланс содержания и уровня познавательной способности, была неправильно понята и применена. Многие подразделения считают матрицу просто таблицей распределения номеров вопросов, из которой они используют программы для случайного выбора, игнорируя подробные спецификации каждого вопроса.
Отсутствие контроля над оцениваемыми компетенциями, сложностью и дискриминацией превращает тест в «лотерейный продукт», а не в инструмент научной оценки. Ещё более тревожно, что путаница между матрицей и спецификациями теста привела к тому, что процесс разработки теста полностью оторвался от требований образовательной программы 2018 года.
В-третьих, ещё одним серьёзным недостатком является отсутствие национального стандартизированного банка вопросов. В настоящее время формулировка вопросов по-прежнему в значительной степени опирается на опыт экспертов, не имея эмпирических данных о сложности или различении. Это делает качество вопросов зависимым от личных ощущений и опыта, что приводит к значительным колебаниям между годами и между экзаменационными кодами.
В результате среднестатистические учащиеся старших классов, которые являются основной целью выпускного экзамена, больше не имеют возможности получить справедливый доступ к экзаменационным вопросам.
Последняя причина — непоследовательность в информационно-просветительской политике и технических процедурах. В феврале представители Министерства образования и профессиональной подготовки объявили о создании банка вопросов для экзамена в соответствии с новой программой.
Но всего несколько месяцев спустя, на пресс-конференции (после экзамена), один из руководителей заявил, что в первый год «не использовался ни один тестовый банк». Непоследовательность в коммуникации политики не только подрывает общественное доверие, но и сбивает с толку подготовку учителей и учащихся.
Источник: https://tienphong.vn/de-thi-kho-nong-bong-cac-dien-dan-quy-trinh-ra-de-thi-can-duoc-chuyen-nghiep-hoa-post1756576.tpo
Комментарий (0)