คุณ NTD ระบุว่า กระบวนการทำข้อสอบในปัจจุบันขึ้นอยู่กับความรู้สึกและประสบการณ์ส่วนบุคคลมากเกินไป แม้ว่าพวกเขาจะเป็นครูที่มีคุณวุฒิสูง แต่หลายคนในทีมทำข้อสอบกลับขาดความเชี่ยวชาญในการทดสอบ และไม่รู้แม้กระทั่งวิธีการทางสถิติขั้นพื้นฐานในการประเมินความยากของคำถามหรือประสิทธิภาพของตัวเลือกแบบแทรกแซง สิ่งนี้ทำให้กระบวนการทำข้อสอบกลายเป็นกระบวนการที่ทำด้วยมือและ ไม่เป็นวิทยาศาสตร์ ก่อให้เกิดข้อถกเถียงเกี่ยวกับระดับความยาก ความง่าย ความสั้น ความยาว และความเสี่ยงที่อาจเกิดขึ้น
![]() |
ผู้สมัครสอบปลายภาควิชาคณิตศาสตร์และภาษาอังกฤษ บ่นว่ายาก ภาพโดย: นู๋ ย. |
ผลที่ตามมาคือความยากในระดับ “การรับรู้”: คำถามจะถูกพิจารณาว่า “ยาก” หรือ “ง่าย” โดยพิจารณาจากการรับรู้ส่วนตัวของผู้เข้าสอบ หรือจากประสบการณ์ในปีก่อนๆ อย่างไรก็ตาม การรับรู้นี้อาจแตกต่างจากความเป็นจริงอย่างสิ้นเชิงเมื่อนำไปใช้กับผู้เข้าสอบหลายหมื่นคน หากไม่มีตัวบ่งชี้ เช่น ดัชนีความยาก (p-value) ที่คำนวณจากข้อมูลจริง เราจะไม่สามารถทราบได้อย่างแน่ชัดว่าคำถามนั้น “ยาก” หรือ “ง่าย” เพียงใดเมื่อเทียบกับความสามารถโดยรวมของผู้เข้าสอบ
การวิเคราะห์สิ่งที่รบกวนสมาธินั้นไร้ประโยชน์ หากปราศจากการวิเคราะห์ทางสถิติถึงประสิทธิภาพของการวิเคราะห์สิ่งที่รบกวนสมาธิ การเลือกที่ไม่ถูกต้องอาจดูชัดเจนเกินไป หรือในทางกลับกัน อาจหลอกลวงเกินกว่าจะสะท้อนความสามารถที่แท้จริงได้ สิ่งนี้ทำให้คำถามนั้นสูญเสียความสามารถในการแยกแยะ กลายเป็นคำถามเชิงโอกาสหรือเป็นเพียงการทดสอบความจำอย่างง่าย
คำถามนี้ขาดการแยกแยะ หากไม่มีดัชนีนี้ เราจะไม่สามารถรู้ได้ว่าคำถามนั้นทำหน้าที่กรองได้ดีจริงหรือไม่ คำถามที่ง่ายเกินไปสำหรับใคร ๆ ที่จะทำ หรือยากเกินไปสำหรับใคร ๆ ที่จะทำ ถือเป็นตัวแยกแยะที่ไม่ดี
เมื่อตั้งคำถามโดยอิงจากประสบการณ์ส่วนตัว ผู้ทำแบบทดสอบอาจตั้งคำถามโดยไม่ได้ตั้งใจ ซึ่งมีความลำเอียงไปในแง่มุมความรู้บางอย่างที่ตนคุ้นเคย หรือใช้ถ้อยคำที่เข้าถึงได้เฉพาะผู้เข้าสอบบางกลุ่มเท่านั้น การกระทำเช่นนี้บั่นทอนความยุติธรรมของข้อสอบและมีความเสี่ยงสูง
คุณ NTD กล่าวว่า ทางออกของปัญหานี้ต้องอาศัยการปฏิวัติแนวทางการทำแบบทดสอบ สู่ความเป็นมืออาชีพและการประยุกต์ใช้ทางวิทยาศาสตร์ ซึ่งรวมถึงการฝึกอบรมเชิงลึกเกี่ยวกับการทดสอบ การสร้างคลังข้อสอบที่ได้มาตรฐาน กระบวนการทำแบบทดสอบอย่างมืออาชีพ และการมีส่วนร่วมของผู้เชี่ยวชาญด้านสถิติ
การละทิ้งจากอารมณ์และประสบการณ์สู่กระบวนการจัดทำแบบทดสอบแบบมืออาชีพที่อิงตามข้อมูลทางสถิติไม่เพียงแต่ช่วยปรับปรุงคุณภาพของคำถามในการทดสอบเท่านั้น แต่ยังเสริมสร้างความเชื่อมั่นของสังคมต่อความยุติธรรมและความโปร่งใสของการสอบเข้าอีกด้วย
“การวิเคราะห์” สาเหตุ 4 ประการ
ดร. ทราน นัม ฮา ผู้เชี่ยวชาญการสอบ ได้วิเคราะห์สาเหตุที่คำถามในการสอบบางวิชาของการสอบปลายภาคมัธยมศึกษาปี 2568 นั้น "ยากอย่างยิ่ง"
ดร. นัม ฮา ระบุว่า สาเหตุแรกคือความไม่สอดคล้องกันระหว่างวัตถุประสงค์ของข้อสอบกับโครงสร้างของข้อสอบ จำนวนข้อสอบในระดับประยุกต์และระดับสูงมีสัดส่วนสูง ในขณะที่คำถามความรู้ความเข้าใจซึ่งเป็น “ตัวช่วย” สำหรับนักเรียนทั่วไปกลับลดลงอย่างรวดเร็ว ความลำเอียงนี้แสดงให้เห็นว่าข้อสอบมุ่งเป้าไปที่การจัดประเภทข้อสอบมากกว่าการสำเร็จการศึกษา
ที่สำคัญกว่านั้นคือ วิธีการถามคำถามและเลือกใช้เนื้อหาในวิชาการหลายๆ วิชาที่ลึกซึ้ง ยาว และไม่คุ้นเคย โดยเฉพาะวรรณคดีและภาษาอังกฤษ ทำให้ผู้เรียนต้องใช้เวลาอ่านและทำความเข้าใจเป็นจำนวนมาก จนแทบไม่มีพลังงานเพียงพอที่จะแก้ไขข้อกำหนดหลัก
ประการที่สองคือข้อผิดพลาดในการทำความเข้าใจและการนำเมทริกซ์ข้อสอบไปใช้ เมทริกซ์ข้อสอบซึ่งควรจะเป็นเครื่องมือที่ช่วยสร้างสมดุลระหว่างเนื้อหาและระดับความรู้ความเข้าใจ กลับถูกเข้าใจผิดและนำไปใช้อย่างไม่ถูกต้อง หลายหน่วยการเรียนรู้มองว่าเมทริกซ์เป็นเพียงตารางแจกแจงหมายเลขคำถาม ซึ่งใช้ซอฟต์แวร์สุ่มจับคะแนน โดยละเลยรายละเอียดเฉพาะของแต่ละคำถาม
เนื่องจากขาดการควบคุมสมรรถนะที่จะประเมิน ความยากง่าย และการแยกแยะ ทำให้แบบทดสอบกลายเป็น "ผลิตภัณฑ์ลอตเตอรี่" แทนที่จะเป็นเครื่องมือประเมินผลทางวิทยาศาสตร์ ที่น่ากังวลยิ่งกว่าคือ ความสับสนระหว่างเมทริกซ์และข้อกำหนดของแบบทดสอบ ทำให้กระบวนการสร้างแบบทดสอบแยกออกจากข้อกำหนดของโครงการ การศึกษา ปี 2018 อย่างสิ้นเชิง
ประการที่สาม จุดอ่อนสำคัญอีกประการหนึ่งคือการไม่มีคลังข้อสอบมาตรฐานระดับชาติ การตั้งคำถามในปัจจุบันยังคงอาศัยประสบการณ์ของผู้เชี่ยวชาญเป็นหลัก โดยไม่มีข้อมูลเชิงประจักษ์เกี่ยวกับความยากหรือการแบ่งแยก ซึ่งทำให้คุณภาพของคำถามขึ้นอยู่กับความรู้สึกและประสบการณ์ส่วนบุคคล ส่งผลให้เกิดความผันผวนอย่างมากระหว่างปีและรหัสข้อสอบ
ส่งผลให้นักเรียนมัธยมปลายทั่วไปซึ่งเป็นเป้าหมายหลักของการสอบเข้ามหาวิทยาลัยไม่ได้รับโอกาสเข้าถึงคำถามในข้อสอบอย่างเป็นธรรมอีกต่อไป
สาเหตุสุดท้ายคือความไม่สอดคล้องกันในการสื่อสารนโยบายและขั้นตอนทางเทคนิค ในเดือนกุมภาพันธ์ ตัวแทนจาก กระทรวงศึกษาธิการและการฝึกอบรม ได้ประกาศสร้างคลังข้อสอบสำหรับการสอบตามโครงการใหม่
แต่เพียงไม่กี่เดือนต่อมา ในงานแถลงข่าว (หลังสอบ) ผู้นำคนหนึ่งกล่าวว่าในปีแรก “ไม่มีการใช้คลังข้อสอบเลย” ความไม่สอดคล้องกันในการสื่อสารนโยบายไม่เพียงแต่บั่นทอนความไว้วางใจทางสังคมเท่านั้น แต่ยังทำให้การเตรียมตัวของครูและนักเรียนไม่มีประสิทธิภาพอีกด้วย
ที่มา: https://tienphong.vn/de-thi-kho-nong-bong-cac-dien-dan-quy-trinh-ra-de-thi-can-duoc-chuyen-nghiep-hoa-post1756576.tpo
การแสดงความคิดเห็น (0)