Vietnam.vn - Nền tảng quảng bá Việt Nam

การกระจายคะแนนไม่สามารถนำมาใช้เป็นพื้นฐานในการประเมินคุณภาพการศึกษาได้

สิ่งสำคัญคือต้องตระหนักว่าสเปกตรัมคะแนนนั้นเป็นเพียงเครื่องมือทางสถิติเชิงพรรณนา ไม่ใช่การวัดความยากหรือคุณภาพของการสอบโดยตรง

Báo Tuổi TrẻBáo Tuổi Trẻ16/07/2025

PHỔ ĐIỂM - Ảnh 1.

ผู้สมัครมีความเครียดในช่วงสอบปลายภาค - ภาพประกอบ: NAM TRAN

* ดูคะแนนสอบปลายภาคปี 2025 ได้อย่างรวดเร็วที่นี่

ในปี 2568 การสอบปลายภาคระดับมัธยมศึกษาตอนปลายจะมีการเปลี่ยนแปลงครั้งสำคัญ นั่นคือ จะไม่ใช้ระบบข้อสอบแบบมาตรฐานอีกต่อไป แต่จะใช้รูปแบบข้อสอบแบบผู้เชี่ยวชาญแทน

นี่เป็นวิธีแก้ปัญหาที่ยืดหยุ่นในบริบทของการเปลี่ยนผ่านไปสู่หลักสูตร การศึกษา ทั่วไปแบบใหม่ อย่างไรก็ตาม การเปลี่ยนแปลงวิธีการตั้งคำถามยังทำให้เกิดคำเตือนที่สำคัญ นั่นคือ การกระจายคะแนนและตัวบ่งชี้ทางสถิติพื้นฐานของการสอบนี้ไม่สามารถใช้ประเมินคุณภาพการสอนหรือวางแผนนโยบายการศึกษาได้

การกระจายคะแนนไม่ได้เป็นการวัดคุณภาพการทดสอบ

ในการสอบปลายภาคปี 2568 กระทรวงศึกษาธิการและฝึกอบรม จะไม่ใช้คลังข้อสอบมาตรฐานเป็นครั้งแรก แต่จะเปลี่ยนไปใช้วิธีการตั้งคำถามด้วยตนเองโดยผู้เชี่ยวชาญ การเปลี่ยนแปลงนี้ไม่เพียงแต่ส่งผลต่อวิธีการจัดทำข้อสอบเท่านั้น แต่ยังส่งผลโดยตรงต่อวิธีการวิเคราะห์และประเมินคุณภาพของข้อสอบและประสิทธิภาพในการสอนอีกด้วย

ทันทีที่การสอบสิ้นสุดลง การกระจายคะแนนและพารามิเตอร์ทางสถิติพื้นฐาน เช่น คะแนนเฉลี่ยและค่ามัธยฐาน จะยังคงได้รับการประกาศอย่างต่อเนื่องและกลายเป็นจุดสนใจของสาธารณชน อย่างไรก็ตาม สิ่งสำคัญคือต้องตระหนักให้ชัดเจนว่าการกระจายคะแนนเป็นเพียงเครื่องมือทางสถิติเชิงพรรณนา ไม่ใช่การวัดความยากหรือคุณภาพของการสอบโดยตรง

การกระจายคะแนนสามารถช่วยระบุลักษณะทั่วไปบางประการของการสอบได้ เช่น ผลการทดสอบมีความเบ้ไปทางซ้ายหรือขวา เข้มข้นอยู่ที่ระดับคะแนนบางระดับ หรือมีจุดสูงสุดที่ผิดปกติ

อย่างไรก็ตาม สิ่งเหล่านี้เป็นเพียงตัวบ่งชี้ทางอ้อมเท่านั้น ซึ่งได้รับอิทธิพลจากปัจจัยหลายประการนอกเหนือจากการสอบ เช่น ระดับการศึกษาของผู้สมัคร ระดับการทบทวน แนวทางการเตรียมตัวสอบ และปัจจัยสุ่มระหว่างการทดสอบ

การประเมินความยาก ความแม่นยำ และการจำแนกประเภทของการทดสอบไม่สามารถขึ้นอยู่กับการกระจายคะแนนเพียงอย่างเดียว

ในการที่จะได้ข้อสรุป ทางวิทยาศาสตร์ นั้น จำเป็นต้องวิเคราะห์โครงสร้างของข้อสอบแต่ละข้ออย่างละเอียด รวมถึงระดับการตอบสนองความต้องการของโปรแกรม และใช้ดัชนีเชิงลึก เช่น ดัชนีความยาก: สะท้อนถึงระดับความท้าทายของคำถามแต่ละข้อ ดัชนีการแยกแยะ: ประเมินความสามารถในการจำแนกนักเรียนที่ดีและนักเรียนที่อ่อน ค่าสัมประสิทธิ์ความน่าเชื่อถือ: วัดความเสถียรและความสอดคล้องของข้อสอบทั้งหมด

เนื่องจากการสอบปี 2568 ยังไม่มีมาตรฐาน การใช้การกระจายคะแนนเพื่อสะท้อนคุณภาพของการสอบ หรือเพื่อสรุปว่าข้อสอบง่ายหรือยากนั้นขาดพื้นฐานทางวิทยาศาสตร์ การกระจายคะแนนในปีนี้ควรเป็นเพียงเครื่องมือทางสถิติที่ใช้สำหรับการรับสมัครเข้าศึกษาต่อเท่านั้น และไม่สามารถใช้เพื่อให้ข้อเสนอแนะเกี่ยวกับคุณภาพการสอนหรือระดับการบรรลุข้อกำหนดของหลักสูตรการศึกษาทั่วไปใหม่ได้

การแจกแจงคะแนนนั้นจะใช้ได้เฉพาะเมื่อการทดสอบเป็นไปตามมาตรฐานเท่านั้น

การกระจายคะแนนและพารามิเตอร์ทางสถิติ เช่น คะแนนเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน อัตราการผ่าน และการกระจายคะแนน เป็นเครื่องมือสำคัญในการวิเคราะห์ผลการสอบ ในทางทฤษฎี การกระจายคะแนนสามารถสะท้อนถึงระดับความยากของการสอบ ความสามารถในการจำแนกนักเรียน และแม้แต่แนวโน้มการสอนในช่วงเวลาต่างๆ

อย่างไรก็ตาม ข้อกำหนดเบื้องต้นสำหรับตัวบ่งชี้เหล่านี้ให้มีประโยชน์คือ แบบทดสอบจะต้องเป็นเครื่องมือวัดที่ได้มาตรฐาน ซึ่งรวมถึง: การมีเมทริกซ์และข้อกำหนดการทดสอบที่ชัดเจน คำถามที่ทดสอบความยากและการแยกแยะ การมีข้อมูลการทดลองจากแบบทดสอบทดลอง การมีกระบวนการสร้าง-ตรวจสอบ-ยอมรับที่เข้มงวด

หากแบบทดสอบไม่ได้มาตรฐาน ไม่ว่าการกระจายคะแนนจะดีแค่ไหน ก็จะไม่สะท้อนถึงลักษณะที่แท้จริง การกระจายคะแนนที่เบ้ไปทางซ้าย (คะแนนสูงหลายครั้ง) ไม่ได้หมายความว่าแบบทดสอบนั้นง่ายเสมอไป และคะแนนเฉลี่ยที่ต่ำก็ไม่ได้หมายความว่านักเรียนจะอ่อนเสมอไป ทุกอย่างขึ้นอยู่กับความน่าเชื่อถือของแบบทดสอบ

การสอบทำโดยใช้วิธีการของผู้เชี่ยวชาญ: ยืดหยุ่นแต่ไม่สามารถทดแทนมาตรฐานได้

การใช้วิธีการของผู้เชี่ยวชาญในการสร้างคำถามนั้นไม่ใช่เรื่องแปลกในแวดวงการศึกษา มักใช้เมื่อต้องการคำตอบที่รวดเร็ว เมื่อไม่มีเวลาเพียงพอในการสร้างคำถามมาตรฐาน หรือในการสอบภายใน อย่างไรก็ตาม วิธีการนี้ขาดความเป็นกลางและความเสถียรเมื่อเทียบกับระบบคำถามมาตรฐาน

เมื่อตั้งคำถามตามผู้เชี่ยวชาญ: ระดับความยากจะขึ้นอยู่กับความคิดเห็นส่วนตัวของคอมไพเลอร์ คำถามยังไม่ได้รับการทดสอบในทางปฏิบัติ ไม่มีข้อมูลเปรียบเทียบสำหรับการปรับแต่ง การกระจายความยากและทักษะได้รับการออกแบบตามประสบการณ์มากกว่าข้อมูล

ผลที่ตามมาคือ การกระจายคะแนนกลายเป็นผลคูณของการวัดที่ไม่ได้ผ่านการสอบเทียบ การใช้การกระจายคะแนนเพื่อสรุปผลเกี่ยวกับความสามารถของนักเรียน คุณภาพการสอน หรือความเกี่ยวข้องของหลักสูตร ถือเป็นข้อผิดพลาดเชิงวิธีการอย่างร้ายแรง

ข้อมูลไม่น่าเชื่อถือ ข้อสรุปที่ไม่ถูกต้อง นโยบายที่ไม่เหมาะสม

ในบริบทของการปฏิรูปการศึกษาในระยะสำคัญ การใช้ข้อมูลจากการสอบเพื่อการประเมิน การเปรียบเทียบ และการตัดสินใจเป็นสิ่งจำเป็นอย่างยิ่ง อย่างไรก็ตาม สิ่งที่อันตรายที่สุดคือการพึ่งพาข้อมูลที่ไม่น่าเชื่อถือเพื่อกำหนดนโยบายอย่างเป็นระบบ

หากเราใช้การกระจายคะแนนสอบมัธยมศึกษาตอนปลายปีการศึกษา 2568 ซึ่งไม่ได้อิงจากคำถามทดสอบมาตรฐาน เพื่อประเมินคุณภาพการสอนระหว่างภูมิภาค เปรียบเทียบผลการเรียนตามกลุ่มนักเรียน และวิเคราะห์ความเหมาะสมของหลักสูตรการศึกษารูปแบบใหม่ การวิเคราะห์ดังกล่าวขาดพื้นฐานทางวิทยาศาสตร์ นำไปสู่ความเข้าใจผิดเกี่ยวกับสถานการณ์ปัจจุบันได้ง่าย และนำไปสู่นโยบายที่ไม่เกิดประสิทธิผล

การสอบเข้าไม่สามารถเทียบเท่ากับการสอบประเมินผลแบบเป็นระบบได้

สิ่งสำคัญคือต้องแยกแยะให้ชัดเจน: การสอบอาจจะเพียงพอที่จะใช้เป็นเกณฑ์ในการสำเร็จการศึกษาหรือการรับเข้าเรียน แต่ไม่มีคุณสมบัติที่จะเป็นเครื่องมือในการวัดคุณภาพของระบบการศึกษา

การสอบปลายภาคปี 2568 ซึ่งเป็นการสอบครั้งแรกภายใต้โครงการศึกษาทั่วไปใหม่ สามารถใช้เป็นการสอบเพื่อจบการศึกษาและคัดเลือกเข้ามหาวิทยาลัยได้อย่างสมบูรณ์ อย่างไรก็ตาม การคาดหวังให้การกระจายคะแนนเป็นตัวชี้วัดคุณภาพการสอน ประสิทธิภาพของหลักสูตร หรือระดับนักศึกษาทั่วประเทศนั้นไม่สมจริงและไม่ถูกต้องตามระเบียบวิธี

การทดสอบที่ไม่ได้มาตรฐาน → ข้อมูลที่ไม่น่าเชื่อถือ → ไม่สามารถใช้เป็นเกณฑ์มาตรฐานในการวิเคราะห์หรือการกำหนดนโยบายทางการศึกษาได้

ความรู้สึกขององค์กรไม่ควรมาแทนที่หลักการทางวิทยาศาสตร์

ในด้านการศึกษา เช่นเดียวกับสาขาอื่นๆ ที่ใช้ข้อมูลเพื่อการตัดสินใจ จำเป็นต้องยึดมั่นในหลักการที่ว่า “ข้อมูลที่เชื่อถือได้ต้องมาจากเครื่องมือวัดที่เชื่อถือได้” อย่างเคร่งครัด ความคาดหวังในการมีข้อมูลไม่สามารถถูกมองข้ามได้ ตราบเท่าที่ความจำเป็นในการสร้างมาตรฐานในเครื่องมือรวบรวมข้อมูลถูกมองข้ามไป

การจัดการสอบปลายภาคปี 2568 โดยใช้คำถามจากผู้เชี่ยวชาญเป็นทางเลือกที่ยอมรับได้ในระดับปฏิบัติการ อย่างไรก็ตาม ผลการสอบนี้ไม่ควรและไม่สามารถนำไปใช้ในการประเมินหรือเสนอแนะนโยบายอย่างเป็นระบบได้

วิทยาศาสตร์การวัดไม่อนุญาตให้ใช้การวัดที่ไม่ถูกต้องเป็นเกณฑ์มาตรฐาน การศึกษาไม่สามารถสร้างนโยบายบนข้อมูลที่ไม่น่าเชื่อถือได้

กลับสู่หัวข้อ
ดร. ไซ กง ฮ่อง

ที่มา: https://tuoitre.vn/khong-the-lay-pho-diem-lam-can-cu-danh-gia-chat-luong-giao-duc-20250716150343597.htm


การแสดงความคิดเห็น (0)

No data
No data

หัวข้อเดียวกัน

หมวดหมู่เดียวกัน

ดอกไม้ ‘ราคาสูง’ ราคาดอกละ 1 ล้านดอง ยังคงได้รับความนิยมในวันที่ 20 ตุลาคม
ภาพยนตร์เวียดนามและเส้นทางสู่รางวัลออสการ์
เยาวชนเดินทางไปภาคตะวันตกเฉียงเหนือเพื่อเช็คอินในช่วงฤดูข้าวที่สวยที่สุดของปี
ในฤดู 'ล่า' หญ้ากกที่บิ่ญเลียว

ผู้เขียนเดียวกัน

มรดก

รูป

ธุรกิจ

ชาวประมงกวางงายรับเงินหลายล้านดองทุกวันหลังถูกรางวัลแจ็กพอตกุ้ง

เหตุการณ์ปัจจุบัน

ระบบการเมือง

ท้องถิ่น

ผลิตภัณฑ์