Vietnam.vn - Nền tảng quảng bá Việt Nam

การกระจายคะแนนไม่สามารถนำมาใช้เป็นพื้นฐานในการประเมินคุณภาพการศึกษาได้

สิ่งสำคัญคือต้องตระหนักว่าสเปกตรัมคะแนนนั้นเป็นเพียงเครื่องมือทางสถิติเชิงพรรณนา ไม่ใช่การวัดความยากหรือคุณภาพของการสอบโดยตรง

Báo Tuổi TrẻBáo Tuổi Trẻ16/07/2025

PHỔ ĐIỂM - Ảnh 1.

ผู้สมัครมีความเครียดในช่วงสอบปลายภาค - ภาพประกอบ: NAM TRAN

* ดูคะแนนสอบปลายภาคปี 2025 ได้อย่างรวดเร็วที่นี่

ในปี 2568 การสอบปลายภาคระดับมัธยมศึกษาตอนปลายจะมีการเปลี่ยนแปลงครั้งสำคัญ นั่นคือ จะไม่ใช้ระบบข้อสอบแบบมาตรฐานอีกต่อไป แต่จะใช้รูปแบบข้อสอบแบบผู้เชี่ยวชาญแทน

นี่เป็นวิธีแก้ปัญหาที่ยืดหยุ่นในบริบทของการเปลี่ยนผ่านไปสู่หลักสูตร การศึกษา ทั่วไปแบบใหม่ อย่างไรก็ตาม การเปลี่ยนแปลงวิธีการตั้งคำถามยังทำให้เกิดคำเตือนที่สำคัญ นั่นคือ การกระจายคะแนนและตัวบ่งชี้ทางสถิติพื้นฐานของการสอบนี้ไม่สามารถใช้ประเมินคุณภาพการสอนหรือวางแผนนโยบายการศึกษาได้

การกระจายคะแนนไม่ได้เป็นการวัดคุณภาพการทดสอบ

ในการสอบปลายภาคปี 2568 กระทรวงศึกษาธิการและฝึกอบรม จะไม่ใช้คลังข้อสอบมาตรฐานเป็นครั้งแรก แต่จะเปลี่ยนไปใช้วิธีการตั้งคำถามด้วยตนเองโดยผู้เชี่ยวชาญ การเปลี่ยนแปลงนี้ไม่เพียงแต่ส่งผลต่อวิธีการจัดทำข้อสอบเท่านั้น แต่ยังส่งผลโดยตรงต่อวิธีการวิเคราะห์และประเมินคุณภาพของข้อสอบและประสิทธิภาพในการสอนอีกด้วย

ทันทีที่การสอบสิ้นสุดลง การกระจายคะแนนและพารามิเตอร์ทางสถิติพื้นฐาน เช่น คะแนนเฉลี่ยและค่ามัธยฐาน จะยังคงได้รับการประกาศอย่างต่อเนื่องและกลายเป็นจุดสนใจของสาธารณชน อย่างไรก็ตาม สิ่งสำคัญคือต้องตระหนักให้ชัดเจนว่าการกระจายคะแนนเป็นเพียงเครื่องมือทางสถิติเชิงพรรณนา ไม่ใช่การวัดความยากหรือคุณภาพของการสอบโดยตรง

การกระจายคะแนนสามารถช่วยระบุลักษณะทั่วไปบางประการของการสอบได้ เช่น ผลการทดสอบมีความเบ้ไปทางซ้ายหรือขวา เข้มข้นอยู่ที่ระดับคะแนนบางระดับ หรือมีจุดสูงสุดที่ผิดปกติ

อย่างไรก็ตาม สิ่งเหล่านี้เป็นเพียงตัวบ่งชี้ทางอ้อมเท่านั้น ซึ่งได้รับอิทธิพลจากปัจจัยหลายประการนอกเหนือจากการสอบ เช่น ระดับการศึกษาของผู้สมัคร ระดับการทบทวน แนวทางการเตรียมตัวสอบ และปัจจัยสุ่มระหว่างการทดสอบ

การประเมินความยาก ความแม่นยำ และการจำแนกประเภทของการทดสอบไม่สามารถขึ้นอยู่กับการกระจายคะแนนเพียงอย่างเดียว

ในการที่จะได้ข้อสรุป ทางวิทยาศาสตร์ นั้น จำเป็นต้องวิเคราะห์โครงสร้างของข้อสอบแต่ละข้ออย่างละเอียด รวมถึงระดับการตอบสนองความต้องการของโปรแกรม และใช้ดัชนีเชิงลึก เช่น ดัชนีความยาก: สะท้อนถึงระดับความท้าทายของคำถามแต่ละข้อ ดัชนีการแยกแยะ: ประเมินความสามารถในการจำแนกนักเรียนที่ดีและนักเรียนที่อ่อน ค่าสัมประสิทธิ์ความน่าเชื่อถือ: วัดความเสถียรและความสอดคล้องของข้อสอบทั้งหมด

เนื่องจากการสอบปี 2568 ยังไม่มีมาตรฐาน การใช้การกระจายคะแนนเพื่อสะท้อนคุณภาพของการสอบ หรือเพื่อสรุปว่าข้อสอบง่ายหรือยากนั้นขาดพื้นฐานทางวิทยาศาสตร์ การกระจายคะแนนในปีนี้ควรเป็นเพียงเครื่องมือทางสถิติที่ใช้สำหรับการรับสมัครเข้าศึกษาต่อเท่านั้น และไม่สามารถใช้เพื่อให้ข้อเสนอแนะเกี่ยวกับคุณภาพการสอนหรือระดับการบรรลุข้อกำหนดของหลักสูตรการศึกษาทั่วไปใหม่ได้

การแจกแจงคะแนนนั้นจะใช้ได้เฉพาะเมื่อการทดสอบเป็นไปตามมาตรฐานเท่านั้น

การกระจายคะแนนและพารามิเตอร์ทางสถิติ เช่น คะแนนเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน อัตราการผ่าน และการกระจายคะแนน เป็นเครื่องมือสำคัญในการวิเคราะห์ผลการสอบ ในทางทฤษฎี การกระจายคะแนนสามารถสะท้อนถึงระดับความยากของการสอบ ความสามารถในการจำแนกนักเรียน และแม้แต่แนวโน้มการสอนในช่วงเวลาต่างๆ

อย่างไรก็ตาม ข้อกำหนดเบื้องต้นสำหรับตัวบ่งชี้เหล่านี้ให้มีประโยชน์คือ แบบทดสอบจะต้องเป็นเครื่องมือวัดที่ได้มาตรฐาน ซึ่งรวมถึง: การมีเมทริกซ์และข้อกำหนดการทดสอบที่ชัดเจน คำถามที่ทดสอบความยากและการแยกแยะ การมีข้อมูลการทดลองจากแบบทดสอบทดลอง การมีกระบวนการสร้าง-ตรวจสอบ-ยอมรับที่เข้มงวด

หากแบบทดสอบไม่ได้มาตรฐาน ไม่ว่าการกระจายคะแนนจะดีแค่ไหน ก็จะไม่สะท้อนถึงลักษณะที่แท้จริง การกระจายคะแนนที่เบ้ไปทางซ้าย (คะแนนสูงหลายครั้ง) ไม่ได้หมายความว่าแบบทดสอบนั้นง่ายเสมอไป และคะแนนเฉลี่ยที่ต่ำก็ไม่ได้หมายความว่านักเรียนจะอ่อนเสมอไป ทุกอย่างขึ้นอยู่กับความน่าเชื่อถือของแบบทดสอบ

การสอบทำโดยใช้วิธีการของผู้เชี่ยวชาญ: ยืดหยุ่นแต่ไม่สามารถทดแทนมาตรฐานได้

การใช้วิธีการของผู้เชี่ยวชาญในการสร้างคำถามนั้นไม่ใช่เรื่องแปลกในแวดวงการศึกษา มักใช้เมื่อต้องการคำตอบที่รวดเร็ว เมื่อไม่มีเวลาเพียงพอในการสร้างคำถามมาตรฐาน หรือในการสอบภายใน อย่างไรก็ตาม วิธีการนี้ขาดความเป็นกลางและความเสถียรเมื่อเทียบกับระบบคำถามมาตรฐาน

เมื่อตั้งคำถามตามผู้เชี่ยวชาญ: ระดับความยากจะขึ้นอยู่กับความคิดเห็นส่วนตัวของคอมไพเลอร์ คำถามยังไม่ได้รับการทดสอบในทางปฏิบัติ ไม่มีข้อมูลเปรียบเทียบสำหรับการปรับแต่ง การกระจายความยากและทักษะได้รับการออกแบบตามประสบการณ์มากกว่าข้อมูล

ผลที่ตามมาคือ การกระจายคะแนนกลายเป็นผลคูณของการวัดที่ไม่ได้ผ่านการสอบเทียบ การใช้การกระจายคะแนนเพื่อสรุปผลเกี่ยวกับความสามารถของนักเรียน คุณภาพการสอน หรือความเกี่ยวข้องของหลักสูตร ถือเป็นข้อผิดพลาดเชิงวิธีการอย่างร้ายแรง

ข้อมูลไม่น่าเชื่อถือ ข้อสรุปที่ไม่ถูกต้อง นโยบายที่ไม่เหมาะสม

ในบริบทของการปฏิรูปการศึกษาในระยะสำคัญ การใช้ข้อมูลจากการสอบเพื่อการประเมิน การเปรียบเทียบ และการตัดสินใจเป็นสิ่งจำเป็นอย่างยิ่ง อย่างไรก็ตาม สิ่งที่อันตรายที่สุดคือการพึ่งพาข้อมูลที่ไม่น่าเชื่อถือเพื่อกำหนดนโยบายอย่างเป็นระบบ

หากเราใช้การกระจายคะแนนสอบมัธยมศึกษาตอนปลายปีการศึกษา 2568 ซึ่งไม่ได้อิงจากคำถามทดสอบมาตรฐาน เพื่อประเมินคุณภาพการสอนระหว่างภูมิภาค เปรียบเทียบผลการเรียนตามกลุ่มนักเรียน และวิเคราะห์ความเหมาะสมของหลักสูตรการศึกษารูปแบบใหม่ การวิเคราะห์ดังกล่าวขาดพื้นฐานทางวิทยาศาสตร์ นำไปสู่ความเข้าใจผิดเกี่ยวกับสถานการณ์ปัจจุบันได้ง่าย และนำไปสู่นโยบายที่ไม่เกิดประสิทธิผล

การสอบเข้าไม่สามารถเทียบเท่ากับการสอบวัดผลอย่างเป็นระบบได้

สิ่งสำคัญคือต้องแยกแยะให้ชัดเจน: การสอบอาจจะเพียงพอที่จะใช้เป็นเกณฑ์ในการสำเร็จการศึกษาหรือการรับเข้าเรียน แต่ไม่มีคุณสมบัติที่จะเป็นเครื่องมือในการวัดคุณภาพของระบบการศึกษา

การสอบปลายภาคปี 2568 ซึ่งเป็นการสอบครั้งแรกภายใต้โครงการศึกษาทั่วไปใหม่ สามารถใช้เป็นการสอบเพื่อจบการศึกษาและคัดเลือกเข้ามหาวิทยาลัยได้อย่างสมบูรณ์ อย่างไรก็ตาม การคาดหวังให้การกระจายคะแนนเป็นตัวชี้วัดคุณภาพการสอน ประสิทธิภาพของหลักสูตร หรือระดับนักศึกษาทั่วประเทศนั้นไม่สมจริงและไม่ถูกต้องตามระเบียบวิธี

การทดสอบที่ไม่ได้มาตรฐาน → ข้อมูลที่ไม่น่าเชื่อถือ → ไม่สามารถใช้เป็นเกณฑ์มาตรฐานในการวิเคราะห์หรือการกำหนดนโยบายทางการศึกษาได้

ความรู้สึกขององค์กรไม่ควรมาแทนที่หลักการทางวิทยาศาสตร์

ในด้านการศึกษา เช่นเดียวกับสาขาอื่นๆ ที่ใช้ข้อมูลเพื่อการตัดสินใจ จำเป็นต้องยึดมั่นในหลักการที่ว่า “ข้อมูลที่เชื่อถือได้ต้องมาจากเครื่องมือวัดที่เชื่อถือได้” อย่างเคร่งครัด ความคาดหวังในการมีข้อมูลไม่สามารถถูกมองข้ามได้ ตราบเท่าที่ความจำเป็นในการสร้างมาตรฐานในเครื่องมือรวบรวมข้อมูลถูกมองข้ามไป

การจัดการสอบปลายภาคปี 2568 โดยใช้คำถามจากผู้เชี่ยวชาญเป็นทางเลือกที่ยอมรับได้ในระดับปฏิบัติการ อย่างไรก็ตาม ผลการสอบนี้ไม่ควรและไม่สามารถนำไปใช้ในการประเมินหรือเสนอแนะนโยบายอย่างเป็นระบบได้

วิทยาศาสตร์การวัดไม่อนุญาตให้ใช้การวัดที่ไม่ถูกต้องเป็นเกณฑ์มาตรฐาน การศึกษาไม่สามารถสร้างนโยบายบนข้อมูลที่ไม่น่าเชื่อถือได้

กลับสู่หัวข้อ
ดร. ไซ กง ฮ่อง

ที่มา: https://tuoitre.vn/khong-the-lay-pho-diem-lam-can-cu-danh-gia-chat-luong-giao-duc-20250716150343597.htm


การแสดงความคิดเห็น (0)

กรุณาแสดงความคิดเห็นเพื่อแบ่งปันความรู้สึกของคุณ!

หัวข้อเดียวกัน

หมวดหมู่เดียวกัน

ศิลปินแห่งชาติ Xuan Bac เป็น "พิธีกร" ให้กับคู่รัก 80 คู่ที่เข้าพิธีแต่งงานบนถนนคนเดินทะเลสาบ Hoan Kiem
มหาวิหารนอเทรอดามในนครโฮจิมินห์ประดับไฟสว่างไสวต้อนรับคริสต์มาสปี 2025
สาวฮานอย “แต่งตัว” สวยรับเทศกาลคริสต์มาส
หลังพายุและน้ำท่วม หมู่บ้านดอกเบญจมาศในช่วงเทศกาลตรุษจีนที่เมืองจาลาย หวังว่าจะไม่มีไฟฟ้าดับ เพื่อช่วยต้นไม้เหล่านี้ไว้

ผู้เขียนเดียวกัน

มรดก

รูป

ธุรกิจ

ร้านกาแฟฮานอยสร้างกระแสด้วยบรรยากาศคริสต์มาสแบบยุโรป

เหตุการณ์ปัจจุบัน

ระบบการเมือง

ท้องถิ่น

ผลิตภัณฑ์

Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC
Footer Banner Agribank
Footer Banner LPBank
Footer Banner MBBank
Footer Banner VNVC