در ۲۴ مارس، دانشگاه علوم و فناوری هانوی نتایج دور دوم را اعلام کرد. این دانشگاه سوالات زیادی در مورد نحوه محاسبه نمرات آزمون ارزیابی مهارتهای تفکر (TSA) دریافت کرد.
طبق اعلام مدرسه، توزیع نمره بیش از ۲۰،۰۰۰ داوطلب در این آزمون از یک توزیع نرمال پیروی میکند و میانگین نمره آنها ۵۵.۴۴ از ۱۰۰ است. بهترین نمره، نگوین توان دات، دانشآموزی از دبیرستان وین بائو ( های فونگ ) است که ۹۸.۹۸ امتیاز کسب کرده است - بالاترین نمره در تاریخ ۶ ساله این آزمون.
طبق نتایج منتشر شده، توآن دات در بخش استدلال ریاضی به ۴۰ از ۴۰ سوال، در بخش درک مطلب به ۱۸ از ۲۰ سوال و در بخش استدلال علمی /حل مسئله به ۳۳ از ۴۰ سوال پاسخ صحیح داده است. بنابراین، توآن دات به ۹ سوال پاسخ نادرست داده و در نتیجه ۱.۰۲ نمره از دست داده است.
با این حال، پس از اعلام نتایج، سوالات زیادی در انجمنهای مختلف در مورد روش امتیازدهی مطرح شد.
علاوه بر این، برخی نظرات او را با برترین نمره اولین آزمون TSA در ژانویه مقایسه کردند، زمانی که آن داوطلب به ۹۲ سوال از ۱۰۰ سوال پاسخ صحیح داد، به این معنی که پاسخهای صحیح بیشتری داشت، اما نمره کل او همچنان ۲.۸۸ امتیاز کمتر از توآن دات بود.
در مورد این سوال، دانشیار وو دوی های، رئیس پذیرش و راهنمایی شغلی در دانشگاه علوم و فناوری هانوی، توضیح داد: «آزمون TSA مانند اکثر امتحانات امروزی در ویتنام از روش نمرهدهی خام استفاده نمیکند.»
در عین حال، به گفته دانشیار دکتر وو دوی های، در امتحانات معمولاً نمره کل سوالات برگه امتحانی محاسبه میشود. به عنوان مثال، اگر امتحان ۱۰۰ سوال داشته باشد که هر کدام ۱ امتیاز دارند و داوطلب به ۷۰ سوال پاسخ صحیح بدهد، ۷۰ امتیاز به او تعلق میگیرد.
با این حال، دانشگاه علوم و فناوری هانوی از این روش محاسبه استفاده نمیکند زیرا تشخیص تواناییهای داوطلبانی که نمره خام یکسانی دارند (مثلاً هر 70 امتیاز) دشوار است و وقتی آزمون دارای میانگین سطوح دشواری متفاوتی است، ارزیابی دقیقی از تواناییهای آنها ارائه نمیدهد.

دانشیار دکتر وو دوی های، رئیس دپارتمان پذیرش و راهنمایی شغلی، دانشگاه علوم و فناوری هانوی
در سراسر جهان، برای پرداختن به این موضوع، آزمونهای بزرگی مانند SAT و ACT از نظریههای اندازهگیری مدرن برای تخمین دقیق و قابل اعتماد تواناییهای آزموندهندگان استفاده کردهاند. یکی از این نظریهها، نظریه پاسخ به سوال (IRT) است.
این نظریه فرض میکند که هر شرکتکننده در آزمون، سطح مشخصی از توانایی را در پاسخ به یک سوال در امتحان دارد. یک شرکتکننده با توانایی بالا، در مقایسه با یک شرکتکننده با توانایی پایین، احتمال بیشتری دارد که به هر سوال داده شده به درستی پاسخ دهد. بر این اساس، مدارس میتوانند پارامترهای مربوط به دشواری و تمایز سوالات و همچنین توانایی شرکتکننده در آزمون را کمّی کنند.
دانشگاه علوم و فناوری هانوی، نظریه دو پارامتری IRT (دشواری و تمایز) را در آزمون TSA اعمال میکند. یک سوال زمانی دشوار تلقی میشود که تعداد کمی از افراد به آن پاسخ صحیح دهند. هرچه تعداد داوطلبان بیشتری به یک سوال پاسخ صحیح بدهند، آن سوال آسانتر تلقی میشود.
دکتر وو دوی های، دانشیار، توضیح داد: «با این مدل، هر چه داوطلب به سوالات دشوارتری به درستی پاسخ دهد، امتیاز TSA او بالاتر خواهد بود. برعکس، اگر داوطلبی فقط به سوالات آسان پاسخ صحیح دهد، امتیاز TSA او پایین خواهد بود. این امر منجر به این میشود که داوطلبانی که ممکن است به تعداد یکسانی از سوالات پاسخ صحیح بدهند، امتیاز TSA متفاوتی داشته باشند.»

TSA صرفاً بر اساس تعداد پاسخهای صحیح نمره نمیدهد، بلکه تواناییهای آزموندهندگان را بر اساس دشواری و قدرت تمایز هر سوال ارزیابی میکند.
برای اطمینان از دقت و عدالت در جلسات امتحان، دانشیار وو دوی های اظهار داشت که دانشگاه همچنین از یک الگوریتم نمرهدهی چند مرحلهای استفاده میکند و دادههای امتحانی که قبلاً به اشتراک گذاشته شدهاند را برای تخمین پارامترها قبل از محاسبه نمره TSA برای هر داوطلب پردازش میکند.
طبق گفته مدرسه، چهار مرحله برای نمرهدهی آزمون سؤال-پاسخ دو پارامتری در آزمون TSA به شرح زیر است:
مرحله ۱: بر اساس نتایج آزمون همه داوطلبان در هر جلسه امتحان، نرمافزار نمرهدهی، سطح دشواری و تشخیص هر سوال در آزمون فعلی را تخمین میزند.
مرحله ۲: نرمافزار امتیازدهی، امتیاز توانایی تفکر هر داوطلب را بر اساس نتایج آزمون و مقیاس امتیازدهی آزمون فعلی تخمین میزند.
مرحله ۳: مقیاس آزمون فعلی را به یک مقیاس مرجع رایج که در آزمونهای قبلی استفاده شده است تبدیل کنید تا نمرات توانایی تفکر داوطلبان به یک مقیاس واحد تبدیل شود.
مرحله ۴: نمره توانایی تفکر ارجاع شده داوطلب را به مقیاس TSA تبدیل کنید.
بنابراین، با فرآیند نمرهدهی دو پارامتری IRT که در بالا توضیح داده شد، نمره TSA نه تنها از تعداد پاسخهای صحیح داده شده توسط داوطلب، بلکه از عملکرد کلی داوطلب در آزمون تعیین میشود.
آقای دوی های توضیح داد: «این توضیح میدهد که چرا بهترین امتیازآور دور اول به یک سوال بیشتر از بهترین امتیازآور دور دوم پاسخ داد، اما امتیاز کل آنها کمتر شد.»
منبع: https://phunuvietnam.vn/ly-do-sai-9-cau-thu-khoa-tsa-van-dat-9898-100-diem-238260325163457583.htm






نظر (0)