测试统计基本术语
13. 试卷平均难度:试卷平均得分除以试卷满分的比值。大学英语考试通常将试卷平均难度控制在 0.5~0.6 之间。
14. 试题平均区分度:试卷中所有题目区分度的平均值。一般来说,所有题目的平均区分度指标 应控制在 0.4 以上为宜。
15. 试卷内部一致性信度(KR20 或 a 系数):反映测验内部题目得分一致性程度的统计指标,主要包括有 KR20 和 a 系数。其中 KR20 的计算方法是: 
式中 K表示题目数,σt 2 表示测验总分方差,p 表示每一道题答对人数比率,q=1-p。KR20主要适用于 0-1 记分题目测验的一致性信度计算。如果测验中包括有非 0-1 记分的题目,可选用 a 系数来计算一致性信度系数, a 系数的计算方法是: 
其中的σi 2 表示每个题目得分的方差。在大规模标准化测验中,一致性信度系数 KR20 应大于 0.9, a 系数也应在 0.80 以上。大学英语考试的这两项指标一直稳定地位于 0.85 以上。
16. 标准测量误差:表示测验分数与测量对象的真分数之间偏离程度的一种指标,测量误差越大,分数的可信度就越小,测量误差越小,就意味测量越精确。当已知测验的信度系数和测验分数的标准差时,计算测量标准误差公式为: 
其中 s E 表示测量标准误差, s T 表示测验分数标准差, r tt 表示测验的一致性信度系数(可 KR20 或 a 系数来表示)。标准测量误差的大小与题目的质量、测验的长度等因素都有密切联系,在编制测验时,应根据设计的要求和考试的目的精确控制标准测量误差的大小,使之在可接受的范围之内。
|