感谢您关注“永大英语”!
杨 飞
摘要:学生的测试成绩是反映教学质量的重要评价指标,因而,对于教学质量管理和教学问题改进具有重要意义。但是,现实中许多中学教师对成绩测试结果分析仅局限在平均分、及格率、优秀率等方面,致使成绩测试结果分析无法正常发挥对教学质量的反拨作用。本研究基于关联统计分析方法,尝试对某高中高二年级的一次英语成绩测试结果进行三个维度的关联统计分析,通过对该年级语言测试结果的总体分析、横向比较和纵向统计,发现这种关联统计分析方法能够真实和全面反映教与学的情况,可以为教师和学生提供比较充分的教与学的改进信息。
关键词:英语测试;成绩测试;关联统计分析
一、引言
目前,多数中学一线教师在统计分析测试成绩时,仅会使用Excel软件中的简单功能,统计方法较为单一;而且在分析数据时,大多都只是孤立看待单个指标。单个指标通常仅仅反映成绩的一个侧面,解读出来的信息往往存在片面性。例如,很多中学一线教师在分析成绩测试结果时,只是简单、直接地使用平均成绩来比较、评价不同班级的测试结果,其实平均值有时并不具有代表性,需要测算班级内部成绩的差异情况。而在一定条件下,将多个指标组合起来,关联使用,可以更全面、合理地分析测试成绩。所以,笔者提出在成绩统计分析过程中使用关联统计分析方法。关联统计分析方法的核心思想是:以某个数据为切入点,巧妙运用相关联的三个统计指标,即总体情况分析、测试结果横向分析和测试结果纵向分析。这种多角度统计分析成绩的方法,能够全面、准确地反馈教与学的各种相关数据信息,帮助教师了解真实的教学与学习效果;在分析过程中,所选指标必须在功能上可以相互补充,揭示各种数据的相关联意义,为学生考试成绩分析提供科学有效的统计分析服务。
二、测试成绩的总体情况关联统计分析
成绩测试的总体情况关联统计可以让我们更加全面、清晰地了解测试中不同题型的统计意义和数据信息,为准确了解各种题型的答题情况提供比较全面的数据分析信息。本文将以海口市某高中2015级8个班在高一下学期的两次阶段性测试的成绩为数据基础,利用SPSS统计软件,探讨如何运用关联统计分析的方法分析成绩,希望能在中学教师进行成绩分析方面有一定借鉴和参考价值(见表2.1)。
(一)指标组合方式及其关联使用的意义
总体情况关联统计分析是指组合运用多个相关联的统计指标对一次成绩测试结果的总体情况进行多角度统计和总体分析,准确阐释测试成绩的总体情况。该指标组所涉及的统计量主要包括全年级学生英语成绩的频数分布直方图、正态分布曲线、偏态值、峰值、平均数、标准差,以及分数段频数统计表。
通过观察正态分布曲线、偏态值和峰值,可以判断全年级所有考生的英语成绩分布是否合理。真正的检测教学质量的测试,其成绩分布应成正态分布或接近正态分布。标准的正态分布曲线形似“钟形”,中间高两边低,以高峰处为轴左右两边对称,且偏态值和峰值都为0或接近0。偏态值大于0为正偏态,且值越大,分数越集中在低分区,说明考试题目越难;偏态值小于0为负偏态,且值越小,分数越集中在高分区,说明考试题目越简单。峰值越大(表现为正值),曲线最高点越尖,形态越陡峭,说明分数越集中,区分度越差;峰值越小(表现为负值),曲线越平,说明分数越分散,区分度越好。刘润清、韩宝成(2013:235)指出“一般来讲,一个考试的偏态值和峰值如果能控制在±1之内,其分数分布可认为基本符合正态分布。”
平均数代表全体学生成绩的平均水平,但极端值会使其代表性大大下降,不能真实反映考生的普遍水平,而频数分布直方图和正态分布曲线可以帮助直观的发现问题,此外,标准差可以反映内部的参差情况,可用于测量平均数所能代表总体的程度,对平均数的描述起着辅助作用,将三者结合使用,可以更全面地分析成绩(李洁,2000)。结合标准的正态分布曲线的概念和教学实际情况的需求,笔者期望该校期中和期末测试中英语平均成绩在75分或略高于75分,学生成绩尽量不要低于40分,按照正态分布的规律:95.44%的分数分布在高于平均分两个标准差或低于平均分两个标准差的范围之内,所以大部分学生的成绩分布在40至110分之间(即四个标准差的范围之内)比较符合预期,这样,相对合理的标准差应在17.5左右。
直方图可以帮助我们了解不同分数段学生分布情况,而分数段频数统计中的有效百分比和累积百分比则可以帮助我们直观、快速地了解学生优、良、中、差等情况,进而反思和调整教学重点和策略。
通过以上指标组合的统计和分析,我们可以快速、全面、准确地描述一次测试中年级所有学生英语成绩的总体情况。
(二)基于SPSS软件的统计结果分析
将选定的8个班的高一下学期期末考试英语成绩总分导入SPSS软件中,定义和生成“分数段”变量,运用描述性统计功能可以得到图2.2.1、表2.2.1和表2.2.2。
图2.2.1中直方图和分布曲线显示其对称性和平滑性基本合格,表2.2.1中峰度和偏度值都在±1之内,说明其分数分布基本符合正态分布。由表2.2.1可知偏度为-0.51,说明成绩呈现为略偏负态分布,题目略偏易,作为阶段性的期末测试是在合理范围内的;峰度为0.29,在合理范围内,但形态略偏陡。观察图2.2.1和表2.2.2可知分数相对比较集中,81~90分数段内集中了总人数的26.6%,说明试卷区分度还有待进一步提高。考虑到样本数量有限,总体看,该次测试质量合格,分数分布合理。但笔者建议对试卷进行系统的难度和区分度的分析,找出无效和低效试题,总结经验,作为提高下次命题质量的重要依据。
由表2.2.1中可以看出,平均分为83.8分,标准差为18,再结合观察图2.2.1可知,成绩离散程度合理,且极端值影响较小,平均分83.8分可以较好地说明全体学生的平均水平,其值略高于75分,整体水平较好,说明教师们的整体教学效果是值得肯定的。
观察表2.2.2可知,121分~130分之间只有0.5%的学生,130分以上的学生人数为0,说明没有成绩特别优秀的学生,建议教师们重视培养成绩优秀的学生,适当给成绩相对好的学生(如分数在101~120之间的学生)增加布置有挑战性的、拓展性的任务,对他们提高学习难度要求。其次,在81~90分之间仅仅10分的范围内,集中了26.6%的学生,有103位学生,所以建议教师们也应关注中等成绩的学生,必要时进行问卷调查和访谈,了解学生的具体情况,有针对性地进行心理或学习上的辅导;我们也可以单独提取该部分学生的得分情况,统计所有题目的区分度,找出区分度低的题目,分析是否在知识、技能等方面存在教师忽视或没有重视的共性问题。
三、横向关联统计分析
横向关联统计分析具有明显的效度意义,可以让我们了解掌握同一年级里不同班级的测试结果数据信息,通过多角度的对比分析,把握全体学生的平均水平以及班级与班级之间成绩的离散程度和显著差异情况,这样,就可以帮助我们从年级整体的视角看待班级个体情况,从而改变以往以班级为单位的单独进行成绩分析状况,这就使得班级个体的数据统计分析信息是完整的而不是孤立的分析结果。
(一)指标组合方式及其关联使用的意义
横向关联统计是指组合运用多个相关联的统计指标对一次成绩测试中不同班级的测试结果进行多角度统计和对比分析,全面准确地阐释测试成绩。所涉及的统计量主要包括平均分、Q-Q图、多组均值差异的显著性检验(单因素方差分析)、标准差、分数段频数分布表。
首先,我们从均值分析入手,均值是反映总体一般水平的非常重要的特征,班级平均分通常可以代表班级全体学生成绩的平均水平,但两个或多个班级成绩均值是否具有显著差异不能只看平均分,因为均值的差异情况还与标准差和样本数密切相关,因此,我们需要借助均值差异性检验结果来判断(刘健智,2008)。观察Q-Q图,如果年级英语成绩服从或近似服从正态分布,可以利用单因素方差分析的方法对多个班级的英语平均分进行差异性统计检验;如果年级英语成绩不服从正态分布,需要对不同班级的成绩两两分别进行非参数检验。通常情况下,一次合格的考试成绩都会近似服从正态分布。反之,则说明测试质量存在问题,进行班级间成绩水平比较也就失去了分析意义。
其次,通过观察、对比各班级的标准差可以初步判断各班级内部的参差情况的差异,标准差越大,说明班内成绩越参差不齐,教师在教学中要面对的困难就越多;标准差越小,班内成绩相对就越集中。
在分析了各班成绩的均值、均值差异的显著性和标准差之后,可以发现年级中成绩总体水平显著偏高或显著偏低的班级,也可以初步判断出哪些班级内部成绩差异较大,哪些班级差异较小,在此基础上,通过观察分数段频数分布表,进一步对比分析各班不同分数段内人数比率的差异,进而评价不同班级的教学效果,或者不同班级学生的学习能力、学习水平,发现问题,启发下一步教学的思考和建议。
(二)基于SPSS软件的统计结果分析
选取高一下学期期末考试英语成绩总分数据为变量,利用描述性统计功能可以生成Q-Q图3.2.1,再利用单因素方差分析可以生成并导出表3.2.1、表3.2.2、表3.2.3、“多重比较”和图3.2.2。限于篇幅,文中省略了此次分析中并未使用到的表格“多重比较”;最后,定义和生成“分数段”变量后,可以制作班级和分数段交叉表3.2.4。
观察图3.2.1可知,样本点基本围绕第一象限对角线分布,接近呈直线,可以证明该样本近似服从正态分布(张屹、周平红,2015:95)。而表2.2.1中的峰度值和偏度值均在大于-1且小于+1范围内也可以证明该样本近似服从正态分布。所以,可以对这些班级的英语成绩进行单因素方差分析。
8个班级英语成绩的方差齐次性检验结果如表3.2.1所示。从检验概率来看,显著性为0.978,远大于0.05,即各组方差具有齐次性,那么,在“多重比较”的统计结果中应选择观察LSD检验法的分析结果。
方差分析结果,如表3.2.2所示。方差检验的F值为0.229,显著性概率为0.978,远大于0.05,说明各班英语成绩均值无显著性差异。此时,已没有必要分析“多重比较”的统计结果。
由以上分析可以判断8个班英语成绩的均值虽然不完全相等(观察表3.2.3可知),但并没有显著差异。经了解得知,这8个班为平行班,分班时成绩水平均衡,平时教学过程中坚持集体备课,统一进度和难度,经常相互听评课,交流平凡,教学材料资源共享,所以教学效果非常接近,也验证了以上统计结果的真实性。
尽管如此,我们仍需观察一下图3.2.2、表3.2.3和表3.2.4,分析是否有些“美中不足”的地方。从图3.2.2中可以直观地发现4班均值最高,8班均值最低;再结合表3.2.3可知4班均值86.10,标准差16.6,8班均值81.75,标准差17.1,均值相差约4分,区别不大,标准差很接近,说明内部成绩整齐度基本一致,而且数值合理。观察表3.2.4可知,细微的差别主要在于,4班在“30~49”的低分段比率相对较低一点,在“90~109”和“110~129”的高分段比率相对较高一点。建议4班教师可以就这三个分数段内学生的答题情况进行分析,或者进行简单的问卷调查或访谈,了解和分析背后真正的原因。
此外,通过观察表3.2.3可以发现,1班的标准差数值为20.5,相对最高,但平均分并非最低,观察表3.2.4可知,1班在“<30”的低分段和“110~129”的高分段所占比率都是相对最高的,所以建议1班教师保持高分段的优势,并发挥好他们的带动作用,也要认真了解这两位低分段学生的实际情况,分析他们“掉队”的原因。
四、纵向关联统计分析
纵向关联统计分析具有显著的信度统计分析意义,这种分析方法可以让我们对同一批次学生的若干次测试成绩有一个“历史性”的了解,帮助我们用联系的眼光看待某个班级学生在若干次考试中的成绩的波动情况,从而避免就事论事,仅凭某一次考试成绩就做出不科学的评价结论。
(一)指标组合方式及其关联使用的意义
纵向关联统计是指组合运用多个相关联的统计指标对同一批学生连续两次同类型阶段性测试的结果进行多角度统计和对比分析,准确地阐释两次测试成绩的对比情况。所涉及的统计量主要包括平均数、标准差、配对样本t检验、条形图。
同一批学生连续两次同类型阶段性测试结果的平均分代表两次测试的平均水平,但要判断是否存在差异,需要进行均值检验。由于同批学生连续两次阶段性测试的成绩是相关变量,所以需要采用配对样本t检验或配对样本非参数检验进行分析,进而判断学生总体的进步情况。同时,观察两次测试成绩的标准差可以辅助了解两次测试成绩的稳定性。此外,再观察两次测试成绩的分数段对比条形图,可以直观地发现不同分数段的比率变化情况,有助于分析教学策略和方法的效果,或学生能力水平的进步情况,也有助于发现问题和制定调整策略。
(二)基于SPSS软件的统计结果分析
首先,对两次测试的成绩进行正态检验,如果服从或近似服从正态分布,则再进行均值的配对样本t检验,否则需进行配对样本非参数检验。上文已经证实期末成绩近似服从正态分布,此处仅对期中成绩通过Q-Q图进行正态检验。导入这8个班的高一下学期期中考试英语成绩总分,利用描述性统计生成Q-Q图4.2.1。观察可知,样本点基本围绕第一象限对角线分布,接近呈直线,可以证明该样本近似服从正态分布。所以,接下来可以进行配对样本t检验。
在SPSS软件中导入8个班学生一一对应的期中和期末两次英语测试成绩数据,利用“成对样本T检验”功能,可以生成表4.2.1、表4.2.2和表4.2.3;增加“分数段”和“测试项目”变量,利用“交叉表”功能生成图4.2.2。
从表4.2.1中可知,期末和期中两次测试成绩的平均值分别为83.84和74.53,期末成绩高出期中9.31分;标准差分别为18.016和18.535,数值非常接近。表4.2.2中的相关系数为0.866,显著性概率为0.000<0.05,说明期末和期中两次英语测试成绩存在显著的线性相关关系,也证明两次测试的信度较高。表4.2.3配对样本检验中的t检验统计量观测值对应的双尾概率p值为0.000,小于0.05,也就是表示两次测试成绩有显著性差异。所以,综上可知,期末英语测试成绩明显高于期中成绩,均分差值为9.31分,分数离散程度稳定,且两次测试可靠性都较强,可以说明该学期下半段时间的教学效果较为明显。
再观察图4.2.2,可以直观地发现,在相对较高的“110~129”和“90~109”分数段内,期末成绩所占的比例明显高于期中成绩所占的比例;在相对较低的“<30”、“30~49”和“50~69”分数段内,期末成绩所占的比例明显低于期中成绩所占的比例。可以推断,全年级大部分学生的英语水平都得到了一定程度的提高。经了解,该年级英语教师曾对期中英语成绩做了详细的难度、区分度等的分析,进行了反拨研究,还有教师撰写了相关论文,对之后一段时间的教学制定了有针对性的、科学的策略,实践也证明确实有效。笔者建议教师们在每次阶段性成绩测试后都能坚持进行较为详细的试题分析,充分发挥测试的正向反拨作用。
五、结语
对于在大数据时代的高中教育工作者来说,全面准确地分析学生阶段性测试的成绩,如期中和期末测试,有着重要的意义,因为这事关教学目标、教学内容和教学策略调整的决策问题。笔者在文中采用了多个相关指标联合使用的方法,避免单个指标的片面性,力图从多个角度对成绩测试结果的总体情况、各班横向比较情况以及与前次测试的纵向比较情况进行三个方面的关联评价分析,这就在很大程度上避免了使用单一数据说明成绩优劣、教与学问题多少的片面性和局限性。借助SPSS软件,我们能够快速地得到科学的统计结果,不再停留在简单的、一次性的百分比成绩统计分析方法上。因此,笔者建议同行们一起探索,寻找更多、更好的基于SPSS软件的关联统计方法,确保我们的每一次测试都能够全面准确地反映学生的真实水平,由此发现教与学的问题,以便更好地对我们的教学进行改进提高。
参考文献
[1] 李洁. 学生成绩定量分析的步骤及应用[J]. 广西高教研究,2000(4).
[2] 刘健智. 利用SPSS进行试卷分析的模式探析[J]. 教育测量与评价(理论与技术),2008(3).
[3] 刘润清,韩宝成. 语言测试和它的方法[M]. 北京:外语教育与研究出版社,2013.
[4] 张屹,周平红. 教育研究中定量数据的统计与分析[M]. 北京:北京大学出版社,2015.
注:本文系海南省教育科学规划立项课题“高中英语成绩测试反拨作用理论与实践研究”的成果之一,课题编号:QJH1251590。
致谢:值此论文完成之际,笔者要向尊敬的海南师范大学关世民教授致以深深的敬意和谢意。在笔者撰写论文的过程中,关教授为我提供了非常宝贵的学术研究和交流的机会,因此我才得以顺利完成此篇论文的撰写,让我从中受益、成长!
A Study on the Application of Associated Statistical Analysis Methods for English Achievement Test Performance in Senior High SchoolYang Fei
Abstract: Students’ test performance is a very important evaluation index of education and teaching, so it is significant in teaching quality management and also helpful for solving problems in teaching. But the reality is that many teachers in secondary schools only focus on average, pass rate, excellent rate, and so on, when analyzing students’ test performance, which will not produce beneficial backwash effect to teaching. Based on the associated statistical analysis method, this research try to count and analyze the test performance of the students in Grade 2 from three aspects: the overall picture, lateral comparison and vertical comparison, and to find that the associated statistical analysis method can reflect the situation of teaching truthfully and objectively and provide sufficient information to improve the efficiency of teaching and learning.
Key words: English test; achievement test; associated statistical analysis
(本文首次发表在《基础教育外语教学研究》2017年第1期)