6.5.5.1 研究问题
本项目第一阶段的工作是在国际比较研究的基础上,根据数学学科的基本特征,结合我国数学教育特色,建构数学学科核心能力评价模型(图6-21).在这个能力模型的基础上,课题组进一步开发可测量的行为指标体系(表6-13)和测评工具,进行测试研究,旨在回答如下问题:
(1)我国8年级学生数学学科核心能力的水平表现如何?
(2)不同地域间的学生的数学学科核心能力存在怎样的差异?
(3)不同性别间学生的数学学科核心能力存在怎样的差异?
6.5.5.2 研究过程
(一)被试的选取
本研究选取8年级学生作为主要的测试研究对象.其中的一个重要因素是,很多有关学生数学学科的学业成就的大型国际比较研究(包括TIMSS和PISA)皆以8年级为其重点的研究对象.这不仅为本研究的开展提供了一个良好的理论与实践的基础,更为本研究提供了一个以国际视野审视我国学生的数学学科核心能力的契机,以帮助我们能更为深入地了解我国学生的数学学习现状.
考虑到我国各地区经济发展水平的不平衡可能对学生数学学科核心能力水平造成差异的这一个特点,本研究团队在选取被试样本时采用了分阶段整群抽样的方法:第一,基于城市的地理位置(包括华东、西北、华中、西南、华南、东北及华北)及相应的经济发展水平(包括发达、中等、欠发达等)确定8个具有代表性的城市;第二,在每个城市中,由当地的教研员或师范院校的同行根据所在地学校的综合水平推荐至少3所中学(即优秀、中等、薄弱);第三,在每个样本学校中,任意选取2~3个整班学生参加测试.从这个意义上说,本研究的被试样本较为完整地了覆盖我国8年级学生的整体能力分布域(competency spectrum),这为项目分析的精确性提供了一定的保障.表6-14列出了本研究中参加数学学科六大核心能力测试所对应的被试学生样本的具体分布情况.
表6-14 数学学科核心能力测试的被试学生分布(按能力类别及地区经济发展水平排序)
注释:城市编码按拼音首字母排序,括号中的数字表示所在城市参与调查的学校数,其中城市F在M能力上的测试数据仅在两所中学有效.表中其他数据均表示相应的学生数.
(二)测试工具的设计及预测
课题组依据可操作的行为指标(表6-13),采用新编或改编陈题的方法,在每一个预设的能力水平上设计出3~4个问题,包括填空及简答两种题型.
对于初设的测试题,研究团队成员联系本地或附近地区(即江浙地区)学校进行了至少两轮的预测,被试学生包括8年级和9年级,以检验所编制的测试题与目标年级(即8年级)的匹配程度.
在预测阶段,研究团队一方面根据预设的理论性能力水平与基于预测结果由项目反应理论而得出的实证性试题指标(包括难度系数及区分度系数)之间的差异修订试题,另一方面还特邀请一线教师及相关领域的专家对预测版的测试题给出专业性意见,以尽可能保证测试题具有较高的内容效度.在经过这样的两至三轮的论证和修正后,六大核心能力的测试正式版形成,其在各预设理论性能力水平上的具体题量分布见表6-15.
表6-15 数学学科核心能力测试题的能力水平分布
续 表
注释:由于数学建模能力的特殊性,其能力水平的分布主要依据问题背景的复杂程度而定.
(三)测试结果的编码与分析
除数学建模能力与数学推理论证能力外,其余4个数学学科核心能力的测试题皆以0-1制二分计分法(dichotomy)为主,即正确回答计为1分,否则为0分.在分析被试在数学推理与论证能力测试中的表现时,本研究以部分计分法(partial credit)为主要计分方式,即被试能正确给出论证推理过程计为2分,仅能正确给出合情推理计为1分,否则为0分.类似地,在分析被试在数学建模能力测试中的表现时,由于该能力测评框架参考了布鲁姆的阶段型建模循环模型[73],被试的应答根据其所达到的最终“阶段”而获得相应的分值,部分计分法亦在此作为主要的计分方式,共设5、4、3、2、1、0六个等级.除了采用主要的计分法外,本研究还参考了TIMSS的双重计分制,对于所有被试的应答给出诊断性编码,以确定特定的表征方式、解题策略、常规的错误或误解.
对于0-1型计分,本研究使用BILOG-MG3.0软件,采用双参数Logistic模型,分别计算各题的难度系数、区分度系数,以及被试的能力估计值.对于等级型计分,本研究使用PARSCALE4.1软件,采用部分计分模型(Partial Credit Model)计算各题的难度系数、区分度系数,以及被试的能力估计值.
针对基于项目反应理论模型而求得的被试的能力估计值,本研究首先进行描述性统计,以期刻画出我国8年级学生在各项数学核心能力上的总体表现,其次依据被试的性别、所在地区的经济发达水平及学校水平等属性进行一系列的对比分析,主要包括性别差异比较(T-检验)、地区间的差异比较(ANOVA检验)、地区内的差异比较(ANOVA检验)以及各城市内各类学校间的差异比较(ANOVA检验).由于参与本研究的被试数量较大,对于显示出显著性差异的统计量,本研究会提供相应的效应值.
6.5.5.3 研究发现与结果
课题组根据上述编码原则,对每个核心能力测评结果进行编码和分析,得到了翔实并有意义的发现和结果.在此就学生数学核心能力的总体表现进行分析.
(一)数学学科核心能力的总体表现
本调查研究通过实际测评以验证课题组所提出的数学学科六大核心能力评价框架的有效性和合理性,在此基础上对8个城市的被试在各能力上的表现做了细致的分析,以期了解我国8年级学生在数学学习上的各项核心能力的掌握情况.在本研究的主测试中,虽然每一个被试仅参加一项核心能力的测试,但因为抽样过程有一定的随机性,使得来自不同城市不同学校的学生在单项核心能力上具有一定的可比性,而不同能力之间的可比性相对较弱.
本研究依据项目反应理论估算出被试在各项核心能力上的能力指数,因此在每一项能力上的能力估计均值皆为0,也即将中等水平学生的能力固定为0值.在所有6个核心能力中,被试的“数学交流能力”相对较强,特别是处于中等水平的学生能较好地完成水平一和水平二的测试题;在“问题提出能力”和“问题解决能力”上,处于中等水平的学生对于水平一和水平二的测试题,只能作出部分正确的回应.很显然,“数学表征与变换能力”涵盖两个相关且独立的能力.本研究显示,处于中等水平的学生在“数学表征”上能较好地完成水平一的测试题,部分能正确地完成水平二的测试题.如前文所述,在本研究中,学生的“数学推理能力”分两种类型,包括合情推理和论证推理.结果发现,处于中等水平的学生能圆满达成所有三类水平层次的测试题上的合情推理,但在论证推理上的表现却差强人意,甚至未及水平一.
相对于其他5个核心能力,“数学建模能力”的测试题的水平划分主要是依据其背景的复杂程度,而要完成每一个建模过程都要经历六个阶段.在本研究中,处于中等水平的被试在前两个水平的测试题上能够大致推进到3~4建模阶段,而对于复杂程度最高的测试题,几乎没有进展.(www.daowen.com)
表6-16呈现出8年级被试在数学学科六大核心能力上的整体表现情况.从这些直方图中可以发现,被试在数学建模能力上的表现水平最为集中,而在其他的核心能力上的分布则相对较为分散.在数学交流能力和数学推理论证能力方面,处于中等水平以下的被试数量偏多;特别地,有相当一部分的被试在这两项指标上,其能力估计值低于-2.在数学表征与变换能力上,亦有不少被试的水平在-2附近.而另一方面,本研究发现在所有6个核心能力中,数学表征与变换能力是唯一一个有被试其能力水平的估计值接近于+3;相反,在数学交流能力、数学建模能力、数学问题解决能力,被试的能力最大估计值小于+2,这些都说明被试在这些能力上亟待提高.
表6-16 8年级学生在数学学科六大核心能力上的表现
续 表
注释:Ability—能力;Frequency—数量.
(二)核心能力水平的性别差异
在数学学习上存在性别差异似乎是一个公认的事实,并且数学往往被视为是一个男性占优的学科.因此,男女被试在各项数学学习核心能力上的差异也成为本研究一个关注焦点.结果发现,在本研究中,男女被试的表现并没有呈现出非常明显的不同.在6个能力指标中,仅有2个出现了性别上的显著差异,分别为男生的数学解决能力显著优于女生,t(1 118)=-3.864,p<0.001,d=0.23,而在数学问题提出能力上女生的表现显著优于男生,t(1 187)=3.693,p<0.001,d=0.21;然而从效应值来看,相应的差异并不是很大(d<0.30).在其余4个核心能力上,除数学表征与变换能力外,男生的表现略占优势,但并未达到显著不同.
(三)核心能力水平的区域差异
由于本研究中的被试样本来自不同城市,如前所述,在选取样本时是充分考虑了城市的不同地域及其不同的经济发展水平,并据此将被试所在城市划分为发达、中等发达和欠发达等三类.在关注来自不同城市的被试在各核心能力上的表现水平时,本研究首先比对了三类地区之间的差异,其次比对了地区内部的城际间的差异.结果发现,相较于性别差异,城际间的差异更为明显,表6-17中给出了不同地区间和同一地区内不同城市间的各核心能力水平的ANOVA比较结果.
表6-17 各城市在数学学科六大核心能力上的表现水平比对
续 表
注释:√表示比较呈现出显著差异,而×表示比较未呈现出显著差异.
从表6-17中可以发现,在6个核心能力上,三类地区在数学建模、数学问题提出、数学推理与论证和数学问题解决诸能力上均呈现出显著差异.其中,大部分差异的效应值都相对较小,而最大的差异出现在数学推理与论证能力上,其对应的效应值水平超过临界值(ω2>0.03).
尽管在两项核心能力上地区间未呈现出显著的差异,但三个地区的内部的城际差异则出现在所有的6个核心能力上.相较而言,经济处于中等水平的地区内部的城际差异最少.在各项能力中,“数学建模能力”仅在欠发达地区的城市间出现显著差异,且相应的效应值达到高水平(ω2=0.17).相反,在“数学表征与变换能力”上,所有三类地区内的城市间都存在显著性差异,且相应的效应值都超过临界值(ω2>0.03),特别是发达地区城际间的差异的效应值达到高水平(ω2=0.27)及中等发达地区城际间的差异的效应值达到中等水平(ω2=0.08).有意思的是,在该能力上三类地区之间却并未呈现出显著差异.事实上,在三类地区中,发达地区所显现出的城际差异是最为显著的,在除“数学建模能力”外的所有其他核心能力上,其城际间差异的效应值都超过临界值,在“数学表征与变换能力”和“数学推理与论证能力”上的差异效应值达到高水平(ω2>0.14),在“问题提出能力”和“问题解决能力”上的差异效应值达到中等水平(ω2>0.06).
在选取被试时,除考虑城市的代表性外,在各城市中亦选取了至少3所综合水平在不同层次上的学校.因此,在研究中发现存在显著的校际差异是可以预见的.然而,分析显示在不少城市的某些核心能力上这类显著差异并没有出现(见表6-18).例如,城市在数学交流及数学问题提出的能力上没有显著差异,在数学建模及数学推理论证的能力上虽有差异,但效应值却显示差异不大.同样地,城市G亦在2个能力上(即数学建模及数学问题提出能力)无显著差异,且在另2个能力上(即数学推理论证及数学问题解决能力)差异效应值较小.当然,在8个城市中亦有城市其校际差异在所有6个核心能力上都较为显著,其效应值至少在中等以上,包括城市A、城市E和城市H.这些一致性与不一致性值得后续的追踪研究进一步去探索其中的成因.
表6-18 各城市各类学校在数学学科6个核心能力上的表现水平差异相应值指标
6.5.5.4 研究结果的讨论
下面就较为突出的研究结果进行讨论.
(一)数学交流能力水平良好
数学交流是分享观点和澄清理解的一种方式,在交流的过程中,具有较高数学交流能力水平的学生能不断反思、精炼或修正自身的数学观点,使思维清晰化,发展自己的数学理解.数据显示,8年级中等水平学生的数学交流能力达到了“联系与变式”的水平,也就是说学生能够从数学类文本中识别和选择信息,并领会其意义;同时也能把他人的数学思想由一种载体转换成另一种载体.数学交流能力成为学生所需的核心数学能力之一.学生天生并不具备数学交流能力,数学教育还需要有意识地培养他们的数学交流能力,让学生领会复杂数学类文本的意义,比较、判断他人的数学思想;学会灵活转换数学思想的载体,并能根据具体情况选择最优的表达载体;流畅表达对学习过程的检查和反思.
(二)数学建模能力水平发展存在瓶颈
数学模型是用数学的概念和原理描述世界所依赖的思想,数学模型搭建了数学与外部世界的桥梁.数学建模也被看作是应用表征模拟并解释物理的、社会的以及数学中的现象.学校培养学生未来社会的适应能力,其中数学建模能力的培养尤其重要.这次的调查数据表明,我国学生只有在自己熟悉或较熟悉的常规情境下,才会识别出熟悉的标准模型,能够直接将现实情境翻译为数学模型,并尝试解决数学问题,但没有检验模型合理性的意识.在复杂且较为陌生情境下,几乎没有学生能够识别合理的现实模型,进而创建数学模型,加以解决该数学问题.从数据上看,这种情况表现集中,几乎没有区域差异.由此可见,我们需要从全国范围设计数学建模能力培养的课程教学方案,尤其需要从真实复杂情境的建模入手,而不是停留在训练学生解决简单生活情境或者“伪情境”的建模问题.
(三)数学问题提出能力仍然需要得到重视
从研究的结论可以看出,我国8年级学生数学问题提出能力总体较为薄弱,相当一部分学生甚至提不出数学问题来,尤其是在开放式的任务情境下,能够达到高层次问题提出水平的甚少,可以发现学生数学问题提出能力亟待提升,应当引起数学教育者和研究者更多的关注.发展学生提出数学问题的能力应当成为数学教学中一个重要的教育目标.发展学生的问题提出能力从培养学生的问题意识开始,在学生的学习中本身就包含了许多无意识的数学问题的提出,要让学生的这些无意识能够转变为一种有意识的、具有反思性的思维习惯.
(四)数学推理与论证能力在地区内部存在城际分化
我国的数学教育历来重视数学证明的教学,重视数学推理与论证能力的培养.本研究发现,在各地区内部不同城镇间学生数学推理能力发展不均衡,尤其在经济发达地区内部,数学推理能力水平严重分化.在这类地区,研究发现有学生在数学论证推理方面表现出很强的能力,能够清晰严谨、步步有据地完成证明.从研究结果看,学生的论证推理能力发展并不是整齐划一的,这与其他研究所得结论是一致的,即:同一年级内部学生的推理能力处于不同水平.[74]但是这种现象在经济发达地区尤为突出,值得我们思考.如何安排论证推理的教学才能够最大限度地使不同的学生得以发展.当然,论证推理能力较强的学生是否真正理解数学证明的价值,也是值得研究的问题.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。