王永晖: 首都师范大学数学系分享 http://blog.sciencenet.cn/u/arithwsun

博文

学业水平测试网站的功能设想(数学类) 精选

已有 1951 次阅读 2019-9-4 09:53 |个人分类:Book-W|系统分类:观点评述

学业水平测试网站的功能设想(数学类)

王永晖


昨天李颖博士来访,但是因为座谈中各位老师的个人自我简介阶段都很精彩,轮到李颖老师的主业,计量心理学,及其在美国各层级学业水平测试的评估方法时,就显得时间很不够用了。


大意是,现在美国的各种考试,都变成机考,每个学生的卷子可能都不太一样,那么怎么样还能给出一个学生的分数,既可以跟这次考试的同学比较,同时也可以跟历届考试的同学比较。甚至还需要做到,如果是分年级考试,同一时间批次的考试,但是年级不同,不同年级的学生的数学能力,都可以去比较。


这当然需要靠数学算法,在美国已经成为了一个产业,形成了专门的博士培养,李颖当年博士毕业的时候,这个专业的需求正好在美国很吃香,她们找到的工作都很不错。


因为座谈时间短,有些东西没有谈到,李颖和我刚说了一点,可能就被其他话题打断了,这里续一下,针对数学学科。


标准化考试,不管是选择题,还是填空题,都是以数字呈现答案了,这其实对于考查学生的基本能力,心算能力和简单推理能力,已经能起到相当的作用。


像这种题目,我们希望能形成这样一个水平测试题的题库,特别设计专有名词如下:

  1.  弹药匣,这个意思是指,某个具体的题型,弹药匣中的题和题之间的差别,仅仅是参数代入的差别,即这个题可以写成ABCD代数字母,真正出题的时候,把每个字母赋值,弹药匣的题目之间的不同,仅仅是赋值的不同。

  2. 弹药箱,这个意思是指,包含了好些个不同的弹药匣,但是,属于同学的相同的能力范围和知识范围,直白的说,就是会做其中一个题型的题,那么,就应该也会做另外的题型,即使这两个题型并不相同。

  3. 弹药塔,这个意思是指,几个弹药箱垒成一摞,竖向排列,属于同学们相同的知识范围,但是从低到高,能力上有不同,高能力的肯定会做低能力的题,低能力的做不了高能力的题,除非日后得以进步。

  4. 弹药阵,把弹药塔,按照矩阵分布,呈几行几列,“列”的不同,是指的同一年级中,所属知识分类的不同,数学学科还有进一步分类,即使是中学数学,也是有相对成熟的分类,见这个国外网站,弄的不错。“行”的不同,则是指年级的不同。年级的不同,跟能力的不同,还是有细微的差别的,年级的不同,更多的还是在于知识,所以,这里区分出来。



当时,李颖博士只提到了弹药匣的做法,在她们行业称作“enemy”,每个enemy只能在卷子中出一道。我们当时时间紧,就忘了问,国外教育评估的专业网站,是否已经有了后面几种做法,可供我们借鉴。


畅想未来的数学教育网站,应该包含这些功能,不仅仅是测试之用,也要作为训练之用,以测代练,是心理学已经证实的更好的学习方法。


测试的时候,弹药匣可能只要发出一两发,就能发现出学生在该题型的水平,就不用再出了,转到下一题就行了。训练的时候,可以出的稍微多几道,能够帮助学生更加发现问题,确认问题。


比如说,同一弹药匣的题,有的题目同学做对了,有的却做错了,那么,很明显原因是,计算能力不过关,不是道理不懂,而是心算/计算能力差了。从而可以引导学生到心算训练的基本题型中,在那儿测试和训练学生的水平。


又比如说,同一弹药箱的题,有些弹药匣的题目,做对了,有的弹药匣却做错了,那么很明显,说明该同学没有真正搞懂这一弹药箱背后的数学思想,缺少举一反三的灵活能力。我们也可以通过互动式设计,再进一步发现同学们真正差在那个地方,倒底是能力上缺少举一反三,还是知识上缺少举一反三。


弹药塔和弹药阵的测试比较清楚,这个系统的意义在于,配合我的数学教育的设想

分级教学思想下的一种中小学数学教材实现方案(胚胎版)

更好地实现学校内的跳级。


我们在训练的时候,弹药匣还有的一个意义是,我们要确定出那些关键性/重点性/基础性弹药匣,我们的想法是,学生的能力,主要来源于这些关键性基础弹药匣,但是在同一个学校同一个班级中,那些聪明的孩子,很快地就达到了相应能力,而普通孩子,即使没有达到这些能力,但因为教学节奏的均一化,大家都在往前走,虽然表面上看,普通孩子们也做了很多题,但是,没有充电突破,数学能力上始终没得到真正的进步。


更好的做法是,人的智力的发育,有早有晚,普通孩子,如果在某个关键性基础弹药匣和弹药箱上,尚未达成优秀学生的水准,那么就应该不断的重复训练,直至达到。


否则落后的孩子,只可能永远的落后,这是我们教育界的悲哀,传统模式确实有难以克服的弊端,借助IT新技术,应该是可以有很大的改变。


我们把题目,做成弹药匣和弹药箱,在训练时候的意义,符合心理学上的广谱原理,这个名词是我取的,不过已经有心理学家,在体育训练等具体情景下证实。即,题目如果做错了之后,或者不够快速熟练,重复训练时候的每个题型,要做一些微小的扰动,或者是弹药匣范围的改变,甚至是弹药箱范围的改变。


这样,训练效果会大增。我把它称之为心理学上的广谱原理,即微小的扰动,反而能够产生稳定的大脑感觉,如语感,数觉。


我跟李颖博士还谈起了另外一个想法,即,总成绩的生成算法。因为现在都是IT电子化操作,获得数据的能力大大增强,成本大大降低。


我们以前的总成绩,就是把各个题目的成绩加在一起,然后算出学生排名。但是因为现在IT技术使得计算能力加强,每个题型的成绩,实际上是有一个独立的学生成绩分布和排名的,如何通过局部的信息,获得整体的信息,这又是一个Local-Global问题。


这里记录一下,以供将来继续探讨。


附录1.   国内外学业水平测试网站的名单   欢迎李颖博士和各位专业人士继续推荐和增加此名单。

附录2.   我的硕士生刘清翼,所做的几个基本题型的网络测试卷(初中代数),可以立刻看到分数,至于优劣评级,需要加她微信获知。




http://blog.sciencenet.cn/blog-45143-1196569.html

上一篇:数觉训练--教师型家长的亲子实践,能够给孩子带来什么样的好处?
下一篇:未来数理中学的一个设想:真正把实验做好

1 黄永义

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-10-16 14:58

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部