博文

学业水平测试网站的功能设想（数学类）精选

已有 5466 次阅读 2019-9-4 09:53 |个人分类:Book-W|系统分类:观点评述

学业水平测试网站的功能设想（数学类）

王永晖

昨天李颖博士来访，但是因为座谈中各位老师的个人自我简介阶段都很精彩，轮到李颖老师的主业，计量心理学，及其在美国各层级学业水平测试的评估方法时，就显得时间很不够用了。

大意是，现在美国的各种考试，都变成机考，每个学生的卷子可能都不太一样，那么怎么样还能给出一个学生的分数，既可以跟这次考试的同学比较，同时也可以跟历届考试的同学比较。甚至还需要做到，如果是分年级考试，同一时间批次的考试，但是年级不同，不同年级的学生的数学能力，都可以去比较。

这当然需要靠数学算法，在美国已经成为了一个产业，形成了专门的博士培养，李颖当年博士毕业的时候，这个专业的需求正好在美国很吃香，她们找到的工作都很不错。

因为座谈时间短，有些东西没有谈到，李颖和我刚说了一点，可能就被其他话题打断了，这里续一下，针对数学学科。

标准化考试，不管是选择题，还是填空题，都是以数字呈现答案了，这其实对于考查学生的基本能力，心算能力和简单推理能力，已经能起到相当的作用。

像这种题目，我们希望能形成这样一个水平测试题的题库，特别设计专有名词如下：

弹药匣，这个意思是指，某个具体的题型，弹药匣中的题和题之间的差别，仅仅是参数代入的差别，即这个题可以写成ABCD代数字母，真正出题的时候，把每个字母赋值，弹药匣的题目之间的不同，仅仅是赋值的不同。
弹药箱，这个意思是指，包含了好些个不同的弹药匣，但是，属于同学的相同的能力范围和知识范围，直白的说，就是会做其中一个题型的题，那么，就应该也会做另外的题型，即使这两个题型并不相同。
弹药塔，这个意思是指，几个弹药箱垒成一摞，竖向排列，属于同学们相同的知识范围，但是从低到高，能力上有不同，高能力的肯定会做低能力的题，低能力的做不了高能力的题，除非日后得以进步。
弹药阵，把弹药塔，按照矩阵分布，呈几行几列，“列”的不同，是指的同一年级中，所属知识分类的不同，数学学科还有进一步分类，即使是中学数学，也是有相对成熟的分类，见这个国外网站，弄的不错。“行”的不同，则是指年级的不同。年级的不同，跟能力的不同，还是有细微的差别的，年级的不同，更多的还是在于知识，所以，这里区分出来。

当时，李颖博士只提到了弹药匣的做法，在她们行业称作“enemy”，每个enemy只能在卷子中出一道。我们当时时间紧，就忘了问，国外教育评估的专业网站，是否已经有了后面几种做法，可供我们借鉴。

畅想未来的数学教育网站，应该包含这些功能，不仅仅是测试之用，也要作为训练之用，以测代练，是心理学已经证实的更好的学习方法。

测试的时候，弹药匣可能只要发出一两发，就能发现出学生在该题型的水平，就不用再出了，转到下一题就行了。训练的时候，可以出的稍微多几道，能够帮助学生更加发现问题，确认问题。

比如说，同一弹药匣的题，有的题目同学做对了，有的却做错了，那么，很明显原因是，计算能力不过关，不是道理不懂，而是心算/计算能力差了。从而可以引导学生到心算训练的基本题型中，在那儿测试和训练学生的水平。

又比如说，同一弹药箱的题，有些弹药匣的题目，做对了，有的弹药匣却做错了，那么很明显，说明该同学没有真正搞懂这一弹药箱背后的数学思想，缺少举一反三的灵活能力。我们也可以通过互动式设计，再进一步发现同学们真正差在那个地方，倒底是能力上缺少举一反三，还是知识上缺少举一反三。

弹药塔和弹药阵的测试比较清楚，这个系统的意义在于，配合我的数学教育的设想

分级教学思想下的一种中小学数学教材实现方案（胚胎版）

更好地实现学校内的跳级。

我们在训练的时候，弹药匣还有的一个意义是，我们要确定出那些关键性/重点性/基础性弹药匣，我们的想法是，学生的能力，主要来源于这些关键性基础弹药匣，但是在同一个学校同一个班级中，那些聪明的孩子，很快地就达到了相应能力，而普通孩子，即使没有达到这些能力，但因为教学节奏的均一化，大家都在往前走，虽然表面上看，普通孩子们也做了很多题，但是，没有充电突破，数学能力上始终没得到真正的进步。

更好的做法是，人的智力的发育，有早有晚，普通孩子，如果在某个关键性基础弹药匣和弹药箱上，尚未达成优秀学生的水准，那么就应该不断的重复训练，直至达到。

否则落后的孩子，只可能永远的落后，这是我们教育界的悲哀，传统模式确实有难以克服的弊端，借助IT新技术，应该是可以有很大的改变。

我们把题目，做成弹药匣和弹药箱，在训练时候的意义，符合心理学上的广谱原理，这个名词是我取的，不过已经有心理学家，在体育训练等具体情景下证实。即，题目如果做错了之后，或者不够快速熟练，重复训练时候的每个题型，要做一些微小的扰动，或者是弹药匣范围的改变，甚至是弹药箱范围的改变。

这样，训练效果会大增。我把它称之为心理学上的广谱原理，即微小的扰动，反而能够产生稳定的大脑感觉，如语感，数觉。

我跟李颖博士还谈起了另外一个想法，即，总成绩的生成算法。因为现在都是IT电子化操作，获得数据的能力大大增强，成本大大降低。

我们以前的总成绩，就是把各个题目的成绩加在一起，然后算出学生排名。但是因为现在IT技术使得计算能力加强，每个题型的成绩，实际上是有一个独立的学生成绩分布和排名的，如何通过局部的信息，获得整体的信息，这又是一个Local-Global问题。

这里记录一下，以供将来继续探讨。

附录1. 国内外学业水平测试网站的名单欢迎李颖博士和各位专业人士继续推荐和增加此名单。

附录2. 我的硕士生刘清翼，所做的几个基本题型的网络测试卷（初中代数），可以立刻看到分数，至于优劣评级，需要加她微信获知。

转载本文请联系原作者获取授权，同时请注明本文来自王永晖科学网博客。
链接地址：https://blog.sciencenet.cn/blog-45143-1196569.html

上一篇：数觉训练--教师型家长的亲子实践，能够给孩子带来什么样的好处？
下一篇：未来数理中学的一个设想：真正把实验做好

收藏 IP: 111.205.218.*| 热度|

当前推荐数：1 推荐人：黄永义

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

王永晖

扫一扫，分享此博文

王永晖：首都师范大学数学系分享 http://blog.sciencenet.cn/u/arithwsun

博文

学业水平测试网站的功能设想（数学类）精选

当前推荐数：1 推荐人：黄永义

该博文允许注册用户评论请点击登录评论 (0 个评论)

王永晖

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

王永晖： 首都师范大学数学系分享 http://blog.sciencenet.cn/u/arithwsun

博文

学业水平测试网站的功能设想（数学类） 精选

当前推荐数：1 推荐人： 黄永义

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

王永晖

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

王永晖：首都师范大学数学系分享 http://blog.sciencenet.cn/u/arithwsun

学业水平测试网站的功能设想（数学类）精选

当前推荐数：1 推荐人：黄永义

该博文允许注册用户评论请点击登录评论 (0 个评论)