博文

1.19 衡量教育改革成效的困难，如何利用一带一路解决

已有 47769 次阅读 2018-5-13 09:12 |个人分类:教育2|系统分类:观点评述

教育可以是一个衡量一个国家未来的指标，教育改革对于国家的竞争力和未来的发展至关重要。教育学作为一门社会科学，没有物理化学等自然科学那么客观，而且教育改革的实验，通常而言需要更长远的时间去考证，这就使得教育改革的研究变得更加困难。社会科学的研究一般借助于实证与统计学的方法。这里探讨一下如何研究教育改革的难点，和如何利用一带一路的政策，可以“有的放矢”地逐步改进。

缺乏机理性（mechanistic）的现象是教育实验研究的第一个难点。教育学与物理化学并不相同，并不存在一个易于观察而且客观的因果现象。自然科学提供了很多的机理性的研究：打一个不太恰当的地方，如果你扇了一个人的巴掌，脸立刻会感到疼痛，手也会感到有些麻，而且脸过一段时间以后也会肿胀起来。这种因果性非常的直观，而且观测所需要的时间也非常短，方式用眼睛看看是不是脸红了，是不是脸肿了就好。但是教育的改革，很难直观看出某些改革方案是不是对最后学生的综合素养有所提高。这也就说明了教育学的改革，必须要建立在大量的证据，通过统计学的方法，才可以获取对大多数人适用的教学规律。而这样子的教学规律，可以反哺到教育改革的设计方案中。

教育学实验的第二个问题就是实验对象的选取的非随机性，存在一个研究对象取样偏差（sampling bias）。我们来看一个心理学研究的问题，这是我一次课堂上听来的觉得有意思的问题[1]：如果我的假设是，把一个人单独关禁闭会对他/她的心理产生很大的负面影响，尤其是更加长期的禁闭会引发抑郁症。想要去做这样一个实验的第一步，就是征集实验的志愿者，也可以给志愿者提供一些经济补偿。或许每个小时可以给到30美元，禁闭两天可以补偿1440美元。这样或许可以找到一定数量的研究对象。我当时觉得，这个心理实验很有意思，我也很想知道自己被关禁闭会不会发疯一般做各种疯狂的事。然后老师的一句话打醒我了，自愿参加这样实验的人，多多少少都有些“不正常”，要么是看上了钱，找到一堆流浪汉，要么就是想要挑战一下自己的极限,或者追求刺激，好奇害死猫的人，而不会有太多普通人参与。所以就算做了这么一个心理实验，最后的研究结果对于普通人也没有任何用处。如果真的要做好这么一个实验，那么必须到大街上，随机捕捉街上的行人，然后关上个几天的禁闭，但是这完全是非法的行为，没有一个社会愿意心理学家去做这种实验。类似的问题，如果富人的基因或者精神状态和普通人并不相同，我们也永远招不到有钱人去做心理实验或者一些基因类新药的实验，因为一视同仁的经济补偿对于有钱人而已，一点也没有吸引力。更加专业的学术讨论关于抽样偏差和实验对象参与程度可以参看文献[2]。

回到教育实验的问题来看，如果一个高中的校长，想要进行一个完全彻底的素质教育，告诉学生家长们，这个高中是培养新一代人才的最好的实验学校，完全不教如何高考备考，怎么去考高分，但是会教领导力和各种优秀的素养。那么这样一个教学实验已经找不到多少普通学生家长的支持了。家长们会用脚投票，这么厉害的素质教育还是给你儿子女儿留着吧，你把你孩子送去哈佛耶鲁我也不羡慕，我的孩子还是去一个中规中矩的高中，参加高考。这样的一个教学实验即便成功了，同样的也总结不出什么适用于普通人的教学规律。

如果不去寻找志愿者，想要把大多数普通学生都囊括进来，做一个好的教学实验,那么第三个难点，就在于难于实现随机化实验（randomized experiments）。在与统计相关的实验中，随机化实验的可靠性最高[3]。通过随机抽样，选取接受新药的实验对象，以及对照组接受安慰剂的实验对象。通过对比这两组实验对象的最后身体情况，可以得出新药是否具有统计显著性，是否可以推广到其他病患。但是在教育实验中，你不可能对一个学校，一个班级里的学生进行随机分组，然后上不同的课，有不同的教育手段，同学们家长们都不会答应的，觉得这并不公平。

所以教学改革的实验最后可以依赖的方法便只有观测性实验（observational experiments）[4]。观测性实验的问题是会找到很多似是而非的混淆变量（confounding variable）。我可以去找一个好的精确的关于混淆变量的定义，但是这里还是用一个简单的例子来阐述什么算是一个混淆变量[5]。研究发现，在一所小学里，脚大的学生阅读能力比脚小的学生更好，这个结论就非常的让人困惑。但是如果把独立变量定义成学生的年级引入作为自变量，那么阅读能力其实只与学生的年级有关，而不在于脚的大小有关，这里脚的大小就是一个混淆变量。

通过观测性实验去查看教育的规律，需要去尝试很多很多不同的混淆变量，把这些变量的关系都理清楚了，那么才能找到真正与教学效果提高有关的手段。这样的观测性实验需要很多的数据，把经济条件，饮食差异，文化差异，方言的差异，教材的不同，都要好好进行考虑，才可以找到比较正确的教育规律。

这也就是为什么我们需要与“一带一路”国家进行教育的合作和教育改革的共同研究。发达国家组成了OECD的一个研究不同经济教育发展的智库。之前上海学生取得优异成绩的国际学生能力评估计划（PISA考试 )就出自该智库之手。发达国家在教育方面有巨大的发言权，也进行了很多的证据支持（evidence based）的教育学研究。教育上科研上的论文都是被发达国家所垄断，要有中国的教育理论体系，一带一路就是很好的尝试点。中国如果想要进行好的教育改革，那么也需要担当引领一个发展中国家版本的PISA教育评估系统，通过各个国家的不同发展阶段，不同的各种变量，才能得到准确的教育原则与规律，而实施的同时，也带动了发展中国家的教育改革，推动发展中国家的更加快速的发展与合作。

国别	教育学论文数量	发展与教育心理学论文数量	实验与认知心理学论文数量
美国	15611	6954	3400
英国	3816	1698	1314
澳大利亚	2534	921	532
加拿大	1976	946	694
德国	1449	1001	851
日本	661	170	187
法国	643	692	347
中国	1948	385	256

表1，中国与其他发达国家在教育学，教育心理学，和认知心理学科研论文的差距[6]。表格列出的是2016年发表的论文数量，是最近的一年的数据。

表1显示中国在教育方面的论文发表还很少(2016年论文发表数量，引用的数量就更低了，来源[6]），与发达国家相比，数量少很多，在证据支持学习（evidence based learning）方面还可以有很大的发展潜力。

在医学上，想要证明吸烟有害健康，因为也不能强迫参与者进行吸烟的随机化实验，很多时候采取了观测性实验，通过很多的数据量，排除了很多的混淆变量，最后印证了吸烟有害健康的假设。但是其实吸烟的危害也从另一些机理性的研究得到印证。医学研究者做了很多动物的吸烟的实验，做了不少随机化实验，也找出了动物机理性癌变的规律，这也更增加了对吸烟有害健康的认证[4]。教育学，其实也有相对应的研究机理的亲缘学科，发展心理学（developmental psychology）和认知心理学（cognitive psychology），可以通过实验去发现人类认知方面的机理，从而用于改革教育的手段与方式。同样在表1中列出了中国在这些领域的科研水平，同样与发达国家有较大差距。

现在比较流行的大数据或者脑科学，是下一个科技竞争的战场，这些地方的成果如果可以更加跨领域应用到教育上，实现了1+1>2的协同效应（synergy effect）。事实上，现在机器学习的大牛迈克尔乔丹（Michael Jordan）就是在认知科学拿的博士学位，另一个机器学习大牛杰弗里辛顿（Geoffrey Hinton）也是认知心理学家。机器学习与认知心理学的之间的联系可见一斑。而认知心理学和教育学的相关性也毋庸置疑。现在机器学习与认知科学的大发展，也可以推动教育学的一些新思路。

教学改革实行以后，检验它的成效需要很多年的时间,存在一个迟滞性。台湾地区十几年前的教育改革，由诺贝尔奖得主李远哲推动[7]，现在看来台湾地区的人才培养似乎给人一种比不上大陆地区的原因，在于十几年前的改革现在后果或影响才会慢慢显现出来。中国的城乡差异，还有一带一路国家的经济发展的不同阶段，很多国家的文化还有经济步调都不相同，正好可以作为多元化的测试人群，进行探索。这样形成了实行教育改革的组别，和没做教育改革的控制组的对比，在短期内可以有一个更好的反馈。这对于发展中国家经济发展与人才培养都是有巨大意义的。

2018年5月12日最后修改。

引用文献：

[1] 戴维丹克斯，卡内基梅隆10-616形式化方法简介的课堂讨论，2015年秋。因果律研究与图模型。David Danks, Carnegie Mellon University course lecture discussion regarding causality and graphical models, Fall 2015.

[2] Shein-CHung Chow, Jun Shao, Hansheng Wang, Sample Size Calculations in clinical Research, Marcel Dekker Inc, New York 2003, Chapter 2, p.26 周星辰，邵军，王函生（名字均为音译），临床研究的样本数量计算，马歇尔德科公司，纽约2003年出版，第二章，26页。

[3] 随机化实验的维基百科，Randomized Experiment,

https://en.wikipedia.org/wiki/Randomized_experiment 2018年5月12日最后访问。

[4] 拉里魏瑟曼，统计学的所有：统计推断的简明课程，斯普林格出版社，纽约2004年，251-262页，第十五章。Larry Wasserman, All of Statistics, A concise course in Statistical Inference, Spinger New York 2004, pp251-262, Chapter 15.

[5] 罗尼罗森菲尔德，卡内基梅隆大学语言与统计课程讨论，2016年春。An example given by Roni Rosenfeld during the lecture of Lanugage and Statistics at Carnegie Mellon University.

[6] SJR期刊与国家排名2016年的论文数据， Scimago Journal and Country Rank http://www.scimagojr.com/countryrank.php 2018年5月12日最后访问。

[7] 台湾教育改革维基百科， https://zh.wikipedia.org/zh-cn/臺灣教育改革 2018年5月12日最后访问。

转载本文请联系原作者获取授权，同时请注明本文来自张鹰科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3116575-1113720.html

上一篇：1.18 美国教育的不平等——减负的他山之石
下一篇：1.20 “素质应试教育”的产生，如何更加公平、多元地考核学生

收藏 IP: 165.225.34.*| 热度|

张鹰的博客分享 http://blog.sciencenet.cn/u/yingzhang1 农村小伙的回顾与展望

博文

1.19 衡量教育改革成效的困难，如何利用一带一路解决

当前推荐数：8 推荐人：徐令予 张骥 杨正瓴 宁利中 秦逸人 晏成和 zjzhaokeqin Hyq18936853798

该博文允许注册用户评论请点击登录评论 (20 个评论)

张鹰

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

张鹰的博客分享 http://blog.sciencenet.cn/u/yingzhang1 农村小伙的回顾与展望

博文

1.19 衡量教育改革成效的困难，如何利用一带一路解决

当前推荐数：8 推荐人： 徐令予 张骥 杨正瓴 宁利中 秦逸人 晏成和 zjzhaokeqin Hyq18936853798

该博文允许注册用户评论 请点击登录 评论 (20 个评论)

张鹰

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

当前推荐数：8 推荐人：徐令予张骥杨正瓴宁利中秦逸人晏成和 zjzhaokeqin Hyq18936853798

该博文允许注册用户评论请点击登录评论 (20 个评论)