JohnXie的个人博客分享 http://blog.sciencenet.cn/u/JohnXie

博文

我与澳大利亚统计学会的故事 精选

已有 10873 次阅读 2023-12-28 12:16 |个人分类:专业学习发展经历|系统分类:海外观察

 澳大利亚统计学会 (Statistical Society of Australia, 简称/缩写SSA)

成立于1962年,现有会员约800名。SSA 还为会员提供统计专业人员资格认证的服务。比如,成为SSA会员五年以上并在专业期刊发表两篇或以上的文章,经两名资格推荐人(一人为统计专业人士,另一人为你的现任或曾经的领导)推荐、SSA资格评审委员会讨论批准,你就可以成为一名SSA认证的统计师(Accredited Statistician = AStat);尚未毕业的统计专业的研究生则可以申请成为研究生统计师(Graduate Statistician = GStat)。SSA的认证统计师(AStat)资格有效期五年,到期须经重新审核确定其资格是否继续有效。

 2011我从新西兰梅西大学(Massey University)拿到统计学博士学位后就到了澳大利亚(澳洲)生活工作。因着地理、历史,及文化传统的原因,新西兰与澳洲的大学及其各个专业学会/协会联系密切,并以澳洲方面为主导。统计学科方面的研究与应用也同样如此。比如,‘澳大利亚及新西兰统计学期刊(Australian & New Zealand Journal of Statistics)‘就是由两国的统计学会/协会共同管理经营(jointly managed by the Statistical Society of Australia and the New Zealand Statistical Association)。在新西兰四年读博期间我有成为新西兰统计协会的学生会员;到了澳洲在大学找到工作后于2013年也申请成为了澳洲统计学会的普通会员。2017年到了位于新南威尔士州小镇Wagga Wagga的Charles Sturt University,有了一份让我从事的统计专业的长工(permanent job) - 更详细的故事见https://blog.sciencenet.cn/blog-3503579-1329126.html 。因此,我也对成为SSA的认证统计师(AStat)这件事上了心,于2018年提出了资格认证的申请,并于2019年初获得了批准。据我的了解,SSA的认证统计师(AStat)人数大约占SSA的会员人数的四分之一左右。

 SSA最重要的专业活动莫过于每两年一次的统计学会的年会,每次开会都会有几百人参会,是一个不但包括了SSA的会员以及澳洲学界、研究或咨询机构、政府部门及许多的企业的统计专业人员或使用统计模型的研究人员,还包括了外国统计学者都来参加的盛会。澳洲行政区划为六个州加一个首都特区,SSA的两年一次统计学会的年会就轮流在这七个地方由当地的SSA的分会做东组织召开。我第一次参加的就是2018年在墨尔本的会展中心由维多利亚州分会组办的SSA年会,记得是有600多名的参会人员,很是热闹;我因为刚刚到新的工作单位不到两年,只是做了个‘观察员’式的参会者,并没有报名做个口头发言或搞个专题海报什么的。到了2020年的时候,本来按计划是7月份轮到在北领地(Northern Territory) 开SSA年会的,但突如其来的新冠疫情让这次的年会最终取消。作为补救,组委会搞了几次网上视频会议让已准备了发言材料的参与者有个机会向大家汇报自己的‘研究成果’。我因为事先准备了一个专题海报:让我们一起向原假设显著性检验说‘不’(Please Join Us – Say ‘No’ to Null Hypothesis Significance Testing)(见下图),于是也在其中的一次视频会议上作了20分钟的发言介绍我的这个专题海报。结果有近70人参会,会后还有几个听众发电子邮件向我索取我的这个专题海报的文稿 ,原文链接DOI: 10.13140/RG.2.2.27275.72482

后来SSA决定在2021年7月正式补开一次年会,但出于疫情的考虑,以网上虚拟大会的形式开。这次我报名做一个口头发言(oral presentation),主题是关于原假设显著性检验(NHST)问题的一个微型文献综述(a mini-literature-review on NHST)(如下图所示,原文链接10.13140/RG.2.2.27898.21441)。这是一个12分钟发言+3分钟回答问题的口头发言。我利用这个机会以文献综述的方式再一次对‘原假设显著性检验(NHST)’这个统计推断分析的有逻辑及技术缺陷的数据分析范式进行批判,效果如何无从判断。估计大多数的参会者对这样的批判性的发言不会感兴趣。如果我能有一个可以让听众快速提升文章发表数量的灵丹妙药式的发言一定会吸引到更多人的兴趣与关注。

 时间转眼来到了2023年。这一次的SSA的年会定在了到悉尼旁边的卫星城市卧龙岗(Wollongong),位于悉尼市东南约80公里的一个海滨城市。会议地点就在卧龙岗大学(University of Wollongong),时间从12月10日到15日,内容包括了几个为期一天的专题短训班(workshops)及SSA年会并(大中学)统计教学年会(Australian Statistical Conference and Australian Conference on Teaching Statistics, 简称ASC&OZCOTS 2023)。为参加今年的SSA的年会我早早地就做了准备。几个月前就完成了一个要在年会上展出的专题海报(a poster presentation)。这次我针对的问题是每一个应用统计推断分析的研究人员都会面临的难题 – 我所有的统计数据是出自一个随机样本吗?我的专题海报的题目是:随机抽样是为确保统计推断分析的数学严谨性的无可辩驳的必要条件(Random sampling is a mathematical necessity beyond debate or opinion for valid statistical inferences) - 原文链接(14) (PDF) Random sampling is a mathematical necessity beyond debate or opinion for valid statistical inferences (researchgate.net)

Picture3.jpg

(上面两张照片拍摄于今年的SSA的年会的会场:(上图)在卧龙岗大学进入开年会的会议大礼堂建筑物的校门前;(下图)在会议大礼堂内我与我的专题海报展板的合影。)        

我相信对于“随机抽样是为确保统计推断分析的数学严谨性的无可辩驳的必要条件”这个理论观点/结果,凡认真修过数理统计课程的读者都不会有什么异议。问题在于这个理论结果是如何应用或体现在实际科研工作中所做的统计推断分析当中的。在我十几年的统计学学习、教学、科研的经历中,我所观察到的现象是令人十分担忧,甚至可以说是让人感到没有希望的。          

随机抽样的目的是为了得到相对于抽样总体而有代表性的随机样本,以此为前提条件所作出的统计推断分析的结果才是有效的。因此,要做到随机抽样遇到的第一个麻烦就是定义抽样总体,而这又取决于我们要研究的问题是什么。假如有人想研究一下清华大学男女生比例(或许是想暗指女生比例过低)的问题,他/她首先要定义清楚‘哪些人算是清华大学学生’。“什么是确定清华大学男女生比例的最佳方法” – 这是一个不严谨的科研问题;相比之下“根据2023年1月1日登记在册学生记录,什么是确定清华大学男女生比例的最佳方法”-这才是一个完整严谨(却普遍意义有限)的科学问题。问题的关键在于一个科研问题的目标总体/抽样总体必须给出时间与空间的限制条件,否则无法给出一个科学的答案。现实生活是大部分的科研问题都无法界定出有意义的抽样总体。比如,农业研究里的实验设计要比较一下几种不同品种的农作物的产出,请问这个研究涉及的抽样总体是什么:在过去、现在、未来,以及在这一地区、一个国家、还是全球的范围来考虑界定?这就是为什么费雪教授及其后来的写实验设计数据分析的教科书的作者们都提出/建议把任何一组样本数据都可以看着是从一个‘假定/想象的超级总体’所获得的‘随机样本’的真正原因 – 一个这么模模糊糊的假定条件就让这个根本性的局限条件消失的无影无踪。我们当然要问,从一个概念上的或是想象出的抽样总体得到的一组所谓的‘随机样本‘/’代表性样本‘所得到的统计推断分析结果难道不只能被看着‘概念上或想象中’能够代表所谓‘抽样总体’吗?从这样得出的数据分析结果对我们认识实际的研究目标总体的代表性如何解读或确认呢?这种做法实在是太不符合科学严谨的标准了吧。既然统计学教科书的作者们都是如此态度,我们也就不难理解在实际的统计推断分析的应用中无数的样本数据都不过是‘方便样本’,被研究人员一本正经地拿来做各种各样的的统计推断分析,并继而堂而皇之地发表文章,这样发表的‘经统计分析确认的科研成果’再被大家不断引用,如此恶性循环。                                     

其实这些对随机抽样/随机样本与统计推断分析的有效性的担忧在已发表的文献中已被多次指出,只是我们统计学应用的主流势力至今仍选择视而不见,听而不理,把这些完全值得关注的问题统统‘扫进地毯下面藏起来’,自我欺骗式地当这些问题并不存在。我的这张小小的专题海报不过是仅仅能起到一个再次提醒统计学的学者及应用者们的作用:请认真面对这个长期存在并被有意忽视的统计学应用的根本性缺陷。如此,我怎么能不感到没有希望-所能看到的只是被滥用的统计推断分析应用的现象依然将长期存在。

看到这里肯定会有读者提出,光听你在说现有的统计分析应用如何存在重大缺陷,怎么不见你告诉我们你认为的正确的科研工作的统计分析应用应该是怎样的呢?我在海报的最后一段就此提问这样说,关于‘正确的科研工作的统计分析应用’的话题已经超出了本海报的目标涵盖范围,特别推荐有兴趣的读者参考“学术研究的堕落:重新塑造应用管理与社会科学学术研究规范的案例论证”这本书,英文原著为CORRUPT RESEARCH: The Case for Reconceptualizing Empirical Management and Social Science, Raymond Hubbard (2016)。作为一个最节省您时间的替代方案,您也可以参阅我之前发表的博客文章:https://blog.sciencenet.cn/blog-3503579-1339495.html



https://blog.sciencenet.cn/blog-3503579-1415651.html

上一篇:缺乏思考的统计学应用
下一篇:植牙
收藏 IP: 49.187.152.*| 热度|

23 宁利中 尤明庆 周健 杨正瓴 郑永军 马鸣 周忠浩 周钰 崔锦华 檀成龙 刘进平 黄河宁 杨锦忠 王安良 高宏 朱晓刚 孙颉 李毅伟 杜占池 孔玲 刘跃 池德龙 葛维亚

该博文允许注册用户评论 请点击登录 评论 (7 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-22 14:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部