JohnXie的个人博客分享 http://blog.sciencenet.cn/u/JohnXie

博文

浅议统计推断分析模型所需的样本容量问题

已有 1308 次阅读 2023-12-25 18:37 |个人分类:对统计推断及统计显著性问题的评述与讨论|系统分类:科研笔记

在我前一篇博文中我说过,统计推断分析的前提就是样本数据必须是代表了总体的统计特征的所谓‘代表性样本’。在此条件下,样本容量越大估计误差就越小。因此,纯粹从统计分析的角度,不论是用什么具体的统计模型分析样本数据,研究人员应该采用尽可能大的样本作数据分析。但是,在实际研究工作中,几乎不存在真正的‘代表性样本’可供统计推断分析。不仅如此,从科学研究的角度,样本数据的大小还受其它一些方面的因素限制,比如,获取数据的成本因素,数据质量的因素等等。因此,现实生活中,用于统计推断分析的数据几乎都不是按数理统计教科书所要求的随机抽样所得到的代表性样本,而是在具体的科研条件下所能获得的‘方便样本数据’。而最根本的麻烦还在于,当研究人员试图在统计假设检验(NHST=Null Hypothesis Significance Test)的框架内把统计推断分析作为科学推断分析的替代手段时,对样本容量大小的确定一下子成为了一项关乎科研成果能否得到‘科学高效地’被确认的重大而关键的任务。于是乎,就有了‘统计功效分析’(Statistical Power Analysis)这个东西,用于‘科学高效地’确定统计推断分析所需要的‘最佳’样本容量(sample size)。统计推断分析被不恰当地当作了可以用于确认科研成果的真伪的‘科学手段’(请参阅https://blog.sciencenet.cn/blog-3503579-1327602.html https://blog.sciencenet.cn/home.php?mod=space&uid=3503579&do=blog&id=1407500 对此复杂问题的更详细的论述,在此不再赘述)。与此相联系的就是,对样本容量大小的确定的重要性也被不恰当地夸大了。

那么,在实际的科研工作中做数据统计推断分析时,究竟应该如何恰当的决定样本容量的大小呢?我的观点及做法如下供您参考。

首先要明确的是,样本容量大小的确定虽然是做统计推断分析时必须考虑的一个因素,但其重要性与敏感性都并非在流行的统计假设检验的框架下所强调的那么关键。因为,太多的其它因素(比如数据质量,模型的构建,假设条件,等等)所带来的影响都可能大大超过样本容量的大小对分析结果的影响。统计推断分析最多所能作的不过是what-if analysis, 不是什么能确定相关的科研成果是否真实可靠的检验工具。因此,样本容量大小的确定最根本的是要符合统计分析的基本原则。因此,在给出具体的确定样本容量的建议前,我一定会提醒/强调请首先要尽可能地明确自己的研究总体及科研问题,以此来达到了解如何能保证收集数据时尽可能地有代表性并认识到可能的偏误的原因(我遇到过太多的来向我咨询的人一上来就问我‘什么是我的最佳样本容量大小’而完全不首先考虑自己的科研问题的定义及相关样本的代表性-这样的思维完全是在误解并误用/滥用统计数据分析)。在此基础上,针对具体的情况我会给出不同的答案。比如,我会对一个搞一个小的科研项目,以拿荣誉本科学位或硕士学位的研究生说,在你的时间及资金的许可的范围内,尽量多获得数据;对一个博士生或教职工科研人员,我会告诉他/她,请好好想一想你的统计模型是什么,有多少参数,按每个参数至少5个独立数据点来设计实验或抽样调查方案并收集数据。当每个参数的独立数据点超过20个时,你的更多数据所能给你带来的新的信息的量会递减(边际效益递减)显著,可以考虑不必采用太大的样本。当然,如果无法确定自己最终会采用什么统计模型,那就按尽量多获得数据的原则处理。

最后,只要有机会/对方原意听,我会把统计学家耶茨Frank Yates70年多前说的话再提醒/强调一下。1951年在为纪念费雪教授里程碑式的著作“研究工作者的统计方法”发表25周年的文章中,耶茨是这样评价统计假设检验的作用的:“对显著性检验的强调,以及把每一个实验的结果分别考虑,这样的做法已经带来了不良的后果,它使得科研人员常常把对来自一个实验的数据进行显著性检验作为最终的目的。看看结果是显著的还是不显著的,这就完事了。因此,科研工作者们一定要让自己认识到这样一个事实,那就是在许多的研究领域,某次实验是真正关键的一次实验的情形是很少有的,而更常见的是需要对同一个科研问题进行多次的实验并将这些实验结果汇总起来以获得一个满意的科学真像的综合结果。在农业大田试验的研究上情况尤其是如此,一般来说实验处理的效应会随土壤及气象条件的变化而变化。其后果就是,要想使研究结论具有普遍适用性,在不同的地区、不同的年份重复同一个科学实验变得绝对必要。在这种情形下,一系列的中等准确度的实验要远远比只有一个但准确度非常高的实验更有价值。”(英文原文登载在 page 33 of The Influence of Statistical Methods for Research Workers on the Development of the Science of Statistics by Yates published in Journal of the American Statistical Association, Mar., 1951, Vol. 46, No. 253.)




https://blog.sciencenet.cn/blog-3503579-1415320.html

上一篇:运用结构方程模型(SEM)分析数据时样本容量(sample size)越大越好
下一篇:澳大利亚近几年的通货膨胀率与大学员工工资方案谈判
收藏 IP: 49.187.152.*| 热度|

11 郑永军 杨正瓴 宁利中 尤明庆 檀成龙 王安良 高宏 朱晓刚 马鸣 黄河宁 陈蕴真

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 21:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部