limx54的个人博客分享 http://blog.sciencenet.cn/u/limx54

博文

生物人如何增强统计“功力”

已有 5994 次阅读 2009-11-7 12:28 |个人分类:统计学习|系统分类:科研笔记| 统计, 学习方法, 生物

常常听到做生物研究的朋友和同时抱怨:其实书也没少看,课也没少听。可拿到实验数据还是一头雾水,不知从何下手。明显感觉“功力”不够。我也是从生物出家,一路来摸爬滚打,现在主攻统计遗传学的理论和计算软件研究。也算是开始上路了。在此,把这些年来自学统计学的心得体会稍微总结一下,与大家分享一下。

初学者,往往会陷入两种比较极端的学习误区:
死记公式型:以为练就统计本领的高境界就是对统计公式滚瓜烂熟。对于很多生物人(不像数学人),记住这些分布的公式,何尝容易,又是指数函数,又是积分公式。。。越记越忘!其实公式书上都有,只要知道怎么回事,又没有监考老师不让看书。
只点按钮型:现在的统计分析软件做得越来越友好(user-friendly),普通的统计分析,几乎闭着眼睛,狂点击“下一步”按钮就可出结果。结果更简单,p-value是不是小于0.05!小于就宣告成功,否则郁闷不已。当问及,为什么会小于0.05时,答曰:其实我也不知道,电脑说的,应该不会错!碰到问题,大家(电脑、他(或她))都傻了。

以下是我认为比较可取的“练功”方法(当然肯定不止这些):
确立“不确定”的意识。要学好统计学,跟学好任何其他东西都一样(包括生物),领会实质。这很抽象。记得本科时微生物老师常常强调,做好微生物的实验的必备前提要有“有菌”的意识,双手从口袋里面一拿出来,就可感觉到上面布满了细菌。类似地,学习统计学,我认为确立“不确定”的意识是必备前提。本来计划早上7:30起床,由于很多不可控制的原因,可能会7:31,也可能会是7:28。在去上班的路上肯定要顺便买点早餐,可能买馒头,也可能买油条。到了办公室,想打开旧电脑查查生物文献,这台旧电脑可能会打不开(尽管很少会打不开)。打开电脑后,它会不间断地死机,大概过两个小时就会死机一次,但有时候会坚持得久一点,有时候会没那么久,弄得你不知道到底要何时保存资料。这些就是“不确定”或者叫随机性。统计学就是用来描述这些不确定现象的。对照教材往往会惊喜的发现(当然也不一定不惊喜,如果您对统计压根没有兴趣的话),这些不确定性早已经被统计学的师祖们描述了,分别为正态分布,伯努利分布,泊松分布,和指数分布。类似地,做PCR实验和炒股票时也会碰到许多这样的不确定性。原来我们一直跟统计都在亲密接触!理解了这些,远比背诵那些烦人的指数函数公式强。统计教材书可以大体翻一遍,理解一些核心的概念(请注意是理解而不是简单地记住)。无需强求把他一一背下来,事实上也不可能。理解的程度基本要求就是:到有实际工作需要时可以准确给出关键词,以便Google兄弟快速帮我们找出最想要的资料。

增强“内力”。学习完了统计学的入门教程后,感觉功力大增。想找本《九阳神功》似的高级书来研习。我当初就找了茆诗松等的《高等数理统计》。看得我,头大了几圈,被打击得不行了。后来干脆暂停“修炼”,去增强“内力”,恶补线性代数和数学分析。最近,由于工作的需要我在研习Daniel Sorensen等的《Likelihood, Bayesian and MCMC methods in quantitative genetics》。整整七百页的书里面约有6百多页的公式推导,但我还看得津津有味,猜想应该是内力比以前大有提高了。

培养兴趣。另外,我发现阅读一些有关统计学的有趣的奇人异事,也是有利于统计学习的。比方,我有一次偶尔在网上读了《生物统计著名历史人物其言其人其事》(http://www.docin.com/p-20008107.html),才知道K.Pearson和Fisher RA他们各自对统计学的贡献,甚至于因学术观点各异而不和。读了之后印象很深,很多相关的统计名词也记得很牢。

https://blog.sciencenet.cn/blog-338817-269240.html


下一篇:您的t检验显著结果只是因为你的运气吗?
收藏 IP: .*| 热度|

3 刘进平 高建国 haohao2009

发表评论 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-22 01:07

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部