“In the xenograft mouse experiment, there were 5 mice per group used. Whether this could lead to a proper statistical analysis remains unclear. The authors need to give a clarification.”这是一位审稿人在稿件回复中问我一个做分子生物学朋友的问题(注:这是一个来检验某种生物处理是否有效果的常规试验,通常的做法就是做两组数据,一组来自生物处理,另外一组来自未处理的对照,然后用t检验,看看p-value是否小于0.05)。审稿人的大意是,实验中每组用5个小鼠能否给出合理的统计分析?实际上就是问您的实验样本够不够数的问题?
所以,要回答这个问题就必须计算能够达到显著水平0.05的概率。对于这个试验,可以认为生物处理的效用是一定的(如果有的话),检验的老鼠越多,就越能提高达到显著性水平的概率。给定一个概率标准(如80%),可以从理论上计算至少需要多少只老鼠。这就是统计上的所谓“最小样本量”。很多统计软件如SPSS,SAS等都可计算理论最小样本量。我曾经发现一个界面很友好的在线计算工具,http://www.danielsoper.com/statcalc/calc47.aspx。比方说当效用(Effect Size)为2的时候,如果希望有80%的概率(也叫统计功效,Statistical Power Level)达到显著性水平0.05(通常叫Alpha Level)的话,单尾t检验最少需用8个样本(每组4个),双尾t检验至少需用16个(每组6个样本)。这里很重要的前提就是,已知效用。这又似乎有点怪异,如果我都已知效用了,还要做实验检验干嘛?!的确,您一般是不知道效用的。所以这里要用到另外一个工具来估算效用,http://www.danielsoper.com/statcalc/calc48.aspx。计算也很简单,输入每组的均值和标准差,点击按钮就出结果了。通过这两个工具计算,我朋友的那个试验达到以90%的概率达到显著的最小样本是8个老鼠(每组4个)。所以,我建议他这样回复:通过统计计算,在我们的样本中只需要每组4个样本就可90%的概率达到0.05的显著性水平。所以,这个基于每组5个小鼠的统计分析结果应该是合理的。