||
之前在科学网上我写了两篇关于‘品茶的女士’(The Lady Tasting Tea)的博客,详见‘女士品茶’还是‘品茶的女士‘ https://blog.sciencenet.cn/blog-3503579-1341518.html 及再谈‘品茶的女士’(The Lady Tasting Tea)https://blog.sciencenet.cn/blog-3503579-1357802.html 。
最近我又在最大型的开放获取(Open Access)期刊PLOS ONE上发表了一篇相关的文章:A Bayesian network for modelling the Lady tasting tea experiment (一个关于品茶的女士试验的贝叶斯网络模型, 文章链接: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0307866 )。
大约100年前当费雪(R. A. Fisher)教授设计测试品茶的女士布里斯托尔博士(Dr. Bristol)分辨一杯英式奶茶究竟是先放的茶水还是鲜奶而冲制而成的能力的时候,他做了一个限制性很强的假设:布里斯托尔博士要么完全没有分辨两种冲制方法的能力,要么百分之百能做出正确的辨别判断。这样的假设当然是非常不合理的,因为更可能是情况是布里斯托尔博士的确具备一定的正确辨别判断的能力,虽然不是百分百准确但肯定不是完全瞎蒙(五五波那么乱猜)。可是Fisher只有做那么一个不合理的假设,他的显著性检验的方法才有效。
我的这篇文章用贝叶斯网络给出了一个能计算费雪教授所设计的检验布里斯托尔博士判断能力试验的后验概率(posterior probability)的模型。有兴趣的读者可以通过上面给出的文章链接阅读整篇文章或下载我用Netica软件所做的贝叶斯模型实际进行测试分析。我所做出的贝叶斯网络模型长的是这个样子的(见下图)。
有读者可能会问,不就是一个随机试验吗,为什么不用一条概率分布(比如二项分布试验)公式描述它就可以了,需要那么大费周章搞一个贝叶斯网络模型才能解决问题吗。事实是品茶的女士的试验是一个系列的彼此不独立的随机事件设计,至少我还没能推导出一个解析的概率分布公式来描述这个试验(如果您能推导出或知道有这么一个公式,应该能就此问题发表一篇学术文章了)。作为一个标准的统计学理论结果,我们都知道一个二项分布试验的概率分布结果由两个参数确定,N(独立伯努利试验次数)及p(每次独立试验成功的概率)。然而,正如我在发表的文章中所指出的,品茶的女士的试验的概率分布取决于三项因素:随机上茶的规律(the order of the served cups)、品茶女士正确判断的次数,以及她做出正确判断的规律(and both the number and the order of the correctly identified cups)。例如,如果我们测试了她两次(两个8杯的试验),即使她两次试验每次都判断对了6杯,只要这两次试验的上茶规律是不同的或正确判断的6杯的规律是不同的,都会得出不同的概率值。看官大人,您可以很容易通过我所提供的贝叶斯网络模型对我所说的进行验证。希望看官大人您能喜欢/欣赏我的品茶的女士试验的贝叶斯网络模型。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 19:54
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社