|||
简单谈谈贝叶斯方法
熊荣川
六盘水师范学院生物信息学实验室
http://blog.sciencenet.cn/u/Bearjazz
首先让我们来看看贝叶斯公式,引网络文献
http://blog.sciencenet.cn/home.php?mod=space&uid=508298&do=blog&id=571888
从上面的资料可以看出,已发生的事件往往是个结果事件,这个事件映射我们已经收集到的数据,例如现在这个时点上的分子序列。我们拿到这些分子序列构建系统发育树的过程说到底就是,倒推什么样的历史事件导致了今天的相关分子序列的相似与差别。例如哪些支系较早分化,那些支系较晚分化。假设导致这一变化过程由很多因子参与,例如碱基间的替代率、进化时间长短(支长)等等,因为同一序列(有时为一基因)上各个碱基由于功能的轻重受到了不同的选择压,其进化速率就有所不同,因此各个因子(在数学模型上称为参数)在各个碱基位置上的取值是相互独立而又在统计上呈一定的分布形态。也就是说这些参数的可能取值组合是一个全概率事件,最终它们的某种组合导致了观察到的结果——现在测出来(比对完毕)的分子序列集。因此,贝叶斯方法就是要在既定的结果基础上去反推以上参数的可能概率组合。其推断过程就是尝试各种参数的不同组合,将它们对应的拓扑结构评分(例如最大似然值或者最小),分值最优的参数集是一个后验概率集,之所以称为后验概率我想应该就是在既定结果下的概率的意思吧。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-7-18 03:26
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社