||
虽然分子系统发育的数据分析流程在几乎所有环节都已经实现量化、自动化,但是从现代自然科学的研究传统来看,目前的分子系统发育研究还存在2个普遍问题,一个是缺少分子生物学中已经长期例行使用的单因素对照分析,另一个是对多证据一致指向的重视。
1.分子系统发育的数据集涉及代表类群和分子标记两个方面,类群选取、序列比对、基因筛选、位点筛选、数据类型、算法选择、模型选择等都有可能影响系统发育重建的结果。目前的系统发育研究中,虽然已经时常可以见到涉及基因筛选、数据类型、模型选择的内容,但是针对单因素的对照分析依然普遍缺乏,这不利于分类学家基于各个案例更为明确地探讨影响系统发育的因素来源。
2.破案时的嫌疑人可能有多个,每个嫌疑人可能都有值得怀疑的证据支持,但是能够凭多个互相独立的证据形成证据链条指向的嫌疑人才最有可能是罪犯。类似地,不同的系统发育拓扑结构之间也是竞争性假设的关系,要判断整个拓扑结构或其中的某一个节点的可靠性,也应该有互相独立证据的一致指向。目前,分子系统发育研究在论证结果可靠性的时候还是主要依靠不同算法的节点支持率的高低。从本质上说,不同算法结果的一致指向是不足以构成多证据的一致指向的。因为如果不同算法所基于的是同一个数据集的话,那么一致的指向应该是代表着不同算法都能体现数据集所含的系统发育信号,不一致的话那应该是由于数据集信号不够强以及方法的偏向性造成的。也就是说,要从数据集之外寻找证据,才能算是多证据。可能的多证据来源包括(第五第六不算是直接证据):
第一,不同分子标记的一致指向。这类证据在某些案例中可以获得,但是对于高级阶元系统发育的问题往往不易得到。在基因组数据水平,还提出了更多挑战。
第二,形态学方面的衍征。
第三,分子结构水平的衍征。
第四,生理生化等其它方面的衍征。
第五,作为不很直接的证据,可以使用consel检验。
第六,作为旁证,可以调整类群选取方案,观察结果的稳健性。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-14 06:34
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社