|||
本例示范操作如何应用我们开发的EasyCodeML软件进行Branch site model 分析
识别序列后,返回菜单栏选择“Sava or Convert Sequence Format”, 如下图所示:
文件类型选择为PAML,扩展为PML(如下图所示),保存后将扩展名改为nuc(当然这个非必须,不改也可以的)。
2. 标记前景枝
打开EasyCodeML,分别定义工作目录(即:程序在哪个文件夹中运行)、选择已比对的序列文件(即:前一步得到的比对文件)、选择树文件。
如果前景枝已经标记, 可以忽略下面这一步。
本示例数据的树文件未标记前景枝,这里演示一下如何用EasyCodeML可视化标记前景枝。
选择Newick的树文件后,点击“Label”标签(下图),程序会调用Chrome等插件来操作。
在待分析的分支上,点击一下,出现红色时,即表明前景枝已选定,此时只需要点击上方的“Finished”按钮完成前景枝标记。
Raindy注:可视化标记是我们这款EasyCodeML的亮点之一。
完成后前景枝标记后,返回程序时,树文件已自动变更为标记好的Tree文件。
此时可以开始后续操作,这里先选择Branch site model,然后“Save Current Profile”保存界面参数设置,最后“Run CodeML”分析,如下图所示:
在运行Codeml分析,程序会提示是否自动开始,“确定“之后就是细心的等待....
3. 似然率检验(LRTs)
程序运行的时间取决于所分析的数据和计算机硬件配置。当完成后,会弹出完成的提示框。
”确定“后,程序自动将LRTs结果显示在主界面上,这里主要看P值,必须低于0.05,如下图所示:
4.结果整理
当然,在LRT的P值显著情况下,您可以选择将运算结果以Excel 电子表格的形式呈现,相关参数直观显示在表格中。表格数据只需要简单整理即可用于发表用。
本示例结果显示,定义的前景枝中第100位氨基酸位点受到显著的正选择作用(后验概率PPs大于0.95)。
下图为部分SCI 文章的结果表格(红色虚线框内),详见原文:Lan T, Wang X R, Zeng Q Y. Structural and functional evolution of positively selected sites in pine glutathione S-transferase enzyme family. J Biol Chem, 2013, 288: 24441-24451.
注意事项: 为什么找到的正选择位点在原始比对序列中找不到?
答:最主要原因可能是比对序列中带有gap,codeml默认忽略gap所带的一列数据 ,从而导致位置发生偏移。因此,分析前最好将带gap的同一列序列全部手工删除,找到正选择位点的氨基酸位置后,再还原对应到原始比对序列上。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 15:40
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社