chen7qi的个人博客分享 http://blog.sciencenet.cn/u/chen7qi

博文

MEGA | 多序列比对及系统发育树的构建

已有 2501 次阅读 2022-1-26 14:39 |个人分类:生物信息|系统分类:科研笔记

图片

   MEGA是一个用于多序列比对和可视化、以及构建系统发育树的免费程序。自1993年发布以来,MEGA共更新9个版本 (没有第八、九版),今年发布的MEGA 11为处理更大的数据集进行了优化。

   之前我们介绍的DNAMAN和Jalview (后文附有链接)都可以用于多序列比对,MEGA有一些其它特点,本篇给大家做简单的介绍

软件下载

   可根据电脑系统选择下载,可支持Win、Mac和Linux系统。下载链接如下:https://www.megasoftware.net/

图片

   下载完成后全部默认安装即可。


基本操作

多序列比较
   下载安装好 MEGA 11 后,首先打开软件。

图片

   在 MEGA 11首页选择"ALIGN",点击 "Edit/Build Alignment" ,会弹出一个对话框,选择"Create a new alignment",根据需要比对的序列 (氨基酸序列或核苷酸序列),选择"DNA"或"Protein"。
图片
图片

图片

   

点击"Edit",选择"Insert Sequence From File"导入我们需要比对的序列,序列文件格式为.fasta格式。


图片


图片

   对目标序列进行多序列比较,可以使用ClustalW和MUSCLE,这里我们选择ClustalW,调整参数(一般用默认参数),即可完成多序列比对。

图片

   比较结果如图所示

图片

   最后点击"Data"选择"Save Session",保存序列比对的结果。

图片

系统发育树
   构建系统发育树时需要基于多序列比对结果进行加工,可以按照下述方法进行,也可以采用其他软件,再将其输出结果导入MEGA 11。
   我们基于上述结果继续操作,找到两端不对齐序列(红框),选中此段序列,点击鼠标右键,选择"Cut"。

图片


图片

   点击"Data",选择"Phylogenetic Analysis"进行系统发育分析。

图片

   返回主页面,点击"PHYLOGENY",构建系统发育树主要有三种方法,分别是最大似然法 (Maximum Likelihood)、邻接法 (Neighbor-Joining) 和最小进化法 (Minimum Evolution)。 

图片

   调整参数,选择自展值,即重复构建进化树以进行检验的次数,一般选择 1000 以上比较可靠。点击 OK 。即可完成系统发育树的构建。

图片

   可以用鼠标双击选中发育树,修改发育树中的文字。

图片

   点击"Copy to Clipboard"可保存为多种图片格式 (PDF、PNG、TIFF等),还可以选择"Copy to Clipboad",直接复制到word中进行图片编辑(wps不可以)。

图片

使用体验

   DNAMAN、Jalview和MEGA都可以做多序列比对,各有优劣。DNAMAN的优势在于序列比对的结果输出为矢量图,可以显示黑白图 (节省版面费),更方便调整序列的名称和前后顺序。Jalview比对方法和算法丰富,图形美观、颜色多样,还可以输出Sequence logo图。MEGA的序列比对图更加美观 (见仁见智),最大的优势在于更专业的进化分析。

图片


—   基本概念 —

外显子和基因组基本概念(一)
外显子和基因组基本概念(二)
  蛋白质生物学推介(一)
  蛋白质生物学推介(二)
  蛋白质生物学推介(三)
  蛋白质生物学推介(四)
  蛋白质生物学推介(五)

—   文献解读  —

一个家系突变分析一篇 SCI | 文章解析
全基因组测序有助于诊断更多的罕见病
整合基因组学和蛋白质结构的致病机制分析
JMG | 基因PRKG2的变异导致骨骼表型异常
JGG | LRP6变异与渗出性玻璃体视网膜病变
    基因突变与脑瘫风险(Nature Genetic,2020)
全外显子测序显示COQ8B基因新的纯合突变与肾病综合征有关
IF>10 家系研究 | OGDHL变异导致神经发育谱系疾病,表现为癫痫、听力与视力障碍等

—   数据库  —

ClinVar数据库详解

AlphaFold数据库简介
gnomAD数据库简介(一)
gnomAD数据库简介(二)
国际千人基因组计划数据库(一)
国际千人基因组计划数据库(二)

    在线人类孟德尔遗传 (OMIM)数据库简介


—   期刊  —

人类遗传学领域期刊速览
AJHG | 人类遗传学领域一流期刊

国产好刊 | 中科院遗传学一区JGG


—   分析技术  —

Sanger测序拼‍接
BAM文件格式解读
Trim Galore软件详解
346个基因组可视化工具一网打进!
基因组浏览器IGV的安装和图形解读
利用IGV可视化基因组遗传变异位点

Jalview多序列比对图中显示序列标识

蛋白质二级结构、结构域及蛋白修饰预测
多序列比对软件Jalview的安装及使用体验
正常与突变蛋白三维结构模型的绘制与分析
分子结构模拟工具UCSF Chimera安装及操作


—   分析平台  —

Linux操作系统结构及常用命令

服务器 | 查看操作系统重启日志

设置RStudio-Server不频繁掉线

RStudio-Server安装和内网穿透要点

Linux服务器的磁盘概念与相关操作 (一)

Linux服务器的磁盘概念与相关操作 (二)


—   理论与技术培训  —

临床基因组家系数据分析实战,快速发表SCI文章

转录组分析和可视化的正确姿势你知道了吗?


—   遗传咨询  —

遗传性肾脏病的基因检测


—   政策法规  —

雇人代写论文是否犯法?

中华人民共和国人类遗传资源管理条例


—  Tales of Genetics  —

巴黎保姆

60亿人,60亿组碱基对

一个突变基因保护了欧洲人祖先

高中学历父亲自学基因编辑,看五六百篇论文,自制药用级化合物救治罕见病儿子!

欢迎咨询全固态大型云服务器租用
1周内完成家系变异生信分析,尽快推进下游分析
更适合家系全外显子组
图片
图片




https://blog.sciencenet.cn/blog-118204-1322764.html

上一篇:一文掌握GSEA通路富集分析,超详细教程!
下一篇:这个转录组比对工具很快,十几分钟一个样品

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2022-7-3 08:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部