ljxue的个人博客分享 http://blog.sciencenet.cn/u/ljxue Liangjiao Xue, Bioinformatics is my favorite.

博文

第三代测序的组装方法(PacBio)

已有 6903 次阅读 2015-12-12 12:14 |个人分类:Bioinformatics|系统分类:科研笔记| 组装, PacBio

PacBio最近有不俗的表现,发了些好文章,股价也节节攀升。

作为生物信息学工作者,咱就关注一下PacBio的数据是如何组装的。做些知识储备。


这里有组装策略的总结:

https://github.com/PacificBiosciences/Bioinformatics-Training/wiki/Large-Genome-Assembly-with-PacBio-Long-Reads

主要有四种:1)PacBio-only, 2) Hybrid, 3) Gap filling, 和 4) scaffolding。

这主要取决于PacBio 数据的覆盖率。 Hybrid的中庸之道应该是不错的选择。


这里有更多的工具供选择:

https://github.com/PacificBiosciences/DevNet/wiki/Compatible-Software

 

这里是关于Hybrid 方法的更多介绍

http://wgs-assembler.sourceforge.net/wiki/index.php?title=PBcR


理想:

用多种方法,得到多个版本,比较出最好的版本。


现实:

有的方法对内存要求较高,有的运行较慢。


理想怎样照进现实:

模仿。 菠萝基因组的分析是一个不错的例子。

http://www.nature.com/ng/journal/v47/n12/full/ng.3435.html



 

 



https://blog.sciencenet.cn/blog-285393-942853.html

上一篇:半个世纪的拟南芥研究
下一篇:How to covert snp file from MUMmer into VCF format
收藏 IP: 128.192.8.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-23 14:39

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部