|||
PacBio最近有不俗的表现,发了些好文章,股价也节节攀升。
作为生物信息学工作者,咱就关注一下PacBio的数据是如何组装的。做些知识储备。
这里有组装策略的总结:
主要有四种:1)PacBio-only, 2) Hybrid, 3) Gap filling, 和 4) scaffolding。
这主要取决于PacBio 数据的覆盖率。 Hybrid的中庸之道应该是不错的选择。
这里有更多的工具供选择:
https://github.com/PacificBiosciences/DevNet/wiki/Compatible-Software
这里是关于Hybrid 方法的更多介绍
http://wgs-assembler.sourceforge.net/wiki/index.php?title=PBcR
理想:
用多种方法,得到多个版本,比较出最好的版本。
现实:
有的方法对内存要求较高,有的运行较慢。
理想怎样照进现实:
模仿。 菠萝基因组的分析是一个不错的例子。
http://www.nature.com/ng/journal/v47/n12/full/ng.3435.html
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 16:33
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社