||
随着用于分子系统发育推断数据量的增大,尤其是基于基因组和转录组的大数据时代的来临,越来越多研究者面临计算周期延长的挑战,因此人们提出了一些通过并行计算进行加速的解决方案。其中最典型的要数基于多CPU的解决方案,这种解决方案出现的时间最早、最成熟,目前也都受主流系统发育重建软件的支持。不过其局限性也比较明显,例如使用的灵活性、能源消耗率、对后验概率算法的加速效果等。基于这些考虑,我们设想,能否基于Nvidia显卡的GPU硬件、在CUDA计算环境下,实现在单机上对MrBayes的加速?在南开大学计算机与控制工程学院刘晓光和王刚教授研究组的努力下,这一设想得到了比较好的实现。
在2011年实现的对于核酸数据的加速水平为15-20倍的样子,矩阵越大加速比越高,最高可达40倍以上[1]。这意味着原先需要2-3个星期的计算可以被缩短到1天之内。
在2013年,对于核酸数据数据的加速比被提高到63-170倍,这意味着原先需要9个星期的计算可以被缩短到1天之内[2]。
在2015年,实现了对于蛋白质数据的加速[3]。
目前,对于MrBayes中形态和二级结构等其它数据的加速改造没有进行过尝试,由于这方面的数据量增长潜力不大,对适用于这些数据进行加速改造的意义不大。此外,目前对于核酸-蛋白质混合数据的加速改造尚未实现,还需要更多尝试和努力。
参考文献
[1]Zhou J-F, *Liu X-G, Stones DS, Xie Q, Wang G. 2011. MrBayes on a Graphics Processing Unit. Bioinformatics 27: 1255-1261. http://bioinformatics.oxfordjournals.org/content/27/9/1255.full.pdf+html
[2]Bao J, Xia H, Zhou J-F, *Liu X, *Wang G. 2013. Efficient Implementation of MrBayes on Multi-GPU. Mol. Biol. Evol. 30: 1471-1479.
http://mbe.oxfordjournals.org/content/30/6/1471.full.pdf+html
[3]Pang S, Stones RJ, *Ren MM, Liu XG, Wang G, Xia HJ, Wu HY, Liu Y, Xie Q. 2015. GPU MrBayes V3.1: MrBayes on Graphics Processing Units for Protein Sequence Data. Mol. Biol. Evol. doi: 10.1093/molbev/msv129, http://mbe.oxfordjournals.org/content/early/2015/05/25/molbev.msv129.abstract?papetoc
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-14 06:34
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社