|
最近做些工作,需要将sRNA匹配到目的序列。曾经尝试过,自己使用perl写的脚本,由于数据量不大,倒也没有出现问题。这次不同,数据量比较大,我的PC机就出现了问题。速度慢,不可忍受(工作催的紧)。
首先想到的替代工具是SOAP,当然是因为其速度快。再就是因为我们所有的测序都是由他们完成,在结题报告中也看到他们用同样的工具做相同工作。没想到麻烦也是这么开始的。
首先按照要求,使用SOAPaligner_builder创建了自己的索引库,然后使用结题报告中的参数(大体就是要求完全匹配,并报告匹配的不同位置)。一开始提示我“Query File Error: Can't read”,通过google发现有人和我遇到了相同问题(博客),按照前人经验,更改参数顺序,问题仍旧存在,百思不得其解。后来检查文档,发现是我建库文档中fasta格式中,">"这一行内容太多,并且空格都是tab引起的不识别导致。
纠正了错误,继续。问题也继续“length y < 0,.."。忍不住向华大相关人员询问,实在是崩溃了。也发现好多人遇到同样问题。华大工作人员耐心的帮我解答,很是感激。在比对27nt以下reads时,soap2会出现类似报错信息,但不影响结果。但我的结果却是没有匹配,这分明是和自己数据对不上啊。不得以,使用blastn继续自己的工作,虽然慢...
求高手解答吧!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-26 07:09
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社