yuebanzishi的个人博客分享 http://blog.sciencenet.cn/u/yuebanzishi

博文

ABI solid 5500 color space 测序格式文件处理

已有 3465 次阅读 2018-12-3 18:05 |系统分类:科研笔记


在网上下载的ABI平台测得 color space 格式的fastq。 bowtie1支持此种格式的alignment, 但是在用tophat2 调用bowtie1比对时,老是报错。 后来换了tophat v1.3.2 bowtie 0.12.7.0 才可以正常运行出结果。


在准备bowtie index 文件时需要 用 bowtie-build  -C  参数来生成针对color space格式的索引。


再用tophat时先利用  sra_to_solid  命令将fastq 文件稍微处理一下,就是除去fastq质量值那一行的第一个叹号。 sra_to_solid 1.fq >2.fq

然后运行tophat

tophat-1.3.2.Linux_x86_64/tophat -C -o . bowtie_colorspace_index/GRCH38  2.fq

后续就可以利用目前ILLUMINA 常用的软件进行后续分析了。


但是后续如果想用RSEM 来计算表达量,输入tophat生成的bam文件老是报错,RSEM currently does not support gapped alignments, sorry! 可能是在tophat上调用的bowtie参数和RSEM想要的不对应。


干脆直接用bowtie 进行比对: 注意:如果后续要用RSEM_calcuate_expression 计算表达量, bowtie要先对resm-prepare-reference 中生成的转录本序列建索引 。

然后在用 bowtie将reads比对到转录本序列上,而不是基因组序列上。

bowtie -C -S human_gencode.transcripts.fa test.fastq >test1.sam



https://blog.sciencenet.cn/blog-3204459-1149650.html

上一篇:没有root权限,如何更新/lib64/libstdc++.so.6 文件版本
下一篇:[转载]安装R包时设置国内镜像
收藏 IP: 222.66.117.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 09:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部