RNA-seq收入即学习转录组专题

转录组分析2——比对基因组

2020-05-01  本文已影响0人  猪莎爱学习

莎莎写于2020.5.1
学校第一批返校的同学已经解封了,我还在宾馆隔离
我今天在这里立个Flag:每天都要写简书✍
哈哈哈,可能不太现实,但是至少今天是新的一个月的开始
要好好学习!!!


好啦,今天学习比对到参考基因组,我们拿到经过剪切reads的数据之后,就需要比对到参考基因组,这里学习两个软件:hisat2和subjunc

分析流程
比对
image.png

首先需要构建基因组索引,

① 官网构建好的索引地址:ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/
官网上有的最好下载使用

image.png

② 可以通过hisat2-build构建基因组索引


image.png

索引构建好之后就可以进行转录组数据的比对

(1)Hisat2

Hisat2:graph-based alignment of next generation sequencing reads to a population of genomes
Hisat2主要是用来进行转录组数据的比对。
使用--help查看选项和参数。

image.png
使用hisat2将reads比对到参考基因组
image.png
image.png
image.png

下面是批量比对:

hisat2批处理脚本内容:

需要两个输入文件:索引文件和fastq文件
image.png

MultiQC整理hisat2结果:

image.png
image.png

(2)Subjunc:http://subread.sourceforge.net/

subjunc是subread里面的一个软件包
第一步依然是构建基因组索引
索引文件有5.8G
image.png
image.png
第2步是使用subjunc将reads比对到参考基因组

subjunc命令运行示例:


image.png

下面是sunbjunc批量比对所有样本:

subjunc批处理脚本内容


和Hisat2是一样的

最后是用flagstat检查比对失败reads

image.png
上一篇 下一篇

猜你喜欢

热点阅读