转录组分析2——比对基因组
2020-05-01 本文已影响0人
猪莎爱学习
莎莎写于2020.5.1
学校第一批返校的同学已经解封了,我还在宾馆隔离
我今天在这里立个Flag:每天都要写简书✍
哈哈哈,可能不太现实,但是至少今天是新的一个月的开始
要好好学习!!!
好啦,今天学习比对到参考基因组,我们拿到经过剪切reads的数据之后,就需要比对到参考基因组,这里学习两个软件:hisat2和subjunc
![](https://img.haomeiwen.com/i3715373/cfa24276a36642a7.png)
![](https://img.haomeiwen.com/i3715373/b2c93cf0a2fbef3a.png)
![](https://img.haomeiwen.com/i3715373/c599ea223ba304d9.png)
首先需要构建基因组索引,
① 官网构建好的索引地址:ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/
官网上有的最好下载使用
![](https://img.haomeiwen.com/i3715373/742bfacb937c58b6.png)
② 可以通过hisat2-build构建基因组索引
![](https://img.haomeiwen.com/i3715373/ab485246e7b4888b.png)
索引构建好之后就可以进行转录组数据的比对
(1)Hisat2
Hisat2:graph-based alignment of next generation sequencing reads to a population of genomes
Hisat2主要是用来进行转录组数据的比对。
使用--help查看选项和参数。
image.png
使用hisat2将reads比对到参考基因组
![](https://img.haomeiwen.com/i3715373/51b5c5eaa93bfdeb.png)
![](https://img.haomeiwen.com/i3715373/7c62618df894d4be.png)
![](https://img.haomeiwen.com/i3715373/95215f1b57dd89bc.png)
下面是批量比对:
hisat2批处理脚本内容:
![](https://img.haomeiwen.com/i3715373/113fd95152361c34.png)
![](https://img.haomeiwen.com/i3715373/e2f4ec1323991f78.png)
MultiQC整理hisat2结果:
![](https://img.haomeiwen.com/i3715373/34350f46cff7e566.png)
![](https://img.haomeiwen.com/i3715373/415a68051b2221ba.png)
(2)Subjunc:http://subread.sourceforge.net/
![](https://img.haomeiwen.com/i3715373/47e5fb34df51219e.png)
第一步依然是构建基因组索引
![](https://img.haomeiwen.com/i3715373/bdc885ba0deffafb.png)
![](https://img.haomeiwen.com/i3715373/c4bb9fe337ac384b.png)
![](https://img.haomeiwen.com/i3715373/fb9579bf6c6eed7d.png)
第2步是使用subjunc将reads比对到参考基因组
subjunc命令运行示例:
image.png
下面是sunbjunc批量比对所有样本:
subjunc批处理脚本内容
和Hisat2是一样的
最后是用flagstat检查比对失败reads
![](https://img.haomeiwen.com/i3715373/a79e48343b836dc2.png)