转录组直播课学习:第四天

2020-04-01  本文已影响0人  焱黎

转录组原理介绍
首先先来解决一下有的参考基因组序列在打开时由于每行碱基太多了,所以要修改一下,利用FASTX-Toolkit工具的fasta_formatter命令, 先利用conda search fastx 搜索可用的软件,然后利用conda install fastx_toolkit安装该软件。然后使用命令:fasta_formatter -i genome.fa -o genome_format.fa -w 70(-i:输入文件。-o:输出文件。-w:设置每行碱基数数目。)

第一步:比对(Spliced alignment)

输入文件:测序数据(sample.fastq)、基因组序列(genome.fasta)
输出文件:比对结果(sample.bam)

第二步:表达定量(Quantification)

输入文件:比对结果(sample.bam)、基因注释文件(genes.gtf)
输出文件:表达量(sample.count)

本节课后需要练习hisat2、samtools软件的使用方法

上一篇 下一篇

猜你喜欢

热点阅读