【RNA-seq自学07】数据分析之表达定量RSEM Kalli
RSEM
RSEM是对基因进行表达定量的一个软件,是基于STAR序列对比的基础之上进行的。而kallisto不需要进行比对可以直接定量。
安装
conda install rsem
安装RSEM时,solving enviorment一直不动,更新conda【conda upgrade --all】并且【conda config --set channel_priority flexible】设置channel
1. prepare-reference
rsem-prepare-reference \ #从参考基因组中提取原始准备文件
--gtf 00ref/Araport11_GFF3_genes_transposons.201606.gtf \ #注释信息
00ref/TAIR10_Chr.all.fasta \ #参考基因组文件
arab_RSEM/arab_rsem
2. calculate-expression
rsem-calculate-expression \
--paired-end \ #双向测序
--no-bam-output \ #不需要输出bam结果
--alignments -p 5 -q 03align_out/sample2_Aligned.toTranscriptome.out.bam \
arab_RSEM/arab_rsem \ #索引位置
04rsem_out/sample2_rsem #输出位置
结果
完成输出了结果文件,其中,rsem.genes.results和rsem.isoforms.results分别表示gene水平和转录本水平的定量结果。
rsem.genes.results rsem.isoforms.resultsKallisto
安装
conda install kallisto
1、构建索引
kallisto index -i arab_kallisto arab_RSEM/arab_rsem.transcripts.fa
2、进行定量
kallisto quant -i arab_kallisto -o 05kallisto_out/sample2 \
02clean_data/output_forward_paired.fq.gz 02clean_data/output_reverse_paired.fq.gz
quant-count模式
-i 索引 arab_kallisto 目录
-o 输出 05kallisto_out/sample2 目录
3、结果
运行程序输出三个结果,abundance.h5 abundance. tsv run_ info. json其中abundance. tsv文件可读,显示表达定量的结果值。
abundance. tsv参考:https://www.jianshu.com/p/3e96d0f8fe71
https://www.jianshu.com/p/ad605d4fa6f6