生物信息学与算法生信分析流程NGS

转录组入门学习(五)

2018-01-13  本文已影响639人  杨亮_SAAS

表达定量

1. 处理原始比对文件
2. STAR + RSEM (先比对,再定量,耗时长)
3. STAR + HTSeq (先比对,再定量,耗时长)
#htseq-count
htseq-count -r pos -m union -f bam -s no \
-q 03align_out/sample2Aligned.sortedByCoord.out.bam > 05htseq_out/sample2.htseq.out
4. Kallisto (free-alignment) (只定量,不比对)
5. STAR + RSEM 实例演示
# rsem prepare reference:建立参照基因组
rsem-prepare-reference --gtf 00ref/Araport11_GFF3_genes_transposons.201606.gtf \
00ref/TAIR10_Chr.all.fasta \
arab_RSEM/arab_rsem
rsem-calculate-expression --paired-end --no-bam-output \
--alignments -p 5 \
-q 03align_out/sample2Aligned.toTranscriptome.out.bam \
arab_RSEM/arab_rsem \
04rsem_out/sample2_rsem
6. Kallisto 演示
mkdir arab_kallisto
cd arab_kallisto
kallisto index -i arab_kallisto ../arab_RSEM/arab_rsem.transcripts.fa 
kallisto运行结果:产生了54.4 million 个k-mer
#定量:quant: 定量模式;-i:index文件;-o:输出文件
kallisto quant -i arab_kallisto/arab_kallisto -o 05kallisto_out/sample2 \
02clean_data/sample2_paired_clean_R1.fastq.gz 02clean_data/sample2_paired_clean_R2.fastq.gz  #输入文件,即原始数据,不需bam格式
运行结果
上一篇 下一篇

猜你喜欢

热点阅读