Rna-seq

转录组原理、分析步骤介绍

2020-07-09  本文已影响0人  嗒嘀嗒嗒嘀嗒嘀嘀

基因课FTP地址:ftp://http://gsx.genek.tv/2020-3-10%E7%9B%B4%E6%92%AD%E4%B8%80%E4%B8%AA%E5%AE%8C%E6%95%B4%E7%9A%84%E8%BD%AC%E5%BD%95%E7%BB%84%E9%A1%B9%E7%9B%AE/
听张旭东老师的课

转录组原理

转录组分析步骤

-1 比对 把各个样本的fastq格式的reads比对到基因组序列上, 得到一个bam格式的文件(sample.bam)

-2 定量 数每个基因上落了几条reads,需要将基因结构画在染色体上 → 基因表达量(表格),又称 原始的reads count 矩阵
以上为转录组标准分析
(非模式物种的可变剪接、融合基因分析不值当)

g/S Sample1 Sample2 Sample3
gene1 38 55 76
gene2 127 41 86
gene3 46 29 34
... ... ... ...

stringtie 用于做转录组拼接,需要证明自己的拼接靠谱,一般不用,除非证明拼接靠谱,已经发表并被广泛认可

-3 原始reads count矩阵标准化(细节见转录组原理篇课程)
RPKM(PE)/FPKM(SE) (该方法是错的,但得出的结论基本上是对的)
TPM (对的)
(重复序列处理方式:可以匹配到多个位置。uniq, EM算法,自动用贝叶斯算一个概率)

上一篇 下一篇

猜你喜欢

热点阅读