走进转录组

RNA-seq

2021-01-25  本文已影响0人  没有眼镜

可以帮助我们了解,各种比较条件下,所有基因的表达情况的差异。
应用:正常组织/肿瘤组织;治疗前/治疗后;不同发育阶段;不同组织之间等。
检测范围:mRNA表达量;mRNA的可变剪接;融合基因;SNP

测序方法

建库(illumina公司的Truseq RNA建库)
正常抽提到的总RNA有95%是rRNA,只有2-3%是mRNA。
文库质量要求:mRNA要完整。建议先对总RNA进行一次电泳质检,并进行打分。
RIN值(RNA Integrity Number)范围为0-10分,建议使用8.0以上的样本进行检测。

RNA质检
建库流程
建库流程
  1. 带Poly(T)探针的磁珠与总RNA进行杂交,吸附其中的带Poly(A)尾巴的mRNA,回收磁珠,把带Poly(A)的mRNA从磁珠上洗脱下来
  2. 把洗脱下来的mRNA用Mg2+溶液进行处理,把mRNA打断
  3. 被打断的mRNA片段用随机引物进行逆转录,形成第一链cDNA
  4. 合成第二链,形成双链cDNA
  5. 在cDNA的3'端加上A碱基
  6. 在双链cDNA的两端接上Y形接头
  7. 经过PCR扩增,成为可以上机的文库

生信分析

判断标本质量

先把测到的RNA片段mapping到基因组上,检查一下多少片段在3'端位置,多少在5'端位置,来判断mRNA是否完整。


mRNA完整时,图形趋于饱满
mRNA有一定程度降解,5'端比3'端低
mRNA表达量差异分析

RPKM(Reads Per Kilobase of exon model per Million mapped reads)

RPKM公式
1. 火山图
火山图——两个样本的RNA表达量的对比
横轴:某个基因的表达量是上升(→)还是下降(←)。
纵轴:差异的置信程度。红:置信程度较高;蓝:置信程度较低。
每个点:两个样本当中同一个基因的mRNA表达量的变化
左图差异大于右图

2. 聚类分析
通过多个样本的全基因表达谱对比,来找到他们之间的相似性和相近关系。

横轴样本,纵轴基因
应用:分析疾病亚型;探索新的Biomarker。

3. GO分析(Gene Ontology)
Gene Ontology:国际化的基因功能分类体系。主要描述三个属性:参与的生物过程;基因产物的功能;基因产物在细胞器内的空间定位。

差异基因GO富集柱状图
显示在生物过程、细胞组分、分子功能富集的差异基因的个数分布情况。
有向无环图
从上到下,它所定义的功能范围越来越小,越来越精准。分支表示包含关系,颜色越深表示富集关系程度越高。

4. 通路分析
通路(Pathway)是指在系统水平上完成生物的某一功能的基本单元或者局部子网络。
KEGG(Kyoto Encyclopedia of Genes and Genomes)(基因功能数据库)

散点图
衡量指标:Rich factor、Q value、富集到此通路上的基因个数。点的面积越大,富集的基因数越多;富集因子越大,富集程度越大;Qvalue越接近0,富集程度越显著。
RNA的结构变异分析

需要测序深度较深,建议10G以上数据量。

  1. 可变剪接
  2. 融合基因


    一个癌细胞中的融合基因示意图
    融合基因交接点
  3. 点突变
    表示点突变的泡泡图
    Frequency越高,泡泡越大,逆时针排列。

以上内容均源于网络视频《陈巍学基因——视频7:RNA-seq》

上一篇 下一篇

猜你喜欢

热点阅读