一文看懂火山图
2020-02-11 本文已影响0人
庄小尽
一文看懂火山图
- 火山图可用于展示两组样本间基因表达水平差异的分布状况。
- 横轴log2 fold change差异表达倍数(Fold Change值,简称FC,根据log2 fold change值的正负判断这些基因的表达量是上升了还是下降了),差异越大的基因分布X轴在两端。
- 纵坐标用-log10 p-value表示,对P值进行-log10的转化,-log10(p-value=0.05)约等于1.30,(-log10(0.01))=2,可知纵轴越往上走P值越小,而P值越小表示越显著。所以我们进行-log10(p -value)转化后,值越大就表示差异越显著。
- 当然,将横纵坐标换下解读是类似的。
接下来让我们看几张图
123.png结果解读
- 上图以|logFC|=0.606且p-value=0.05为截断标准。
- logFC>0.606且p-value<0.05定义为上调的基因,
- logFC<-0.606且p-value<0.05定义为上调的基因。
- 图中红色 的点表示上调的基因,蓝色 的点表示下调的基因,黑点 是无显著差异的基因。
- 两条红竖线外侧为差异表达倍数为2倍以上的基因。
- B1横线以上表示p-value<0.05,
- B2横线以上表示p-value<0.01。
- 区域1表示|FC|在2倍以内且p-value>0.05,区域2和区域3表示:|FC|>2倍且p-value<0.01的基因。
懂了基础的知识后,就去看看别人是如何描述的吧
案例一
1.1.png
顺便把他它翻译下:差异表达基因的火山图。Y坐标是|log2(fold change)|,X坐标是−log10(p值)。每个点代表一个基因。红点是显著表达上调的基因。绿点是显著表达下调的基因。黑点是无显著差异的基因。
案例二
下面让我们来看一个“正常一点”的火山图。它的的解读应该就比较简单了!
它在方法中的描述的是:
它的结果是:
这里有几个细节问题。
问题1:为什么火山图是对称的呢?
通过对logFC值的箱线图可以看出。
问题2:为什么对P值进行-log10的转化?
转换前后的火山图对比。交互式的火山图可以试试plotly包哦!
参考来源:
- Qiu C C, Su Q S, Zhu S Y, et al. Identification of Potential Biomarkers and Biological Pathways in Juvenile Dermatomyositis Based on miRNA-mRNA Network[J]. BioMed Research International, 2019, 2019.
- Lin X D, Wu Y P, Chen S H, et al. Identification of a five‐mRNA signature as a novel potential prognostic biomarker in pediatric Wilms tumor[J]. Molecular genetics & genomic medicine, 2019: e1032.
- 感谢jimmy老师在画图以及在处理代码过程中的指导,还有推荐了Rmarkdown这个神器。