生信相关生信技巧R

重复之间的相关性分析

2019-06-01  本文已影响23人  e3617f9991e1

六一放假!!!...不可能的。

在实验时,我们总说到要做重复。我理解的就是重复目的是为了消除实验的技术因素带来的误差。
技术重复的对象为同一来源的样品,生物学重复的对象为不同来源但同类的样品。所以平时所做的同一组织器官的样品不同次的实验,我就觉得应该是技术重复。重复之间就要探究其相关性。
相关性的描述自然是要用到相关系数。记录了下自己chip-seq重复之间的相关性分析,和RNA-seq相关性分析,主要是分析加作图。
chip-seq做相关性分析的方法肯定要说deeptools ,这个简直是可视化的利器!不仅仅是做相关性。一应俱全...
https://deeptools.readthedocs.io/en/develop/
RNA-seq我们可以利用fpkm、read-count 来做相关性的分析,那chip-seq肯定就没有这样的数据了。所以,deeptools用了一种方法,将基因组划分为等长的bin,也就是参数里面的binsize,通过计算这个bin的覆盖度,来计算样本之间的相关性。
安装好了,就可以使用里面的命令了。
先计算覆盖度(里面的参数可以修改,甚至还可以只做某一条染色体的):

deepTools2.0/bin/multiBamSummary bins \
--bamfiles rep1.bam rep2.bam \
--binsize    num  \  #选择这个bin的大小,看基因组多大,我觉得玉米选10000bp还行
-p num \ #线程数
-o result.npz \

然后是画图,可以画成热图,可以画成散点图。

plotCorrelation  -in ./MS12_results.npz --corMethod pearson  \
--skipZeros --plotTitle "Pearson Correlation  " \
--whatToPlot scatterplot --xRange 0 10000 \
--yRange 0 10000  --labels MS_rep1 MS_rep2 \
-o ./result.pdf 
自己画的.png 别人画的.png

热图的画法就是whatToPlot改改就行.
RNA-seq相关性分析就是用read-count 或者fpkm都行的。可以做成热图,散点图都行。我用的read-count的矩阵。直接就输入就行

library(corrplot)
data <- read.table("test1.txt",header =T)
cor_matrix <- cor(data)
corrplot(cor_matrix, method = "color") #还可以加很多参数

参数解释:https://blog.csdn.net/lalaxumelala/article/details/86084040
然后画出了这样的图....不说了...

image.png

直接基于fpkm,plot直接画散点图,我觉得也不好看。


image.png

ok,程序应该跑完了。

上一篇 下一篇

猜你喜欢

热点阅读