走进转录组NGS避坑指南

转录组分析中的技术重复或生物学重复检查

2019-04-12  本文已影响159人  多啦A梦的时光机_648d

一: 首先准备两个文件:

1. 基因表达的counts.matrix 文件(即上一步生成的isoforms.counts.matrix 与genes.counts.matrix )

2. 生物学重复的表文件

记住samples.txt中的名字需要和matrix中的名字一致,否则没办法识别。

二: 调用PtR脚本

$PtR  #调用PtR脚本

--matrix isoforms.counts.matrix  #指定给定的matrix

 --samples samples.txt  #样品重复信息

 --log2  #做一个对数处理

 --min_rowSums 10  #过滤数据指标

 --compare_replicates  #输出的图像参数

同理做genes.counts.matrix,最终会生成许多pdf文件。

最后结果就是关于一个处理中生物学重复之间的相关性的几个图,放在一个PDF上的.

几个图的意思还没大懂,请指教!

三:下面进行跨样本间的相关性检测与作图

$PtR

--matrix isoforms.counts.matrix \

--min_rowSums 10 \ 

--samples samples.txt \ 

--log2 \ #数据转换参数 

--CPM \ #数据转换参数 

--sample_cor_matrix #输出样品相关性矩阵图

这个代码做出来的结果是不同样本间的数据一致性热图

四:最后一个结果是通过PCA分析对样品重复关系进行检测。

$PtR

--matrix isoform.counts.matrix \

--samples samples.txt \

--log2 \

--min_rowSums 10 \

--CPM \

--center_rows \

--prin_comp 3

输出结果为PCA分析图 (pdf)

同理做genes.counts.matrix。

到此结束!

欢迎交流,909474045@qq.com

上一篇 下一篇

猜你喜欢

热点阅读