转录组分析中的技术重复或生物学重复检查
一: 首先准备两个文件:
1. 基因表达的counts.matrix 文件(即上一步生成的isoforms.counts.matrix 与genes.counts.matrix )
data:image/s3,"s3://crabby-images/996b4/996b4a91bc03494b0711bbc683a5f46ce2b42b7e" alt=""
2. 生物学重复的表文件
data:image/s3,"s3://crabby-images/93f6c/93f6c429d320c8ed905312a8a2c851c97b12763c" alt=""
记住samples.txt中的名字需要和matrix中的名字一致,否则没办法识别。
二: 调用PtR脚本
$PtR #调用PtR脚本
--matrix isoforms.counts.matrix #指定给定的matrix
--samples samples.txt #样品重复信息
--log2 #做一个对数处理
--min_rowSums 10 #过滤数据指标
--compare_replicates #输出的图像参数
同理做genes.counts.matrix,最终会生成许多pdf文件。
data:image/s3,"s3://crabby-images/dd3cd/dd3cd58bddee3f70602e172a08ac0784e27fea3f" alt=""
最后结果就是关于一个处理中生物学重复之间的相关性的几个图,放在一个PDF上的.
data:image/s3,"s3://crabby-images/7191d/7191dc9e132ecafabec86807b903c1ae20e53e7b" alt=""
data:image/s3,"s3://crabby-images/daffd/daffd6338272d708f7cdf4a723df04c576778d68" alt=""
data:image/s3,"s3://crabby-images/d0993/d099331ab9ed060dd493473aed4d5d50e002f1a3" alt=""
data:image/s3,"s3://crabby-images/69b9e/69b9e48be9991228417fad670ec2a33e8dc86e4e" alt=""
几个图的意思还没大懂,请指教!
三:下面进行跨样本间的相关性检测与作图
$PtR
--matrix isoforms.counts.matrix \
--min_rowSums 10 \
--samples samples.txt \
--log2 \ #数据转换参数
--CPM \ #数据转换参数
--sample_cor_matrix #输出样品相关性矩阵图
这个代码做出来的结果是不同样本间的数据一致性热图
data:image/s3,"s3://crabby-images/f3148/f314854312fe2f769b02fb3b946a3f59f0599434" alt=""
四:最后一个结果是通过PCA分析对样品重复关系进行检测。
$PtR
--matrix isoform.counts.matrix \
--samples samples.txt \
--log2 \
--min_rowSums 10 \
--CPM \
--center_rows \
--prin_comp 3
输出结果为PCA分析图 (pdf)
data:image/s3,"s3://crabby-images/d459f/d459fe154eeb1e5155203c60b924e42c09e668ab" alt=""
data:image/s3,"s3://crabby-images/730b6/730b642c3b06f2e9a438ff6aee5d08f65299077d" alt=""
同理做genes.counts.matrix。
到此结束!
欢迎交流,909474045@qq.com