Scater package 中的exprs的纠结

2017-10-21  本文已影响0人  普鲁卡果

scater package应该是目前单细胞数据QC功能最为齐全强大的包了,然而在对数据集进行转换后,总会出现exprs 这一项,关于exprs value值的计算过程真是让我纠结了好久,下面贴出R Documentation中关于exprs转换的具体过程:

即当提供的原始数据集中有TPM或FPKM时,exprs=log2(TPM/FPKM+1),其他的情况(只有counts/CPM时),exprs=log2(CPM+1).

真是信了这个Documentation 和scater vingette 的邪,

当我去对照自己的数据后,发现:仅有counts值时,exprs ≠log2(CPM+1)

多处查询无果,Google也没出来解答,最后竟然在bioconductor 下的bug reports发现惊喜:

第一句话真是让我怀疑狗生(ノへ ̄、)

之后又去了作者的github答疑板块进行确认,发现在仅有counts的文件时,返回的exprs确实是log-(normalized)count values.

但目前对于normalized这一步的具体原理我还不是很清楚。

Tips:不要忽略bioconductor de bug reports 功能,毕竟你遇到的问题别人很可能都遇到过,与其在google中盲目搜索,不如这个网站更有针对性的回答来的更高效;

R 中很多包的功能很复合,一句话中数据可能做了多种处理转换,务必尝试尽量理解每一步的作用,原理。


上一篇下一篇

猜你喜欢

热点阅读