【包】arrayQualityMetrics
该包仅用一个函数生成一个对芯片数据库进行质量评价的HTML文件
主要支持Affymetrix、Illumina芯片,其他芯片可以转换为one or two colour array使用
函数适用于ExpressionSet, NChannelSet, AffyBatch类数据对象
1、使用在raw array上
可以反应芯片技术的质量
以下代码使用的是ALLMLL包中的MLL.A示例数据,为AffyBatch类
读者可以使用affy包中的ReadAffy方法从CEL文件中读取出该类对象
library(“ALLMLL”)
data(“”MLL.A)
arrayQualityMetrics(
expressionset = MLL.A[,1:5],
outdir = “report_for_MLL.A”,
force = T,
do.logtransform = T
)
outdir是输出文件路径
force为T会强制覆盖重名文件
do.logtransform为T会对intensity进行对数转换
2、使用在preprocessed array上
主要用以挑选后续使用的array
preprpcessed包括的流程有:background corrected (干扰校正)、whthin array normalised (芯片内部同质化)、summarised(基因映射)
以下代码使用的是rma方法(单函数对raw array进行综合处理),获得ExpressionSet类对象
nMLL <-rma(MLL.A)
arrayQualityMetrics(
expressionset = nMLL,
outdir = “report_for_nMLL”,
force = T
#不需要进行do.logtransform,因为rma会进行该处理
)
3、其他类
illumina data使用beadarray包产生的数据读入ExpressionSetIllumina类;
one colour array读入ExpressionSet类;
two colour array使用limma包读入RGList或MAList类,调用arrayQualityMetrics时,会自动转换为NChannelSet类;
总之,就是想办法读入ExpressionSet, NChannelSet, AffyBatch类
4、提供更多信息
可以在不改变质量评价的情况下,结合对象的phenoData slot中的factor数据进行分析。
以下手动添加了两个因子后进行分析
pData(nMLL)$condition = rep(letters[1:4],times = 5)
pData(nMLL)$batch = rep(paste(1:4),each = 5)
arrayQualityMetrics(
expressionset = nMLL,
outdir = “report_for_nMLL_with_factors”,
force = T,
intgroup = c(“condition”,”batch”)
)
5、扩展质量分析
5.1 添加基因的坐标:AffyBatch和BeadLevelList不用处理,其他要添加“X”和“Y”列到featureData slot;
featureData(nCCl4)$X<-featureData(nCCl4)$Row
featureData(nCCl4)$Y<-featureData(nCCl4)$Column
5.2 分析identifiers是否匹配特定要求返回T or F:在featureData中添加一列hasTarget;
featureData(nCCl4)$hasTarget = (regexpr(“^NM”, featureData(nCCl4)$Name)> 0)
#table(featureData(nCCl4)$hasTarget)可显示结果
5.3 将RNA芯片数据质量设置为因子丰富报告:将数据中的权重转换为因子搐存在pData中(见第4部分),然后调用intgroup参数。
本文主要参考arrayQualityMetrics包的参考文件,具体细节请阅读原文件
https://www.bioconductor.org/packages/release/bioc/vignettes/arrayQualityMetrics/inst/doc/arrayQualityMetrics.pdf