【包】arrayQualityMetrics

2021-08-06  本文已影响0人  JamesMori

该包仅用一个函数生成一个对芯片数据库进行质量评价的HTML文件
主要支持Affymetrix、Illumina芯片,其他芯片可以转换为one or two colour array使用
函数适用于ExpressionSet, NChannelSet, AffyBatch类数据对象

1、使用在raw array上

可以反应芯片技术的质量
以下代码使用的是ALLMLL包中的MLL.A示例数据,为AffyBatch类
读者可以使用affy包中的ReadAffy方法从CEL文件中读取出该类对象

library(“ALLMLL”)
data(“”MLL.A)
arrayQualityMetrics(
  expressionset = MLL.A[,1:5],
  outdir = “report_for_MLL.A”,
  force = T,
  do.logtransform = T
)

outdir是输出文件路径
force为T会强制覆盖重名文件
do.logtransform为T会对intensity进行对数转换

2、使用在preprocessed array上

主要用以挑选后续使用的array
preprpcessed包括的流程有:background corrected (干扰校正)、whthin array normalised (芯片内部同质化)、summarised(基因映射)
以下代码使用的是rma方法(单函数对raw array进行综合处理),获得ExpressionSet类对象

nMLL <-rma(MLL.A)
arrayQualityMetrics(
  expressionset = nMLL,
  outdir = “report_for_nMLL”,
  force = T
#不需要进行do.logtransform,因为rma会进行该处理
)

3、其他类

illumina data使用beadarray包产生的数据读入ExpressionSetIllumina类;
one colour array读入ExpressionSet类;
two colour array使用limma包读入RGList或MAList类,调用arrayQualityMetrics时,会自动转换为NChannelSet类;
总之,就是想办法读入ExpressionSet, NChannelSet, AffyBatch类

4、提供更多信息

可以在不改变质量评价的情况下,结合对象的phenoData slot中的factor数据进行分析。
以下手动添加了两个因子后进行分析

pData(nMLL)$condition = rep(letters[1:4],times = 5)
pData(nMLL)$batch = rep(paste(1:4),each = 5)
arrayQualityMetrics(
  expressionset = nMLL,
  outdir = “report_for_nMLL_with_factors”,
  force = T,
  intgroup = c(“condition”,”batch”)
)

5、扩展质量分析

5.1 添加基因的坐标:AffyBatch和BeadLevelList不用处理,其他要添加“X”和“Y”列到featureData slot;

featureData(nCCl4)$X<-featureData(nCCl4)$Row
featureData(nCCl4)$Y<-featureData(nCCl4)$Column

5.2 分析identifiers是否匹配特定要求返回T or F:在featureData中添加一列hasTarget;

featureData(nCCl4)$hasTarget = (regexpr(“^NM”, featureData(nCCl4)$Name)> 0)
#table(featureData(nCCl4)$hasTarget)可显示结果

5.3 将RNA芯片数据质量设置为因子丰富报告:将数据中的权重转换为因子搐存在pData中(见第4部分),然后调用intgroup参数。

本文主要参考arrayQualityMetrics包的参考文件,具体细节请阅读原文件
https://www.bioconductor.org/packages/release/bioc/vignettes/arrayQualityMetrics/inst/doc/arrayQualityMetrics.pdf

上一篇下一篇

猜你喜欢

热点阅读