何为batch effect?影响因素和纠正方法
2022-03-02 本文已影响0人
期待未来
定义:
批次效应代表了在不同批次中处理和测量样品时的系统技术差异。在分子生物学中,当实验中的非生物因素导致实验产生的数据发生变化时,就会发生批次效应。当这些影响的原因与实验中一个或多个感兴趣的结果相关时,这些影响可能会导致不准确的结论。它们在许多类型的高通量测序实验中很常见,包括那些使用微阵列、质谱仪、和单细胞 RNA 测序数据的实验。它们最常在基因组学和高通量测序研究的背景下讨论,比如不同平台的数据,同一平台的不同时期的数据,同一个样品不同试剂的数据,以及同一个样品不同时间的数据等等都会产生一种batch effect 。这种影响如果广泛存在应该被足够重视,否则会导致整个实验和最终的结论失败。
影响因素:
- 实验室条件
- 选择试剂批次
- 人员差异
- 进行实验的时
- 大气臭氧水平
- 用于进行实验的仪器
如何纠正
更正
已经开发了各种统计技术来尝试纠正高通量实验中的批次效应。这些技术旨在用于实验设计和数据分析阶段。他们历来主要专注于基因组学实验,直到最近才开始扩展到其他科学领域,例如蛋白质组学。与此类技术相关的一个问题是它们可能会无意中消除实际的生物变异。一些用于检测和/或纠正批次效应的技术包括:
- 对于微阵列数据,已使用线性混合模型,其中混杂因素包括随机截距。
- 2007 年,约翰逊等人。提出了一种用于校正批次效应的经验贝叶斯技术。这种方法代表了对以前方法的改进,因为它可以有效地用于小批量。
- 2012年推出sva软件包。它包括多种功能来调整批次效应,包括使用替代变量估计,这在以前已被证明可以提高可重复性并减少高通量实验的依赖性。
- Haghverdi等人。(2018) 提出了一种为单细胞 RNA-seq 数据设计的技术,该技术基于对数据中相互最近邻的检测
- 帕皮兹等人2019提出了一种动态规划算法来识别高通量数据中未知值的批次效应。在分子生物学中,当实验中的非生物因素导致实验产生的数据发生变化时,会发生批量效应。当它们的原因与实验中的一个或多个兴趣结果相关时,这种效果可以导致不准确的结论。
不同平台的数据,同一平台的不同时期的数据,同一个样品不同试剂的数据,以及同一个样品不同时间的数据等等都会产生一种batch effect 。这种影响如果广泛存在应该被足够重视,否则会导致整个实验和最终的结论失败。