methylation

易基因 | 文献速递:重亚硫酸盐扩增子测序研究通过DNA甲基化监

2021-09-23  本文已影响0人  表观遗传学爱好者

今天要分享解读的是一篇发表于Leukemia(IF 11.528)的DNA甲基化研究文章,本文通过重亚硫酸盐扩增子测序,分析了通过研究DNA甲基化模式来监测急性髓系白血病(acute myeloid leukemia,AML)治疗后的可测量残留病灶(Measurable residual disease ,MRD)的可行性。

期刊介绍

Leukemia:Leukemia针对医学-血液学研究方向发表高质量的同行评审研究,涵盖白血病及相关疾病研究和治疗的各个方面。主题包括癌基因、生长因子、干细胞、白血病基因组学、细胞周期、信号转导、治疗靶点等。Leukemia长期居于JCR一区,在肿瘤学和血液学科中属于Top期刊。

关于重亚硫酸盐扩增子测序

亚硫酸盐靶基因扩增高通量测序(Bisulfite amplicon sequencing,BA-seq)是针对已有目标基因panel组合,运用自主研发的甲基化特异性多重PCR引物设计软件,对亚硫酸盐转化或氧化亚硫酸盐转化后的目标基因多重扩增,建库后进行超高深度(1000X以上)甲基化和/或羟甲基化精准检测。

➢超高深度亚硫酸盐甲基化测序,检测准确性极高,完胜传统BSP测序;

➢实现近百个基因的多重扩增,检测通量高,优于焦磷酸甲基化测序;

➢检测灵敏度高,可准确检测到样本中低于1%的甲基化水平;

➢平行化学氧化后亚硫酸盐测序,甲基化和羟甲基化精准检测;

➢样本需求量低,20ng基因组DNA可实现多基因扩增;

➢适用范围广,对基因组DNA、FFPE样本、游离cfDNA等样本均适用;

➢检测费用显著低于现有技术、快周期、超高性价比

一起来看看今天的高分文献吧:

标题:Investigation of measurable residualdisease in acute myeloid leukemia by DNA methylation patterns

期刊:Leukemia

2021影响因子: IF 11.528/Q1

发表时间:2021.6.15

技术平台:扩增子甲基化技术(靶向甲基化测序技术)

1、研究摘要:

急性髓系白血病(AML)治疗后可测量残留病(MRD)的评估仍具有挑战性,此前研究通常通过高度敏感的PCR、基于测序的特定突变筛查、通过多参数流式细胞术等技术来评估。但并非所有患者都有合适的突变,标记物的异质性阻碍了临床常规的标准化。在这项研究中,研究人员提出了一种基于AML相关DNA甲基化(DNA

methylation,DNAm)模式的MRD评估方法。研究人员鉴定了四种显示AML中异常DNAm的CG二核苷酸(CpG)区域,且它们的组合能够准确识别健康和AML样本。

重亚硫酸盐扩增子测序分析结果证明两个等位基因上的异常DNAm模式是对称的,这表明同源染色体之间存在表观遗传串扰。研究人员通过浅层学习和深度学习算法来识别异常的DNAm模式,随后在有和没有MRD的随访样本上进行测试。值得注意的是,即使是被归类为MRD阴性的AML样本,DNAm异常率也往往高于健康对照组,这可能反映了克隆性造血。最终结果表明,靶向DNAm分析有助于准确鉴别恶性和健康样本。然而,由于健康样本也包含少量异常分类的DNAm

reads,因此该方法尚不能准确区分MRD阳性和阴性样本。

2、建库测序:

(1)样本选取:

为了鉴定AML中异常DNAm的CpG,研究人员使用了健康献血者的Illumina HumanMethylation450 BeadChip (甲基化450k芯片)数据集:GSE40279、GSE50660和GSE77716;和来自AML患者的骨髓:癌症基因组图谱(TCGA)、GSE58477(细胞遗传学正常 AML)和 GSE62298。为了识别真实可靠且可重复的候选 CpG,研究人员将这些健康对照组和 AML研究组数据集进行随机配对。

对于这些配对研究,候选CpG的选择基于:(i)β值(DNAm水平),健康样本<0.1或 >0.9;(ii) 健康样本中DNAm的标准偏差(sd)<0.05;(iii)根据相应数据集中健康样本和AML样本之间的平均DNAm差异进行排序。基于这些标准,研究人员选择了AML样本中高甲基化或低甲基化的前100个CpG。同时在白细胞亚群(GSE35069)的DNAm数据集(所有甲基化450k芯片)、造血干细胞和祖细胞(GSE63409)、CD34 + 细胞 (GSE58477)、B细胞淋巴瘤(GSE37362)、骨髓增生异常综合征(MDS)(GSE51758)、老年AML

(GSE86409)、IDH1/IDH2 突变AML(GSE153347)、AML1-ETO (GSE80508)、FLT3-ITD (GSE64934)、MDS和继发性 AML (GSE152710)中分析了所选CpG的DNAm。

(2)样本采集和制备

对于DNAm 的靶向分析,研究人员使用了来自血液科、肿瘤科、止血科和干细胞移植科共15名AML患者的34份血液样本(包括首次诊断和随访样本);从研究联盟白血病生物库(Study Alliance Leukemia Biobank,SAL)获得34名AML患者的83份血液样本(包括首次诊断和一份/多份随访样本); 以及来自亚琛工业大学(RWTH Aachen University)医学院输血医学系的 63 名健康捐献者的外周血。

使用 QIAamp DNA Blood Kit (Qiagen, Hilden,

Germany) 从血液样本中分离基因组 DNA。将健康对照组样本的DNA和骨髓/外周血中显示高细胞计数的AML样本的 DNA 混合进行了有限稀释测定。此外,研究人员分析了六种白血病细胞系的DNAm模式:HL-60(AML)、KG-1a(AML)、TF-1(AML)、K562(慢性髓系白血病)、U937(组织细胞淋巴瘤)和SUP-B15(B细胞前体白血病)。

(3)靶向重亚硫酸盐扩增子测序

针对AML相关CpG的四个区域进行靶向重亚硫酸盐扩增子测序分析。包括cg15289427周围的14个相邻CPGs、cg22797031周围的10个CPGs、cg27630153周围的15个CPGs和cg19586199周围的9个CPGs。

3.测序分析结果

(1)特定基因组区域显示AML样本中频繁且显著的异常DNAm

研究人员选择健康对照组和AML样本质检后平均DNAm差异最大的CpG位点进行分析,三组DNAm数据集(对照组与AML研究组)独立进行:GSE40279(n=656)与TCGA(n=194); GSE50660(n=464)与GSE58477(n=62); GSE77716(n= 573)与GSE62298(n=68)(图1a、b)。分析结果表明前100个选定的CpG位点中存在显著的重叠:所有三组比较均显示AML样本在26个CpG位点中存在一致的异常高甲基化,在19个CpG位点中存在低甲基化(图1c,d)。

通常来说,对照组与AML研究组中的平均DNAm(Δβ值)差异高于50%,而当分析单个AML样本中CpG位点的DNAm水平时,研究人员观察到异常DNAm频繁变化至与对照组完全相反的水平(图1e)。这是出乎意料的,因为AML细胞内的两个等位基因修饰并不一定一致,而且单个AML样本包括白血病细胞和正常血细胞。为进一步研究Δβ值是否与细胞计数相关,研究人员将这26个高甲基化基因和19低甲基化基因的CPG位点中的异常DNAm与TCGA数据集AML样本中的blast计数进行比较分析,分析结果显示骨髓细胞异常DNAm百分比高于blast计数的预期。综上所述,数据结果确定了许多AML样本中异常DNAm的候选CpG位点,且这些CpG位点的Δβ值通常非常高。

图1:AML 相关 CpG位点 的选择

(2)对AML样本中具有异常DNAm的CpG位点进行靶向分析

对AML样本中异常DNAm相关CpG位点的靶向分析结果表明,无论哪种方式,对TCGA数据集的分析都表明DNAm与FAM65B、FAM38A和PRKACA的基因表达无关,相关CPpG位点的DNAm几乎与年龄无关。值得注意的是,所选的CpG位点还揭示了B细胞淋巴瘤和MDS中的异常DNAm,表明这些CpG位点的异常DNAm不具有疾病特异性(图2a)。

随后研究人员设计了AML样本四个相关区域的BA-seq(Bisulfite

amplicon sequencing)分析,重复性通过三次技术复制验证,尽管测序深度不同,但DNAm模式的组成在不同的测序过程中具有高度的重复性。BA-seq数据验证了AML样本相关CpG位点在对照组中呈现一致的甲基化或未甲基化,而在AML首次诊断时,CpG位点表现出明显的异常DNAm,甚至走向相反的极端(图2b)。在MRD阳性样本中也观察到类似的DNAm畸变。值得注意的是,即使是归类为MRD阴性的AML样本,也比对照组显示出更高的DNAm变化,尤其是在cg15289427、cg19586199和cg27630153中。

由于并非所有AML样本中四个相关CpG都显示DNAm异常,研究人员将相关CpG位点的DNAm水平合并成一个简单的AML评分,范围为0到1,以区分健康样本和AML样本(图2c)。将AML评分应用于Illumina

BeadChip数据和BA-seq数据集中,分析结果表明AML评分能够以高度的特异性和敏感性识别健康和恶性样本。这种DNAm异常可以在许多研究和所有测试的分子亚群中观察到。但AML评分不能准确区分MRD阳性和阴性样本。

图2:AML 相关 CpG 的靶向分析 AML评分的计算方法

(3)AML样本中单个reads的 DNAm 模式分析

所选AML相关区域包括几个相邻的CpGs(cg15289427: 14个相邻CpGs;cg22797031: 10个相邻CpGs ;cg27630153: 15个相邻CpGs; cg19586199: 9个相邻CpGs),因此,AML样本中单个reads可以转化成甲基化和非甲基化CpG的二元数据(binary sequel)。研究人员对每个AML相关区域的reads进行了主成分分析(PCA)。总体而言,健康对照组的reads聚类在一起,而在AML样本中未观察到这一现象(图3a-d)。相邻CpGs的平均DNAm水平表明,在AML样本中,整个AML相关CpG区域均显示DNAm异常(图3e-h)。在MRD阳性甚至一些MRD阴性的样品中,在一定程度上也能观察到DNAm异常的情况(图3i–l)。值得注意的是,在单个AML样本中,相邻CpGs的平均DNAm水平并没有一致性改变,而是遵循患者的特异性模式,这与此前对phosphodiesterase 4C(PDE4C)基因中年龄相关区域的结果一致(图3m-t)。以上结果表明,短基因组区域内DNAm的异常特征也可以区分健康和恶性样本。

图3:AML 相关区域的 DNAm 图谱

对于在cg27630153和cg19586199的AML相关区域中具有单核苷酸多态性(SNPs)的患者#56的BA-seq

reads进行了代表性的描述(图4):在首次诊断(首诊)、缓解和复发时,DNAm模式有显著变化,但DNAm模式在两个等位基因上总是几乎完全相同。

图4:异常 DNAm 在两个等位基因之间是对称的

(4)将单个DNAm模式分类为正常和异常

研究人员使用机器学习算法对二元DNAm模式进行分类,将单个BA-seq的reads数分类为正常或异常。与AML评分相比,这种方式可能有助于更好地对MRD阳性和MRD阴性样本进行分类,因为AML评分主要基于单个CpG的平均DNAm水平(图5a,b)。研究人员使用浅层学习(Random forest)算法对43个健康对照组样本的650万个reads数和34个AML首诊样本的260万reads数进行模型训练。对于与AML相关的区域,Random forest采用每个CpG位点的DNAm状态,并根据DNAm模式来构建决策树(decision tree)。结果发现对照组样本都显示了较低的异常评分,而所有AML首诊样本均具有较高的异常评分 (图5c,d)。

接下来,研究人员使用带或不带聚类的深度学习(autoencoder,自动编码器),无监督聚类旨在通过DNAm图谱区分样本中的各种细胞类型,并使自动编码器能够以更高的特异性学习模式(图5e-h)。随后将不同方法的检测结果与混淆矩阵(confusion matrixes)进行比较(图5b-h)。结果显示所有方法均能很好地对健康对照组样本和AML首诊样本进行分类,但对MRD阳性和阴性样本的分类准确性较低。

图5:不同DNAm模式分类方法

(5)有限稀释法检测异常的灵敏度

为评估AML患者的MRD分析是否可以基于DNAm模式来进行,研究人员采用有限稀释法(limiting dilution)对独立的AML样本(骨髓或外周血的 DNA)和对照组样本进行稀释,在稀释实验中,随着外周血和骨髓AML样本进一步稀释至恶性DNA的5%,AML样本的异常评分持续下降。在Random forest和自动编码器中,使用上述方法检测恶性DNAm模式的灵敏度达到25%左右(图6)。但该方法受到一定限制,因为即使是健康的血液也包含一些被分类为异常的reads。

此外,研究人员用六种白血病细胞系(HL60、KG1a、TF-1、K562、U937和SUP-B15)对算法进行验证。所有这些克隆细胞系都被正确地归类为异常,但即使在这些克隆细胞系中,DNAm模式也是异质性的。由于DNAm模式在健康对照组和恶性样本中的变化,检测残留恶性细胞的阈值远高于传统的MRD检测方法。

图6:有限稀释法检测异常的灵敏度

易基因小结

在本研究中,研究人员首先遵循了DNAm可以基于残留的异常表观遗传模式来诊断MRD的假设。在这个基础上确定了通常揭示AML中异常DNAm的基因组区域,利用重亚硫酸盐扩增子测序(BA-seq)技术和浅层学习及深度学习算法对这些区域进行靶向分析,然后将单个reads的DNAm 模式分类为正常或异常。

然而,使用DNAm模式进行MRD监测的存在巨大的挑战,因为即使健康样本,也有小比例的DNAm被归类为异常reads。因此基于DNAm模式的MRD监测在灵敏度方面是存在困难的。

文献来源:/doi.org/10.1038/s41375-021-01316-z

上一篇 下一篇

猜你喜欢

热点阅读