吸烟会引会起外周血表观遗传学变异!

2023-08-23  本文已影响0人  Biomamba生信基地

写在前面

最近在捣鼓表观遗传学,处理了一批Bulk RNA-Seq和WGBS(Whole Genome Bisulfite Sequencing)的数据。熟悉我风格的粉丝都知道,我一般会读几篇文献再下手,遂于PubMed中检索了几篇文章,这次读的是2021年发表的题为"Genome-wide methylation and expression analyses reveal the epigenetic landscape of immune-related diseases for tobacco smoking"发表于《Clinical Epigenetics》的文章[1],影响因子为6.551

具体内容

吸烟显然是万恶之源,可提示癌症、呼吸系统疾病、心血管疾病等等多种疾病的患病风险。全球大约共有十亿烟民,其中吸烟每年直接或间接造成的死亡人数大约为八百万人。烟草中的一些化合物与固有免疫或适应性免疫具有直接关联,例如吸烟会诱导肺泡巨噬细胞表达溶酶体酶和弹性蛋白酶引起粘连组织和薄壁组织的损伤从而引发肺气肿与支气管炎。此外,大约1/3的癌症均与吸烟有关联,例如肺癌、口腔癌、胰腺癌、肾癌等。DNA的甲基化在表观遗传学当中也占据重要地位且影响着免疫疾病、癌症等病症的发生与发展。因此作者收集了数十例临床外周血样本,做了72个样本的WGBS(Whole Genome Bisulfite Sequencing)、75个样本的RNA-Seq以探究吸烟这一行为带来的DNA甲基化及转录组表达量上的变化。
Methods与分析方法不做介绍,大家感兴趣我们后续可以出个教程,该文献的主要流程见Fig.1。

Fig.1

在WGBS的72个样本中共获得了7亿个CpG位点,抛开SNPs的影响后(防止基因型对甲基化水平及基因表达量存在影响),24,479,261个CpG位点被保留。超过半数的CpG位点位于基因编码区域(Fig.2B)。这点倒是出乎我的意料,毕竟基因编码序列仅占人类基因组的3%不到。而其中吸烟组vs不吸烟组之间约3/4的差异甲基化区域(diferentially methylated regions, DMR)位于CpG高度富集区域(Fig.2C)。

Fig.2

对于DMR的进一步分析可以发现,在基因组的各个染色体上均有DMR的分布(Fig.3A)(这种图我们以前出过类似的教程:想知道自己研究的基因在染色体上如何分布吗)。在基因结构中,启动子、3'UTR、5'UTR、外显子、内含子、基因间隔序列、CpG island、CpG shores(CpG island相邻的上下游2kb区域)、CpG shelves (CpG shores相邻的上下游2kb区域)、部位的甲基化水平上调与下调程度也具有一定差别。为了避免DMR是由采取外周血时获得的血细胞比例不同所造成,作者绘制了这些血细胞marker的组间差异(Fig.3C),可以看出部分基因受到了影响。作者接着对高甲基化变异的DMR(1205个基因)与低甲基化变异的DMR(534个基因)分别进行了KEGG富集分析,后者的结果中包含了一个与癌症相关的通路:Transcriptional misregulation in cancer。

Fig.3

在RNA-Seq的数据中,仅多因素矫正的差异计算后,共获得了55个差异基因(differntially expressed gene, DEG)(Fig.4A),经DisGeNET数据库的富集分析,可以发现这些基因被富集于immunosuppression通路中(Fig.4 B)。而通过简单的线性回归获得的1746个差异基因与DMR间存在148个交集基因(Fig.4C),它们富集程度最显著的通路为Immune System Diseases(Fig.4D)。

此后作者挑选了一些基因的增强子区域甲基化程度与基因表达量进行了相关性分析,其中CMKLR1作为一种趋化因子,其甲基化程度与表达量呈现显著的负相关关系。

接下来就图穷而匕首现了,作者直接分析了27个细胞因子在吸烟者与非吸烟者间的水平差异(完全没考虑WGBS和RNA-Seq的事),可能是课题组的一些研究基础:

聊聊读后感

这篇文章总的来说比较简单,总体来说中规中矩,分析时也对受试人群的年龄、BMI、SNPs等因素进行了矫正,数据分析方面较为严谨。但是也有一些作者也承认的缺点,例如受试人群均为矿场男性工人,这显然是一个很特殊的群体,考察这类人群的健康状态显然会有一些微妙的影响因素;作者也承认,甲基化程度的差异未必会造成表达量的改变,可变剪接也是一种可能发生的情况,但并没有纳入本文的研究之中。我无德无能,但如果让我站着说话不腰疼,这篇文章的可以改进的地方还有:

1、研究范围过广,甚至没有给出一种具体的疾病,因此也无法谈论具体的研究价值。研究的样本为血液显然也有些不合适,血细胞作为各类细胞的混合物,其采集时获得的细胞比例显然会影响WGBS和RNA-Seq的测定。每种细胞均会有自己的特征基因与甲基化区域。

2、虽然有免疫通路的铺垫,但后续的细胞因子测定还是显得过于生硬,完全抛开了WGBS和RNA-Seq的内容。

3、作者不知为何加了一段VEGF的内容,这个基因在WGBS与RNA-Seq中均没有表现出差异,为了加入VEGF的段落,甚至描述其受体FLT1在吸烟者中存在WGBS的低甲基化变异与上调,有点不知所云。

4、作者反复强调了这个观点: "The underlying molecular mechanisms linking smoking and diseases have not been well explored"。显然我不是很认同,在不加定语的情况下,"smoking and diseases"相关研究显然已经有很多很棒的工作。

但这篇文章的确揭示了吸烟者与非吸烟者的外周血WGBS与RNA-Seq的差异,且详细记录了分析过程,对于想做这两种组学联合分析的读者来说,是个不错的参考。

参考:

[1]Mao Y, Huang P, Wang Y, Wang M, Li MD, Yang Z. Genome-wide methylation and expression analyses reveal the epigenetic landscape of immune-related diseases for tobacco smoking. Clin Epigenetics. 2021 Dec 9;13(1):215.

上一篇下一篇

猜你喜欢

热点阅读