针对特定基因集,进行单细胞+空转+分型+百种机器学习+pcr表达
杂志:Frontiers in Immunology
影响因子:5.7
研究概述:
肝细胞癌 (HCC) 是一种普遍存在的异质性肿瘤,治疗选择有限且预后不良。A disintegrin and metalloprotease (ADAM) 家族基因是一组编码蛋白酶的基因,这些基因可影响许多生理和病理过程,包括肿瘤的发生和发展。ADAM家族约有30个成员,其功能和表达在不同类型的肿瘤中有所不同。该研究来利用单细胞数据和空间转录组学数据,发现来自ADAM家族的基因信号在内皮细胞、肝细胞、单核巨噬细胞中显著富集。作者利用GSVA包计算ADAM家族信号的分数,后通过无监督聚类将其分为高、中、低ADAM组,发现AMAM家族信号评分升高与不良临床结局、免疫微环境和代谢重编程的破坏有关。作者通过采用99种机器学习算法组合开发了ADAM临床预后评估模型,该模型可以准确预测 HCC 的生存持续时间,AUC 值约为 0.9。此外,作者通过PCR 和 IHC 实验,以确认 ADAM 家族基因内的差异表达模式,结果显示在 HCC 组织中,ADAM9 、 ADAM10 、 ADAM15 和 ADAM17 的表达水平显著升高。
研究结果:
HCC中ADAM家族基因的自测单细胞数据概述
图1A展示了HCC患者的病理学信息, 在作者自测的HCC数据中,在质控标准内的细胞有47299个, 图1B显示,将分辨率设置为1.5会产生最佳的聚类结果,SingleR 自动注释的结果表明,HCC 微环境中主要存在 8 种细胞类型,包括 T 细胞、NK 细胞、中性粒细胞、B 细胞、肝细胞、平滑肌细胞、单核细胞-巨噬细胞和内皮细胞(图 1C、D)。HCC 肿瘤组织的细胞组成比例与其相邻的非癌组织显著不同(图1E)。
B 细胞和内皮细胞表现出明显活跃的 ADAM 信号 (图 2A)。重要的是,与非癌组织相比,肿瘤组织内的大部分细胞类型都显示出异常的 ADAM 信号(图 2B),这表明 ADAM 信号在 HCC 发展过程中具有潜在作用。为了更清楚地可视化每个细胞的 ADAM 信号,作者随后将 ADAM 信号分数投影到之前的 t-SNE 聚类图上。结果表明,肿瘤组织内的内皮细胞是异常活跃的 ADAM 信号的主要来源(图 2C-H)。
结合公共数据中的单细胞和空间转录组学结果进一步分析ADAM家族信号分布情况
使用CopyKAT包识别单细胞的全基因组非整倍体情况,其中内皮细胞、单核细胞衍生的巨噬细胞和平滑肌细胞主要存在于 G1 期,而其他细胞类型在 G1/S/G2M 期表现出更均匀的分布(图3A)。肝细胞、内皮细胞和平滑肌细胞是 HCC 患者恶性细胞的主要成分(图 3B)。图 3C 描述了每个肿瘤样本的细胞周期分布和恶性肿瘤评估结果。结果再次一致表明,与良性细胞相比,恶性细胞表现出更活跃的 ADAM 信号,尤其是在内皮细胞和肝细胞中(图 3D)。良性细胞和恶性细胞之间的 ADAM 基因集评分中存在明显的统计差异;此外,恶性细胞表现出较高的 G1 期信号,而良性细胞表现出较高的 S 期和 G2M 期信号(图 3E)。
作者还分析了公开的单细胞数据(见补充图),copykat 结果显示,这 2 例 HCC 患者的肝细胞几乎全部为恶性细胞,而免疫细胞和平滑肌细胞为良性细胞。恶性肝细胞由 G1、S 和 G2M 期的细胞组成,其中 G1 期占主导地位。以上结果与作者自带单细胞数据结果具有相似性。 空间转录组学则提供了多个肝癌组织中ADAM 家族信号的第一个空间分辨率成像
图谱(图4)。
ADAM家族成员在多种癌症中的基因组学和转录组学分析
泛癌中SNV分析显示,ADAM29、ADAM7 和 ADAM18 的突变频率相对较高(图 5A), 突变主要在SKCM和UCEC中,而HCC 中几乎没有任何 ADAM 突变(图 5B)。CNV分析结果显示,ADAM15 和 ADAM22 具有相对较高的 CNV 扩增(图 5C)。 差异分析结果则表示,ADAM8 和 ADAM12 在大多数癌症类型中始终表现出显着的上调趋势,而ADAM33 在各种癌症中始终表现出显着的下调趋势(图5D)。甲基化分析显示,与正常组织相比,ADAM11 、 ADAM32 和 ADAM33 在肿瘤组织中表现出更高水平的甲基化。相反,与正常组织相比,ADAM7 和 ADAM21 在肿瘤组织中的甲基化水平较低(图 5E)。
基于ADAM家族信号强度的HCC患者分组比较
在TCGA-HCC队列中,作者根据ADAM家族信号的强度进行无监督聚类,地将 TCGA-HCC 患者分为三个亚组(图 6A)。具有不同 ADAM 信号的 HCC 患者表现出不同的临床结果(图 6B)。在这些亚组中,C1 表现出最强的 ADAM 家族信号,其次是 C3,C2 表现出最弱的信号(图 6C)。当ADAM家族信号越强,HCC 患者的预后就越差。 此外, 具有不同 ADAM 信号的 HCC 患者伴有不同的代谢和免疫状态(图 6D、E)。例如,属于 C1 亚组的个体表现出 β-丙氨酸代谢的显著减少和鞘脂代谢活性的增加。 在免疫方面,则是具有活性 ADAM 信号传导的 HCC 患者通常表现出大量免疫细胞流入肿瘤微环境,ADAM 家族信号与免疫通路呈正相关,特别是与 CCR、Treg、副炎症和巨噬细胞相关的通路(补充图)。
基于 ADAM 家族信号的机器学习辅助预后模型开发
鉴于 ADAM 家族信号成员的数量有限,仅基于 ADAM 家族基因创建精确高效的分子模型是一项重大挑战。因此,作者首先利用 Spearman 相关性分析 (|cor|> 0.3,p < 0.001),收集和整理与 ADAM 家族成员显着相互作用的6,910个候选基因。利用以上候选基因,通过多种机器学习算法组合来筛选与ADAM家族信号相关的最佳预后模型。随机生存森林 (RSF) 算法成为构建预后模型的最合适方法,实现了最高的平均 C 指数,约为 0.706(图 7A)。生存分析结果表明,该模型有效地将 HCC 患者分为不同的风险组,证明了其在 TCGA 和 Meta 队列中的适用性(图 7B)。ROC 曲线强调了模型在预后评估中的显着准确性,AUC 值约为 0.9 (图 7C)。最后,作者验证了 4 个关键 ADAM 家族基因的表达水平, ADAM9、ADAM10、ADAM15 和 ADAM17 在至少一种肝癌细胞系中表现出上调趋势,与GEPIA2平台的结果具有一致性(图 7D)。作者的自测序数据和公开的单细胞数据都表明,ADAM9、ADAM10、ADAM15 和 ADAM17 的表达在良性细胞和恶性细胞之间存在显著差异(图2F)。
ADAM10 的临床相关性分析和表达验证
除了 TCGA 数据集外,几乎所有肝癌数据集都表明肝癌组织中 ADAM10 的转录水平显著高于其相应的邻近组织或正常肝组织样本,不仅如此,与HBV 阴性肝癌患者相比,伴有 HBV 感染的肝癌患者的 ADAM10 表达水平更高。 然而在蛋白水平,48 对肝癌组织中的免疫组织化学结果显示,大多数癌症组织样本表现出下调趋势(图 8A-B);然而,也有一些患者的癌症组织样本显示出相反的趋势(图 8C)。评分结果表明与邻近组织相比,肝癌组织中 ADAM10 蛋白水平存在潜在的下调趋势(图8D)。
研究总结:
该研究采用一种新的多组学整合方法来研究 ADAM 信号在 HCC 中的关键作用。单细胞测序分析显示,ADAM 信号传导主要在单核细胞巨噬细胞、内皮细胞和肝细胞中被激活,在良恶细胞之间观察到 ADAM 信号传导存在显著差异。此外,这项研究提供了 ADAM 信号传导的第一个空间分辨特征。基于 ADAM 信号传导的聚类分析再次强调,增强的 ADAM 信号传导可能导致患者生存期缩短,肿瘤代谢重编程和免疫微环境破坏是预后不良的潜在原因。 最后,作者利用机器学习算法构建了与ADAM相关的预后模型,并分析了组成模型基因的表达情况,发现ADAM10的转录水平在HCC中较高,高表达的ADAM10与肿瘤大小以及组织学分级之间的明确关联。此外,作者还发现与ADAM10 低表达的患者相比,ADAM10 高表达患者对 TACE 治疗更敏感,对索拉非尼治疗更不敏感,这暗示着ADAM10 靶向和索拉非尼联合治疗癌症似乎是一种有前途且可行的方法。不过在这里作者关于ADAM10在转录组层面和蛋白层面的表达有所出入,并未提出合理的解释,该原因还有待进一步的探索。