最新5.8分非肿瘤纯生信,热点基因集+机器学习+二次分型+单细胞
![](https://img.haomeiwen.com/i22741039/0cc3695082cb64e7.png)
影响因子:5.8
研究概述:
骨关节炎(Osteoarthritis, OA)是一种退行性炎症性关节疾病,是致残的主要原因,以长时间活动后的关节疼痛和僵硬为特征;Anoikis为失巢凋亡,是一种发生于细胞外基质(ECM)丢失或细胞与ECM之间存在破坏时的程序性凋亡。
骨关节炎(OA)与失巢凋亡(Anoikis)密切相关,本研究旨在通过机器学习和单细胞分析等手段,重点探索失巢凋亡相关基因在OA的发生、发展和治疗中的表达水平,并探索新的基于转录组的失巢凋亡相关生物标志物和 OA进展的通路。
关于非肿瘤生信,我们也解读过很多,主要有以下类型
1 单个疾病WGCNA+PPI分析筛选hub基因
2 单个疾病结合免疫浸润,热点基因集,机器学习算法等
3 两种相关疾病联合分析,包括非肿瘤结合非肿瘤,非肿瘤结合肿瘤或者非肿瘤结合泛癌分析
4 基于分型的非肿瘤生信分析
5 单细胞结合普通转录组生信分析
目前非肿瘤生信发文的门槛较低,欢迎交流
流程介绍:
作者首先在GEO数据库下载数据集GSE114007和GSE89408,从 GeneCards 数据库中收集了与 Anoikis 相关的一系列基因。接着鉴定出37个Anoikis 相关差异表达基因 (DEARGs)。采用Lasso回归分析鉴定出 10 个 DEARGs,并以此区分了两个失巢凋亡亚型,进行免疫浸润分析。
随后作者对A、B两个失巢凋亡亚型进行差异分析,发现了 1844 个DEARGs,并采用共识聚类的方法将OA患者分为基因亚组A和基因亚组B,进而进行免疫浸润和生物学功能分析。
在疾病WGCNA分析中发现MEgreen模块,在基因亚组WGCNA中发现MEturquoise模块最为显著。利用XGB、SVM、RF和GLM模型鉴定了5个枢纽基因(CDH2、SHCBP1、SCG2、C10orf10、PFKFB3),使用这5个基因构建的诊断模型在训练和验证队列中表现良好。最后使用数据集GSE152805在单细胞水平上分析OA。
![](https://img.haomeiwen.com/i22741039/6079f8ed3f78369d.png)
研究结果:
一、失巢凋亡相关基因的表达图谱
1. 在正常组和OA组之间的火山图中显示了756 DEGs(图2A)。作者在756个DEGs和513个失巢凋亡相关基因之间的维恩图中,鉴定出37个失巢凋亡相关差异表达基因(DEARGs)(图2B)。
2. 图2C的热图可视化了37个DEARGs,许多基因在OA样本中高表达,包括IGF1、TUBB3、THY1、MMPP11、EGF、CDH2、EDA2R、SPP1、EZH2、CENPF、BUB1、S100A4、TNC、HTRA1、MMP3、CXCR4、PLAU、ITGA4、TIMP1、CDCP1和PIK3CG等21个基因。
![](https://img.haomeiwen.com/i22741039/e552bcbca1ed6e1f.png)
3. 同时对37个DEARGs的染色体位置进行可视化(图2D)。为研究这些DEARGs之间的相互作用,作者进行了相关分析,发现CENPF与BUB1之间高度正相关(图2E)。
![](https://img.haomeiwen.com/i22741039/14eeabac280b0ed8.png)
二、鉴定失巢凋亡亚型
1. 采用Lasso回归分析,从37个DEARGs中获得10个基因作为潜在的OA生物标志物(图3A,B)。
2. 作者基于10 个DEARGs的表达,使用共识聚类算法进行无监督聚类以识别失巢凋亡相关亚型。将k的值设置为1–9,结果表明,k=2是根据10 个 DEARGs将42份Oa样本分为A和B亚型的最佳参数(图3C-F)。
3. 主成分分析(PCA)结果显示A亚型和B亚型之间有明确的区别(图3G)。
![](https://img.haomeiwen.com/i22741039/fdf379fb4261d67e.png)
三、两种失巢凋亡亚型的免疫浸润具有不同的特征
1. 图4A的火山图显示了两种失巢凋亡相关亚型之间的DEGs。图4B是28 种免疫细胞表达热图,显示两亚型之间存在差异,如浆细胞样树突状细胞和中央记忆 CD4 T 细胞在 B 亚型中表达较高。
2. 条形图显示了28个免疫细胞的不同比例,巨噬细胞M0和浆细胞占比很大(图4C)。基因集变异分析(GSVA)显示,糖胺聚糖生物合成硫酸乙酰肝素和糖胺聚糖生物合成硫酸软骨素在A亚型中高表达,B亚型主要富集戊糖和葡萄糖醛酸相互转化(图4D)。
![](https://img.haomeiwen.com/i22741039/a97f353f70ade5a9.png)
3. GO分析显示,1844个与失巢凋亡相关亚型的DEGs在BP的骨化、CC的含胶原的细胞外基质、MF的核苷三磷酸酶调节剂活性和GTP酶调节活性中富集(图5A)。GO分析的圆图(图5B)及KEGG条形图和气泡图(图5C,D 包括前20个KEGG项)显示:PI3K-Akt信号通路和钙信号通路主要在KEGG分析中富集。
![](https://img.haomeiwen.com/i22741039/02a88075820233cb.png)
4. 作者探索了两个亚型的25个免疫检查点,共有9个免疫检查点基因具有显著性(图5E)。为确定两种亚型之间的潜在过程和通路,作者使用GSEA进行了KEGG通路富集分析:包括组氨酸代谢、丙酸代谢、核糖体、RNA降解和泛素在内的多种免疫相关通路主要富集于A亚型(图5F)。而轴突引导、基底细胞癌、ECM受体相互作用、局灶黏附和Notch信号通路等通路主要富集于B亚型(图5G)。
![](https://img.haomeiwen.com/i22741039/816d4cfd75023f17.png)
5. B亚型中的活化B细胞、活化CD4 T细胞、活化CD8 T细胞、CD56dim自然杀伤细胞、自然杀伤T细胞、浆细胞样树突状细胞和17型辅助性T细胞水平显著高于A亚型(图6A)。相关性分析显示28个免疫细胞与OA存在相关性:巨噬细胞与髓源性抑制细胞的正相关性最高,未成熟树突状细胞与活化B细胞的负相关性最高(图6B)。
6. 图6C计算了A、B两亚型所有骨关节炎患者的 10 个基因特征和 28 种免疫细胞类型之间的相关性:2型辅助性T细胞和活化CD4 T细胞与THY1基因呈负相关,单核细胞与TIMP1基因呈正相关。
![](https://img.haomeiwen.com/i22741039/b17ad05285a6c98c.png)
7.,A亚型中CCR、检查点和T细胞共刺激水平较高,B亚型中aDCs、中性粒细胞、Th1_cells和Th2_cells水平较高(图6D)。aDCs与MMP11的相关性最高且呈负相关,APC共刺激与TIMP1基因呈正相关(图6F)。
![](https://img.haomeiwen.com/i22741039/645576672a31b5d1.png)
四、基于失巢凋亡亚型DEGs的基因亚组鉴定
1. 为验证失巢凋亡亚型,作者对A、B亚型进行差异分析,共发现了 1844 个DEARGs。基于此,作者采用共识聚类的方法将OA患者分为基因亚组A和基因亚组B(图7A)。图7B显示每个聚类之间关系的项目共识图。从图7CD可见,共识评分在理想分组为 K = 2存在最大值。
2. 图7E是基于基因亚组的 28 个免疫浸润热图,表明激活 CD8 T 细胞和激活 CD4 T 细胞在基因亚组A中水平较高。
![](https://img.haomeiwen.com/i22741039/df0b717b770e2337.png)
五、两个基因亚组的免疫浸润和生物学功能具有不同的特征
1. 根据基因亚组,图8A的条形图将 28 个免疫细胞的不同比例可视化。幼稚B细胞、M0巨噬细胞和浆细胞在条形图中占有很大比例。作者在两个基因亚组之间进行GSVA,发现Notch信号通路和碱基切除修复在A亚组中上调,而戊糖和葡萄糖醛酸互转化和其他聚糖降解在B亚组中下调(图8B)。
2. 图8C的冲积图显示,失巢凋亡亚型和基因亚组之间的分布和关系相似:活化B 细胞和 2 型辅助性T细胞在基因亚组 B中的水平较低,而活化的CD4 T细胞和自然杀伤细胞在基因亚组 B 中的水平较高(图8D)。
免疫相关通路的比较:T细胞共抑制和T细胞共刺激在基因亚组A中更高,而Th2细胞和Treg在基因亚组B中更高(图8E)。
![](https://img.haomeiwen.com/i22741039/46b12e2c3ecec50a.png)
3. 相关图显示10个基因与免疫细胞和通路之间存在显著相关性:VEGFA基因与未成熟B细胞呈负相关,MMP11基因与CD56dim自然杀伤细胞呈正相关(图8F)。VEGFA基因与巨噬细胞呈负相关,THY1基因与CCR呈正相关(图8G)。
![](https://img.haomeiwen.com/i22741039/7423b2080a61058e.png)
六、37种失巢凋亡相关差异表达基因(DEARGs)在不同组中的表达
1. OA样本中的大多数基因高于正常样本。然而DAPK2、FASN、ITGB4、ITPRIP、JUP、LTB4R2、MAOA、PAK3、PDK4、PTK6、RAC3、RHOB、SESN2、SIK1和VEGFA在OA样品中的表达较低(图9A)。
2. 根据失巢凋亡亚型绘制37个DEARGs的箱线图,可见VEGFA、PLAU、FASN、TNC、TUBB3、TUBB3和MMP11在失巢凋亡B亚型中的表达水平较低,而EGF、MAOA 和 PDK4 在失巢凋亡B亚型中的表达更高(图9B)。
2. 比较两基因亚组间37个DEARGs的表达,HTRA1、BUB1、HK2、S100A4、MMP3和PDK4等在基因亚组A中的表达水平较低,而VEGFA、FASN、JUP、TIMP1、SIK1、ITGB4、THY1、PTK6和MMP11在基因亚组A的表达水平较高(图9C)。
因此得出结论:DEARGs在OA样本中的表达较高,而且有更多的基因在失巢凋亡B亚型和基因亚组B的表达水平较高。
![](https://img.haomeiwen.com/i22741039/5d6905f794b69c0a.png)
七、枢纽基因的鉴定和列线图的构建
1. 基因亚组的WGCNA分析将MEturquoise模块鉴定为枢纽模块,包含1192个基因(图10A)。在疾病WCNA分析中,MEgreen模块为最显著模块,包含239个基因(图10B)。维恩图显示了基因亚组 WGCNA 和疾病 WGCNA 分析之间的 114 个交叉基因(图10C)。
2. 使用 XGB、RF、SVM 和 GLM 四种模型来确定最佳模型。XGB的残差最小(图10D),RF、SVM、XGB 和 GLM 的 ROC 值分别为 0.892、0.850、0.917 和 0465 (图10E)。 图 10F是为GLM、RF、SVM和XGB模型创建的特征重要性![](https://img.haomeiwen.com/i22741039/30695e5aa407c191.png)
3. 综上作者确定XGB模型为最佳模型,将XGB模型的前5个基因确定为枢纽基因(CDH2、SHCBP1、SCG2、C10orf10和PFKFB3)。作者构建了基于枢纽基因的列线图模型,以探索疾病风险(图11A)。
4. 利用校准曲线对列线图模型进行评价,可见5个枢纽相关基因与理想模型吻合较好(图11B)。DCA曲线显示,基于列线图的决策可能有益于OA患者,且列线图模型比单个ARG具有更高的临床效用(图11C)。
5. 最后作者使用五个枢纽基因,从合并的数据集中构建单独的ROC曲线和完整的ROC曲线 (图11D,E)。5个枢纽基因的箱线图显示,C10orf10和PFKFB3在OA样本中的表达低于正常样本,CDH2、SCG2和SHCBP1在OA样本中的表达高于正常样本(图 11F)。热图显示5个枢纽基因的表达情况(图11G)。
6. 使用GSE55235数据库验证枢纽基因的表达。GSE55235中枢纽基因的箱线图和热图与合并数据集中的箱线图和热图相同(图11H,I)。
![](https://img.haomeiwen.com/i22741039/13505983dd9913b7.png)
八、ceRNA的构建与免疫浸润相关性分析
1. 作者构建了lncRNA-mRNA-miRNA网络,有大量lncRNA和miRNA受到五个枢纽基因的调控(图12)。IncRNAs和SNHG14的has-miR-30b-3p、has-miR-149-3p和has-miR-515-5p,以及lncRNAs的MUC2与枢纽失巢凋亡相关基因密切相关。该网络有助于探索骨关节炎的潜在机制,并为后续的治疗策略提供方向。
![](https://img.haomeiwen.com/i22741039/f27a447219a75fd9.png)
2. 作者还对 5 个枢纽基因和 28 个免疫浸润细胞进行了相关性分析(图13A)。结果表明:
C10orf10与活化B细胞的关系最强,与活化的树突状细胞呈负相关;
CDH2与未成熟树突状细胞呈正相关,与活化B细胞呈负相关;
PFKFB3与活化B细胞的相关性最高,与活化的树突状细胞呈负相关;
SCG2 在调节性T细胞中呈最高阳性,在活化B细胞中呈最高阴性;
SHCBP1与调节性T细胞的正相关关系最强,与活性B细胞的正相关关系相反。
综上所述,这些枢纽基因很可能参与OA发病过程中的免疫调节。
![](https://img.haomeiwen.com/i22741039/95fa4ad6cc1d5293.png)
九、单细胞分析:失巢凋亡与OA软骨中的免疫相互作用
1. 从GSE152805数据集中获得6个OA样本的25852个细胞的基因表达谱(图14A)。nCount_RNA与nFeature_RNA呈正相关(图14B)。方差图显示所有细胞中有 30,738 个基因,红点代表前 2000个高度变异的基因(图14C)。
2. 采用24个鉴定的标记基因在不同亚群中显示并鉴定出相应的细胞类型(图14D)。作者共发现14个独立的亚群,并建立了7 种细胞类型(HomC、RepC、HTC、preFC、FC、preHTC 和 RegC)(图14E,F)。特征图和小提琴图显示了5个ARG枢纽基因在各种细胞类型中的分布:C10orf10和BFKFB3的表达高于其他免疫细胞类型(图14G,H)。
![](https://img.haomeiwen.com/i22741039/96ed5c00020481d1.png)
3 图15通过CellChat推断细胞间通信,揭示了全局信号变化。
(A-B)每种软骨细胞亚型之间细胞相互作用数量和相互作用强度的圆图。
(C)OA软骨中每个簇的细胞类型之间的串扰分析。
(D)与每个簇的细胞类型相关的基因的表达。
(E)OA软骨簇中7种细胞亚型的相对强度 (F)不同簇在SPP1信号通路中的作用重要性。(G)与SPP1信号通路相关的基因的表达水平。
(H)圆图显示了 SPP1 信号通路介导的细胞通讯的明显变化。OPA软骨中的SPP1信号水平增强,pre-FC为信号通信中心。
![](https://img.haomeiwen.com/i22741039/778a907a8872bf92.png)
研究总结:
本文采用机器学习和单细胞分析方法筛选出5个与失巢凋亡相关的枢纽基因(CDH2、SHCBP1、SCG2、C10orf10和PFKFB3)和免疫相关细胞。利用ceRNA对枢纽基因的开发可为探索OA的机制提供相应的lncRNA和miRNA,关键基因为OA的免疫治疗提供潜在的靶点。本研究可能为研究Anoikis相关基因与OA的关系提供新的见解。