生信学习

通过整合生物信息学分析辨认TNBC的重要基因和通路

2019-04-13  本文已影响127人  Forest_Lee

部分代码见:https://www.jianshu.com/p/3553220509d7
原文名称:Identification of Key Genes and Pathways in Triple-Negative Breast Cancer by Integrated Bioinformatics Analysis

背景知识

三阴性乳腺癌是指不表达ER、PR和Her2的乳腺癌,治疗困难,预后较差。

方法

1.微芯片数据

使用GSE76275数据集,包含265个样本,其中有198个TNBC,67个non_TNBC

2.确定DEGs

使用GEO2R确定差异表达基因(FC≥1.5,p<0.01);

使用Morpheus对100个显著的DEGs作热图

3.GO和KEGG通路富集分析

使用STRING 10.5 input DEGs并output结果,p<0.05认为具有显著性;使用DAVID 6.8作KEGG分析

4.PPI网络建立和通路间的相关性分析

使用实验设置、文本挖掘、数据库、共表达、邻域、基因融合和共流框勾选建立DEGs网络;使用Cytoscape中的MCODE来screen PPI网络中的分子(显示score>3,nodes number >3的分子);使用Cytoscape中的ClueGo进行通路间富集分析(呈现p<0.05)

5.生存分析

即总体生存率Kaplan-Meier估计

使用cBioPortal数据库中的METABRIC等数据进行生存分析。以GO富集分析和ClueGO构建的相互关系网络为基础,在cBioPortal中提交基因名,进行生存分析,其中Logrank检验p <0.05的基因呈现。

结果

1.确定DEGs

基于标准找到207个DEGs,其中56 up,151 down,见火山图。top 100的基因见热图和聚类分析


image.png
image.png

2.GO和KEGG通路富集分析

上图

image.png image.png
image.png

3.PPI网络建立和通路间的相关性分析

确定了168个nodes和108个edges

image.png
image.png

4.生存分析

image.png

参考来源:生信技能树

友情链接:

课程分享
生信技能树全球公益巡讲
https://mp.weixin.qq.com/s/E9ykuIbc-2Ja9HOY0bn_6g
B站公益74小时生信工程师教学视频合辑
https://mp.weixin.qq.com/s/IyFK7l_WBAiUgqQi8O7Hxw
招学徒:
https://mp.weixin.qq.com/s/KgbilzXnFjbKKunuw7NVfw

欢迎关注公众号:青岛生信菜鸟团

上一篇 下一篇

猜你喜欢

热点阅读