The Connectivity Map-揭示化合物,基因和疾病
The Connectivity Map, or CMap, is a resource that uses cellular responses to perturbation to find relationships between diseases, genes, and therapeutics.
The Connectivity Map(CMap) 是由Broad研究所开发的一个基于干预基因表达的基因表达谱数据库;主要用于揭示小分子化合物,基因和疾病状态的功能联系。
CMap原理
实验分析得到的上调和下调差异表达基因列表,利用CMap将差异基因列表与数据库参考数据集比对;根据差异表达基因在参考基因表达谱富集情况得到一个相关性分数(-100~100);正数表示上调和下调的差异表达基因与参考基因表达谱具有相似性;负数表示上调和下调的差异表达基因与参考基因表达谱可能是相反的;最终,根据参考基因表达谱相关性分数排序。
CMap数据库
CMap数据库主要包含的是由不同干扰(小分子化合物,过表达基因和基因敲除)作用于不同细胞系的基因表达谱;通过比较参考数据,找到相似性高的细胞基因表达谱,从而研究细胞对不同干扰是否具有某种联系。
基因表达谱数据库构建
使用GEO中基于ffymetrix HGU133A平台的12063个基因芯片数据,通过计算生物学方法计算选出的978个基因(L1000);测量978 基因芯片表达数据后,再使用算法推断额外11350基因表达情况;这种方法得到的转录组信息可以概括80%转录组信息;
为啥不用RNAseq数据构建转录组基因表达谱?
1)L1000的花费大概是每个样只需要 约1.50美元;相比于RNAseq,就不用说有省钱了。
- L1000与RNA-Seq相比,结果差异并不大;
同一样品相关性系数中值高达0.84;
98% 的样本 (3,103/3,176) Recall ratio> 0.99
CMap分析工具
Tools这儿就介绍:Query与Touchstone
Query
根据自己实验差异表达基因在数据库中搜索具有相似性的基因表达谱;
1)这儿使用了例子数据:(GSE33643) PI3K/MTOR inhibitor BEZ235 treated A2058 cells (3 doses at 24H) vs. DMSO treated
使用自己的数据时,可以手动粘贴数据;也可以使用load from my files导入自己先前构建的list数据(工具:ListMaker) ;
2)数据提交之后,需要等一段时间(反正不止网站说的5分钟,计算量还是比较大的,只要工具好用,我还是可以理解的)
3)查看结果:可以从右上角Tools -> history查看结果
4)summary是对不同细胞系数结果的一个综合;
一般首先查看是否有相关性大于95%和小于-95%;如果没有,可以适当放宽范围到90%;
右测栏可以挑选感兴趣的实验类型和细胞系相关数据;
页面左上角View可以简单地调整热图
Tools中有一些工具:
Clustering SimilarityTouchstone
Touchstone用于挖掘CMap数据库中各种表达谱数据之间的联系;
植物黄酮芹菜素( the plant flavonoid apigenin)已知具有抗炎症和抑制增殖功能;
在 Touchstone 中搜索apigenin;
展开DETAILED LIST查看结果,score值来自与多个细胞系summry的值;
左下角PHARMACOLOGIC显示了富集分数大于90或者小于-90的数据集相关化合物的一个药理学特性;其中与CDK Inhibitor Grp1相关的有6个,这也佐证了apigenin在细胞增殖过程中起作用;
HEATMAP中查看输入的上调或下调基因集与不同个细胞在不同情况下表达的相似性;
右边的Quick Tools中可以进行一些选择;
选择Perturbagen Classes查看到 CDK Inhibitor Grp1 (CP),PKA Inhibitor (CP),GSK3 Inhibitor (CP),PARP Inhibitor (CP),PKC Inhibitor (CP)五个化合物有很很好的相关性,因此可能有相似的作用机制;
参考:
Connectopedia: The CLUE Knowledge Base
Lamb, et al., (2006). The Connectivity Map: Using Gene-Expression Signatures to Connect Small Molecules, Genes, and Disease. Science 313, 1929–1935
Subramanian et al. (2017). A Next Generation Connectivity Map: L1000 platform and the first 1,000,000 profiles Cell 171, 1437–1452