抗癌药物敏感性数据库——GDSC
阿琛 挑圈联靠 5月5日
抗癌药物敏感性数据库——GDSC
随着精准医疗的不断推进,人们对于个性化治疗的需求也越来越高。发现能够作为诊断和治疗的分子靶点,从而找到那把医生手中的利器“药物”,成为研究的一大热点。药物,作为基础科研“三变量”的一大因素,对许多研究者而言,是具有很大吸引力的。然而,花花世界,分子类型眼花缭乱,药物种类同样迷人眼。
那么,如何在这已有的药物中找到那一个适合自己的呢?酸菜老师在三十六策的第五策“引药生变”中给大家介绍了一些研究思路,针对某一特定表型,买库与筛库,完成一整套的起步动作。但是,对于部分经费拮据的小医生而言,这过程可谓是杀敌一千,自损八百,实验刚开始经费就开始抗议了。今天,阿琛给大家介绍一个药物相关数据库,供大家品味。
初识GDSC
抗癌药物敏感性基因组学(https://www.cancerrxgene.org/),即Genomicsof Drug Sensitivity in Cancer (GDSC),是目前关于癌症细胞药物敏感性和分子标志物信息的最大的公共数据库。该数据库基于多个研究与数据库信息,整合并重新分析,从细胞、药物和分子三个检索层次,阐述了不同肿瘤细胞对药物的敏感度和反应。
GDSC主要包括三个方面的数据:
- 药物敏感性基因特征分析;
- 细胞系药物敏感性数据;
- 细胞系的基因组突变与CNV变异数据,表达谱数据以及甲基化数据(GSE68379);
其中,2020年2月的8.2更新版本将47种化合物添加到GDSC1数据集,并将23种化合物添加到GDSC2数据集;目前,总共有60434个新的药物IC50,可谓能满足大部分研究者的筛选需求了。
数据库查询
进入GDSC数据库,在搜索栏里面输入基因名字或药物或细胞系即可进行搜索,当然点击上方的栏目Compounds(药物)、Features(分子)以及Cell Lines(细胞系)栏目也可分别检索。
从分子到药物,通过“筛”与“猜”获得研究的主变量分子后,接下来就是药物的选择了。以EGFR为例,进行检索,点击“EGFR_mut”进入结果页面。
在Dataset中,选择相对较新的GDSC 2数据集的结果,就可以看到所有肿瘤(Pan-cancer)中EGFR突变与抗癌药物之间的相关性,对于具体的肿瘤我们也可以在Tissue specific analysis中进行修改。
▲ 图中,每个圆圈代表一种抗癌药物,鼠标移至圆圈处即可显示该药物的具体信息,包括Drug,Samplesize,Effect,以及P-value。如结果显示,随着IC50值的增大,药物对EGFR突变的耐药性也逐渐增加,绿色部分代表对EGFR突变敏感的药物,红色部分代表对耐药的药物。下方的表格具体展示了各种药物与肿瘤之间的相关性,其中存在三种药物对EGFR的突变存在较高的敏感性;通过点击表格下方的“CSV/TAB/XLS”即可下载相应格式的结果。
随后,点击“Scatter plots”,可以查看具体药物对EGFR突变的影响。点击“Select Drug”可更换你所感兴趣的药物,下方的表格也提供了该药物在各个肿瘤中的治疗人数以及相应的P值。如图所示,Osimertinib治疗对于EGFR突变患者存在明显的敏感性,且P <0.001。
▲ Osimertinib对EGFR突变的肺癌患者敏感性分析
结果分析与展示
通过截屏获取火山图结果,这是GDSC的不足之处,只能再通过Adobe Illustrator进行后期的拼图。大家也可以进入解螺旋,学习“大师兄带你修炼科研绘图独家秘籍”,修炼并点亮该项技能。
我们一起来看下2019年12月最新发表在PeerJ杂志上一篇文章(PMID: 31871844)的Figure 3,作者通过使用GDSC数据库,分析了TP53突变对膀胱癌化疗药物敏感性的分析。在图A中,火山图显示带有TP53突变的膀胱癌对丝裂霉素C,阿霉素和吉西他滨显着敏感;随后,作者分别分析了丝裂霉素-C,阿霉素和吉西他滨对TP53突变的泛癌和膀胱癌的影响。
▲ TP53突变影响膀胱癌的药物选择
其他查询方式
当研究药物确定时,从一种药出发研究肿瘤耐药的机制,此时也可以通过GDSC数据库检索合适的分子。点击“Compounds”进入药物检索页面,在搜索栏中输入感兴趣的药物进行检索;同时,我们也可以点击“CSV”或“TSV”下载所有药物的基本信息,包括药物的名字、靶点、影响的通路以及该药物在数据库中的特异性编号。
通过检索5-FU,点击进入,即可看到5-FU在不同肿瘤中的情况,包括5-FU在各个肿瘤细胞系和组织中的IC50分布,血药浓度,有效范围等信息。
▲ 5-FU在不同细胞系中的IC50(其中,每个点代表一种不同的细胞系)
▲ 不同组织中5-FU的IC50分布图
当然,GDSC也支持数据下载通过原始的药物浓度、基因表达相关数据,使用生信手段来进一步地进行多层次的关联分析