GDSC数据库使用(分析基因表达量与药物敏感性影响)
2022-03-15 本文已影响0人
期待未来
-
数据下载:不要下载raw data
- 细胞系注释文件: Cell-line-annotation
- 药物注释文件:Compounds-annotation img
- 药物IC50以及AUC文件:GDSC1-dataset img
- ANOVA统计文件(可选):GDSC1-ANOVA img
- 基因在各个细胞系表达量的文件:Download from GDSC1000 resourse
- 或者依此检索后下载
-
处理下载后的数据
-
Step 1 - 使用perl程序-整理“expression”和“drug两个数据表格,”将表达数据+药物的IC50数据整理成,横行为细胞COSMIC的ID,列为IC50/基因名字
-
Step 2 - 按基因检索:使用R语言程序提取“某个基因”在不同细胞系的IC50情况,最后会生成一个表:基因与药物IC50的关系,co r>0表示呈现正相关,基因表达越高,IC50越大,表明高表达耐药。(之需要在R脚本中改写文件位置以及基因名称运行R与语言即可。)
文件位置/Users/xiangyu/Documents/GDSC/GDSC6_geneCor只需要点开R脚本,修改待查找的基因名称就可以查询信息,需要几分钟运行。<mark style="box-sizing: border-box; background-color: rgb(255, 255, 0); color: rgb(0, 0, 0);">可以查该基因表达与药物耐药的关系</mark>
/Users/xiangyu/Documents/GDSC/GDSC8_cancer/geneCor<mark style="box-sizing: border-box; background-color: rgb(255, 255, 0); color: rgb(0, 0, 0);">可以查该基因表达在特定肿瘤中的与药物耐药的关系</mark>只需要更改R脚本中的基因名称 -
Step 3 - 按药物检索:结果会显示一个药物中IC50与哪些基因有关
-