NAR 2019数据库总结——g:profiler
G:profiler 包括四个主要的工具:g:GOSt 是一个对目标进行富集分析的工具。其他三个:g:Convert;g:Orth以及g:SNPense是进行相关基因ID转换的工具。
g:GOSt:富集分析
数据输入
g:GOSt
是一个可以进行富集分析的工具。它可以接受多种多样的输入方式。其中包括:geneid; SNPIDs; 染色体位置;GOterms
。另外值得注意的是。它可以接受不同类型的输入。比如输入geneids + 染色体位置 + SNPids。
结果
富集分析的结果可以通过一个瀑布图和分布热图来进行可视化。同时也提供了数据结果下载的界面。其结果包括11个部分:
-
GO分析结果:BP;CC;MF
-
通路分析:Reactome, KEGG and WikiPathways
-
DNA相关调控:转录因子调控(TRANSFAC)以及miRNA(mirTarBase)调控
-
蛋白数据库:CORUM蛋白复合物注释数据库以及人类表型数据库(Human Phenotype Ontology,HPO)
按照下图显示,即检索结果的默认显示界面,我们可以看到各个注释的结果。结果的横坐标是注释的数据库,总坐标是注释的-log10(P)。每一个点代表一个结果。
image.png同时。如果我们点击Detailed Results
就可以看到所有详细的结果,同时还可以把结果导出成csv。
g:Convert:基因ID转换工具
这个工具和第一个一样也支持多个类型的基因数据。我们需要做的就是设定好想要转换的ID类型即可。
image.png导出的结果包括,输入的类型,转换的结果,结果的官方SYMBOL,以及简单的描述。同样的结果可以导出表格格式
image.pngg:Orth:不同物种同源基因转换
该工具通过收集ENSEMBL
数据库里面不同物种基因序列上同源关系的相近程度。寻找不同物种之间相近同源关系的基因。
同样的这个工具也接受多种类型的ID输入。
image.png结果当中会显示原始物种和想要转换的物种之间的配对信息
image.pngg:SNPense:SNP注释工具
该工具可以用来注释单核苷酸多态的相关信息。其中包括相关的位置信息,所在基因,具体可能的功能。
该文件的输入就是标准的SNP号即可
image.png