TCGA生物信息学基因家族分析

NCBI-cdd保守结构域预测

2021-12-17  本文已影响0人  MLD_TRNA

利用NCBI当中的CD-search工具预测基因的保守结构域

搜索鉴定基因的保守结构域,应该用专门搜索基因的保守结构域工具CD-search,而不是简单的用blast搜索注释。快速找到这个基因上的保守结构域,对研究基因的功能是非常重要的,因为行驶相同相近功能的基因往往具有相同的保守结构域!

1.CDD入口:https://www.ncbi.nlm.nih.gov/cdd/,该工具为NCBI提供的,NCBI主页选项口选择进入Conserved Domain然后点击Search。

然后选择CD-search(单个基因),或者Batch CD-Search(多个基因)。

attachments-2018-07-HXZXbUUl5b55498230963.jpg

2.预测单条序列的保守结构域,点击CD-search进入:

粘贴基因的蛋白序列,或者是核酸序列都可以,注意为fasta序列,如果你知道基因的GI或Accession号,也可以直接数据这些ID就可以查询,右方OPTIONS中选择要搜索的数据库,Expect Value等,或者使用默认设置,然后按“提交”按钮。就可以搜索了;

attachments-2018-07-p64PmH1F5b554dcd35d3e.jpg

3.结果查看,默认为concise 简洁显示,可以选择full result显示全部内容:

attachments-2018-07-PjN2IRP15b5551fc237ea.jpg
搜索匹配结果,有特定匹配(specific hits),非特定匹配(non-specific hits),这些匹配所属的超家族(superfamily),我们发现这个基因特定匹配在dnak,属于HSP70超级家族;

4.批量提交序列搜索保守结构域,Batch CD-Search,如下::

可选择直接粘贴多序列的fasta格式文件,或者提交fasta格式的文件,然后选择数据库,如果数据较大搜索时间很久,可填写email,搜索完成之后会发邮寄,最后点击submit提交就可以搜索了:

attachments-2018-07-D3KiocWy5b55531d0bd65.jpg

5.批量搜索结果展示:

批量搜索结果如下,只展示部分结果,详细结果可点击download进行下载(记得勾选full,下载全部结构域信息),或者点击Browse results 进行详细的可视化浏览;

attachments-2018-07-K4e8FfiT5b5554032e57a.jpg

表格结果说明如下:


image.png

6.批量搜索结果,可视化浏览界面:

可以选中,然后浏览,下载等:


image.png
上一篇下一篇

猜你喜欢

热点阅读