基因家族分析我爱编程基因家族生物信息学分析

展示基因家族的结构域

2018-06-21  本文已影响280人  Wee_001f

motif与domain

motif(模体)是蛋白中较小的保守序列片段,概念比domain小。
PROSITE是专门搜索蛋白motif的数据库,其中signature seqs是最重要的motif信息。

domain(结构域)是在较大的蛋白质分子中形成的某些在空间上可以辨别的结构,若干motif可以形成一个domain。
Pfam可以搜索某段序列中的domain,并以图形化表示出来。用法:在搜索栏输入蛋白的swissprot的序列号。


展示基因家族的结构域

  1. MEME适合挖掘motif,不适合展示基因家族的结构域
    MEME以motif为单位,在序列中,往往一个结构与会包含一个以上的motif。
  2. NCBI CDD数据库,鉴定基因保守结构域
    NCBI conserved domain database(CDD),是收录大量NCBI官方矫正过的结构域模型,同时也提供一部分结构域的3D结构和功能说明。一般做基因家族,或者基因结构域鉴定的时候会用到
  3. 批量化绘制一个基因家族的结构域图片
    1)序列下载:http://planttfdb.cbi.pku.edu.cn/download_seq.php?sp=Ath&fam=ARF
    2)提交到NCBI的CDD batch search:https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi
    3)下载结果
    4)使用TBtools可视化Batch-CDD结果
    Others->Redraw Motif Pattern (from NCBI Batch-CDD)

来自:生信札记

上一篇 下一篇

猜你喜欢

热点阅读