基因组学生物信息学

【基因组学】PHI生物互作数据库和植物R基因数据库

2022-03-05  本文已影响0人  巩翔宇Ibrahimovic

写在前面
    最近碰到点需求,了解一下其他植物的病害和抗性基因,于是检索了生物互作数据库,发现了Phibaseprgdb这两个网站,做个简单的介绍。

1. Phibase

website:http://www.phi-base.org/index.jsp
    收录了经过实验验证或文献报道的能够感染植物、动物、真菌和昆虫的真菌、卵菌、细菌等病原菌的致病基因、毒力基因和效应蛋白基因。另外,还收录了抗真菌化合物及其靶基因。

image.png

    这个数据库于2019年发表在NAR,最近的一次更新在2021年9月1日,内容上可以说是非常新了。

1.1 想查看该网站收录了哪些病原菌、宿主及病害名称。

分别对应左侧的PathogenHostsDieases,可以直接下载excel表格到本地查看。

1.2 根据宿主名或基因名称或功能检索

search-(advanced search,精确搜索需要advanced search,否则不需要),输入你想检索的信息就可。

比如我想搜索已报道的能侵染玉米的病害,我直接输入‘Zea mays’,然后拿到18页的信息。


image.png

第一列是已报道的致病基因名,第二列是表型,第三列是来源的病原菌,第四列是造成的病害部位,第五列是宿主。
把这部分信息download下来,用R语言的table()函数统计一下。

de <- read.table('maize-deasease.txt',sep = '\t',header = F)
dee <- de[,c(-1,-6)]
colnames(dee) <- c('geneid','function','pathogen','organ')
#统计病害并作图
library(ggplot2)
ta <- as.data.frame(table(dee$pathogen))
ggplot(ta,aes(Var1,Freq))+
  geom_bar(stat="identity",fill="steelblue")+
  geom_text(mapping = aes(label = ta$Freq), size = 6, colour = 'red', vjust = 0.5)+#给柱状图数值添加label
  theme(axis.text.x = element_text(angle = 45, hjust = 0.5, vjust = 0.5)) #调整横轴label为45度
image.png

可以看到,研究的最多的是玉米的瘤黑粉病,其次是玉米的小斑病。

1.3 下载网站所有的effector信息

downd按钮,有两种格式,CSV格式和FASTA格式任君挑选,不过下载之前要填写基本信息来注册,很快的。

1.4 对未知序列进行病菌基因寻找或同源基因寻找

PHI-Blast
不过只能做少数的数目,如果要搜索的数目太多,倒不如下载所有的基因组信息,本地做blast。

2. PRGDB

website:http://prgdb.crg.eu/wiki/Main_Page

image.png
这个用法就比较简单,你可以根据物种名,R基因类型名称搜索已报道的R基因。美中不足的是,这个网站自2014年就没再更新,因此信息可能有点陈旧。
参考链接
1.http://lib.mimazi.net/bioinf/112.html
2.https://mp.weixin.qq.com/s?__biz=MzA5NzQzOTgzMw==&mid=2650828558&idx=1&sn=56a798b6dedd5421ccc9673700e8d692&chksm=8b541638bc239f2e16998740dbaeee96568d9943c23310e0d94ec6aa012796c0cc9cf3e9e780&scene=21
上一篇下一篇

猜你喜欢

热点阅读