转录组比较与进化基因组学

LncRNA学习

2020-03-01  本文已影响0人  M78_a

特点:

1,长度大于200nt,非编码RNA
2,植物 lncRNA 主要由 RNA 聚合酶Ⅱ转录,具有5′帽子和3′多聚腺苷酸加尾
3,本身缺少完整的开放阅读框,正常情况不编码蛋白质
4,ncRNA 在动植物体内的表达水平都较低,在序列的进化上保守性差

植物lncRNA数据库:

1,CANTATA数据库(http://yeti.amu.edu.pl/CANTATA/)

收录了大部分植物的lncRNAs信息, 主要通过软件预测的方式识别植物中的lncRNA,目前收录了39个物种, 是最大的植物lncRNA数据库(Quek等2015);

那我们点开网址进行看看:


image.png

常见的作物都有,但是么有小麦的。

2,GreeNC数据库(http://greenc.sciencedesigners.com/wiki/Main_Page)

收录了植物和藻类的lncRNAs信息(Quek等2015)。

该数据库预测lncRNA的策略较为严格, 主要是:
1,通过与Swiss-Prot蛋白数据库比对, 筛选没有比对上的转录本的方法,
2,或者采用CPC软件预测蛋白编码潜能,

最终取2种方法的并集作为候选的lncRNA数据, 其lncRNA数据分
为high confidence和low confidence。目前收录49个物种的lncRNAs信息。

image.png

geng粳稻,小麦,玉米都有

3, NONCODE是一个系统化的数据库(http://www.noncode.org/),

致力于提供非编码RNA尤其是lncRNA最完整的注释(Yi等2015)。
通过收集和整合, 该数据库中的lncRNAs数量从527 336个增加到548 640个, 且数据库物种总数达到17个


image.png

植物的话,只有拟南芥!

4,PlncRNADB (http://bis.zju.edu.cn/PlncRNADB/index.php)

该数据库共包含了拟南芥、白杨、玉米的lncRNAs信息。从
GEO数据库中采集物种对应的RNA-seq测序reads,
通过特殊算法策略组装得到转录本序列, 识别到
lncRNA之后, 通过catRAPID在线服务预测lncRNA
和蛋白之间的相互作用, 这个数据库提供了研究
植物中lncRNA的思路, 其预测lncRNA序列和lncRNA-protein相互作用的方法值得借鉴。


image.png

物种有限,拟南芥,玉米,白杨,好在是打开速度快!

以上纯粹是记录一下,以后用到再翻翻看,这些数据库暂时咱还没时间过,最近就是想把LncRNA
的分析流程走一遍

参考文献:植物长链非编码RNA的生物学功能研究进展

上一篇下一篇

猜你喜欢

热点阅读