NAR2019数据集——CNIT RNA编码能力预测
2019-07-11 本文已影响12人
drlee_fc74
lncRNA是指长链的非编码RNA。指的是没有编码能力的RNA。但是随着研究的深入。我们发现一些lncRNA也存在编码能力。CNIT是一个预测RNA是否具有编码能力的数据库
![](https://img.haomeiwen.com/i10631927/ba5acc41f73e3e0f.png)
输入
CNIT
数据库接受mRNA序列的的 fasta格式的输入。我们可以输入多个fasta序列来预测其基因是否具有编码能力。如果大于1000条序列可以通过上传fasta文件来进行预测。
![](https://img.haomeiwen.com/i10631927/6650f107bef8834e.png)
我们这次使用实例文件的More Fasta
来进行预测。
输出
预测的结果包括一个下载方式
以及结果的展示
。我们的原始结果当中可以看到每一条fasta是否具有蛋白编码能力。同时也会本数据库自己计算的编码蛋白能力的得分。
![](https://img.haomeiwen.com/i10631927/9e8cafa7ac2cfde0.png)
另外我们可以通过 Details—View来查看每个fasta预测的详细结果
![](https://img.haomeiwen.com/i10631927/84841ce8be89477d.png)
代码行运行
如果觉得网页形式比较麻烦。这个数据库也提供了代码行运行的工具。这个工具是使用python
编写的。使用python
运行就行。
Animal:
[root@bogon CNIT]# python CNIT.py -f CNIT_Test_Data_multi_animal.fa -o CNIT_Test_Data_Result_animal -m 've'
Plant:
[root@bogon CNIT]# python CNIT.py -f CNIT_Test_Data_multi_plant.fa -o CNIT_Test_Data_Result_plant -m 'pl'