科研信息学生信数据库

[NAR|2019] SeqTailor 提取测序结果的序列

2019-07-22  本文已影响4人  drlee_fc74

我们在做二代测序的时候。最终得到的数据结果当中是不包括基因的序列的。最多也就是得到VCF/bed文件来反应目标序列的位置。SeqTailor是一个可以提取bed/vcf文件当中基因突变序列的网站。我们可以输入特定的vcf/bed文件格式。即可得到目标的RNA/protein序列

image.png

输入

SeqTailor包括两个功能:提取RNA序列以及提取蛋白序列。其中提取RNA序列可以输入vcf/bed文件。而提取蛋白序列则只能输入vcf文件。

image.png

我们就以提取RNA序列来进行演示。我需要选择的是参考基因组。对于VCF数据结果,我们需要输入起CHROM; POS; ID; REF; ALT。而对于bed文件。我们需要输入的则是CHROM; START; END

另外值得注释的是,这个数据库可以预测VCF格式当中的突变对于剪切位点的关系。

image.png

输出

这里我们输入chr13 32954282 . GG TA。同时观察这个位点的突变和剪切位点的关系。

对于剪切位点的注释:

+ve distance: 说明突变位于剪切位点的上游多少bp。

-ve distance:说明突变位于剪切位点的下游多少bp.

0: 正好位于剪切位点上。

如图则是代表正好位于剪切位点上。

image.png
上一篇下一篇

猜你喜欢

热点阅读