[NAR|2019] SeqTailor 提取测序结果的序列
2019-07-22 本文已影响4人
drlee_fc74
image.png我们在做二代测序的时候。最终得到的数据结果当中是不包括基因的序列的。最多也就是得到
VCF
/bed
文件来反应目标序列的位置。SeqTailor是一个可以提取bed/vcf
文件当中基因突变序列的网站。我们可以输入特定的vcf/bed
文件格式。即可得到目标的RNA/protein
序列
输入
SeqTailor包括两个功能:提取RNA序列以及提取蛋白序列。其中提取RNA序列可以输入vcf/bed
文件。而提取蛋白序列则只能输入vcf
文件。
我们就以提取RNA序列来进行演示。我需要选择的是参考基因组。对于VCF
数据结果,我们需要输入起CHROM; POS; ID; REF; ALT
。而对于bed
文件。我们需要输入的则是CHROM; START; END
。
另外值得注释的是,这个数据库可以预测VCF
格式当中的突变对于剪切位点的关系。
输出
这里我们输入chr13 32954282 . GG TA
。同时观察这个位点的突变和剪切位点的关系。
对于剪切位点的注释:
+ve distance: 说明突变位于剪切位点的上游多少bp。
-ve distance:说明突变位于剪切位点的下游多少bp.
0: 正好位于剪切位点上。
如图则是代表正好位于剪切位点上。
image.png