生信工具生物信息学与算法遗传调控

4️⃣ 核酸序列特征分析(2):CpG岛预测

2019-01-25  本文已影响37人  Y大宽
序列比对和序列特征分析总目录

如何识别CpG岛

GC含量:CpG岛的GC含量达到55%
二核苷酸的出现率:CpG二核苷酸的出现率(观测值与期望值的比率)达到0.65
序列长度:长度不少于500bp

传统的CpG岛识别方法就是基于以上三条。
另外还有一种主要的方式基于统计学特征的识别方法,如马尔科夫链和隐马尔科夫链
CpG岛是200bp或更长的DNA序列,GC含量较高,一般富集在人类基因组组启动子区和起始外显子区,在这个区段容易出现DNA甲基化,从而对基因表达进行调控。

推荐工具EMBOSS的CpGPlot

结果如下



满足
Observed/Expected ratio > 0.60
Percent C + Percent G > 50.00
Length > 200
三个条件的CpG显示在下方。

可以看出,该序列可能存在6个CpG岛。位置如图中所示。

其他

softberry

上一篇下一篇

猜你喜欢

热点阅读