序列也“内卷” – 蜗牛图展示双重序列比对

2022-05-04  本文已影响0人  微生信

从“内卷”说起

内卷化效应就是长期从事某一方面的工作,水平稳定,不断重复,进而自我懈怠,无渐进式的增长,无突变式的发展,对即将到来的变化没有任何准备,完全缺乏应变能力。-- 摘自百度百科

我们这里所说的内卷,完全就是字面意思– 往内部卷,简称内卷!

图1. 互补碱基配对展示

序列比对是生物学分析中最常用的一种研究序列相似性的方法,准备好fasta序列,可以使用clustalw在线比对(https://www.genome.jp/tools-bin/clustalw),或者使用mega等软件本地运行。

一般进行展示的方式如下:

图2. 多重序列比对展示

这种展示方式看着很直观,对于短的序列还行,对于长的序列,由于长度的限制,往往会分成多行展示,占用大量篇幅,而且,现在随着高通量测序的发展,越来越多的序列比对变得越来越长,因此,展示方法也在逐渐改进。

这里,我们以内卷化展示双重序列比对。

[if !supportLists]0, [endif]准备两条待比对序列

这两条序列存储在fasta文件中,如下:

图3. 待比对序列

[if !supportLists]1, [endif]在线比对

我们使用微生信平台的在线工具来进行在线比对,即添加空位,让尽可能多的碱基匹配。打开paired align网址:

http://www.bioinformatics.com.cn/static/others/sms2/pairwise_align_dna.html

分别将序列one和序列two贴进去,提交

图4. 序列比对

[if !supportLists]2, [endif]获得比对结果

点击提交后,可以获得比对后的结果,如下图

图5. 比对结果

[if !supportLists]3, [endif]粘贴比对结果,选择参数

将上述步骤的比对结果,仅名字和序列,共4行,粘贴到微生信平台http://www.bioinformatics.com.cn/plot_basic_paired_sequence_alignment_on_sparials_plot_125

图6. 待粘贴的4行(必需是4行)

然后选择参数,提交即可出图

图7. 提交页面

参数包括:图像大小,标注名字的位置,碱基的大小,需要转多少圈等等。大家可以一一尝试。

[if !supportLists]4, [endif]提交出图

图8. 比对图,相同碱基连线

为了展示碱基互补结果,我们还提供了AT、GC配对的展示方式,也就是配对碱基间进行连线(图1)。

与线性(长序列被截断成多段)或者circos图(一个圈,空间浪费严重)相比,使用内卷化(有网友称之为“蜗牛图”,很形象)展示这种结果的好处有:

[if !supportLists]1, [endif]最大限度地使用有限空间。

[if !supportLists]2, [endif]因为是连续的,所以视觉上比较顺畅。

[if !supportLists]3, [endif]图新颖直观。

这种图可以展示:

[if !supportLists]1, [endif]双重序列比对,例如clustalw和blast结果等

[if !supportLists]2, [endif]碱基互补配对,例如miRNA-靶基因的碱基配对比对等。

凡是两个通道的比较,理论上都可以用这种方式展示。

最后,感谢spiralize R包作者提供这么好的一个可视化包供大家使用。https://github.com/jokergoo/spiralize

微生信云平台 注册用户38000 引用400

微生信云平台(http://www.bioinformatics.com.cn)以在线作图、在线数据分析为基本方式,致力于0代码分析科研数据,0代码展示数据结果,帮助生命科学、医学等领域的科研工作者更便捷地分析数据,了解数据,挖掘数据背后的生物医学意义,辅助科研,促进知识传播。

上一篇下一篇

猜你喜欢

热点阅读