序列也“内卷” – 蜗牛图展示双重序列比对
从“内卷”说起
内卷化效应就是长期从事某一方面的工作,水平稳定,不断重复,进而自我懈怠,无渐进式的增长,无突变式的发展,对即将到来的变化没有任何准备,完全缺乏应变能力。-- 摘自百度百科
我们这里所说的内卷,完全就是字面意思– 往内部卷,简称内卷!
图1. 互补碱基配对展示
序列比对是生物学分析中最常用的一种研究序列相似性的方法,准备好fasta序列,可以使用clustalw在线比对(https://www.genome.jp/tools-bin/clustalw),或者使用mega等软件本地运行。
一般进行展示的方式如下:
图2. 多重序列比对展示
这种展示方式看着很直观,对于短的序列还行,对于长的序列,由于长度的限制,往往会分成多行展示,占用大量篇幅,而且,现在随着高通量测序的发展,越来越多的序列比对变得越来越长,因此,展示方法也在逐渐改进。
这里,我们以内卷化展示双重序列比对。
[if !supportLists]0, [endif]准备两条待比对序列
这两条序列存储在fasta文件中,如下:
图3. 待比对序列
[if !supportLists]1, [endif]在线比对
我们使用微生信平台的在线工具来进行在线比对,即添加空位,让尽可能多的碱基匹配。打开paired align网址:
http://www.bioinformatics.com.cn/static/others/sms2/pairwise_align_dna.html
分别将序列one和序列two贴进去,提交
图4. 序列比对
[if !supportLists]2, [endif]获得比对结果
点击提交后,可以获得比对后的结果,如下图
图5. 比对结果
[if !supportLists]3, [endif]粘贴比对结果,选择参数
将上述步骤的比对结果,仅名字和序列,共4行,粘贴到微生信平台http://www.bioinformatics.com.cn/plot_basic_paired_sequence_alignment_on_sparials_plot_125
图6. 待粘贴的4行(必需是4行)
然后选择参数,提交即可出图
图7. 提交页面
参数包括:图像大小,标注名字的位置,碱基的大小,需要转多少圈等等。大家可以一一尝试。
[if !supportLists]4, [endif]提交出图
图8. 比对图,相同碱基连线
为了展示碱基互补结果,我们还提供了AT、GC配对的展示方式,也就是配对碱基间进行连线(图1)。
与线性(长序列被截断成多段)或者circos图(一个圈,空间浪费严重)相比,使用内卷化(有网友称之为“蜗牛图”,很形象)展示这种结果的好处有:
[if !supportLists]1, [endif]最大限度地使用有限空间。
[if !supportLists]2, [endif]因为是连续的,所以视觉上比较顺畅。
[if !supportLists]3, [endif]图新颖直观。
这种图可以展示:
[if !supportLists]1, [endif]双重序列比对,例如clustalw和blast结果等
[if !supportLists]2, [endif]碱基互补配对,例如miRNA-靶基因的碱基配对比对等。
凡是两个通道的比较,理论上都可以用这种方式展示。
最后,感谢spiralize R包作者提供这么好的一个可视化包供大家使用。https://github.com/jokergoo/spiralize
微生信云平台 注册用户38000 引用400
微生信云平台(http://www.bioinformatics.com.cn)以在线作图、在线数据分析为基本方式,致力于0代码分析科研数据,0代码展示数据结果,帮助生命科学、医学等领域的科研工作者更便捷地分析数据,了解数据,挖掘数据背后的生物医学意义,辅助科研,促进知识传播。