CIRCOS模块---这应该是最接近原版circos的版本了吧~

2021-08-27  本文已影响0人  许东

circos图是在基因组以及基因家族中较为常见的图。原本circos据说是一位画家玩腻了学了学数学搞出来的。所以其配色、比例等是比较耐看也是比较大气与和谐的。如下图所示:

原版circos

但使用这个程序需要克服两点:第一点是需要会使用linux系统(当然,它有windows版本,但安装各种模块足以让人崩溃);第二点是需要搞懂它的逻辑与配置文件的设置。我当初在学习这个程序的时候也是几乎用了一整个月的时间。因此,如何克服这两点并且实现近乎类似的作图效果,是需要解决的一个重要问题。

在SPDE的新版本中为大家设置了类似功能,它的位置在:

SPDE circos模块

其中,第一个按钮是介绍该模块各个参数的名称以及意义的,如下图:

circos中各参数以及意义

还是本照了新版SPDE的基本原则,界面上凡是用红色特殊标注的是必填选项,其他为选填或者后续可以调整的:

界面

第一个需要填入的文件是染色体及长度,其格式为:

chr-length格式

就两列,一列是染色体ID一列是长度。该文件的获取可以通过

fai文件获取

或者:

fai文件

在得到fai文件并打开后,

fai文件内容

你会看到类似这样的内容。只取前两列就好,其余删除。

第二个文件是染色体ID-长度和颜色,基本格式为:

染色体ID-长度和颜色

该文件的获取在前面的For circos模块中已经有所讲解,这里不再赘述。

那么获得上述两个文件后就可以开始进行一个基本的绘图了,如下:

基本参数

说明:大家可以看到界面有很多可以调节的参数,同时大家也知道circos图,它是一圈一圈叠加的。正是因为它是一圈一圈叠加的,所以要求大家在绘图前能够先进行一个大体的设计。因为参数多,所以我给大家设置了很多默认值,也就是说只要不标红,在刚开始绘图时,你是可以不用管的。而当你把每个参数都调节好了之后,一定要点击下方的submit按钮,这个时候你所设计的各个参数会汇集到右侧的表单中。这个表单区域也是最终数据的获取区域,后续有哪些参数需要调整可以直接在表单相应区域进行更改,也可以将生成的信息删除再调节完成过后重新生成表单信息。

结果如下:

基本circos

大家可以看到用不同颜色标注的染色体。

这个时候有些同学可能需要添加多层,那么表单这个位置发生的变化是:

表单

这里我直接用了上一次的数据文件,结果变为:

添加了第二层

这里大家可以细细比较和品味一下我所涉及表单的好处。如果你想要为染色体加上刻度,那么可以先直接点击提交

添加刻度线

结果为:

添加刻度

表单区域参数:

添加刻度线

这个时候如果想要添加类似于gc含量这种参数的时候,可以添加文件:

GC含量文件格式

前面是染色体ID 后面是终止和起始位置,再后面是GC含量,其他与数据相关的数据都可如是进行准备。

界面是:

GC含量界面

当然如果同学们想表达在染色体的某个区域的各个基因的表达量也同样可以用这个界面来实现。换言之,有关于任何与基因及其相关数量(GC含量,表达量等)相关的设置都在此处进行。

结果:

GC含量示例

在这里我仅仅只是举了一个小例子,向同学们说明用法,当然同学们在真正做的时候肯定数据要比这个多,效果肯定也要比这个好。表单如下:

在做家族分析的时候往往还需要展示基因ID,界面为:

添加染色体相应部位文字描述

文件内容:

添加文字描述

第一列染色体ID,第二列和第三列分别是起始和终止位置,第四列是描述性文件,第五列是颜色,第六列是字体大小。在做这个文件的时候前面的关于染色体位置等信息可以通过For circos模块实现。后面关于一些个性化的设置,则建议同学们打开excel,在excel里添加后,一定注意另存为制表符格式,注意一定是制表符格式,注意一定按照每一列该是什么东西来添加。如果该列某些参数不做设置可空,比如上图中的ARF9不做其关于颜色的设置,那么第五列这个位置空着就好。结果如下:

添加文字标注

另外,还可以添加的是连线,这个在circos图中也是比较常见的要素:

效果如下:

添加连线

所用的功能是:

连线功能

文件格式为:

连线文件格式

这几列分别是染色体ID,起始和终止位置,最后两列是颜色和透明度的设置。其中,前四列一般是共线性分析的结果,关于该部分可参考之前对几个模块的描述来获取相应共线性文件。获得后在

格式化共线性文件

这个模块进行相应的格式化操作。

还有一个是线框模块,在这里:

线框模块

该某块不需要输入文件,至于需不需要设计是根据同学们的自己的需求来的,其结果是在所设置的半径处增加一个相应的线框,如下:

增加线框

这个是根据同学们个人审美来定的。

总之,大家通过阅读上面的文字,可以看出这个circos模块事实上具有着高度的灵活性,最终这个图会画成什么样是完成由同学们自己的设置以及文件内容决定,就以本章最开始画染色体基本图形举个小例子:情况是如果有些同学想要针对某个染色体来重点说明或者染色体以及scaffold太多画不开,这个时候可能就要考虑分层,那么如果实现这样一个场景呢?其实很简单,只需要再多加一个文件就好了,以1号染色体为例:

在第一个文件中,可以把一号染色体的颜色设置为白色(因为背景是白色,所以相当于隐藏1号染色体),这个文件长这样:

第一文件

第二个同样是这样的格式,但我只保留一号染色体,长这样:

第二个文件

然后,拖入一个文件设置一个参数,拖入第二个设置第二个参数,于是表单长这样:

仅仅改变了半径以及文件

注意,我改变了第二个文件的半径为4.5。于是,绘图结果就变成了:

1号染色体突出显示

这样就把一号染色体突出出来了。所以,最终的结论是:工具就是这样,至于如何能够画出精彩的图,这就需要看同学们自己的智慧了。

至此,也完成了关于整个SPDE功能的介绍。同学们如果有什么建议或者遇到什么问题可以给我留言,对于一些同学们常出现的问题我会不断在简书中加以完善和补充。同时,我做的第二款软件(关于基因功能注释)也即将面世,关于其用法也将陆续在该简书中公布。所以,请同学们持续关注该简书,谢谢!

上一篇下一篇

猜你喜欢

热点阅读