circos 可视化手册-plots篇
不论是highlights
还是links
,展示的都是染色体上某段区域的信息,在实际的数据中,除了区间信息外,还会有该区间对应的数据信息,比如测序深度等信息。对于这种信息,通常我们会使用散点图,折线图等图表来展现。
在circos
中,也有对应的功能,通过plots
这个block , 可以在数据映射到二维坐标系中,然后通过不同的图表类型来呈现。
plots
需要的数据格式如下
共4列,空格分隔;前3列定义坐标,包括染色体,起始和终止位置;第4列定义对应的值。在这个文件中,有两点需要注意
- 区间信息可以是一个点,文件的第2列和第3列定义起始和终止位置,但是起始和终止位置可以相同;
- 第四列的信息不仅是数字,也可以是文字。数值可以使用散点图等展现形式,文字可以直接标记在图上。
plots
的基本用法如下:
在circos
中,基本都是通过一个圆环来展示数据的,r0
和r1
分别定义圆环的内径和外径,肯定是必须的。
这里有两个新的参数max
和min
, 对于散点图等图表来说,是需要一个坐标系的 ,file
文件中的前3列定义了横坐标,纵坐标就是通过这里的max
和min
来定义;max
和min
分别定义了纵轴的最小值和最大值,通过将file
文件中的第四列的值映射到这个范围,就可以确定在图上的位置。
type
定义图表类型,对于plots
而言,有以下类型
1. scatter
scatter
代表散点图, 展现形似如下
2. line
line
代表折线图, 展现形式如下
3. histogram
histogram
代表直方图,展现形式如下:
4. heatmap
heatmap
代表热图,展现形式如下
5. text
text
直接在图上标记文字,展现形式如下
在plots
中,还有两个比较特殊的图表类型,其数据格式和之前的几种类型都不太一样。
1 . tile
tile
用于展示染色体区域分布,通过边距,使得相邻区域不会重叠,其展现形式如下:
2. connector
connector
用于展示染色体上两个位置之间的联系,它需要的文件格式有点特殊,后续我会详细讲述,其展现形式如下:
上述就是plot
的基本概念和展现形式。在实际使用中,plots
还可以结合backgrounds
, axes
, rules
来使用,使图片更加美观。
由于plots
中的图表类型过多,每种类型又有很多的细节,针对每种图表类型,在接下来的文章中再单独介绍。