用Tableau画和弦图之二

2019-11-22  本文已影响0人  扫地sir

以前写过一篇《用Tableau画和弦图》,介绍了Noah Salvaterra大神的和弦图制作方法,完全只是模仿,看不懂思路。

网上也看到有另一种和弦图,只是点之间用连线表示关系,这种看起来就简单多了,我研究了一段时间,但是总是有一些小问题得不到解决,就一直没有分享。前些天,有人问起制作方法,既然答应了要写一篇,所以就分享一下心得。严格意义上这不是一个完美的制作方法。

创建数据集

数据集来自混子哥的公众号——着迷小课里的《唐朝诗人朋友圈》,我自己整理了一下数据

链接: https://pan.baidu.com/s/1GV1D14DZ3zRwUO3zCM0CNA 提取码: z4fb

这里要说一下,一共29个诗人,每个诗人都有一个顺序编号(1-29),姓名1顺序和姓名2顺序,就是取的这个顺序编号,这两个字段决定了,每个诗人在圆环中的位置。

姓名1位置和姓名2位置是辅助列,辅助计算后面的4个字段,数据集的excel表里有公式,大家可以自己研究一下,很简单。

另一张表是link表,用来增加数据密度。

导入数据data表和link表,做表连接,这样每行数据就变成了102行。

创建计算字段

SEPT1

image.png

这个字段决定了要显示多少个点,目前是29个诗人,所以选择29,多了圆环会有缺口,少了会只显示一部分

SEPT1的4个计算字段,确定了每个点在圆环上的X、Y值,如果姓名1和姓名2都出现的,那么这个点就会有重复值,也就是后面问题的根源。

SEPT2

SEPT2共3个计算字段,segment length就是有关系的两个姓名之间的直线距离,用的是勾股定理。

SEPT3

IF [T] <=1 
THEN "chord"
ELSEIF [T] = 2
THEN "start point"
ELSEIF [T] = 3
THEN "end point"
END

这样区分了数据点的类型,0.01-1这100行用来画弦,也就是中间的连线,2和3两行用来画点,也就是姓名1和姓名2。

SEPT4

用来调节弦和点之间的距离

x=

IF [T] >= 0 AND [T] <= 1
THEN
(( (1 - [T])^2 ) * [name1.x]) +
(2 * (1 - [T]) * [T] *  
  (
    ((2 - [segment length])/ 2) *
    [angle.x]
  )
) + 
([T]^2 * [name2.x])
ELSEIF [T] = 2
THEN [distance] * [name1.x]
ELSEIF [T] = 3
THEN  [distance] * [name2.x]
END

y=

IF [T] >= 0 AND [T] <= 1
THEN
(( (1 - [T])^2 ) * [name1.y]) +
(2 * (1 - [T]) * [T] *  
  (
    ((2 - [segment length])/ 2) *
    [angle.y] 
  )
) + 
([T]^2 * [name2.y])
ELSEIF [T] = 2
THEN [distance] * [name1.y]
ELSEIF [T] = 3
THEN [distance] * [name2.y]
END

这计算字段利用的是二阶贝塞尔曲线公式,大家可以自行百度,如果希望自己控制弦的弧度,可以把(2 - [segment length])/ 2)设置成一个参数,大致在-1到1之间,1的时候基本上是直线。

制作图表

这样和弦图的样子基本上就有了。

现在我们可以再创建两个计算字段

SEPT5

IF [T] = 2 then [姓名1总次数]
ELSEIF [T] = 3 then [姓名2总次数]
ELSE 0.1
END
IF [姓名1第一次出现]= 1 and [T] = 2 then [姓名1]
ELSEIF [姓名2第一次出现] = 1 and [T] = 3 then [姓名2]
ELSE NULL
END

但是如果直接把[关系]拖到“颜色”里,圆点上的颜色就会有问题

那么我们新建一个字段,只显示圆点

IF [T] = 2 and [姓名1第一次出现]=1
THEN [distance] * [name1.x]
ELSEIF [T] = 3 and [姓名2第一次出现]=1
THEN  [distance] * [name2.x]
END

大致效果如下,这样就可以区分开弦和点,可以根据需要,分别调整点和线上的颜色,大小,标签等。

大家可以到我的public上下载我做完的文件。

public地址:https://public.tableau.com/profile/jiangbin#!/vizhome/TangDynastypoetrelationship/1_1

目前这种方法只适用于点和线比较少的情况,一般来说数据量大了以后,需要通过集动作高亮显示,这里我参考过一些public上的viz作品,但是实验下来总会有些小bug。原因是姓名1和姓名2中都有的人,导致这个点上 "start point"和"end point"都会有值,而我只想取 "start point",取值的时候就会有偏差。
这里就不介绍了,等研究透彻了再说吧。

此篇文章已发布到我的公众号:saodisir,有兴趣也可关注一下

上一篇下一篇

猜你喜欢

热点阅读