数据分析不只Tableau,还有这样一款可视化分析神器!
关于数据分析,有两个流行工具:PowerBI和Tableau ,但凡是提到做可视化,做数据探索分析,总会提及他们。
小编也是一枚数据分析爱好者,时常把弄一些工具,有开源的也有商业的。像Tableau的可视化很人性,个人用就像是Excel的智能升级版,但数据处理的速度和友好性略鸡肋,操作空间不大。如果是针对业态多样,数据量大而庞杂的企业数据分析,尤其是面临数据建模、数据清洗等耗费很多人力的操作,其实有款工具比Tableau更优 —— 帆软FineBI。
可能是企业级应用的缘故,比较低调,推荐的不是很多,今天小编就来给他正个名。(从事BI、DBA的IT人可以关注下,职业利益相关!)
在正式介绍它之前,先给大家科普一下BI,尤其是自助式BI。
自助式BI VS传统意识中的BI
FineBI属于自助式BI,最大特点是用起来简单。
在自助式BI出现之前,BI 通常只有具备IT技术背景的研发人员和数据科学家能用,他们多集中在企业技术部门,通常也称为企业级BI,典型工具如SAP的BO、IBM的cognos。它们最大的问题是使用门槛高,让懂业务却不懂技术的业务分析师望而却步,只能向IT提需求,并不能对数据做统筹。而且传统BI工具效率低,完成一个需求要经过数据建模、ETL架构设计、报表开发等一系列工作,通常3~15个人天,如果需求一改,这些工作又得重做。
同样的工作用自助式BI,数据没有大问题的话,1~2个人/天。
为什么差距这么大?主要是技术上的原因:传统BI是手动建模,而自助式BI是自动建模。
手动建模建出的模型是死的,使用聚合存储,建模之前必须把全部需求调查清楚,一旦需求有变,需要打回信息部重新来一遍,一前一后都有较高的沟通成本(你试过被反复dis的感受吗)。自动建模是以表间关联为依据,多维数据库中存储明细数据,以深度优化的索引等技术保证即席运算性能。得到的模型灵活多变,需求变化的响应可以在OLAP层面,而非建模层面实现,免去了大量沟通和建模工作。这样的好处就是信息部可以授人以渔:信息部准备数据,教授业务部门做数据分析,立刻就知道问题出在哪里。
那么,作为自助式BI的FineBI,高效这一特征这不言而喻。具体体现在哪里?这里从工作效率、制作难度、需求应付率、可视化和数据处理性能等方面来介绍下。
如何让IT & 业务配合更高效?
可以来看一下FineBI的使用流程(如下图):分别为管理员创建业务包(准备数据),业务人员新建仪表板(可视化和探索性分析),业务人员新建螺旋分析(前端再处理数据),领导查看分析(对外分享报告)。
数据分析不只Tableau,还有这样一款可视化分析神器!创建业务包就是准备数据,这个工作一般让信息部去做,把数据转化成业务分析人员可理解的数据(一般会准备大而全的明细数据)。
然后,业务人员拿着业务包里的明细数据,根据需求做分析,比如做一个销售dashboard,分析每个产品、每个地区、每个销售员的销售情况综合判断。在没有分析目标的情况下,可以尝试探索性分析:聚合、预测、帕累托等,都有现成的模型。
螺旋分析就是有些情况下,一些字段没有现成的,比如环比、同比,你可以在前端创建新的公式。
这些都完成后,基本的可视化就算完成了,然后将你的数据报告分享给领导,或者是定时出日报、月报,自动推送给指定人群。
这样的流程改变了以往业务提需求,IT拼死拼活赶需求的状态,现在就是IT给准备好数据:
IT部门:喏,你会用到的数据都在这儿来了,不同类型的数据都放在业务包了。你们自己去取,然后拖拽图表就可以了,没有的字段可以在finebi里面临时生成。
业务部门:这么简单,我们试试。不过这样也好,我们自己分析出成果也快,省得之前怎么也get不到我们的需求,我们都省事。
IT部门:......
所以,相比以前整天向信息部要催报告,修改报告的模式,流程配合上也就不再迂回,反复推锅了。
如何10分钟做出一张dashboard?
流程上见解了很多,说到底还得自己做dashboard,FineBI到底如何做dashboard ?
流程:
数据分析不只Tableau,还有这样一款可视化分析神器!简单来讲就是,数据准备好了之后,选图表——添加数据字段——没有现成字段的就设置一个——添加分析元素(钻取、联动)——美化图表——分享。
如何做一份让人眼前一亮的可视化分析?
比如下面这个大屏,通常应用在展厅、领导办公室、政务掌控中心。通常掌握上述的dashboard制作,30分钟就可以搞定。原理就是构建每一块图表,然后拼接在一起,美化一下背景,增加一些科技的元素。至于展示哪些数据,这个考量你的内功,需要根据你分析的思路来布局,最终能讲好一个故事。
数据分析不只Tableau,还有这样一款可视化分析神器!除了分析,还能搞定复杂式中国报表!
之前有网友评价,诸如此类的BI工具无法制作复杂的中国式报表。这里喊一下冤,BI工具和报表工具还是不一样的,前者是为了数据分析,快速出报告;后者就是做报表的,就是数据展示。使用BI是对同一个问题从不同的角度进行分析、以多种形式展现分析结果、通过管理驾驶舱突出业务问题的本质。使用报表就是制作中国式复杂报表、固定格式报表、周报、月报等。
如果非要说两个需求都要的话,FineBI可以搭配FineReport,做复杂式中国报表。
FineReport是什么?
它的本质是一个通用的报表制作和数据可视化工具。好比Excel,小到可以存储统计数据、制作各式各样的图表、dashboard,主要制作中国式复杂报表、固定格式的报表。参考这款效率远超Excel的表格工具,没用过就可惜了!
怎么搭配使用?
FineReport可以借助FineBI对大数据处理的性能,连接数仓和多维数据库,出表更快。同样的FineBI也可以借助FineReport,制作表格式报表,报表形式也不受局限。
数据分析不只Tableau,还有这样一款可视化分析神器! 数据分析不只Tableau,还有这样一款可视化分析神器!数据处理性能如何?
刚提到FineBI在大数据方面处理性能较佳,对于处理千万级、上亿级的数据,可以看下图:
数据分析不只Tableau,还有这样一款可视化分析神器!这工具的性能主要分为FineIndex性能和数据分析性能。
FineIndex性能
FineIndex本身作为数据仓库到自定义分析的中间层,它是将数据仓库中抽取的数据作为缓存数据生成文件放置到硬盘上的,它本身构建的是数据立方体,需要切片、分组索引。因此其性能参数主要在于如下:
(1)内存
FineIndex在抽取数据、分组写入索引、写入关联生成缓存数据的过程中,均会将数据在内存中去操作,内存越大其速度越快。
FineIndex在数据计算的过程,采用的是java计算(一般优于sql计算),也是消耗内存的资源,因此内存越大其运算的速度越快。
(2)硬盘
FineIndex的生成是写入硬盘的文件。因此写入速度越快,性能越高。在被读取数据时,系统执行的是文件级读取(性能上优于数据库读取),读取文件的速度越快,则性能越优。
数据分析性能
数据分析是前端新建仪表板模块加载FineIndex的数据进入内存中进行计算。因此仍然是FineIndex的数据读取进行加载,然后在内存中运算。
但是,区别于由于建立了业务包,数据仓库的数据定时更新,比如夜里更新,第二天处理数据就直接拿着本地的业务包里的数据做处理,也避免重复计算,像Tableau每次都是重新读取全部数据,数据量大会卡顿,运行速度高效快速。
数据&分析协同
FineBI有类似办公协同软件OA的一套流程管理和权限控制,主要出于数据安全考虑。可以设置部门只能看部门内的数据,个人只能看个人权限范围内的数据,dashboard制作完分享给别人时,也可以指定分享给谁,被分享者收到通知后登录门户时,可以看到报表出现在桌面中,然后修改、批注。
小编觉得这点比tableau好太多,尤其是出于数据安全的考虑,更能适应本土化的需求。
最后:
总得来说,业务部门更关注底层数据处理的可信度,是否真实反映业务状况,是否能高效便捷低成本的完成数据分析,指导业务经营。在底层数据处理上,FineBI建立业务包这些操作,让IT部门的人能互动,协同数据准备,高效而准确。
最后,关于FineBI这工具,有个人免费版,真的随便用,没有阉割功能。只是有两个并发限制,毕竟是商业软件嘛。
PS:文章中有提到FineReport这个工具,小编会在下次更新中专门介绍FineReport,大家记得持续关注我哦!