漫画也能讲清数据治理

2022-07-11  本文已影响0人  数据分析不是个事儿

转载/省联社科技信息中心,如有侵权,可后台联系删除!

在说数据质量之前,我们先来看一个小故事。

降落伞的真实故事

在第二次世界大战中期,

在当时,美国空军降落伞的安全度不够完美,

经过厂商努力的改善,良品率已经达到了99.9%,

应该说这个良品率

即使当今社会许多企业也很难达到,

但美国空军却要求降落伞公司的良品率必须达到

100%

于是,降落伞制造商的负责人便与之商讨此事,

看能否降低这个标准?

厂商认为当前这个程度已接近完美了,

没有必要再改了,

美国空军一口回绝“品质没有折扣”。

后来,军方改变了检验降落伞品质的方法;

是从厂商交付的降落伞中,

随机挑出一个,

让厂商负责人装备上身后亲自从飞行中的机身跳下。

这个方法实施后,不良率立刻变成零。

数据质量是什么

数据质量是指数据满足准确性、完整性、时效性、一致性、唯一性、关联性、适当性、有效性及可获取性的程度。具体含义如下:

(一)准确性:数据是否能够准确、真实反映实际信息,以及数据格式是否符合数据标准的要求;

(二)完整性:业务操作所需要的数据是否完备;

(三)时效性:数据是否能够及时被获取,以及是否能够反应当前业务情况;

(四)一致性:反映同一业务实体的数据及其属性是否具有一致的定义和含义;

(五)唯一性:数据在数据集中不存在重复值;

(六)关联性:数据是否具有明确的关联关系,数据关联关系是否被准确定义,数据是否符合数据间的关联关系;

(每个人的机票和飞机座位,都有明确的关联关系。)

(七)适当性:数据是否在可控、安全的范围内发布和使用;

(八)有效性:数据符合已定义的格式规范和业务规则;

(九)可获取性:数据易于理解,且数据格式满足用户需要。

责编 | 付斌

编辑 | 冯捷

来源 | 省联社科技信息中心

上一篇下一篇

猜你喜欢

热点阅读