大数据,只是“大”就好了吗?
食材,只有在被做成一盘菜的时候,它的价值才真正体现。
同理,数据也是一样。只有当数据真正用起来的时候,它的价值才真正体现。数据,也得讲究实用性。
但,在我们用数据之前,我们需要的往往不是单纯的数据的量,而是有质的量。
因此,从这个角度出发,我们该怎样来用数据呢?
01 “活”用数据,把数据用“活”
前者,我们需要灵活收集数据。维克托在《大数据时代》这本书里提到过:
数据的本质属性是相关性。
换句话说,我们现在接触到的数据是有一定相关性的。因此,我们在收集数据的时候,需要跳出我们的既定思维,从相关联的行业和事物中去收集能为现在有所用的数据。
后者,讲究动态的使用数据。这里包含两个层面,一个把数据变“活”;另一个是“活”用数据
通常情况下,我们收集到的,更多是存储在数据库里的数据。这里的数据是静态的,它反应的仅仅是在那个时间节点下,用户的数据是怎样的。却不能真实反应用户现在的行为是个什么样。因此,我们需要用场景来验证,将静态数据转变成动态数据。创造“活”数据。
接着,我们就得把这个“活”数据,用活。
车品觉在《决战大数据》这本书提到了活用数据的一个重要方法论:
- 我们的数据为用户体检改善了什么。
- 企业在使用数据时,对活数据的运用解决了什么问题或开创了什么机会。
02 核心数据很重要
在认识了数据的分类,并明确了数据的价值之后, 我们才能更好的识别哪些是我们想要的核心数据,从而发挥数据的作用。
为什么要认识数据的分类?
因为不同的数据,有着不同的用处。
为什么要明确数据的价值?
同一组数据可能会在不同场合产生完全不一样的价值;单一的数据需要组合起来才能产生价值。因此,我们需要明确的知道自己手上的数据有哪些价值,才能更好的运用他们。
而说到数据分类,车品觉给了我们4个维度:
- 是否可再生。
- 不可再生数据通常是最原始数据,要及早收集,并严格保护;
- 可再生数据是指通过其他数据生成的数据,要及早做好业务的预判和数据处理规划,以便在需要是能及时应用。因此,这类数据同样需要保护。
- 数据的存储层次。数据可分为基础层、中间层和应用层三个层次。
- 基础层往往就是我们的原始数据,是最基本的数据。
- 中间层是根据不同的业务需求,基于基础层加工的数据。
- 应用层是针对具体数据问题的应用。
- 数据业务归属
按照公司的不同业务,将数据分为相对应的业务数据。
- 是否为隐私
隐私数据需要有严格的保密措施来保护。
对于数据价值,作者也给我们总结了5点:
- 识别与串联价值。能辨别关系、身份的数据是最重要的。
- 描述价值。描述数据最好的一种方式就是分析数据的框架。
- 时间价值。在考虑了时间维度之后,数据缓存产生更大的价值。
- 预测价值。要么是对单品进行预测,要么就是对经营状况的预测。
- 产出数据的价值。很多数据自身没有特别的含义,但是当几个数据组合在一起,就可能产生新的价值。
03 关注数据盲点
盲点,往往指的是它存在,但是我们没有看到的东西。从数据上来讲, 盲点指的是我们无意中忽略的重要数据或角度。这里,大致可分为三类:一个是物理盲点,一个是逻辑盲点,另一个是人造盲点。
- 所谓物理盲点,是指在数据库不存在的数据,在收集数据时有遗漏。
- 所谓的逻辑盲点,指的是数据虽然存在,但我们并没有发掘出更有价值的信息。
- 所谓的人造盲点,指的是人为掩盖数据,或者调整数据口径。
而我们是否发现到数据盲点的核心,则在于:有没有看到应该看到的数据,有没有错失不应该错失的数据。
相关阅读:
《5分钟,跟着阿里学习数据化运营》
《人人都是数据分析师,人人都应是数据分析师》
1/33 《决战大数据》之读书笔记(一)