大数据愚见
好久没有用简书写东西,因为之前无情的校招让我非常疲惫,虽然有结果但目前不太满意,考虑考研中,北京之行有所斩获,虽然只拿了实习但是是一直想去的公司还是比较开心,今天想写一下《智能时代》的读书笔记,这本书是原《浪潮之巅》的作者吴军所写,这本书伴随我整个校招的时光,看得很零散,但依旧有不少收获,想谈谈自己的一些看法以及如何讲大数据以及大数据的思维结合到运营当中,顺便打法火车上的无聊时光
什么是大数据,这个问题比较难理解大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,这是百度百科的解释,我目前看来是通过数据的方式来描述事物和事件,当然数据量要足够大,描述维度要足够多,数据要足够完整,才能够看作是大数据,大数据可以说是未来改变世界的东西,机器学习,人工智能都离不开它,但在此之前我想先分享一下另一个离我们更近的东西,大数据思维
大数据思维是什么或者说现在我们现有的思维是什么?我们现在运用的思维方式是机械思维,现在看到机械就觉得是贬义,但机械思维却是现代文明的基石,简单理解就是因果思维,因为有这样的因导致了这样的果,你看我们现在学习是不是都是这样的思维模式,这套模式过去一直是帮助我们了解和定义世界的客观规律所用,而大数据思维是什么?显然和机械思维不同大数据思维是结果强相关的思维,直接通过大数据的客观现象来得出结论,通过相关性来直接定义规律,沃尔玛的啤酒尿布(啤酒和尿布在超市摆在一起可以获得更好的销售额)就是运用的大数据来来进行发现的,至于他的因显然就不这么重要,所以你可以直接运用这个结论进行实行就可以了,显然通过大数据思维可以不需要去了解它的因,而直接用数据来得到事实,这种分析的方法论已经越来越多的人和越来越多的产业开始运用,甚至国外的司法程序也开始在为这种论证方式进行背书,很显然思维的革命毁影响到每一个人
说完大数据思维,再来看看大数据的作用,最基本的作用是尽可能的消除或者减少不确定性,书中的一个例子我特别深刻,抛一枚骰子大家都知道任何一面的可能性是六分之一,但是如果你在抛出来之前就已经知道它的力度,空气的阻力,桌面的弹性……所有相关的数据,那我相信如果你数学够ok的话可以精准的计算出最后的数字是什么,消除不确定性的应用简直太多了,亚马逊的推荐,就是利用大数据来揣测你的喜好,消除的不确定性是你是否真的喜欢我推荐的东西,目前互联网加金融的征信系统,就是消除你这个人是否诚信以及能否有能力支付利息和确定贷款的额度,而国外飞机公司给商务人士推送高价票(这个很坏)也是通过大数据来消除你对价格是否敏感的不确定性......这样的例子太多了,以至于在大数据时代,是不是致我们终将逝去的隐私了......
大数据的第二个作用我认为是可以进行优化方案以及提高效率,你可能会遇到这个情况你延后5分钟走可能达到某地的时间比你不延后5分钟走到达目的地晚一个小时,因为你可能正好迈入了高峰期,而大数据则可以通过各种各样的对比(过去数据等等指标)得出最佳的出行方式,来提高效率,不仅仅是出行行业,大多数的行业都可以通过大数据来进行优化,本书提出的有医疗和律师,节省不少的人力成本
第三点就和人工智能机器学习有关系,这一点实话说技术渣的我看的稍微有点云里雾里,影像较深的例子是阿尔法go大战李世石的围棋大战,这是一场大数据的胜利,可以知道的是阿尔法go里面有着大量的围棋的数据,可以说李世石下一步,它几乎将这一步及其以后它有可能走的每一步都预测出来(确切的说是之前已经录入只是进行匹配)在根据这些数据通过一系列复杂的计算得出最优解,这不就相当于几百几千位围棋高手打李世石嘛……所以你可能发现人工智能不是本来就这么聪明,是大数据让他变得更聪明了
就像《运营之光》里老黄说的,运营肯定是具有不确定性(比如你不会精确的知道这篇推文有多少阅读量),高级运营就是要让不确定性变小,并在提前做好充足的准备,我们生活在数据时代,数据不会骗人,但发现数据后面的规律却需要我更加长足的学习和补充,就像很早有人得出结论,晚上8点推送的阅读量最好,至于为什么我也不是知道得很明了,但谁管他了,会用就好,这就是大数据的秘密吧,火车快到了,大数据的事以后再说,欢迎批评指正,毕竟还是新人,只是愚见......