数据分析解密大数据

黑天鹅笔记:重识熵信息论与数据科学

2017-02-22  本文已影响125人  凡凡了了


黑天鹅笔记:重识熵信息论与数据科学

题记:从熵的信息论角度看待黑天鹅事件,更需要理性与数据科学修养。

一.黑天鹅的世界

   最初开始阅读英文版《the black swans》,太多的地方仅仅只懂字面上的意思,根本不知道作者想说什么。听从了Tiger的建议,开始阅读中文版黑天鹅。粗读了一遍后,被作者有趣的想法与观念所吸引,于是又’细读’了一遍。即使若干年后,我忘记书中文字内容与逻辑结构,对“不确定性”这四个字的某些看法,仍会铭记于心。

        本书最吸引我的地方是作者面关于世界不确定性的思考,以及如何形成自己的决策理论与实践方法论,并最终形成经验怀疑主义的理念。作者毕业于沃顿商学院,商学院的从学经历和对他人关于“报酬具有突破性的职业”建议的思考,让作者走上了研究不确定性之路。书中用大量的篇幅说明我们很多时候无法预测不确定性,先后从哲学、历史等方面讲述了不确定性的产生的某些原因,而印象最深的是关于人性的生物性原因的解析。人的本性是喜欢面对确定性事物,人底层基因就喜欢接受确定性;避免叙事谬误和证实谬误确实很难,历史的积累无法完全解决黑天鹅带来的不确定性;很多时候,我们对事件的发生及影响会潜意识进行事后解释,这几乎也是无法避免的。当意识到这些现象存在,我们需要尽可能地避免事后解释给我们带来的“想象中已知”而“现实中无知”所带来一些列不利后果。

        面对未来的大量不确定性,我应该怎么面对与处理过往的经验呢?我不懂怀疑与经验之间存在怎么样的证伪关系。阅读刑事审判中无犯罪推理, 想要证伪一件事情是容易,想要证实一个结论确实很难。作者在面对不确定性时选择的更加理性的分析:在一个事件内,当发生极端事件影响很小时,积累效应有效,同时,你更应该大胆的尝试;当发生极端事件影响很大时,你必须保持怀疑,拥抱不确定性,努力将自己置身于积极的影响之下,避免不受消极的不利影响。总之,不要关注发生极端事件的概率,不要试图掌控黑天鹅事件,而是始终预测极端事件会产生什么影响,以及如何尽可能利用有价值的部分。

      阅读完黑天鹅不久,有些概念与逻辑我渐渐地遗忘,实际上是我忘记目前还不属于我的理念和逻辑。我原本是一个完美主义者,总是想能够全面分析得知利弊后再去做一件事情。看完黑天鹅之后,觉得柏拉图式分类定义的边界是有很多害处的,如果我给我的人生定义了许多边界,会让自己的人生产生更多的遗憾,尤其当意外事情突然发生的时候,我会更加不知所措。我开始放弃了对完美主义的追求。作者书中提到一些不具有突破性报酬的职业与具有突破性报酬的职业进行对比,如面包师与作家,医生与风险投资家。我对此有一些不同的看法。任何行业的从业者都可能成为该行业中具有突破性收入的人群,报酬是否具有突破性更多地取决于你能力是否具有稀缺性,这是我一生中需要不断思考的问题。

二.熵信息论与数据科学

      当我开始接触数据科学的时候,我对熵产生了浓厚的兴趣。 熵是什么?熵是不确定性的度量。首先,熵是不确定性的度量,它衡量着我们对某个事物的“无知程度”。既然熵代表了我们对事物的无知,那么当我们从“无知”到“完全认识”这个过程中,就会获得一定的信息量,我们开始越无知,那么到达“完全认识”时,获得的信息量就越大。因此,作为不确定性的度量的熵,也可以看作是信息的度量,说准确点,是我们能从中获得的最大的信息量。从熵的信息论角度学习黑天鹅事件,需要更加理性与完善的数据科学知识理论。在不能获得全部信息的条件下,获得更加真实的数据信息,才能更好的面对世界。面对世界的快速变化,我一直想不清楚在未来如何更好的提高自己的能力,如何获得更有尊严的报酬与利润。为了进一步实现自我价值的更大化,学习数据分析和数据挖掘,可以不断地提高自己的数据分析能力与软件应用能力。我已经在路上...

       面对未来,当我幸运地经历成功时,我需要思考黑天鹅事件;当我经常性经历失败时,我更需要思考黑天鹅事件,而且,我相信我并不孤独。

上一篇 下一篇

猜你喜欢

热点阅读