这周学习有感

2019-04-14 本文已影响0人 DJ_f3ee

贝叶斯全名为托马斯·贝叶斯(Thomas Bayes，1701-1761),是一位与牛顿同时代的牧师，是一位业余数学家，平时就思考些有关上帝的事情，当然，统计学家都认为概率这个东西就是上帝在掷骰子。当时贝叶斯发现了古典统计学当中的一些缺点，从而提出了自己的“贝叶斯统计学”，但贝叶斯统计当中由于引入了一个主观因素（先验概率，下文会介绍），一点都不被当时的人认可。在1723年的一篇论文中，他首先提出了这个定理。这篇论文是在他死后才由他的一位朋友发表出来的。在这篇论文中，他为了解决一个“逆向概率”问题，而提出了贝叶斯定理。

贝叶斯在他的文章中是为了解决一个“逆概率”的问题。就是从已知信息推向可能的信息。比如，我们通常看云识天气。但是这个假设通常有些问题，比如说：中学书上提到的一枚硬币的频率为1/2，当掷(理想均匀)硬币的次数够多时，正面和反面的次数就会一样多。我当时就像，为啥不会竖直立起来，1元的钢镚不就....

学得足够多了，才知道，书上的，也就看看，它其实暗含了原假设这个硬币是立不起来的(或者立起来的概率非常小...，那么哪儿来的概率...频率足够时，这又是个令人头大的问题。

还有另外一种理解贝叶斯定理的思路：它给我们提供的是一种根据数据集D的内容变化更新假设概率H的方法。

书上对如何获得更好的频率作出了解释。

获取更多的数据。

更多的背景信息。

另一些问题是关于做出的假设是否主观。比如说，这个假设：一只大王蝶扇动翅膀时，米国就会发生一场风暴。明明知道，这个东西的几乎没啥关系，基本上就是胡说的，但有什么方法来说明它的确有很大问题的，书上做出了一些解释：

贝叶斯当中，有两种途径选择先验分布。一些人建议选择最能代表问题相关背景资料的先验概率，在这种情况下，先验被认为是“信息”。问题是，人们可能会使用不同的背景信息（或者进行不同的诠释）。所以基于信息的先验往往显得主观。

另一种方法是所谓的“无信息参考的先验”，其目的是为了让数据来说话，越没有约束越好。在某些情况下，你可以选择包含一些期望属性的特殊先验，例如，就估计量设置一个最小先验

贝叶斯分析总是基于模型决策的。选择先验就是决策之一，但它不是唯一的部分，甚至可能不是最主观的。因此，即使无信息先验较为客观，整个分析本身仍然是主观的。

所以，可以根据数据来更新原假设，比如加上更多的限定条件，最终做出决定，还是得看误差是否很小。当然，如果你有大量的数据，先验的选择不是特别关键；信息先验和无信息先验会得到几乎相同的结果

这个星期的理解也就这些，下次想把：最大似然值琢磨琢磨；还有这句粗体的，也没怎么明白。

996 ：真正的劳动，或能实现价值，或能快乐；当我们选择了最能为人类幸福而劳动的职业，那么，重担就不能把我们压倒，因为这是为了人类而献身。那时，我们所感到的就不是可怜的、有限的、自私的乐趣，我们的幸福将属于千百万人。我们的事业将永恒地存在，并发挥作用。面对我们的骨灰，高尚的人们将洒下热泪。

Max

《贝叶斯思维：统计建模的python法》

图片来源：百度

笔记：https://github.com/Jiangjao/python_learn_demo/blob/master/notes

这周学习有感

猜你喜欢

热点阅读