这周学习有感
贝叶斯全名为托马斯·贝叶斯(Thomas Bayes,1701-1761),是一位与牛顿同时代的牧师,是一位业余数学家,平时就思考些有关上帝的事情,当然,统计学家都认为概率这个东西就是上帝在掷骰子。当时贝叶斯发现了古典统计学当中的一些缺点,从而提出了自己的“贝叶斯统计学”,但贝叶斯统计当中由于引入了一个主观因素(先验概率,下文会介绍),一点都不被当时的人认可。在1723年的一篇论文中,他首先提出了这个定理。这篇论文是在他死后才由他的一位朋友发表出来的。在这篇论文中,他为了解决一个“逆向概率”问题,而提出了贝叶斯定理。
贝叶斯在他的文章中是为了解决一个“逆概率”的问题。就是从已知信息推向可能的信息。比如,我们通常看云识天气。但是这个假设通常有些问题,比如说:中学书上提到的一枚硬币的频率为1/2,当掷(理想均匀)硬币的次数够多时,正面和反面的次数就会一样多。我当时就像,为啥不会竖直立起来,1元的钢镚不就....
学得足够多了,才知道,书上的,也就看看,它其实暗含了原假设这个硬币是立不起来的(或者立起来的概率非常小...,那么哪儿来的概率...频率足够时,这又是个令人头大的问题。
还有另外一种理解贝叶斯定理的思路:它给我们提供的是一种根据 数据集D的内容变化更新假设概率H的方法 。
书上对如何获得更好的频率作出了解释。
获取更多的数据。
更多的背景信息。
另一些问题是关于做出的假设是否主观。比如说,这个假设:一只大王蝶扇动翅膀时,米国就会发生一场风暴。明明知道,这个东西的几乎没啥关系,基本上就是胡说的,但有什么方法来说明它的确有很大问题的,书上做出了一些解释:
贝叶斯当中,有两种途径选择先验分布。一些人建议选择最能代表 问题相关背景资料的先验概率,在这种情况下,先验被认为是“信息”。 问题是,人们可能会使用不同的背景信息(或者进行不同的诠释)。所 以基于信息的先验往往显得主观。
另一种方法是所谓的“无信息参考的先验”,其目的是为了让数据来 说话,越没有约束越好。在某些情况下,你可以选择包含一些期望属性 的特殊先验,例如,就估计量设置一个最小先验
贝叶斯分析总是基于模型决策的。选择先验就是决策之一,但它不是唯一的部分,甚至可能不是最主观的。 因此,即使无信息先验较为客观,整个分析本身仍然是主观的。
所以,可以根据数据来更新原假设,比如加上更多的限定条件,最终做出决定,还是得看误差是否很小。当然,如果你有大量的数据,先验的选择 不是特别关键;信息先验和无信息先验会得到几乎相同的结果
这个星期的理解也就这些,下次想把:最大似然值琢磨琢磨;还有这句粗体的,也没怎么明白。
996 :真正的劳动,或能实现价值,或能快乐;当我们选择了最能为人类幸福而劳动的职业,那么,重担就不能把我们压倒,因为这是为了人类而献身。那时,我们所感到的就不是可怜的、有限的、自私的乐趣,我们的幸福将属于千百万人。我们的事业将永恒地存在,并发挥作用。面对我们的骨灰,高尚的人们将洒下热泪。
Max《贝叶斯思维:统计建模的python法》
图片来源:百度
笔记:https://github.com/Jiangjao/python_learn_demo/blob/master/notes