强化学习所需的概率基础——随机相关概念
首先我也是小白,二懂二懂的,这里只是做个自己的学习记录,以后好随时查看。
很多地方可能不严谨,不过自己明白才是最重要的,所以不要当成学术性文章来看哈,拒绝各种喷子。
当然,非常欢迎指出我的问题,帮助我进步。
随机相关基础
有以下几个概念必须先搞清楚
- 随机事件
- 随机变量
- 随机事件的概率
- 随机抽样
- 随机观测值
随机事件
啥是随机事件呢,好像举个🌰说明比较容易,例如:
扔骰子这个事件,就是一个随机事件。
这里说的是一个普通的、打麻将用的六面骰哈。
至于详细定义就懒得抄了,自己随便查下就有准确的解释。
随机变量
好我们来继续扔骰子的🌰:
扔骰子这个事件会产生的结果就是一个随机变量,记做 A。
扔骰子事件有6种可能的取值,它可能是1~6中的任意一个。
再说详细点:
随机变量是一个未知的量,他的取值取决于一个随机事件的结果。
随机变量一般记为大写的字母 例如:A、X 都可以
随机事件的概率
概率一般记做一个空心的P,书上一般大概长这个鬼样子:
所有点数出现概率都是1/6,一般可能看到以下记法:
怎么读呢,随便读一个好了,第一个读作:“随机事件A结果为1,发生的概率为六分之一”。
以上这些就是叫随机事件的概率
不知道说清楚没,反正我自己是清楚了。
随机抽样
对于扔骰子来说,扔一次就是一次随机抽样,这个简单。
随机观测值
一般来说用小写字母表示随机观测值,例如 a、b、x 都可以。
主要是避免和随机变量搞混,虽然不是全部,但大部分书上、文章中也基本是这么表示的。
继续扔骰子的例子,比如我扔3次(随机抽样3次)骰子的结果记做:
聪的人一眼就明白了,下标就是随机抽样的次数
那具体观测值是什么意思呢,就是当扔骰子这个事件结束后,可以观察到的随机抽样的结果,可以观察到骰子哪一个点数出现。
需要特别说明的是,随机观测值只是一个值而已,它没有随机性,这点一定要记住!!!
(就是TM仅仅一个值,但非要叫随机观测值,我TM也是醉了)
小结
随机的需要的知识,大概就是这些,其实也不多