CFA level 1 重点必会

必考知识点,CFA一级数量分析-常见概率分布-上

2020-03-22  本文已影响0人  温暖的法律

 学习应该应用于实践,实践让你的迷惑茅塞顿开。

文:蓝兔子读难NOTES

图: 配图 来源于网络

编码:0007

[Quantitative Methods]

[Common Probability distribution-1]

上一篇文章我们讲了概率论基础,什么是随机事件,什么是随机事件的结果,以及随机事件之间的关系,是相互独立的,还是相互排斥的。在弄清楚了概率论基本的概念之后,我们又进一步讲解了概率的加法和乘法公式,并在乘法公式的基础上,引出了贝叶斯公式。虽然贝叶斯当时在研究这个公式时,只是想要证明上帝的存在,但是他并没能找到我们的造物主。反而是在当今,贝叶斯公式已经广泛应用于数据科学中,无论是天气预测还是医药测试都有贝叶斯公式的应用[1]

如果你还是不明白贝叶斯公式的重要性,我这么跟你说:因为蘑菇弹的存在世界的历史被分成了两半,而因为贝叶斯公式,统计学被分成了两半,其中一半就叫做贝叶斯学派。在最新的发展中,贝叶斯公式已经在人工智能领域大规模应用。也许多年以后,我们的人工智能会通过贝叶斯公式找到他们的造物主。

在后面的内容中,我们又进一步解释了期望和方差相关的概念。期望代表者预期会得到的结果(概率加权),通常用在金融工具的收益计算中,而方差代表着收益的不确定性,用来衡量资产的风险。对于一个资产组合来说,用协方差来衡量其不确定性。

在了解了概率的相关概念之后,我们这篇文章,将会来说说那些非常重要或者常见(很大程度上,因为常见所以重要)的概率分布,他们实际上代表了很多前辈为我们总结的客观规律。有了前辈们的总结,我们想要造车,就不用去做炫酷的PPT了,哦不,是就不需要去重新造轮子了。那下面,我们就直接去把前辈们的轮子搬回自己家吧。

基本概念和术语

为了更好的学习这篇文章的内容,我们先复习一下上篇文章中的两个概念:随机事件随机变量。随机事件,某件事情的结果具有不确定性,任何一个结果发生都是一个随机事件发生,而发生的结果就是随机变量的值。以抛骰子为例,随机事件就是抛出骰子得到一个数,这个具体的数会是多少,是不确定的,叫做随机变量。接下来,我们开始介绍概率分布相关的概念。

概率分布(probability distribution):某一个事情有多个可能的结果,每一个结果发生,都各自对应一个概率。发生的结果和其概率的函数关系就叫做概率分布。根据事情发生结果的不同,可以分为离散随机变量和连续随机变量,对应的就是离散概率分布和连续概率分布。

离散概率分布(discrete distribution),最常见的就是丢硬币和抛骰子了,每次事件的结果的可能性是有限的或者可以数出来的。丢硬币无非正反两个结果,抛骰子也就6个结果。因为离散的结果一般是有间距且有限的,可以用表格或者方图来记录。

连续概率分布(continuous distribution):与离散概率分布相对,其事件的结果具有无限多种且根本就不能数,比如量同学的身高。每一位同学的身高都有无限种可能,哪怕是在175mm和176mm之间,也能量出无限种可能。连续概率分布一般使用概率密度函数(probability density function | PDF)来描述

正是因为连续概率随机变量的结果可能为无数多个,我们可以近似认为某一确定的结果发生的可能性近乎为0,所以其有如下性质

一般衡量事件出现在某个区间内的概率,如上图的阴影区域就是结果在(a,b)的概率;

认为某个点上的概率为0,即P(a)=P(b)=0,所以1中使用开区间还是比区间不影响;

因为一个事件所有结果的概率和为1,所以上图中曲线与x轴围成的面积为1。

累积分布函数(cumulative distribution function | CDF):在前面说统计相关内容时,当时也出现过累积相关的概念。所谓累积,就是在当前这个值之前的都算,以随机事件x为例,PDF表示为P(x)=P(x),而CDF表示为F(x)=P([-∞,x]),一般CDF用F表示

对于CDF来说,在上图中,如果把结果在a到b之间的概率记为P([a,b]),则P([a,b])=F(b)-F(a)

常见离散概率分布

这里要说的离散概率分布一共有3个:离散的均匀分布(uniform distribution)、伯努利分布(Bernoulli distribution)二项分布(binomial distribution)。下面,一个一个来看。

均匀分布,应该是最简单的一个了。比如我们丢硬币,结果就是5/5开,正反面都是50%;抛骰子虽然结果有6种,但是每一个面的概率也是一样的。均匀分布指的就是,无论有多少种可能的结果,但出现每一种可能的结果的概率是相等的

伯努利分布,也挺简单的,最典型的例子还是丢硬币,伯努利分布就是结果只有两种的分布。要么成功,要么失败,但是成功和失败的概率无需对等。联系前面说过的赔率,如果进行单次比赛,这次比赛的结果就是伯努利分布,有可能输有可能赢,且无需五五开。

二项分布,怎么说呢,也许是觉得一个简单的伯努利分布很难在数学史上名垂千古,伯努利想到了一个绝妙但却“无聊”的办法:把简单的事情重复做。通过把硬币一直丢这种方式,伯努利在伯努利分布的基础上搞出了二项分布,教科书式的说法,把伯努利实验重复n次就是二项分布。但是有两个点要注意:

每次实验是一样的,成功为p,失败为1-p;

每次实验是一样的,不受上次影响,不影响下次,成功为p,失败为1-p。

n次实验成功x次的概率,用大白话表示为:

从n次里面取出x次来成功,没有顺序要求,nCr;

x次成功,概率为p*p*p*~*p(x个),

n-x次失败,失败的概率为((1-p)*(1-p)*~*(1-p)(n-x个))。

这三个事情同时发生,就是n次实验成功x次的概率:

最后,再记住这么一个结论就好啦:

这个难记吗?不难吧,看看这规律,二项分布他不就是n个伯努利嘛!

最后的最后,还有一个股价二叉树(binomial tree)的问题。举个例子,某只股票每期要么涨(up)要么跌(down),问4期之后,股票价格为uudd的概率为多少。其实只要从四期里面选两期来d,剩下两期来u就可以了,解法同上面的二项分布。

常见连续概率分布

模拟分析

由于前面的废话说得有点多,显然字数是要超标了,而后面又有非常重要的正态分布,所以连续概率分布和模拟的内容放到下篇文章中,请大家自行查阅。

部分资料来源:

[1] Quartz Daily Brief . The most important formula in data science was first used to prove the existence of God

兔纸的相关文章

美联储降息,多国下调利率,敢问利率为何物

从余额宝七日年化谈今天的一百块,明天值多少

CFA一级数量分析-货币的时间价值

CFA一级数量分析-数理统计基础与收益

CFA一级数量分析-概率论基础

阅读原文

上一篇 下一篇

猜你喜欢

热点阅读