风险管理定量基础(2)
(3)正态分布
正态分布的应用场景:正态分布是风险分析中最适用的一个函数,如果影响一个事件发生的因素非常多,且每一个因素产生的影响力均有限(不是特别大),又不同因素之间相互独立,则可以用正态分布来描述。
正态分布的公式:

上述公式中,μ代表均值,σ代表标准差。
美型。我们可以把正态分布的曲线看作一个美妙的图形,μ标定了该曲线的对称轴在哪里,又被称为位置参数,而σ则描绘了该曲线的高矮胖瘦程度,σ越大,曲线越矮且胖,σ越小,曲线越高且瘦,σ又被称为形状参数。
完美。正态分布曲线还有一个特别之处就是整个曲线下方的面积为1,也就是100%的完美。
三个特殊临界值。在距离均值1个σ、2个σ、2.5个σ的位置,是三个常用的概率值:
P(μ-σ<X<μ+σ)≈68%
P(μ-2σ<X<μ+2σ)≈95%
P(μ-2.5σ<X<μ+2.5σ)≈99%
标准正态分布。当μ=0,σ=1时,称该正态分布为标准正态分布,记为N(0,1)。一般正态分布转换为标准正态分布的公式为:

(3)卡方分布
卡方分布是n个服从标准正态分布的变量的平方之和:

卡方分布的特点是:E(X)=n,D(X)=2n
(4)t分布
假设随机变量X服从标准正态分布N(0,1),Y服从卡方分布,且X和Y相互独立,则:

t分布曲线是一条以0为中心,左右对称的单峰曲线。
自由度n决定t分布曲线的形状,当n较小时,t分布呈现厚尾形状,当n趋近于无穷大时,t分布趋近于标准正态分布曲线。
(5)F分布
假设X服从卡方(m)分布,Y服从卡方(n)分布,且X与Y相互独立,则:

3.偏度和峰度
偏度衡量的是概率分布的不对称性,它是样本的三阶标准化矩,公式为:

偏度,在负无穷到正无穷之间,偏度为正值时,数据分布呈现右偏(又称正偏),偏度为负值时,数据分布呈现左偏(又称负偏)。

峰度,衡量的是随机变量概率分布的陡峭程度,它是样本的四阶标准化矩,公式为:

峰度的取值范围为[1,正无穷],正态分布的峰度为3,当峰度大于3时,呈现“尖峰肥尾”的形态,当峰度小于3时,呈现“矮峰瘦尾”的形态。