数据分析|偏离正态分布和风险度量
前面可以看出超额收益的正态分布大大简化了组合选择的过程,正态分布保证标准差是衡量风险的完美度量,因此夏普比率是证券表现的完美度量。然而,很多投资者通过观察相信资产收益对正态分布的偏离已经很显著,不可忽视。
正态偏离可以通过计算收益分布的高阶矩来看到。超额收益R的n阶中心矩为,一阶矩为0,二阶矩为方差的估计值 (注:对于一个关于均值对称的分布,比如正态分布而言,所有的奇数矩量(n=1,3,5,…)的期望都为零,而所有的偶数矩量都仅仅是标准差的一个函数。比如,四阶矩为,六阶矩为。
因此,对于服从正态分布的收益率而言,标准差提供了风险的全部信息,而资产组合的投资绩效可以通过夏普比率来计算。然而对于其他非对称分布而言,奇数阶矩可能非零。一个比正态分布更大的偶数阶矩,加上一个负的奇数阶矩,意味着发生极端恶劣状况概率的增加。)
一个关于不对称性的度量,称为偏度(skew),计算公式如下:
偏差的立方有正有负。因此,如果分布是右偏,则如图中黑色的曲线,偏度为正。左偏如浅色曲线所示,偏度为负。当偏度为正时,标准差高估风险; 当偏度为负时,标准差低估风险。
另一个正态偏离的度量考虑分布两端极端值出现的可能性,即从图像上来看有肥尾特征的情况,分布的尾部发生的概率较正态分布预测的要高,分布中部发生的概率则较正态分布的低。
这种度量称为峰,计算公式如下:
之所以减去3是因为正态分布的上述比率为3,所以正态分布的峰度为零,峰度为正则说明存在肥尾现象。肥尾曲线峰度为0.35。
极端负值可能由负偏度以及负峰度产生。
因此,我们需要一个风险度量来衡量极端负收益率的发生情况。注意偏度和峰度都为纯数值。它们不会随着高频观测值的年化而变化。极端负收益的频繁发生会导致出现负偏和肥尾。
因此,我们需要揭示极端负收益发生的风险测度。
我们将讨论业界最普遍使用的该种测度:在险价值、预期损失、下偏标准差和极端收益频率(3--sigma)。