偏差 (bias) 和方差(variance)

2018-01-20  本文已影响0人  陌生的城市啊_David

偏差:描述的是预测值(估计值)的期望与真实值之间的差距。偏差越大,越偏离真实数据。如下图第二行所示。

方差:方差是数据偏离平均数的程度,描述的是预测值的变化范围,离散程度,也就是离其期望值的距离。方差越大,数据的分布越分散,方差可以表示一组数据在均值周围的聚集密度,如下图右列所示。

标准差:方差开方即得到标准差  standard deviation, The standard deviation tells you how tightly your data is clustered around the mean

协方差:是统计学中使用的一种数值,用于描述两个变量间的线性关系。两个变量的协方差越大,它们在一系列数据点范围内的取值所呈现出的趋势就越相近(换句话说,两个变量的曲线距离彼此较近)。一般来说,两组数值x和y的协方差可以用这个公式计算:1/(n -1)Σ(xi - xavg)(yi - yavg)。其中n为样本量,xi是每个x点的取值,xavg为x的平均值,yi和yavg也类似。Covariance is a measure of how much tworandom variablesvary together. It’s similar tovariance, but where variance tells you how a single variable varies, co variance tells you how two variables vary together

方差的计算公式

(s2) = Σ [(xi - x̅)2]/n - 1

s2 = 方差

Σ = 求和,表示后面所有项的和。

xi = 样本观察值,表示各项数据

x̅ =平均值,表示所有数据的平均。

n = 样本大小。就是数据的个数

上一篇下一篇

猜你喜欢

热点阅读