工作生活

coefficient of determination 回归分

2019-07-02  本文已影响0人  鲸鱼酱375

决定系数:

拟合优度越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集。

为了判定模型拟合的好坏,用r^2判定,越大拟合效果越好

image.png

1.平方和

平方和表示对距离均值的变异或离差的度量。计算方法是与均值之差的平方之和。计算总平方和时,同时考虑来自因子和来自随机性或误差的平方和。

2.方差分析中的平方和

在方差分析 (ANOVA) 中,总平方和有助于表达可能因不同因子所致的总变异。例如,运行试验以检验三种洗衣粉的效果。

总平方和 = 处理平方和 (SST) + 残差误差平方和 (SSE)

处理平方和是因处理(在此例中为洗衣粉之间的不同)所致的变异。残差误差平方和是因误差所致的变异。

通过除以自由度将平方和转换为均方,可以对这些比率进行比较,并确定是否因洗衣粉而导致显著差异。此比率越大,处理对结果的影响越大。

3.回归中的总平方和

在回归中,总平方和有助于表达 y 的总变异。例如,您收集数据以确定将总体销售解释为广告预算函数的模型。

总平方和 = 回归平方和 (SSR) + 残差误差平方和 (SSE)

image

回归平方和是因 x 与 y 之间关系(本例中为广告预算与销售额之间)所致的变异。残差误差平方和是因误差所致的变异。

通过将回归平方和与总平方和进行比较,确定总变异中由回归模型解释的比率(R2,确定性系数)。此值越大,将销售额解释为广告预算的函数的关系越好。

4.残差平方和(又称误差平方和,SSE,Sum of Squares for Error): 也是rss

因变量的各实际观测值(给定点的Y值)与回归值(回归直线上的Y值)的差的平方和,它是除了x对y的线性影响之外的其他因素对y变化的作用,不能由回归直线来解释的。

SSE越小,Y¡′对Y¡的拟合度越高,回归直线保留的因变量信息越多。

总结:
tss= ess+rss 总平方和= 回归平方和+误差平方和
回归平方和:SSR(Sum of Squares forregression) = ESS (explained sum of squares)
残差/误差平方和:SSE(Sum of Squares for Error) = RSS(residual sum of squares)
总离差平方和/总平方和:SST(Sum of Squares fortotal) = TSS(total sum of squares)
SSE+SSR=SST RSS+ESS=TSS

r是相关系数,r^2不是他的平方,因为r^2可以是负值

reference:
https://zhuanlan.zhihu.com/p/24886209
https://blog.csdn.net/snowdroptulip/article/details/79022532
https://blog.csdn.net/theonegis/article/details/85991138
👆这个讲的比较好

上一篇 下一篇

猜你喜欢

热点阅读