数据分析入门-多元统计分析方法
2017-03-06 本文已影响320人
毛嘎子
方差分析和回归分析都是研究变量之间的关系
回归分析
回归分析有一个非常重要的前提是:X和Y是否存在线性相关关系。无论X与Y之间是否存在线性在用最小二乘法得到一个线性回归方程,但如果X与Y之间根本不存在线性相关关系,这样求出来的方程是没有意义的,这个问题第1靠实践。第2靠辅助的统计方法
** F检验法 **
- 总离差平方和:反应了Y的总的离散程度 y-y(avg);它由残差与回归离差共同决定(把总离差平方和分解为离差回归平方和+残差平方和,就是方差分析)
** 逐步回归 **:其实就是F检验法与回归结合起来,保证引入变量与因变量存在线性相关关系。
应用:对广告位或者推广价格的精准制定
方差分析
跟t检验的目的很像,都是多个样本平均数(t检验只能是两个样本,但是方差可以多个样本)的差异程度。因素在不同水平下有不同样本,以此可以看出这个因素对结果的影响是否显著
原理:误差分解的思想。将总离差平方和拆分为:回归离差平方和(条件误差)+残差平方和(随机误差);也就是说,在一方面要考察各种指标对结果的影响情况,也考虑随机误差的影响情况。
前提:指标在取不同值的时候,都~N(u,o);且这些分布的方差相同,能通过方差齐性检验
单因素方差分析:一个因素(特征)变动对实验指标的影响。可能实际中有多个因素在影响指标,我们只考虑其中一个因素的时候,是将其他因素固定下来,只让这一个因素变动。
应用:对不同推广方式的有效性进行检测