机器学习

(一)逻辑回归结果 —— 回归系数表

2017-12-29  本文已影响1056人  WooWoods

——本系列翻译自某大佬博客,是我看到很通俗易懂的逻辑回归结果解读的文章了,在此首先向大佬献上膝盖。

由于工作中经常用到逻辑回归,也看过不少相关文章,自己照猫画虎写过脚本,但一直停留在一知半解的程度,尤其对于p值如何计算,如何解释,哪些自变量是与因变量相关的,不知所以,一脸懵逼。数学早还给老师了。直到读到这位大佬的博客,真是开我茅塞。遂决定翻译过来,主要是做一个备忘,方便以后翻阅。


The KidCreative Logistic Regression

KidCreative数据集将作为我讲解逻辑回归结果解读的例子,贯穿整个系列。通过这个数据集,我们将尝试预测某个消费者回应e-maile并购买儿童杂志“Kid Creative”的可能性。我们通过实验收集了673组观看了“Kid Creative”广告的消费者的观测数据,其中每组观测数据记录了消费者是否会购买,以及性别、收入等一系列变量。由于因变量(是否购买杂志)是二元的数据,因此适用于逻辑回归分析。
逻辑回归分析结果的系数表如下:


根据逻辑回归的定义,预测一个消费者是否购买:

我们将在后续的文章中关注这个逻辑回归方程,当前我们主要讨论逻辑回归系数表。

逻辑回归的系数表和最小二乘回归的系数表有很多相同之处:

在对最小二乘回归的简短回顾中,我简要概述了回归系数表的四个主要用途:

  1. 评价哪个变量是与因变量相关的
  2. 评价各自变量的影响大小
  3. 对结果作出预测
  4. 评价不确定性

对于逻辑回归的结果,只有其中一条是与最小二乘回归有很大区别的,那就是评估各自变量的影响。在随后的文章中我将逐个讨论回归系数表的这四个用途。

上一篇下一篇

猜你喜欢

热点阅读