41统计基础- 比率和比率对数
你很有可能已经对比率(odds)很熟悉了,例如,你可以说我们队获胜的比率是1:4。事实上,我们有5个游戏,1个游戏我们队赢,还有4个游戏我们输。我们可以用分数表示1/4,如果我们做一下计算,我们看到我们队赢这场比赛的比率(odds)是0.25。另一个例子,可以说我们队获胜的比率是5:3。事实上,我们有8个游戏,5个游戏我们队赢,还有3个游戏我们输。我们可以用分数表示5/3,如果我们做一下计算,我们看到我们队赢这场比赛的比率(odds)是1.7。注意:odds are not probabilities。
image-20201230161625318.png既然我们知道概率和比率是不同的,我们来讨论一下比率是如何从概率中计算出来的。现在我们来计算一下获胜概率与失败概率的比例。因此,概率的比例最终等于原始计数的比例,我们得到了相同的比率(odds) image-20201230162240992.png
有两种计算比率(odds)的方法,第一种是通过原始计算计算。第二种是通过概率。
注意:你将会看到不同计算比率的公式
image-20201230162545639.png现在我们知道比率是多少,接下来我们讨论比率对数(Log(Odds))。
让我们回到最初的例子,我们将获胜的比率计算为1比4或0.25,如果我的队伍更差,获胜的比率是1比8,或者0.125,如果我的队伍很糟糕,获胜的比率可能是1比16,或0.063,最后,如果我的队伍是最差的,获胜的比率是1比32,或0.031。我们可以看到,我所在的队越差,获胜的比率就越接近于0。换句话说,如果我们队获胜的比率不大,那么他们的比率将在0到1之间。
现在,如果我的团队很优秀,那么我的团队获胜的比率可能是4比3,或者1.3.......…如果我的球队很好,赢的比率可能是32比3,也就是10.7。我们可以看到,我的球队越好,赢球的比率从1开始不断上升。换句话说,如果我的团队获胜,比率是1到无穷之间!
01这种比率看起来要小得多,1+∞太大。将概率取为log0(即log(odds))可以解决这个问题,因为一切都是对称的。
image-20201230164429717.png注意:比率的对数称为logit函数(logit function),它构成了逻辑回归的基础。