机器学习

深入浅出统计学

2018-10-20  本文已影响11人  城市中迷途小书童

异常值总是要么极大,要么极小,四分位距将异常指统统铲除。

平均数:指出数据的中心。

image.png

百分位数:将数据一分为百。对于划分档次非常有用。

箱线图:能在同一张图上体现多个距和四分位数,是在这方面十分有用的一种方法。‘箱’显示出四分位数和四分位距的位置。‘线’则显示出上、下界。箱线图能在一张图上体现多批数据,因此非常有利于比较。

方差:量度数据分散性的一种方法,是数值与均值的距离的平方数的平均值。

image.png

标准差:度量与均值的距离,量度数据的分散性。,体现数值的变异度。

标准份分:利用均值和标准差,将一个数据集中的各个数值转化为更通用的分布形态,同时确保数据的基本形状不变。

概率空间:样本空间,是表示所有可能结果的一种简便表示法。可能发生的事件都是S的子集。

A与B为对立事件:P(A)=1-P(B)

B发生的条件下A发生的概率: P(A|B)=P(AB)/P(B)

image.png

image.png

什么时候使用贝叶斯定理?

答:在需要求出条件概率,且该条件概率与已知条件概率顺序相反时使用。(过滤垃圾邮件,医学实验上)

image.png

image.png

image.png

image.png

image.png

image.png

image.png

作者:至极L

链接:https://www.jianshu.com/p/0b370f51f21c

來源:简书

简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

上一篇 下一篇

猜你喜欢

热点阅读