统计学习01:数据类型与常见统计指标

2020-11-11  本文已影响0人  小贝学生信

初学生信,逐渐开始意识到统计学的重要性,例如p值、标准误等概念;回归建模、深度学习等方法都要很好的统计学基础。因此现在利用空闲时间系统得补下相关知识。
目前计划:打基础阶段先看冯国双老师的《白话统计》,之后进行深入学习(李航老师的《统计学习方法》蛮多推荐的,之后了解下)
此外遇到示例绘图等操作,主要基于R(3.61)

要点一:统计资料类型classification

统计离不开数据;根据不同的数据类型,会选择不同的分析方法。

1、定量资料 numeric

最简单,也是最常见的数据类型,即数字指标。

1.1 subclassification
1.2 其它

由于之后重点学习的统计方法主要基于定量资料,就不多做叙述了。

2、分类资料(频数)categorical

2.1
2.2 统计方法
2.3 定量数据转换为分类资料

3、计数资料 count

3.1 特征
3.2 相关统计方法

要点二:常见统计指标

主要是基于定量资料的统计指标

1、描述数据集中程度

2、描述数据分布情况

百分位数
箱图boxplot

在正态分布中,Z值也是反映数据位置的方法,具体到时再学吧

3、描述数据变异程度★

3.1 离均差平方和
3.2 方差

n-1 其实也就涉及到自由度的概念了,在最后记录下。

3.3 标准差

附1:自由度的概念 degree of fredom

附2:∑符号

上一篇 下一篇

猜你喜欢

热点阅读