多元统计分析:(一)概述
2019-10-04 本文已影响0人
克罗地亚中场
系列内容为笔者结合R语言学习多元统计分析的笔记。简书的markdown编辑器方便易用,节省了大量排版、格式修改的时间。
课程网址为:https://www.icourse163.org/course/XMU-1206305809#/info
STRCTURE
1.定义
2.方法简介
3.应用领域
1.定义
2.方法简介
2.1数据描述:ch2
2.2统计推断:ch4
2.3 经典降维:简化数据结构,ch6,7
用少数几个变量代替原有的数目庞大的变量,把重复的信息合并起来,既可以降低现有变量的维度,又不会丢失掉重要信息的思想,就称为降维。经典降维方法包括主成分分析 (Principal component analysis, PCA) 和因子分析(Factor analysis)
- 主成分分析主要用于构造“综合指标”,以将原始数据最大程度地区分开
因子分析旨在用一个变量(公因子)代替原始高度相关的某几个变量
降维图解
2.4 目标归类:根据数据特征构造归类模式,ch5,8
- 有监督学习范畴的分类问题(classification):用历史数据寻找分类规则,即判别分析(Discrimination),将新个体按照分类规则归至某一类(Classification)
- 无监督学习范畴的聚类分析(clustering):定义刻画多元数据相似性/差异性的距离(Distance), 将“相似”的个体聚在一起作为一类(Cluster)
3.应用领域
John Tukey:The best thing about being a statistician is that you get to play in everyone else's backyard.
以实践生活中的营销为例,多元分析可以帮到我们什么?
- 预测新的购买趋势:建立模型,预测未知值
- 锁定忠实客户:分类问题
- 发掘潜在顾客:分类问题
- 精准营销、市场细分:聚类问题
多元分析的数据分析路线