关联分析和分类的区别应用

2018-05-17  本文已影响57人  enhengz

分类是根据输入的样本属性值,在已有标记的数据集条件下,将每个样本映射到先定义好的类别上。分类有很多经典的算法:决策树、回归、贝叶斯、支持向量机等等....

关联分析是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构,是发现商品之间的关联联系

当然关联分析也可以用于分类,发现事物之间的关联性,吧相互有联系的分到一类,但是在实际运用中,关联分析一般用来进行事物推荐,比如人和人之间喜欢的电影相同,那么就把一个人喜欢的另一个电影推荐给另外一个人,同时,关联分析还可进行变量筛选,比如在进行聚类之前,如果变量过多,假设有200个,但是有的变量之间存在高度相关性,则就相当于在一个特征上面的权重放大,当然这个筛选过程还可以根据主成分分析来实现。

分类则是根据一个人的行为数据观察另一个人和这个人的行为是否相似来决定是否属于同一个类别,分类一般是建立在已经知道一部分类别的特征的情况下进行分类,而关联规则则是只能知道事物是相关的,但不知道具体的类别,这点有点像聚类分析了其实

总之,为了这个问题我是纠结了一下,但后来想想,还是利用算法的有点进行场景选择比较好,比如我有已知的类别,对未知的进行分类,那就选择分类算法,若是进行产品推荐就选择关联分析,用算法的长板来选择使用的场景,就像制作excel图表的时候,一个占比的数据我们可以用柱状图、条形图等所有图表进行表示,但是我们最终还是会选择饼图,因为图表都可以做,但是每个图表的优势所在和表达的主要含义不同。

上一篇下一篇

猜你喜欢

热点阅读