Apriori算法

2018-07-22  本文已影响32人  heaker

Apriori算法

1.定义:一种用于关联规则挖掘的代表性算法

2.一些基本的概念:

2.1 数据挖掘可以视为数据库、机器学习和统计学三者的交叉。第一者提供了数据管理技术;后两者提供了数据分析技术。

2.2关联规则是形如 X→Y 的蕴涵表达式,其中X和Y是不相交的项集【包含0个或多个项的集合被称为项集(itemset)】,即 X∩Y=∅。关联规则的强度可以用以下两个指标来衡量:

两者的公式如下:

两个公式

2.3 用一个简单的例子来解释该概念:

一个超市的收银数据

[图片上传失败...(image-a983f3-1532249865361)]

2.4 因此,大多数关联规则挖掘算法通常采用的一种策略是,将关联规则挖掘任务分解为如下两个主要的子任务:

3.先验原理

3.1 Apriori 两条定律:

3.2 运用定理的一个例子:

下图表示当我们发现{A,B}是非频繁集时,就代表所有包含它的超级也是非频繁的,即可以将它们都剪除。


image

4.Apriori算法与实例【核心】

4.1 算法的形式化描述:

image

4.2 算法的实例:

image

4.3 上条C集生成策略的解释:

image

5.参考资料

  1. https://blog.csdn.net/baimafujinji/article/details/53456931
上一篇下一篇

猜你喜欢

热点阅读