apriori 算法的介绍,Apriori算法详解
很多朋友对apriori 算法的介绍,Apriori算法详解不是很了解,艾巴小编刚好整理了这方面的知识,今天就来带大家一探究竟。
一、 Apriori算法介绍:Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和场景向下封闭检测两个阶段来挖掘频繁项集。
Apriori算法应用广泛,可以用来分析消费市场的价格,猜测客户的消费习惯。网络安全领域的入侵检测技术:可用于高校管理,根据挖掘的规则,有效协助学校管理部门开展有针对性的贫困学生帮扶工作;也可用于移动通信领域,指导运营商的业务运营,辅助服务提供商的决策。
二、挖掘步骤:1。根据支持度找出所有频繁项集(频率);2.根据置信度生成关联规则(强度)三、 A-B的基本概念支持度:P(A B),A和B都出现的概率置信度:P(B|A)。
40%的信心:意味着40%买牛奶的顾客也买面包。如果事件A包含k个元素,那么这个事件A称为k-项集。事件A满足最小支持度阈值的事件称为频繁k项集。同时满足最小支持度阈值和最小置信度阈值的规则称为强规则四、实现步骤Apriori算法是挖掘布尔关联规则频繁项集最有影响力的算法。Apriori使用一种叫做逐层搜索的迭代方法,用“K-1个项集”来搜索“K个项集”。
首先,找出频繁“1项集”的集合,记为L1。L1用于寻找频繁“2项集”的集合L2,而L2用于寻找L3。这样下去,直到找不到“K项集”为止。找到每个Lk需要数据库扫描。核心思想是:连接步骤和修剪步骤。连接步骤是自连接,原则是保证前k-2项相同,按字典顺序连接。剪枝步骤是使任何频繁项集的所有非空子集也是频繁的。另一方面,如果有人
候选的非空子集不是频繁的,所以候选肯定不是频繁的,所以可以从CK中删除。简单来说,在1、中找到频繁项集,过程是(1)扫描(2)计数(3)比较(4)生成频繁项集(5)连接和剪枝生成候选项集。重复步骤(1)-(5)直到找不到更大的频率集2、生成关联规则。
(1)对于每个频繁项集L,生成L的所有非空子集;(2)对于L的每个非空子集S,若P(L)/P(S)min _ conf,则输出规则“SL-S”。注:L-s表示Apriori算法和步骤在项集L的上一篇文章中有简要描述,现在用伪代码实现,描述了一个经典的例子:
for(k=2;Lk-1!=nullK ){//生成候选,剪枝Ck=apriori _ gen(Lk-1);//对D{Ct=subset(Ck,t)中的每个事务t进行候选计数扫描D;//得到每个候选c的t的子集属于Ctc.count}//返回项集Lk={c属于CK | c.count=min _ sup}}返回l=所有频繁项集;步骤1:为属于Lk-1的每个项目集l1加入apriori _ gen (Lk-1:频率(k-1)-项目集)过程。
对于每个项目集,l2属于Lk-1IF((L1[1]=L2[1])(L1[2]=L2[2]).(L1 [k-2]=L2 [k-2])。//剪枝步骤:删除不频繁候选else将c加到Ck;}返回Ck;第二步:修剪。
过程has _ incocrative _ sub(c:候选k项集;Lk-1:频繁(k-1)-项集)对于cifs的每个(k-1)-子集不属于Lk-1,则返回true返回false二、Apriori算法示例三、总结:Apriori算法的缺点:(1)频繁k-1项集自连接产生的候选频繁K项集数量巨大。(2)在验证候选频繁K项集时,扫描整个数据库是非常耗时的。
网上提到的几种频率集算法优化方法:1。基于分区的方法。2.基于哈希的方法。3.基于采样的方法。4.减少交易次数。我重点介绍了“基于划分的方法”的改进算法,现在简单介绍一下实现思路:
该算法以划分算法为基础,将数据库逻辑上划分为若干个不相交的块,每次单独考虑一个块并为其生成所有频率集,然后将生成的频率集合并生成所有可能的频率集,最后计算这些项集的支持度。
其中,分区算法要注意碎片的大小选择,保证每个碎片都能放入内存。当每个切片生成一个频率集时,将其合并生成一个全局候选k-项集。如果多个处理器被分区,则可以通过在处理器之间共享散列树来生成频率集。看这张图和伪代码对比一下,基本就能看懂了~简单明了
以上就是关于apriori 算法的介绍,Apriori算法详解的知识,希望能够帮助到大家!
推荐阅读
- 雅迪厂家电话,雅迪电动车厂家联系方式
- 华为应用市场无法打开是怎么回事,华为应用市场打不开怎么办
- 怎么查银行卡的开户行在哪里开的,怎么查银行卡的开户行
- 国产奥迪a4最新价格,国产奥迪a4
- 二建准考证什么时候可以打印(浙江二级建造师准考证打印)
- 经济适用房申请条件(经济适用房申请条件)
- 如何给手机微信加密码锁,如何给手机微信加密
- 小居室该怎样布置呢图片,小居室该怎样布置呢
- 星际战争异形入侵免费版游戏介绍(星际战争异形入侵免费版)
- 苹果手机显示不受信任的开发者,苹果手机提示不受信任的开发者该怎么解决
- 双色球的中奖规则说明,双色球的中奖规则
- 简短悲伤句子除了爱情?(短篇伤感爱情故事)
- 2021年12月新的婚姻法?(婚姻法司法解释三)
- 刹车盘十大品牌排行榜最新,刹车盘十大品牌排行榜
- Panda杀毒软件(panda free antivirus)软件介绍(Panda杀毒软件(panda free antivirus))
- oppo手机怎么设置软件的权限管理,OPPO手机软件权限怎么设置
- 裸捐是什么意思就是一分钱,裸捐是什么意思
- soul怎么设置匹配的年龄,soul怎样设置匹配年龄
- STC90C52Rc电路图,stc89c52简介