基于FP-tree的快速挖掘全局最大频繁项集算法

摘要/Abstract

摘要： 挖掘最大频繁项集的算法多基于局部数据库，为此提出了一种基于频繁模式树的快速挖掘全局最大频繁项集算法。该算法首先挖掘出所有全局频繁项目组成集合，然后各个节点根据该集合构建局部频繁模式树，最后将该集合作为全局最大频繁候选项集，采用自顶向下策略挖掘出所有的全局最大频繁项集。与类Apriori算法相比，该算法采用的频繁模式树结构能大幅度降低数据库扫描次数和运行时间;自顶向下的策略能大幅度减少候选项集数和通信量。实验结果表明，该算法是快速和高效的。

关键词: 数据挖掘, 频繁模式树, 全局最大频繁项集, 算法

Abstract: Most mining maximum frequent itemsets algorithm based on local data base, so a fast algorithm for Mining Global Maximum Frequent Itemsets based on Frequent pattern tree(MGMFIF) was proposed. MGMFIF mined all global frequent items and made itemset, then local Frequent-Pattern tree (FP-tree) of each node was constructed based on this itemset. Finally, this itemset was chose as global maximum frequent itemsets, and all the global maximum frequent itemsets were obtained by top-down strategy. By adopting FP-tree structure, MGMFIF greatly reduced database scanning times and runtime comparing to Apriori-like algorithms. MGMFIF remarkably lessened candidate itemsets and communication traffic by using top-down strategy. Experimental results suggested that MGMFIF was fast and effective.

Key words: data mining, frequent-pattern tree, global maximum frequent itemsets, algorithms

中图分类号:

TP311

何波. 基于FP-tree的快速挖掘全局最大频繁项集算法[J]. .

HE Bo. Fast algorithm for mining global maximum frequent itemsets based on FP-tree[J]. .

[1]	陈年,金涛,王建民. 基于变异反馈的临床路径优化[J]. 计算机集成制造系统, 2021, 27(9): 2556-2564.
[2]	陈志远,伍章俊,童珊珊,刘晓. 基于改进双归档进化算法的多目标动态软件项目调度[J]. 计算机集成制造系统, 2021, 27(9): 2565-2574.
[3]	原佳怡,朱锐,林雷蕾,李彤,郑明. 单触发序列突发漂移检测算法[J]. 计算机集成制造系统, 2021, 27(9): 2636-2646.
[4]	汤雅惠,李彤,朱锐,南峰涛,付会林. 基于执行者过程树的双维度遗传过程挖掘方法[J]. 计算机集成制造系统, 2021, 27(9): 2680-2690.
[5]	田钰. 基于多元特征感知网络的高考成绩预测[J]. 计算机集成制造系统, 2021, 27(9): 2741-2748.
[6]	王沙沙,张则强,刘俊琦,陈凤. 多路径交互环形过道布置问题建模及改进蚁狮算法优化[J]. 计算机集成制造系统, 2021, 27(8): 2237-2247.
[7]	秦旋,房子涵,张赵鑫. 考虑资源约束的预制构件多目标生产调度优化[J]. 计算机集成制造系统, 2021, 27(8): 2248-2259.
[8]	尚正阳,顾寄南,王建平. 求解带能力约束车辆路径优化问题的改进模拟退火算法[J]. 计算机集成制造系统, 2021, 27(8): 2260-2269.
[9]	李国明,李军华. 带软时间窗随机需求车辆路径问题的算法研究[J]. 计算机集成制造系统, 2021, 27(8): 2270-2281.
[10]	顾九春,姜天华,朱惠琦. 多目标离散灰狼优化算法求解作业车间节能调度问题[J]. 计算机集成制造系统, 2021, 27(8): 2295-2306.
[11]	黎英杰,刘建军,陈庆新,毛宁. 多层级装配作业车间等量分批策略与调度算法[J]. 计算机集成制造系统, 2021, 27(8): 2307-2320.
[12]	冯春,张祎伟,黄成,姜文彪,武之炜. 双足机器人步态控制的深度强化学习方法[J]. 计算机集成制造系统, 2021, 27(8): 2341-2349.
[13]	王春雨,蒋祖华,王福华,吉永军,江辉. 面向工业软件开发的半结构化知识语义检索方法[J]. 计算机集成制造系统, 2021, 27(8): 2371-2381.
[14]	冯国奇,崔东亮,代学武,俞胜平. 数据视角下神经网络增量学习支持的涡轮盘多目标优化[J]. 计算机集成制造系统, 2021, 27(8): 2393-2404.
[15]	汪逸晖,高亮. 乌鸦搜索算法的改进及其在工程约束优化问题中的应用[J]. 计算机集成制造系统, 2021, 27(7): 1871-1883.

基于FP-tree的快速挖掘全局最大频繁项集算法

Fast algorithm for mining global maximum frequent itemsets based on FP-tree

PDF

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics