浅析改进的Apriori关联挖掘算法的实践
2014-02-11 02:40
导读:计算机论文论文,浅析改进的Apriori关联挖掘算法的实践论文样本,在线游览或下载,科教论文网海量论文供你参考:摘要:本文介绍了数据挖掘技术在图书馆中的应用,并运用改进的Apriori关联挖
摘要:本文介绍了数据挖掘技术在图书馆中的应用,并运用改进的Apriori关联挖掘算法对安徽省图书馆自动化系统中读者流通库进行挖掘,并对挖掘出的结果及其意义进行评价,从而为图书馆读者管理、图书资源的采购提供决策支持。
关键词:数据挖掘 Apriori算法 图书馆管理 读者管理
数据挖掘技术在商业领域内的应用给图书馆带来了很大的启发。图书馆的数据库可以运用数据挖掘技术中的关联规则分析、聚类分析、决策树、时间序列分析等数据挖掘方法,以找出数据库中蕴藏的对于图书馆管理有用的潜在规则,并且通过描述和预测,为图书馆的图书采购、读者服务、馆藏目录设置等管理工作提供决策支持。
关联规则是与多数人想象的挖掘过程中最相近的一种数据挖掘形式,即寻找在同一事件中出现的不同项的相关性。关联规则的研究有助于发现数据库中不同商品间的联系,找出顾客购买行为模式。在图书馆运用关联规则分析可以细分出读者群,根据其借阅情况提供不同的服务,为图书馆的管理决策提供参考。关联规则的核心算法是Apriori算法。
关联规则的基本概念及算法
挖掘流通借阅事务数据库中所有的关联规则的问题可以被划分成如下两个子问题:
找出所有具有最小支持度的项集(即频繁项集),可用Apriori算法来找出频繁项集。由频繁项集产生强关联规则,对于每一个频繁项集I,找出其中所有的非空子集,然后,对于每一个这样的子集a,如果support(I)与support(a)的比值大于最小置信度,则存在规则a=