Web数据挖掘中频繁访问页组有趣性的研究(1)
2015-05-03 01:43
导读:计算机应用论文论文,Web数据挖掘中频繁访问页组有趣性的研究(1)应该怎么写,有什么格式要求,科教论文网提供的这篇文章是一个很好的范例:摘 要 关联规则挖掘是Web使用挖掘的一个重要研究课题,而其中重要的一个问题
摘 要 关联规则挖掘是Web使用挖掘的一个重要研究课题,而其中重要的一个问题就是挖掘出的规则的兴趣度评估。在实际的应用中,一般的关联规则算法往往很容易从Web数据源中挖掘出大量的规则,而这些规则中,大部分对于用户来说是不感兴趣的。本文结合网络站点拓扑结构,提出了有趣关联规则的算法(MIR)。利用页面之间的关联概率对所产生的频繁访问页组的有趣度进行评价,得到有趣度高的频繁访问页组。实验显示,MIR算法提高了规则的利用率,有效的改善网站拓扑结构。 关键词 有趣关联规则;页面关联概率;频繁访问页组1 引言 随着互联网技术的快速发展,如何在WWW数据中找到有用的信息,已经成为当今
计算机技术研究的一个热点课题。Web挖掘是数据挖掘技术在互联网上的重要应用。它主要包含两大范畴:Web内容挖掘和Web使用挖掘。 关联规则挖掘是Web使用挖掘的一个重要研究课题。它的目的是找到网站资源访问记录中隐含的相互关系,能够发现隐藏的用户访问模式。本文着重讨论了有趣关联规则的挖掘。通过分析日志文件,我们可以寻找到那些经常被用户访问的页面及他们之间的关联规则(即频繁访问页组)。但是,这些挖掘的结果应该考虑到规则的有趣度。兴趣度低的规则对于网站的结构调整和整体设计无重大意义。在本文中我们认为一个兴趣度高的用户频繁访问页组满足三点: (1)页组内页面本身之间链接程度低。 (2)页组内尽可能包含多的页面。 (3)经常被用户在一次浏览过程中访问。2 关联规则 关联规则的问题描述如下: 设R = { I1,I2,