计算机应用 | 古代文学 | 市场营销 | 生命科学 | 交通物流 | 财务管理 | 历史学 | 毕业 | 哲学 | 政治 | 财税 | 经济 | 金融 | 审计 | 法学 | 护理学 | 国际经济与贸易
计算机软件 | 新闻传播 | 电子商务 | 土木工程 | 临床医学 | 旅游管理 | 建筑学 | 文学 | 化学 | 数学 | 物理 | 地理 | 理工 | 生命 | 文化 | 企业管理 | 电子信息工程
计算机网络 | 语言文学 | 信息安全 | 工程力学 | 工商管理 | 经济管理 | 计算机 | 机电 | 材料 | 医学 | 药学 | 会计 | 硕士 | 法律 | MBA
现当代文学 | 英美文学 | 通讯工程 | 网络工程 | 行政管理 | 公共管理 | 自动化 | 艺术 | 音乐 | 舞蹈 | 美术 | 本科 | 教育 | 英语 |

Web数据挖掘中频繁访问页组有趣性的研究(1)

2015-05-03 01:43
导读:计算机应用论文论文,Web数据挖掘中频繁访问页组有趣性的研究(1)应该怎么写,有什么格式要求,科教论文网提供的这篇文章是一个很好的范例:摘 要 关联规则挖掘是Web使用挖掘的一个重要研究课题,而其中重要的一个问题
摘 要 关联规则挖掘是Web使用挖掘的一个重要研究课题,而其中重要的一个问题就是挖掘出的规则的兴趣度评估。在实际的应用中,一般的关联规则算法往往很容易从Web数据源中挖掘出大量的规则,而这些规则中,大部分对于用户来说是不感兴趣的。本文结合网络站点拓扑结构,提出了有趣关联规则的算法(MIR)。利用页面之间的关联概率对所产生的频繁访问页组的有趣度进行评价,得到有趣度高的频繁访问页组。实验显示,MIR算法提高了规则的利用率,有效的改善网站拓扑结构。 关键词 有趣关联规则;页面关联概率;频繁访问页组1 引言 随着互联网技术的快速发展,如何在WWW数据中找到有用的信息,已经成为当今计算机技术研究的一个热点课题。Web挖掘是数据挖掘技术在互联网上的重要应用。它主要包含两大范畴:Web内容挖掘和Web使用挖掘。 关联规则挖掘是Web使用挖掘的一个重要研究课题。它的目的是找到网站资源访问记录中隐含的相互关系,能够发现隐藏的用户访问模式。本文着重讨论了有趣关联规则的挖掘。通过分析日志文件,我们可以寻找到那些经常被用户访问的页面及他们之间的关联规则(即频繁访问页组)。但是,这些挖掘的结果应该考虑到规则的有趣度。兴趣度低的规则对于网站的结构调整和整体设计无重大意义。在本文中我们认为一个兴趣度高的用户频繁访问页组满足三点: (1)页组内页面本身之间链接程度低。 (2)页组内尽可能包含多的页面。 (3)经常被用户在一次浏览过程中访问。2 关联规则 关联规则的问题描述如下: 设R = { I1,I2,
    上一篇:浅谈电子政务外包的模式(1) 下一篇:没有了