用户访问模式挖掘及在电子商务中的应用(1)(2)
2015-02-03 01:09
导读:1.站点结构的分析 每个Web网站并不是平面结构,而是有自己的特定结构。我们可将Web结构看作是一个多层的模型,每个层面包含很多页面,这些页面上有
1.站点结构的分析
每个Web网站并不是平面结构,而是有自己的特定结构。我们可将Web结构看作是一个多层的模型,每个层面包含很多页面,这些页面上有很多文本、图片、
音乐等页面元素组成,它们可以链接本层面或其他层面的页面元素。
Web可以用一个有向图来表示,G=(V,E),V是页面的集合,E是页面之间的超链接集合。页面抽象为图中的顶点,而页面之间的超链接抽象为图中的有向边。顶点v的入边表示对v的引用,出边表示v引用了其它的页面。 所以Web页面之间的超链接揭示了Web结构。通过对Web结构的分析可对Web数据挖掘有很大的帮助,如图4,某站点拓扑结构示例图。
2.基于图结构的用户访问模式挖掘算法
Web用户访问模式的挖掘过程可描述为:把用户会话序列看成是对图的遍历,结合数据库和Web图结构确定访问的最大向前路径。从中找出支持度大于阈值的所有子路径即频繁遍历路径,最后确定最大频繁遍历路径。基于图结构的用户访问模式的挖掘和现有方法最大的不同是,访问模式也被认为是图遍历,而不是二叉树访问顺序,即用户会话序列是图中的路径。
(1)生成最大向前路径
Web用户访问模式的挖掘过程的第一步是把用户会话序列看成是对图的遍历,结合数据库和Web图结构确定访问的最大向前路径。所谓最大向前路径(MFP)是指从起始页开始到回溯发生前,用户连续访问的最大页面序列。
假设
代表一个用户会话,代表一个含有潜在MFP的字符串,初值为空,f1ag表明当前的遍历方向是前进还是后退,数据库D存储MFP序列。算法依次对每一个用户会话进行如下操作: (科教范文网http://fw.nseac.com)
①依次读取页面xi(1≤i≤m)。
②若Xi不存在于{y1,…,y-1}中,即xi是没有访问过的页面,则将xi作为yj加入当前可能的MFP中,f1ag标记为前进,转(1)。
③否则若xi=yk(1≤k 如果f1ag标明前进遍历,则将{y1,…,y-1}作为一个M F P输出到最大前向路径集合F中,然后从中删除{yk 1,…,yj-1},并设标志f1ag为向后移动,转(1)。
如果flag标明为回退,删除{yk i,…,yj-1}后转(1)。
④当处理到用户会话中的最后一页时,如果f1ag标志仍-标明向前,则此时的{y1,…,yj 1}是该会话中的最后一个MFP。共2页: 1 [2] 下一页 论文出处(作者):
电子商务环境下的企业规模趋势
企业在电子商务环境中的价值链战略研究