浅议面向电子商务的Web日志挖掘系统(2)
2014-11-09 01:13
导读:模式发现层次包括:路径分析、关联规则挖掘、序列模式挖掘以及聚类和分类分析。 模式分析利用层由两部分组成:个性化网站及贸易智能。这也代表了
模式发现层次包括:路径分析、关联规则挖掘、序列模式挖掘以及聚类和分类分析。
模式分析利用层由两部分组成:个性化网站及贸易智能。这也代表了Web挖掘在电子商务中的两大应用方向。数据挖掘的结果可以帮助他们了解客户,调整营销策略,改进促销手段,从而达到赢得竞争的目的。
三、改进站点设计的算法
对Web站点的链接结构的优化可从两个方面来考虑:一是通过对Web日志的挖掘,发现用户访问页面的相关性,从而对密切联系的页面之间增加链接,方便用户使用。二是通过对Web日志的挖掘,发现用户的期看位置。假如在期看位置的访问频率高于实际位置的访问频率,可考虑在期看位置和实际位置之间建立导航链接,从而实现对Web站点的优化。本文对第二点做深进探讨。
通过该算法,我们可以找到用户的返回点,这个位置可能是期看位置,也可能是目标页面,但可以通过确定时间阈值来解决这个题目。当用户在返回点停留的时间较长,超过指定的阈值,则以为该页面是目标页面,、否则可以以为该页面是期看位置找不到目标页面,就会在第二期看位置找,假如还找不到,会在第三期看位置找……。其中我们最关心的是第一期看位置,而且是那些被第一期看且发生频率高于系统设计者指定值的所有页面。因此,寻找第一期看位置便成了我们关注的焦点。
②发现第一期看位置算法。设Ei表示第一期看位置,算法如下:先以用户的ID为主关键字,时间为次关键字,对Web日志文件建立索引,扫描Web日志索引文件,对每一个用户ID,摘取出页面序列。
For(I=1;I