个性化推荐服务中用户兴趣模型研究(1)(2)
2015-06-15 01:06
导读:中的任一文档 ,采用向量空间模型表示为: = 其中m 为文档 特征向量的个数, 为文档 的第i个特征向量, 为文档 中 的权值。2.2 页面相似度函数 采用向量

中的任一文档

,采用向量空间模型表示为:

=

其中m 为文档

特征向量的个数,

为文档

的第i个特征向量,

为文档

中

的权值。2.2 页面相似度函数 采用向量空间模型表示的数据,必须选择计算两个特征矢量之间相似性的相似度函数。现在常用的方法有欧几里德距离、曼哈坦距离和夹角余弦函数。我们在这里采用夹角余弦函数。但是在计算时可能会遇到用于比较的两个特征矢量长度不一样,我们可以采用添零补齐的方法使两者长度一致。夹角余弦函数如下:

其中,C(X,Y)表示页面X与Y的相似度,

与

表示X与Y对应的特征词的权值。页面X与Y值越相似,C(X,Y)值越大;反之则越小。3 基于浏览行为的用户兴趣分析 研究表明,用户很多浏览行为都能很好地反映用户的兴趣。文献[6]指出用户的很多动作都能暗示用户的喜好,如查询、浏览页面和文章、标记书签、反馈信息、点击鼠标、拖动滚动条、前进、后退等。文献[7]的研究指出用户访问时的停留时问、访问次数、保存、编辑、修改等动作能够揭示用户兴趣。这些行为究竟怎样反映用户的兴趣,我们需要对其进行量化估算。3 .1 浏览行为的分类 从表面上看能揭示用户对网页P兴趣度d(P)的浏览行为很多,但我们分析发现,起关键作用的是两种行为:在网页P上的浏览时间t(P)(简称T行为)和翻页/拉动滚动条的次数v(P)(简称V行为)。 原因有三:1)查询、编辑、修改等行为必定增加网页浏览时间和翻页次数,因此能够通过后者间接的得到反映。2)执行了保存、标记书签等动作的页面,若真为用户关心,通常以后会被多次调出来重新浏览,故可体现为访问次数。3)点击鼠标动作不被考虑,因为简单动作不能有效揭示用户兴趣。3 .2 浏览行为参数的计算 为了找到T,V与网页兴趣度的定量关系,通过分析和实验,决定采用一元线性回归方法作为网页兴趣建模分析的工具。线性回归分析方法是在分析研究对象变化趋势的基础上建立函数模型,从而研究对象之间存在的相互依存关系。共2页: 1 [2] 下一页 论文出处(作者):
(科教作文网http://zw.ΝsΕAc.Com编辑整理) CDMA系统中扩频序列相关性的研究
基于遗传算法的高校排课系统研究