数据挖掘技术在电子商务网站中的应用(2)
2014-04-27 01:08
导读:关联规则挖掘算法的瓶颈出现在第一步。由于第一步需要反复扫描交易数据库,所以增加了系统的开销,降低了系统性能。例如:Aprior算法是一种最有影响的挖
关联规则挖掘算法的瓶颈出现在第一步。由于第一步需要反复扫描交易数据库,所以增加了系统的开销,降低了系统性能。例如:Aprior算法是一种最有影响的挖掘关联规则频繁项集的算法。该算法使用一种称为逐层搜索的迭代方法寻找频繁项集,它开创性地使用基于支持度的剪枝技术,系统地控制候选项集指数增长。它缺点就是由于数据库数据的增多,需要多次扫描数据库,这样便影响了系统的性能。
(二)基于内同的推荐算法
基于内容的推荐系统的产生根源于信息检索与信息过滤。其具体是根据项之间的相似性来进行推荐的,先用机器学习等技术分析用户已经评分的项的内容,建立用户档案,然后从项集中选择与用户档案相似的项,再从中根据评分选择一定的项推荐给用户,最后根据用户的反馈信息修正推荐。
基于内容得推荐技术具有一定的局限性。首先,资源内容必须以机器可以理解的格式表示,而很多信息例如图像、视频等多媒体信息是很难做到这一点的;其次,资源内容的分析范围比较小,不能提供较多的建议;再次,基于内容的推荐不能从质量、样式、审美等角度对项进行过滤。
(三)协同过滤推荐算法
协同过滤是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户爱好,在用户群中找到指定用户的相似(爱好)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度猜测。
协同过滤推荐算法的缺点是:(1)用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不正确(即稀疏性题目)。(2)随着用户和商品的增多,系统的性能会越来越低(即可扩展性题目)。(3)假如从来没有用户对某一商品加以评价,则这个商品就不可能被推荐(即最初评价题目)。
(转载自http://zw.NSEAC.com科教作文网) 为了弥补各种推荐方法的缺点,在实际中常采用组合推荐。在组合推荐上,国外的有关学者提出了七种组合思路:
(1)加权:加权多种推荐技术结果。
(2)变换:根据题目背景和实际情况采用不同的推荐技术。
(3)混合:同时采用多种推荐技术给出多种推荐结果,为用户提供参考。
(4)特征组合:组合来自不同推荐数据源的特征被另一种推荐算法所采用。
(5)层叠:先用一种推荐技术产生一种粗糙的推荐结果,第二种推荐技术在此推荐结果的基础上进一步做出更精确的推荐。
(6)特征扩充:一种技术产生附加的特征信息嵌进到另一种推荐技术的特征输进中。
(7)Metal-Level:一种推荐方法产生的模型作为另一种推荐方法的输进。
尽治理论上有很多种推荐组合方法,但在某一具体题目中并不见得都有效,组合推荐一个最重要的原则,就是通过组合后要能避免或弥补各自推荐技术的弱点。
三、电子商务推荐算法面临的挑战
电子商务推荐技术在实际应用中取得了巨大成功,很多电子商务网站都提供了各种不同的推荐服务。但随着站点结构内容的复杂度和用户人数的增加,电子商务推荐算法也面临很多挑战,主要包括:
(一)实时性和扩展性题目:对于上百万之巨的数据,推荐系统必须快速处理、实时搜索,在几毫秒内处理成千上万用户并提供推荐。通常的推荐算法将遭到严重的实时性和扩展性题目。
(二)智能化推荐:目前大部分的协同过滤推荐系统采用显示评分输进的方式提供个推荐服务,用户必须显示输进对商品的数值评分。这种方式一方面使得评分数据的获取比较正确可信,但同时也使得用户在使用上不是很方便。如何根据用户的行为向用户提供完全智能化得推荐需要做进一步的研究。
内容来自www.nseac.com (三)实时性与推荐质量之间的平衡:推荐系统的推荐精度和实时性是一对矛盾。大部分推荐技术在保证实时性要求的同时,是以牺牲推荐系统的推荐质量为条件的。在提供实时推荐服务的同时,如何有效进步推荐系统的推荐质量,需要做进一步深进的研究。