计算机应用 | 古代文学 | 市场营销 | 生命科学 | 交通物流 | 财务管理 | 历史学 | 毕业 | 哲学 | 政治 | 财税 | 经济 | 金融 | 审计 | 法学 | 护理学 | 国际经济与贸易
计算机软件 | 新闻传播 | 电子商务 | 土木工程 | 临床医学 | 旅游管理 | 建筑学 | 文学 | 化学 | 数学 | 物理 | 地理 | 理工 | 生命 | 文化 | 企业管理 | 电子信息工程
计算机网络 | 语言文学 | 信息安全 | 工程力学 | 工商管理 | 经济管理 | 计算机 | 机电 | 材料 | 医学 | 药学 | 会计 | 硕士 | 法律 | MBA
现当代文学 | 英美文学 | 通讯工程 | 网络工程 | 行政管理 | 公共管理 | 自动化 | 艺术 | 音乐 | 舞蹈 | 美术 | 本科 | 教育 | 英语 |

基于Web数据挖掘的用户上网兴趣收集VB+CSW

2016-02-21 01:09
导读:计算机应用论文论文,基于Web数据挖掘的用户上网兴趣收集VB+CSW怎么写,格式要求,写法技巧,科教论文网展示的这篇文章是很好的参考:毕业
毕业

基于Web数据挖掘的用户上网兴趣收集
 
摘  要 在电子商务活动中,为了研究用户的上网、购买习惯或者提供个性化的服务,往往需要用户注册,这种对个人信息的需求,在1定程度上影响了电子商务的发展。因为互联网用户对个人隐私非常关心,在很多情况下用户不愿提供详细的个人信息。
获取个人信息1方面应在用户可以接受的范围内获取尽可能多的用户信息;另1方面应当以尽可能少的、最有价值的用户信息来保证电子商务活动的需要。本文通过对用户上网兴趣进行收集,得到用户的兴趣模型,即用户兴趣数据库。通过VB 6.0和CSW 5.0分词软件实现了用户在个人电脑上的上网兴趣收集。通过不断地收集活动,更新兴趣数据库。电子商务或其它服务提供商,通过获取该用户的兴趣模型,就可以为用户提供个性化服务,提高了客户或用户与服务提供商交流的效率。
关键词: Web数据挖掘; 用户兴趣收集;用户兴趣模型; 中文分词;网志分析
 
User’s Web-Pages Interests Collection Based On
Web Data Mining
 
Abstract  In order to offer better personal services, E-Business servers often acquire users’ private information registered by the users. This information needs affect the development of E-Business for everyone is concerned with his own information and afraid of being revealed, consequently. he won’t offer detailed information in many conditions. 
So, it is essential to get users’ information as much as possible while extract the most useful information as little as possible to guarantee the E-Business services. In this paper, we build users’ interest model by acquiring users’ interests continuously. We use VB 6.0 and CSW 5.0 to acquire and analyse users interests, at the same time, update the User Interest Database by tracing the users’ behaviours which reflect their interests. As a result, E-Business or other servers can provide personality and improve the communion fluency between users and providers servers with this model.

(科教范文网http://fw.NSEAC.com编辑发布)


Keywords:Web data mining; users’ interests collection; users’ interests modeling; word segmente; web log mining
目录
前言 2
1 开发环境 3
1.1 MICROSOFT ACCESS 2003 3
1.2 MICROSOFT VB 6.0 3
1.2.1 Visual Basic 6.0 开发平台 3
1.2.2 Visual Basic 6.0 访问数据库 4
2 WEB数据挖掘及相关技术探讨 6
2.1 WEB数据挖掘的概述 6
2.2 WEB文本挖掘及日志挖掘概述 7
2.3 WEB数据挖掘的相关技术 8
2.3.1 Cookies分析 9
2.3.2 收藏夹分析 15
2.3.3 中文分词介绍 20
2.3.4 钩子 23
2.4 兴趣建模 29
2.4.1 用户兴趣模型的表示 29
2.4.2 建模技术 29
2.4.3 用户兴趣收集数据库 30
3 系统分析与实现 32
3.1 系统分析及可行性研究 32
3.2 总体设计 32
3.3 数据库设计 34
3.4 详细设计 34
3.5 系统关键代码 38
3.6 部分模块测试后的显示结果 40
4 总结 42
参考文献 43
致谢 44
附录1 CSW简介 45
附录2 部分代码 47

 
前言
近年来,Internet技术得到了广泛的应用,并日趋普及,成为全球范围内传播信息的重要手段。目前,Internet用户可以利用搜索引擎工具,通过输入关键字,获得自己所需的信息。Internet上包含了大量的Web站点,每个Web站点就是1个数据源。Web挖掘的数据通常包括3类:(1) 用户的背景信息:此类信息主要来自用户的注册信息。(2) 浏览信息:浏览信息主要来自于浏览者的单击流(Click-stream),这部分数据主要用于考察用户的行为表现。Web上有海量的的数据信息,人们在浏览网站时,包含了大量的潜在信息,如个人姓名和住址,单击了哪1个连接,在哪里浏览时间最多等。 (3) Internet自身信息:这类信息来自Web自身,如网页内容、Web结构等。 (科教作文网http://zw.nseAc.com)
在网页迅速增长的同时,Web用户也迅猛地增长。海量的网页在为人们提供包罗万象、丰富无比的信息资源,同时,也向人们提出了如何快速、有效地从信息海洋中获取其所需信息的挑战。由于信息站点的建立,信息发布是大量的、自由且无序的,如果没有有效的搜索工具,在网络中查找信息如同大海捞针。搜索引擎在网络信息资源查找中起到了相当重要的作用,是最普遍的辅助人们检索信息的工具,比如传统的搜索引擎Yahoo和新1代的搜索引擎Google等。
如今,在许多商务活动中,为了研究用户的上网、购买习惯或者提供个性化的服务,往往需要用户注册,这种对个人信息的需求,在1定程度上影响了电子商务的发展,因为互联网用户对个人隐私非常关心,在很多情况下用户不愿提供详细的个人信息。因此,在这种情况下,服务提供商就不得不从用户浏览信息中的1系列相关动作(比如把感兴趣的网页信息存入收藏夹、在某个网页上的停留时间等)来推测用户的兴趣,进而为用户提供个性化服务。
本文通过研究和验证用户上网兴趣收集的方法,得到提升电子商务价值的途径。把基于内容的Web挖掘和基于日志的Web挖掘两种方法结合起来,在前人的基础上,研究用户兴趣的收集方法并将收集数据进行组织和建模,得到的用户兴趣模型可以应用于电子服务行业,使之能为用户提供更加方便及个性化的服务。为检验模型的实用性,本文设计1种智能网页推荐系统,为网站的每1访问用户迅速提供其真正感兴趣的网页。并给出系统的实现算法。
本的研究内容有:对用户定制信息的保存和分类;对用户收藏的网页进行分析和特征提取; 对cookies的读取与分析;对用户浏览某网页的动作进行统计分析;综合用户兴趣爱好,统计用户兴趣排行;建立用户兴趣模型。 (科教范文网http://fw.ΝsΕΑc.com编辑)
本论结构及每章的基本内容如下:
前言给出了写作的背景、工作、研究目标以及研究内容;
第1章开发环境的主要介绍;
第2章详细介绍了Web数据挖掘及相关技术,包括Web文本挖掘概述、Web日志挖掘概述、Cookies分析、收藏夹分析、中文分词介绍和钩子以及用户兴趣建模的相关情况;
第3章进行系统分析与实现;
第4章对本文作了全面性的总结。

    上一篇:基于角色权限的访问控制设计VC++ 下一篇:没有了