网络读者访问流量统计分析系统的研究与实现(2)
2013-05-20 01:04
导读:操作系统 Windows 2000 SP4 Server+Aix 4.3.3 Web服务器软件 IIS 5.0+Apache 3.0 浏览器软件 IE5.5 网页制作 Frontpage2000+JavaScriPt ASP工具 Editplus Text Editor 编程语言 Visual Basi
操作系统 Windows 2000 SP4 Server+Aix 4.3.3
Web服务器软件 IIS 5.0+Apache 3.0
浏览器软件 IE5.5
网页制作 Frontpage2000+JavaScriPt
ASP工具 Editplus Text Editor
编程语言 Visual Basic 6.0
图表软件 Excel2000
(4)程序流程与代码实现
该系统由main.asp(主界面程序)、flux.asp(小时、日、星期流量分析)、target.asp(被访页面分析)、visitor.asp(来访读者分析)、chart.asp(统计分析图表)五个组成。
我们以“被访页面分析”模块的程序流程和代码说明系统组成模块的实现过程,该模块程序流程图如图4。
“被访页面分析”程序流程图
相应代码:
<table
<td class=定义的表格形式及表头>
Set conn=server.creatobjectl("adodb.connection")
conn.open"dsn=dsn_dbs;uid=xxx;pwd=xxx"
Set re=server.creatobject("adodb.recorderset")
re.activeconnection=conn
dbname=Application("logtime")——数据表名称
re.open“QL语句”
do while not re.eof
执行Recordset操作,服务器进行统计计算
response.write——写入统计表
re.movenext
loop
re.close
程序中一些代码说明:
①Recordset的Open方法:允许用户向数据库发出请求,通常是运行sql命令。如:Sqlquery="select logtime from intemetlog where day(logtime)=day(getdate())and month(logtime)=month(getdate())and year(logtime)=year(getdate())"Dbrs.open sqlquery,dbconnection,3,3
(转载自中国科教评价网www.nseac.com )
②Recordset的RecordCount属性:可以取得当前在Recordset对象中的记录条数。如:set dbrs=server.createobject("ADODB.recordset")amount=dbrs.recordcount
③Recordset的MoveNext方法:移动指针到Recordset对象的下一条数据。如:Dbrs.movenext
④Response的Write方法:负责将字符串信息输出的用户端。如:Response.write“页面总访问量:“& amount &”<br>
⑤Recordset的Close方法:可以用来关闭指定的Recordset对象。如:Dbrs.close
2.6 系统运行过程
下面以西安交通
大学图书馆网站为统计分析对象说明该系统运行过程。
首先我们用FTP工具抓取网址为http://www.lib.xjtu.edu.cn的服务器,时间段为2003/01/01到2003/12/31的访问日志导入到数据库中,该服务器完成图书馆网站的部分功能:门户信息、OPAC、馆际互借、电子
期刊、网络数据库、网络资源、参考服务等。
对日志分析系统进行运行参数设置:读者访问时间间隔设为20分钟;从最新
QQ显IP版软件中导出读者IP地址分配资料,转换格式后导入到日志分析系统的地址表中,以便对读者分群;设置过滤规格文件滤掉一些无用的访问信息,如背景图片、图书馆Logo,页面美化图片和服务器漏洞扫描日志等日志信息,然后对服务器访问日志进行初步统计分析,保存统计分析结果准备进行进一步统计分析。
最后利用精致多样的统计分析方法对初步统计结果进行统计分析,统计分析出的数据有:一年内资源点击与访问计数;一年内网站中最常使用的资源与服务;一年内点击次数最多的读者;一年内务分群读者的点击次数比例;一年内点击次数与阅读次数的变化;一年内上网的读者与累积
成长趋势;一周各天的平均点击次数;一天内各时段的平均点击次数;校内各区读者点击次数比例;各项相关资源被使用的情形等等。这些数据可用Eexel软件生成直观的统计分析图表,部分图表详见实际应用一节中。本系统的研究主要采用访问过程日志分析法,以内容分析法、问卷调查法辅助研究。主要考虑:一是这种方法在电子商务和其它网络应用的量化分析,已经有许多研究成果,可使我们的研究更为便利;二是可以经济的,较具体客观的分析到网络读者信息需求特性;三是通过定量的计算,定质的分析,形成一种综合分析的方式,以求分析结果更为客观和科学。
3 实际应用
从2002年开始,我们从图书馆门户网站读者访问计数开始了网络读者访问统计工作,从最初的图书馆首页访问计数到现在应用网络读者访问流量统计分析系统到以信息资源发布站点、数据库为单元的访问利用上,取得了不少研究成果,下面我们介绍以2003年西安交通大学图书馆网站读者访问日志为统计对象,获得的一些统计分析结果。 (科教作文网http://zw.NSEaC.com编辑发布)
表3是2003年图书馆网站的资源浏览次数,访问次数与访问读者数的统计表,我们看到一年内资源的浏览次数是10,222,296,访问次数是 1,617,166,访问读者是310,628,对照2003年西安交大统计公报教职工5341人,在校学生32766人的数据表明图书馆网站有很高的访问量。另外网络访问读者310,628远远大于学生和教职工的总和,表明有相当多的读者使用本馆的资源,这说明本馆的信息资源丰富,吸引了很多读者。网站不足之处是自建的外文资源很少。从表3看,来自国内访问占6.43%,来自国外访问占0.01%。综合以上资料,西安交大图书馆网站为校内外读者提供了方便、丰富的资源服务,吸引了大量的读者,但在国外的知名度很低,现有资源不能吸引国外读者,对此图书馆采取一些措施,来解决这个问题。
①建设网站的英文版本;
②把本校和本地一些有特色的文化资源数字化后,做成中英文全文数据库。如钱学森多媒体数据库、江南制造局多媒体数据库;