基于XML及其数据过滤的高速信息查询系统的设计
2013-08-26 01:00
导读:计算机应用论文论文,基于XML及其数据过滤的高速信息查询系统的设计样式参考,免费教你怎么写,格式要求,科教论文网提供的这篇文章不错:
摘 要 随着信息时代的到来,人们查询需要的信息变得越来越繁琐。本文
摘 要 随着信息时代的到来,人们查询需要的信息变得越来越繁琐。本文则是从当前信息查询系统的一些缺点入手,提出了一种通过XML及其数据过滤相结合的方法来构造一种高速信息查询系统,并且给出了相关的实现技术和关键部分XML数据过滤的实现方法。 关键词 XML ; 数据过滤 ; 信息查询 ;XQuery1 引言 随着网络的迅速发展和信息的爆炸式增长,人们需要在繁多的数据中寻找所需的信息变得越来越困难,因此,信息查询系统的研究与发展成为一个热点问题。然而,当前的信息查询系统存在一些普遍的缺陷与弱点:信息查询存在盲目性和偶然性,缺乏明确的目标,查询效率低、查询速度慢、不能找到有效数据;并且在当前研究的一些高效的信息查询系统多是基于查询语言的优化或查询策略的改变。本文则从具有可伸缩性的路由机制入手介绍了一种基于XML及其数据过滤的高速信息查询系统设计方案。2 系统模型 本系统采用三层结构:即界面层、中间层和数据层。其结构如图1所示:

图1(1) 界面层 即信息查询的目标信息输入层和查询结果的输出层。它可以采用网络浏览器作为用户的交互界面。(2) 中间层 将输入的查询目标转化为XML文档中将查询要求转化为XQuery表达式(为了更好的发挥XML的特性,我们采用XQuery 作为信息查询语言),然后通过XML数据过滤从将多种异构数据库集成的XML文档中将众多的查询信息通过不同的数据过滤策略查找出我们要查询的信息,并将查询结果通过XML文档返回给界面层。(3) 数据层 由于当前数据库的类型、品牌和运行平台各不相同,我们需要将各种不同的数据进行整合来形成一种异构数据库集成的XML文档来供XML数据过滤从中查询信息。3 实现相关技术(1)XML 随着WEB服务的广泛应用,为了更好的描述信息数据,XML的重要性也越来越突出,XML凭借其平台无关性以及同各种数据库数据格式的简便转化等优越性让其成为了当前网络信息传输的重要载体。(2)XQuery语言 XML 查询技术的发展也伴随着XML技术的广泛应用而发展。各种XML查询语言相继问世,例如早期的XML-QL、XQL、UnQL,后来的Quilt、Xpath以及XQuery。XQuery语言是当前普遍应用的一种基于XML的数据查询和查询的语言。XQuery是在Quilt基础上发展起来的语言。在W3C的极力推动和各界的大力支持下,XQuery逐渐在这些语言中脱颖而出成为事实上的工业标准。 XQuery语言的基本结构是表达式,它由关键词、符号、操作数构成。XQuery表达式的模式包括:路径表达式、元素构造符、FLEW表达式、算子和函数表达式、条件表达式、限定表达式、列表表达式、数据类型表达式。(3) 数据层中基于XML的异构数据库信息集成 由于XML文档和数据库数据在结构上存在很多差异。XML文档是嵌套的多层次结构、数据长度和类型都不规则,数据间的关系通过父元素与子元素的嵌套形式实现;关系型数据库中的数据是以二维表的形式存在,数据间的关系通过主外键的方式体现。因此在数据转化过程中可以采用XML与数据库模式的映射机制。XML信息存入关系数据库需要利用XML Schema与关系模型的对应关系,将XML文档转化为关系数据库。它包括两种方法:一种是将XML文件作为数据库的表的一个字段列入一段中(作为一个CLOB对象存入)。另一种方法是将XML文件拆分,将其属性、元素等分别作为字段存储到数据库中,并保持原来数据之间的关系。第一种方式虽然保存了XML的结构,但是它将XML作为一个字段直接存入数据库的表中,但在查询过程中由于没有使用关系数据库的优势,因此查询效率很低。第二种方法将XML文档进行拆分,再作为表格的字段存入表中,这种方式很好的保存了原有关系数据库字段之间的关系,可以利用关系数据库的查询工具有效的提高查询效率。本文采用的就是第二种转化方式,下面给出了一段代码采用此方式的映射结构图: