网格技术在校园网中的应用(1)(2)
2015-02-02 01:07
导读:效率高低 存储方式网络共享空间,可扩展服务器存储,不可扩展 大小无限有限 资源方式网络共享服务器提供 大小多少 传输方式多种方式传输单一方式传
效率高低
存储方式网络共享空间,可扩展服务器存储,不可扩展
大小无限有限
资源方式网络共享服务器提供
大小多少
传输方式多种方式传输单一方式传输
速度高低
服务器方式少量数据交换大量数据交换,资源提供
工作率高低
综合性能高低
表1 传统校园网和基于网格技术的校园网的技术性能对比3 基于网格技术校园网的设计3.1 采用开放网格体系结构 OGSA(Open Grid Services Architecture)被公认为下一代的网格结构,它为基于网格的应用定义了一个公共的和标准的体系结构,这个结构的核心是网格服务的概念,把网格服务看作是一种特殊的Web 服务。OGSA 以服务为中心,采用一种基于网格服务的分布式交互和计算体系结构,确保异构系统间的互操作性,使不同类型的系统可以进行通信和共享信息。OGSA 只是一个框架,网格服务的具体实现是OGSI (开放网格服务基础设施) 标准,它是定义在网格环境中各种服务之间使用的接口和协议的标准。OGSA 架构由四个主要的层构成:物理和逻辑资源层; Web 服务层;基于OGSA 架构的网格服务层;网格应用程序层。所有的服务(持久的或瞬时的) 都是用Globus Toolkit构建的,所以,OGSA 的基本思想等于网格结构加Web 服务再加工具箱( Toolkit) 。OGSA 中解决了两个重要的问题,即标准服务接口的定义和协议的识别。因此,我们将采用OGSA 网格体系结构,在校园网原有资源服务的基础上,应用GT3 工具包,建立网格平台,以实现网格内资源管理、信息服务和数据管理功能[2]。 在考虑网格校园网的易管理性同时,还遵循如下原则:高性能、可扩展性、关键业务服务质量保证、信息点可控性、可靠性、安全性。3.2 网格网络构建解决方案 针对校园网结构,我们采用了千兆骨干网络、百兆网线到桌面的方案,整个网络采用分布式三层交换构架,具有很高的带宽和良好的可扩展、可管理性。具体网络拓扑见下图2,磁盘阵列包含校图书馆的所有电子资料库和大量空闲空间,供入网用户使用,下方外层的宿舍电脑群是另外一个大的共享资料库。
(转载自中国科教评价网www.nseac.com )
图2 三层网络拓扑结构
4 网格校园网设计中要解决的问题 网络构架设计解决了硬件设备和线路在校园内的连接关系问题,但网络还需要一系列软件支持才能正常运作,主要涉及到学校服务器索引设计、用户的瘦客户端更新信息上报和网络流量控制等实际问题,我们的设计思想如下:4.1 网格中服务器端索引机制的设计 由于学校图书馆文献、各部门发布信息乃至教师、学生电脑的部分信息都送到网上共享,要从中搜索浏览我们需要的资料是件很难的事情。为了使网络共享功能实用化,采用服务器加瘦客户端的模式,服务器端必须有灵活高效的信息检索能力,我们采用数据挖掘技术和倒排索引技术来实现这一要求。 结合校园网构成的实际情况,数据挖掘过程各步骤的内容如下: (1) 确定业务对象 清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步。作为校园网,学生是最大的服务对象,网络必须有效得为其提供业务服务,虽然挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,应针对校园网的特点设计挖掘结构。 (2) 数据准备与倒排索引结构的建立 数据准备包括数据选择、数据预处理和数据转换三部分。首先,搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据。校园网的搜索的信息大部分将来自客户端发送的资源地址列表。资源的地址列表包括各条资源的名称、数据类型和大小、所在地的网内IP地址和资源的存储路径。第二步,数据预处理研究数据的质量,为进一步的分析做准备.并确定将要进行的挖掘操作的类型。最后是数据转换,将数据转换成符合分析模型需要的格式,这个分析模型是针对挖掘算法建立的。建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键,我们利用倒排文件的检索技术对服务器收到的大量资源地址列表进行多层次的分类,提高检索效率。首先,根据第一步得来的资源总表建立多级检索目录。对图书馆的电子文献往往有已知多级分类目录,在第一级分为文、理两类,再在理科下属第二级分计算机、电子信息工程、
数学等分支,然后在计算机分之建立第三级目录,包括离散数学、C语言、算法、网络等,到第四级(如网格类文章)即是索引树的树叶一级的结点了,用来对应存储具体资料名称和存储路径。对于教师和学生宿舍电脑,先根据楼栋号和学生所属院系分IP地址段建立多级索引目录,然后针对最后一级结点内容结合用户经常搜索的关键词映射到主多级目录的次关键字建立倒排索引,列出相关资源(如网格)的存储路径。若有人共享一份有关网格的技术文章,它的存储路径将被整理分类到理科——计算机——网络对应的倒排索引列表中。 (3) 结合倒排索引的数据挖掘 对所得到的经过转换的数据进行挖掘。除了完善选择合适的挖掘算法外,其余一切工作都能自动地完成。 若有人搜索有关网格技术的文章,索引算法将会确定这种资料来自计算机的网络类资源,于是进入其对应的倒排文件列共2页: 1 [2] 下一页 论文出处(作者):