互操作联邦数字图书馆研究(2)
2017-11-13 06:56
导读:附图 图2 Harvesting方法 Harvest系统[4]是这种方法的代表,它包括一组从各个DLs馆藏中搜集信息并建立基于主题内容索引的集成工具。Harvest体系结构主要包括
附图
图2 Harvesting方法
Harvest系统[4]是这种方法的代表,它包括一组从各个DLs馆藏中搜集信息并建立基于主题内容索引的集成工具。Harvest体系结构主要包括两部分:搜集者(gatherers)和代理(brokers)。每个搜集者从DLs馆藏中搜集并提取索引信息。代理程序从一个或多个搜集者或其他代理检索索引信息,并按增量方式对其进行更新。代理程序能够为多个馆藏建立集成索引,并提供一个查询界面。
由于Harvesting方法采用集中处理方式,所以能够保证有较好的查询响应时间,但各DLs馆藏元数据内容的变化不能及时得到反映。另外,Harvesting方法不要求严格遵守一组完整的技术协定,只要求做少许支持基本共享服务(如数据访问)的工作。同NCSTRL方法相比,Harvesting方法提供的互操作性相应的要差一些,但对联盟成员的要求却很少。因此,许多组织可能会加入这种松散的DLs联邦。
2.3 搜集(Gathering)方法
对于那些不能正式加盟的DLs组织,仍有可能通过搜集(Gathering)DLs可公开访问信息的途径获得一定程度的互操作。这种联邦方法通常提供统一的用户界面,用户输入查询请求,系统执行分布式搜索,并将合并后的查询结果返回给用户。元数据蜘蛛(MetaCrawler)[5]是搜集方法的代表,它是由美国华盛顿大学实现的并行Web搜索服务。MetaCrawler提供一个智能接口界面,它能将用户的查询并行地送往多个搜索服务(如Lycos、Altavista和Yahoo等),并对返回的结果进行整理,筛除其中重复的内容,然后返回给用户。MetaCrawler体系结构具有许多优点,它在传统的搜索服务之上提供一个抽象层,使其在Web增长和变化时具有较好的适应性、可伸缩性和便携性。
利用搜集方法建立联邦数字图书馆无须任何DLs直接参与合作,但所提供服务的质量比参与合作情况下的要差。同前面介绍的两种方法相比,搜集方法所提供的互操作性最差。目前许多关于Web的研究可视为在这个层次上添加功能,这将会提供更有效的互操作性。尽管期望整个Web表现出丰富的语义不太现实,但是人们还是期望着通过搜集方法提供服务的水平能够逐步地得到改善。
(科教论文网 Lw.nsEAc.com编辑整理) 上述三种联邦方法中,NCSTRL方法通过使用相同的协议或软件系统来消除DLs之间的异构问题,因此可以实现全面的互操作。而对现有的DLs来说,Harvesting方法是比较现实的建立联邦数字图书