计算机应用 | 古代文学 | 市场营销 | 生命科学 | 交通物流 | 财务管理 | 历史学 | 毕业 | 哲学 | 政治 | 财税 | 经济 | 金融 | 审计 | 法学 | 护理学 | 国际经济与贸易
计算机软件 | 新闻传播 | 电子商务 | 土木工程 | 临床医学 | 旅游管理 | 建筑学 | 文学 | 化学 | 数学 | 物理 | 地理 | 理工 | 生命 | 文化 | 企业管理 | 电子信息工程
计算机网络 | 语言文学 | 信息安全 | 工程力学 | 工商管理 | 经济管理 | 计算机 | 机电 | 材料 | 医学 | 药学 | 会计 | 硕士 | 法律 | MBA
现当代文学 | 英美文学 | 通讯工程 | 网络工程 | 行政管理 | 公共管理 | 自动化 | 艺术 | 音乐 | 舞蹈 | 美术 | 本科 | 教育 | 英语 |

开放源代码的数字资源管理系统DSpace和Fedora的分(2)

2015-01-02 01:38
导读:3.2 Fedora的体系结构 Fedora是一个三层结构的系统,采用灵活可变的数字对象仓储体系结构。 Fedora的体系结构图[15] 最上层是管理和访问接口层,定义了系统
   3.2 Fedora的体系结构
    Fedora是一个三层结构的系统,采用灵活可变的数字对象仓储体系结构。
    Fedora的体系结构图[15]
    最上层是管理和访问接口层,定义了系统的公共视图,构建于Web Services技术之上。仓储提供了两个相关的Web Services,管理Web Service和访问Web Service。Fedora管理接口定义了管理仓储的公开接口,包括创建、修改、删除数字对象或者数字对象的数据元素(包含数据和元数据)。Fedora访问接口定义了访问数字对象的公共接口。
    中间层是内部服务层,包含管理子系统,访问子系统,安全子系统。管理子系统和访问子系统分别实现了管理和访问接口。
    底层是存储于系统,负责读写数字对象和数字对象元素。数字对象的元素可以是分布的。存储子系统需要负责实时请求和缓存分布的数据。Fedora支持通过HT-TP协议和FTP协议访问分布式资源。
    3.3 Fedora的主要功能特点[16]
    (1)灵活的数字对象模型
    Fedora数字对象模型提供很大的灵活性,支持创建各种类型的对象,包括:文档、图像、电子书、多媒体学习对象、数据集、元数据等。Fedora中的元数据模型可以用数字对象中的一个或多个数据流描述和访问,可以是一个本地的元数据集合,一个标准的元数据集合,或者是DC元数据的扩展。
    (2)以Web Service方式发布管理和访问服务
    Fedora仓储系统提供的管理和访问服务作为Web Service进行发布,通过WSDL(Web Services Description Language)进行描述。同时访问服务接口还提供了基于Web页面的调用实现。外界对数字对象的访问通过调用数字对象提供的行为中的具体方法来进行。数字对象的行为作为分布式的Web Service进行实现,用WSDL进行表述,通过HTTP GET/POST或者SOAP(Simple Object Access Protocol)进行访问。 中国大学排名
    (3)内容版本控制
    通过Fedora管理接口修改数据元素或者是数据发布器可以自动地生成新版本的相应内容。Fedora对象包含一个所有版本的记录,对以往版本内容的访问可以通过在Fedora访问服务(API-A和API-A-LITE)请求之上加入时间戳来实现。
    (4)XML格式的数据存储和导入导出
    缺省情况下,Fedora数字对象在Fedora系统中以FedoraObject XML(FOXML)格式编码的XML文件形式存储。数字对象中的内容数据保持本身的格式以数据元素(Data Stream)的形式存放在系统的序列化存储区。
    数字对象可以遵照Fedora Object XML(FOXML)Schema或者是Metadats Encoding and Transmission Standard(METS)[13]Schema格式编码过的XML文件的格式提交到Fedora存储系统和从系统中导出。在Fedora的未来版本中还将支持MPEG2/DIDL和METS 1.3规范。
    (5)对象之间的关联支持
    Fedora提供对象之间关联关系的声明。对象到对象的关联元数据用来表示对象之间的各种关系,包括:某个对象是一个数字馆藏的成员,是否另一个对象的一部分从另一个对象派生,或者是等价于另外一个对象等。这些关系定义在Fedora的关联本体集合中。
    (6)简单检索功能
    Fedora自动地为存储系统创建两种索引。缺省的检索索引是有关对象的属性和DC元数据元素。在Fedora 2.0中,有一个新的基于RDF的资源索引,包含对象之间的关联关系。这两种索引都可以通过基于表现性状态传输协议REST(Representational StateTransfer)[17]这种面向资源的Web服务接口来检索。
    (7)OAI元数据采集服务
    每个Fedora数字对象有一个原始的DC记录,符合OAI PMH 2.0协议[9]标准所定义的Schema规范,这种元数据可以使用OAI PMH 2.0标准访问。

(科教范文网http://fw.ΝsΕΑc.com编辑)


    (8)管理工具
    Fedora2.0系统提供一个迁移工具可以实现批量的对象导入和导出。迁移工具在2个新增强的命令行工具:Fedoraingest和Fedora-export的基础上实现,可以在不同的仓储之间实现对象的移动和复制,包括从以前的版本升级。
    Fedora仓储系统中包含一个管理员客户端中的批处理工具,可以批量创建和修改数字对象。另外,还包括一个报告工具,提供对Fedora仓储中各种内容的不同管理视图的报告。
    3.4 Fedora的安装和运行环境
    本文以Fedora 1.2版本为基础扩展开发了一个通用的数字资源管理系统DRMS[18],所需的安装和运行环境如下:
    Unix类或者是Windows操作系统,包括Linux,Solaris等;
    Java2 Standard Development Kit(J2SDK)1.4或者是更高版本;
    MySQL 3.23.x版本,MySQL4.x版本,或者是Oracle 9i关系数据库系统;
    Apache Jakarta Tomcat 5.x或者是类似的系统。

  4 DSpace和Fedora的比较

    通过上述对两个系统的分析,可以总结出两个系统之间的一些共同点和区别如下。
    4.1 相同点
    (1)都基于开放和模块化的体系结构。DSpace基于一个三层结构而且数据模型基于OAIS参考模型;Fedora使用灵活可扩展的数字对象和仓储体系结构。
    (2)都支持长期保存的问题,可以给同一种内容提供多种数字格式,使用技术元数据并保证一个全球唯一的标识符来访问每个数字对象。
    (3)都支持数字对象,可以是原生的或者是数字化的,不受特定的文件格式或数字内容类型的限制。
    (4)都采用METS标准作为数据交换的格式。
    (5)都实现了OAI协议,提供元数据采集服务,方便系统之间的互操作。 (科教论文网 lw.nseaC.Com编辑发布)
    (6)系统都采用纯Java实现,具有良好的跨平台性。
    4.2 不同点
    (1)处理数据的方式不同。DSpace中的数据和元数据作为独立的两个实体,Fedora中的数据和元数据被封装在数字对象内部。
    (2)对内部数据的管理和访问方式不同。DSpace直接将数据和元数据暴露给最终用户,直接操作内部数据。Fedora为管理服务提供2种公共的API(API-M,API-Mlite),为访问服务提供2种公共的API(API-A,API-A-Lite),都通过Web Service的方式提供,不用直接操作内部数据。
    (3)信息模型不同。DSpace的信息模型基于一些数字空间群(Communities),由用户和用户组组成,包含数字馆藏(Collections),再顺次包含条目(Items)。Fedora系统中把各种资源统一成数字对象,本身不直接支持馆藏(Collection)的概念。为了描述馆藏,需要使用一个数字对象来表示包含适当的馆藏描述信息、权限元数据和创建数据对象的模版的馆藏对象。
    (4)数据的导入导出支持不同。DSpace中提供终端用户交互和接口功能,基于Web的用户界面,批量数据导入导出工具。数据导入格式是DSpace内部的格式,数据导出格式可以是简单的METS编码的文件。Fedora中提供客户端形式的批量数据导入导出工具,格式采用METS标准编码,方便与其它系统之间交换数据。
    (5)元数据支持的灵活程度不同。DSpace中内置的支持允许一些简单修饰符的DC元数据,如果要扩展其它的元数据方案,需要对数据库结构进行修改。Fedora中的元数据模型可以是一个本地的元数据集合,一个标准的元数据集合,或者是DC元数据的扩展。Fedora只提供对DC元数据集中的元素进行索引和检索的支持,如果对其他的元数据字段做索引和检索,可以扩展一个外部的应用程序来实现,比DSpace更为灵活。

(科教范文网http://fw.NSEAC.com编辑发布)

    (6)快速开发、易用性方面。DSpace可以很容易地生成包含独立数字文档内容的数字仓储。它对一些常见问题提供了简单,实用和高效的解决方法,如:用户和工作流的管理,持续化和索引/检索问题。Fedora不提供直接面向终端用户的数据操作和访问界面,它的目标是提供一个数字对象存储、管理、检索和交换的基础平台,利用它提供的开放的接口可以实现复杂应用的需求,但二次开发的起点较高。
    (7)可扩展性。DSpace提供了几种内置的工具可以简单和快速地开发一个数字仓储,这些功能都是高度捆绑的,而且与底层的数据库结构绑定。为了实现功能上的重大改进,必须对数据库结构和相关的代码进行修改。一旦进行这些修改,会破坏对系统将来版本的兼容性,限制了对系统将来性能提高和扩展的继承性。Fedora的可扩展体系结构提供了开发附加的外部模块的能力,通过它提供的公共接口实现,不用修改到核心代码。这种扩展方式可以在Fedora之上开发新的应用,而且可以保持对Fedora系统核心升级的兼容性。

      5 结语

    通过对两个系统的分析和比较,可以看出,作为目前较为流行的两个开放源代码数字资源管理系统,DSpace和Fedora都提供了丰富的功能,可以满足许多馆藏数字资源的提交、保存、管理和发布中的一般需求。在部署本地应用系统时,应该根据实际需要,选择合适的系统作为基础平台。对于一般的简单应用,不需要扩展特殊功能的情况下,可以选择DSpace作为应用的基础,利用它的快速开发支持解决一些常见的资源保存和发布的问题。对于一些复杂的应用需求,比如说:对用户的授权控制方面有特殊的需求,对元数据的支持方面有特殊的需求,需要对功能上作较大的改进,这种情况下,可以考虑以Fedora为基础扩展实现。

【参考文献】

(转载自http://zw.NSEAC.com科教作文网)


    1 DSpace的官方站点.http://www.dspace.org/(Accessed Feb.8,2005)
    2 Fedora的官方站点.http://www.fedora,info/(Accessed Feb.8,2005)
    3 The BSD License.http://www.opensource.org/licenses/bsd-li-cense,php(Accessed Mar.5,2005)
    4 浙江大学图书馆,DSpace研究.http://libweb.zju.edu.cn/aduser/dspace/dspace,jsp(Accessed Jan.5,2005)
    5 DSpace System Documentation:Functional Overview.http://dspace.org/technology/system-docs/functional.html(Accessed Feb.10,2005)
    6 DSpace System Documentation:Architecture.http://dspace.org/technology/system-docs/architecture,html(Accessed Feb.10,2005)
    7 x509-Certificate display and signing utility.http://www.openssl.org/docs/apps/x509,html(Accessed Mar.8,2005)
    8 CNRI Handle System.http://www.handle.net/(Accessed Feb.8,2005)
    9 Open Archives Initiative.http://www.openarchives,org/(Accessed Jan.10,2005)
    10 Ex Libris SFX Overview.http://www,exlibrisgroup,com/sfx,htm(Accessed Feb.10,2005)
    11 The OpenURL Framework for Context-Sensitive Services.http://www.niso.org/committees/committee_ax.html(Accessed Feb.10,2005)
    12 The Apache Lucene.http://lucene.apache,org/java/does/(Accessed Feb.10,2005)
    13 METS官方站点.http://www,loc.gov/standards/mets/(Accessed Dec.8,2004)
    14 Mellon Fedora Technical Specification.December,2002.http://www.fedora.info/documents/master-spec-12.20.02.pdf(Assessed Feb.10,2005)
    15 Thornton Staples and Sandy Payette,The Fedora Project.http://www.fedora,info/presentations/2003-4-28-CNI1.ppt(Accessed Feb.10,2005 )
    16 Fedora Repository Features.http://www,fedora,info/download/2.0/userdoes/server/features/features.html(Accessed Feb.10,2005) (科教作文网http://zw.ΝsΕAc.com发布)
    17 Paul Prescod.Second Generation Web Services.http://webservices.xml.com/pub/a/ws/2002/02/06/rest,html(Accessed Feb.10,2005)
    18 王勇.通用数字图书馆管理系统设计和实现——资源存储管理和服务,清华大学硕士学位论文。 

共2页: 2

论文出处(作者):
上一篇:自然语言检索中的概念控制(1) 下一篇:没有了