论文首页哲学论文经济论文法学论文教育论文文学论文历史论文理学论文工学论文医学论文管理论文艺术论文 |
因此,数据库首当其冲的是应针对不同类型的信息作更为详尽的标引,设定不同的可检索字段,以便为进一步的内容挖掘打下基础。例如,对机构名录信息应根据其属性要素,对机构名、法人、电话、传真、地址、邮编、e—mail、所属地域、机构性质、单位简介等进行标引;对人名录则主要包含人名、性别、生卒日、籍贯、工作单位、部门、职务、职称、、人物类型(先进、领导、专业奖项获得者等)、从业类别等属性的标引;对大事记部分,现有的年鉴全文库都是不加分割地作为完整的文献单元处理,连最简单的检索某日各地发生的重大事件都不可能,因此应以独立的事件为单位,用数据库的结构提取时间、地点、所属地域、事件内容等相关信息提供检索,并按单独的事件为单位输出检索结果,而不是输出整篇大事记的全文;对法规类信息应提取其特有的法律法规的级别、颁布部门、颁布年、实施年、发文号等属性供用户检索;对图像应建立基于图像内容的索引库,提供图片内容特征的搜索;对表应进行统计指标、表头的标引,甚至有能力的话,还可以加强对统计表的标准化处理,提供具体的数值检索,充分体现数字信息检索的优势,发挥年鉴统计数据的价值。同时,系统应在详尽标引的基础上,对以上信息类型设置专类信息检索功能,提供针对各类信息的检索字段,提高信息检索的精准度。
4.3检索结果后处理能力不强
(1)年鉴全文库现有的二次检索没有提供算符的选择,只能进行逻辑“与”的二次检索,这不便于用户进一步调整检索策略。
(2)对于年鉴全文库而言,由于条目数量巨大,检出记录数往往较多,因此特别需要对检索结果作进一步的分面和聚类。但目前的年鉴全文库都没有提供检索结果分面功能。所以,年鉴全文库应当按结果的信息类型、所涉地域、条目年份、所属年鉴、行业、学科等维度进行分面,供用户选择合适类别的结果浏览,这样既使大量检索结果序化,又可减少读者筛选结果的时问。
(3)现有年鉴全文库的统计表基本都是格式或PDF格式,数据导出灵活性不够,用户对统计表数据的再处理非常不便。数据库应对所有统计表格以Excel形式录入并提供导出接口,并可以进一步利用ASP、JsP等动态网页生成技术,根据用户需求,以交互互动的方式输出数据,实现统计表与统计图动态转换的数据可视化,为用户提供深加工的统计数据,简化用户后续处理的过程(这些功能在国外的Knovel工具书数据库中已经实现)。此外,在Excel表格显示地同时应提供原表格的图片格式或PDF格式的链接,以供读者核对数据,保证准确性。
(4)检索结果中条目所属栏目标注不够完整,仅标注了栏目,没有标注其上级类目,用户很难找到该条目在年鉴目录体系中的准确位置。因此必须完整标注出该条目在年鉴原有框架结构中所属的篇目>类目>分目>栏目(如:上海年鉴>>教育>高等艺术教育),并分别对年鉴名称、篇目、类目、分目、栏目制作超链接,指向与纸本年鉴框架结构一致的年鉴目录导引下的全文浏览,便于用户利用年鉴目录体系调出相关内容浏览。
4.4个性化服务功能欠缺
在个性化功能上年鉴全文库还很薄弱,CNK1只提供了检索的浏览,Apabi则只提供条目的收藏,尚缺乏其他服务。由于年鉴资料连续性的特点,用户往往需要对密切关注领域的特定资料作跟踪收集。这就需要数据库开发针对用户个体需求的个性化服务,这些服务包括特定年鉴品种、年鉴的栏目、检索策略的RSS订阅,定题跟踪,我的检索集设定等功能,这样用户就可以在第一时间获得由系统自动推送来的最新信息,而不必再每隔一段时间去查找相同主题的信息。
4.5信息整合层次单一
当前的文献数据库领域正在发生着重要的转型,许多数据库正从单一的信息检索工具,向广泛整合外部资源的、综合的信息资源与服务体系转变,它是数字信息源发展到一定阶段的必然选择,封闭的“信息孤岛”是难以充分满足用户需求的。然而,目前年鉴全文库对信息的整合尚停留于以条目为单位的跨年鉴文献层面,CNKI也仅与自己的各类全文库做了相似文献的整合。年鉴全文库与其他全文数据库、工具书乃至互联网信息等外部资源的整合有待加强。
在年鉴各类信息中,一些文章类信息的参考文献、二次文献信息等,可以与电子期刊、电子图书等其他全文数据库建立原文链接;有关法律法规、标准的信息,如果没有全文的,则可链向法律法规和标准全文库;一些机构名录、重点单位介绍类信息,则可与该机构、团体在互联网上的网站主页建立链接;对于年鉴的统计指标、划分标准、计量单位等涉及的专业术语,可以引入百科全书、词典类工具书,供读者查询参考。通过这些方式,可以发挥互联网的优势,多层次地整合各种资源,为用户提供全方位的信息保障。