论文首页哲学论文经济论文法学论文教育论文文学论文历史论文理学论文工学论文医学论文管理论文艺术论文 |
一、前言
连续出版物具有信息量大、传递周期短、内容相对客观真实等特点,经长期积累,便会形成一部信息量极其丰富的地方信史,是地方文献品种中非常引人瞩目的一种信息资源。
唯其信息量巨大,所以对分散在不同时代各类报刊中的众多地方文献信息进行针对性检索,无论是读者、信息用户、还是信息工作者,都会视为畏途。为此,首都图书馆自1958年创建北京地方文献部伊始,就开始编制《北京地方文献报刊资料题录索引》。这套索引的回溯检索范围,包括首都图书馆、北京图书馆、北京大学图书馆和清华大学图书馆所藏自本世纪初至1963年的2800余种报刊。至1964年,已累积款目70000余条。1979年以来,又回朔编制了1963年以来的索引。此后,正式开始了现行报刊索引的编制工作,检索范围包括正式与非正式出版的报刊300余种。至1995年底,已累积款目250000余条,并以20000条/年的速度递增。
然而,此时的北京地方文献报刊索引仅仅是一种手工编排的分类篇目索引。其分类依据是《北京地方文献报刊索引分类表》,索引项目包括篇名、著者、出版日期、卷期、版次和部分内容提要。限于当时的传统手工加工形式,对于涉及多学科、多主题的条目,只能着重考虑分类的第一需要,而其它相关主题则不能逐一得到表现。
1996年初,北京地方文献部正式引入计算机系统。进行报刊索引的编制与检索,彻底改变了索引工作的传统模式。它不仅省去了工作人员手工抄写、编排卡片的繁琐工作,同时,使检索速度大大加快,增加了报刊索引的时效性;由于计算机对文献特征的揭示途径大幅度增加,使多途径的针对性检索和组配检索成为可能,解决了以往手工工作模式不能解决的困难。
在建立报刊索引数据库主题标识系统的过程中,北京地方文献部结合地方文献的特征,通过近一年时间的试验,确定了一套基本符合特定地域的自然,人文现象和各类地方事业的主题标识系统。本文拟结合首都图书馆《北京地方文献报刊信息管理系统》的实际工作,探讨地方文献报刊索引工作中有关主题标识的一些问题。
二、主题词法的选取
主题词法是一种利用检索语言来描述文献主题和查找文献的方法。1975年,国内首部供机检用的综合词表——《汉语主题词表》问世后,对主题词表的发展,特别是对叙词表的发展起到了促进作用。然而《汉语主题词表》仅仅是一部综合性的基础词表,它所收录的词汇是用来供各专业机构从中选词,来编制适合自己本专业用的专业词表。实际上,我国的图书馆、情报机构都是在参考这部国家词表的前提下,根据本单位的工作实际情况,来编制适合本单位、本专业使用的主题词表。
地方文献的内容所表现出的地域性和专指性极强,综合性内容的《汉语主题词表》很难满足其主题标引的特殊需求。报刊索引的标引用词与时代发展同步,《汉语主题词表》作为阶段性产品,也很难满足对新生事物的标引需求。因此,在确立地方文献的主题系统时,首先应确定一段时间为试验期。从有关文献内容中抽取关键词对文献主题进行标引,待积累了一定数量的词汇后,参考《汉语主题词表》使之规范化,确定好词间关系,从而形成适用的主题词表。人们一般把这种选择主题词的方法叫做经验法。用经验法编制的词表是后控词表。它比较适合于特殊类型文献主题词表的编制。采用这种方法的优点是省去了先期编制词表的时间,标引工作与编制、修改词表可以同步进行;标引和检索所使用的是自然语言,因此对标引人员要求相对较低;同时事先不用考虑词间关系和查表抽词,所以标引速度较快。
《北京地方文献报刊情息管理系统》在建立主题标识系统时就是采用了经验法,并在此基础上为今后着手编制《北京地方文献主题词表》积累词汇。在即将编制的主题词表中,主题词的来源主要包括以下几部分:
第一是《汉语主题词表)中的已有的词汇。这些是地方文献与非地方文献都使用的综合性词汇。在使用时暂不考虑原有的词间关系,直接从《汉表》中抽取。