论文首页哲学论文经济论文法学论文教育论文文学论文历史论文理学论文工学论文医学论文管理论文艺术论文 |
在我国报纸信息数据库建设中,地方报纸信息数据库发展较快。例如广东省的《南方日报》、《广州日报》、《东莞日报》等不但建立了报纸信息数据库,而且还继《人民日报》之后进入了因特网,向全球推出了电子版,使国外的华人同胞能够及时地了解广东在改革开放中的新风貌、新变化。
但是,由于政策与机制、技术手段与设备、社会信息意识、人员素质等多方面的原因,我国地方报纸信息数据库的建设尚存在许多问题。本文通过对上述地方报纸信息数据库的现状与存在问题的分析研究,提出一些设想和改进措施,以期对今后地方报纸信息数据库、电视台、电台新闻数据库以及其他数据库的建库工作实践提供一点参考和借鉴。
1 地方报纸信息数据库建设存在的问题
1.1 宏观调控不力,数据库建设重复现象严重
由于国家、地区间的宏观调控不力,主观上缺乏统一规划的思想意识,技术上缺乏网络环境的支持,属于事业单位的各报社缺少需求分析和用户界定,也很少注重数据库的利用率问题,致使各地方报社自行投资建库,造成数据库规模小,缺乏竞争机制,建库方式单一,在选题上重复与空缺并存,造成人力、物力、财力的极大浪费。例如《南方日报》、《广州日报》和《羊城晚报》,各自都建有报纸信息数据库。由于同属于广东地区的地方报纸,相当一部分内容是重复的。像“中国新闻”、“国际新闻”、“广州新闻”、“体育新闻”、“天气预报”、“金融证券信息”等报道,因为消息来源是一致的,所以几乎每天的内容都大同小异。
目前,从总体上看,地方报纸信息数据库开发重复现象严重;而从个别来看,由于地方报纸信息的地方性、复杂性与时效性和技术支持不够,以及人员专业素质较低等因素的影响,普遍存在现有的报纸信息资源开发不足的问题。
1.2 检索效果未如人意
一个实用可行的报纸信息检索系统应是外部特征检索、主题检索、分类检索、全文检索的综合应用[1]。目前已经建立的地方报纸信息数据库大多都只有外部特征检索和全文检索两种检索途径(见表l)。
表1 广东部分地区报纸信息数据库可检字段一览
单 位
(科教作文网http://zw.ΝsΕac.cOM编辑)
(1997-)日期、标题、版次、版名
类目名称
关键词
羊城晚报
(1991-1993)(起始)时间、时间版次、作者、标题
(1994-)标题、作者、时间、专栏、版次、注释(专题报导名称等)
专栏名称
关键词
深圳特区报
标题、作者、时间、版次、地区、来源
关键词
一般的用户都能快速简便地从作者、标题、日期、版次等外部特征入手查找资料,但前提是用户已事先知道要查找的资料所在的日期及其他信息,否则,用户要想扩大或缩小检索范围,查全查准资料,并非易事。数据库缺乏科学的辅助检索工具,影响了它的使用效果。
全文检索与其他检索途径相比,虽然具有不需人工标引加工、便于查找文章细节、检索结果直接可靠、检索详尽彻底、使用简便易学等优点,但在不进行任何控制的情况下,文章中的每一个字、词均可成为检索点,虽在输入方面大大节省了人力和存贮空间,却加重了检索方面的负担,使每次检索命令中的文献量偏多,筛选量过大,用户检索所需时间长,直接影响了查准率,造成了检索噪音。再加上“假义词”、同义词大量存在,更容易造成漏检错检,难以保证查全率和查准率。
1.3 人员素质及其知识结构影响数据库发展进程
由于多方面原因,我国新闻资料从业人员整体素质不太高,知识结构不合理。据调查统计,具有高级职称的新闻从业人员仅占全部人数的5%[2],信息学情报学专业毕业的工作人员更是凤毛麟角。近年来,一些沿海经济发达地区、尤其是广东地区的新闻资料从业人员的大专以上学历的比重有所增加,但大部分属于后继学历,而且学科专业不对口,从整体而言,同样存在素质不高、知识结构不合理的问题;负责开发数据库的计算机技术人员一般都不甚了解数据库所属专业,而数据库所属专业人员反过来也不懂计算机技术;负责开发报纸信息数据库的计算机技术人员,一般都不熟悉报纸信息的分类、主题标引等业务工作,同样,从事报纸信息业务的工作人员通常都不懂得计算机程序编写及系统设计等知识,或是只懂得一些计算机的基本操作。因此,常常囿于双方的沟通和知识结构差异的问题,都会不可避免地、或多或少地影响数据库的发展进程。