《史记》电子资源述评网(4)
2013-09-12 01:15
导读:的范围内。以后的发展方向,则应该是这两种模式的结合。在近年的图书建设中,已经有不少人为此而努力。其中值得一提的是全息数字化技术。 这种全
的范围内。以后的发展方向,则应该是这两种模式的结合。在近年的图书建设中,已经有不少人为此而努力。其中值得一提的是全息数字化技术。
这种全息数字化技术的特点是能完整保留原印刷版的全部完整信息,既包括前面所提到的文字信息和图像信息,还包括字体、字号、文字位置、版式、公式、图表等信息,而且能实现最广泛的检索手段。当然其占用的空间比文字录入性质的html等格式要大一些,但比扫描的pdg格式要小很多。
值得注意的是,技术革新除了要充分考虑读者的使用效率以外,还应该在加密技术上做足文章,这样才能更好地保护相关机构的版权。
(三)要处理好当前利益与长远利益的关系
对于包括《史记》在内的各种古籍来说,都需要面对两个,一个是学术市场,另一个是大众市场。而学术市场的消费者都是比较专业的学者和研究人员,他们对古籍软件的技术功能、精确资料要求较高,否则便弃之不用,并进而影响到大众市场的舆论评价。因此,出版商应放弃过于功利的短期效益观念,树立长远眼光,充分重视现代信息技术与古籍出版产业结合的市场价值,利用资源和专业优势,与高技术公司、科研单位、大专院校、者开展多方位的合作,树立品牌意识,精心策划、精心编辑、精心校对、精心制作,生产出高质量的产品。
(四)消除汉字字库不足的瓶颈
现有的中文字库,日常使用尚且偶有困难,应用在古籍上时,缺字情况更是屡见不鲜。对此,一般的对策是换字或空字,或用“某加某”的形式表示,也有的制作一套字型文件供使用者下载。但这些情况影响了电子数据的精确度,成为专家学者不敢直接以电子文献为依据、还要核对纸版原文的重要原因。因此,开发通用的、大容量的中文字库势在必行。
(科教作文网http://zw.NSEaC.com编辑发布)
目前全球中文使用三套内码:中国大陆、新加坡及东南亚地区使用国标码,简称GB码;香港、和澳门地区使用BIG5码;北美、西欧华人使用HZ码。三种中文内码使用的结果是互不兼容。此外,GB码的最大缺陷就是字库不够用。GB码的
是GB2312,只收录6763个汉字。至今中国大陆的许多运用软件,仍然执行的是这一国家标准。随着中文汉字国际标准——“ISO/IEC10646.1”的制定,全球中文内码有望统一。1995年国家颁布了一个新的汉字内码扩展规范:GBK(即国际扩展字库),在保持GB2312的基础上,将其字汇扩充与ISO10646中的CJK(中国、日本与韩国统一编码汉字)等量,同时也包容了台湾的标准BIG5码汉字,共收录20902个汉字,还为用户留了1894个码位的自定义区。
2000年3月国家相关部门发布了两项新的中文信息处理基础性国家标准。其中一项为强制性国家标准,称为GB18030-2000《信息技术和信息交换用汉字编码字符集、基本集的扩充》,收录了27484个汉字,而繁、简字均处于同一平台,总编码空间超过150万个。美国Microsoft公司的操作系统WindowsXP已经支持这一标准。再有,在汉字圈(中国内地、香港及台湾、日本、韩国、越南、新加坡)专家的争取下,国际标准化组织在Unicode编码体系中给汉字划出了9万多个码位。在字库扩充完成后,各种内码转换不便的状况将得到彻底解决,古籍资源的电子化将会有更大的发展空间。