浅论数字水印技术在电子阅读业务的应用(2)
2016-07-25 01:05
导读:3.2文本数字水印 与图片或视频文件不同,文本文件没有太多的冗余信息空间,因此基于文本的水印技术也远远少于图像或视频。常用的文本水印主要是基于固
3.2文本数字水印 与图片或视频文件不同,文本文件没有太多的冗余信息空间,因此基于文本的水印技术也远远少于图像或视频。常用的文本水印主要是基于固定格式的文本水印。
电子文本多以一种或几种固定格式的电子文档存在,如PDF,DOC,PS等。这些文档中除了含有文本内容之外,多有对固定的格式描述,比如行距、字间距以及字符属性等。因此,我们可以将水印信息藏入到这些描述版面布局的信息中,这样作不会影响文件的正常使用,而且只要对格式作人类视觉上不能分辨的微小改变,就可以隐藏大量的信息。常用的方法有:基于行间距的信息表示法、基于字间距的信息表示法和基于字符属性的信息表示法。
基于行间距的信息表示法的原理是通过整体移动某一行文本,同时该行文本的上下两行并不移动。这样可以参考固定的上下两行来辨别该行所表示的信息(比如上移表示1,下移表示0)。大部分的格式文档都有一个固定的特点,就是行间距是一致的,起码在同一个文本块中是一致的,因此如果行移动的距离是人类视觉所感知不到的,这样的信息表示是不会被察觉的。
基于字间距的信息表示方法原理与基于行间距的基本相同,只不过改变的是字间距。通过将某个位置的字或者词水平移动,而同时该字左右的字并不移动,从而根据该字与两边字的距离表示信息(比如左移表示1,右移表示0)。同样,需要字符的移动距离是人眼无法察觉到的。这种方法对软拷贝同样敏感。
基于字符属性的信息表示方法原理是基于字符在计算机中的存储方式的。一般而言,电子文档中的字符都是按照一定的格式存储的,其中包括该字符的编码(对应着一个字典)、字体、大小和粗细等。其中字符的编码对应着字典中一个特殊的形状(对中文而言),一旦改变将会改变文字,所以不可以对字符的编码作修改。字体的改变也是人的眼睛可以觉察到的,因此只能用表示标志的脆弱性水印。字符的大小如果作细微的改变,人的肉眼是不容易察觉的。因此可以用作信息的表示。
内容来自www.nseac.com
在实际使用中,可以上述三种信息隐藏方式综合起来使用。比如选取文本中的某一行或者某两个标志(如标点、特殊字符等)之间作为嵌入水印的位置,然后根据区间内字符的属性描述作某种运算,将运算的结果作为行偏移量或者字偏移量。
基于固定格式的文本水印,其最大弱点就是对保留文本内容但改变文本格式的软拷贝比较敏感。为了解决这个问题,有人提出了基于文本语法语义的水印技术,但这种技术实现难度大且提取水印时需要提供源文件对照,可操作性并不强。在实际的电子阅读中,我们可以将分发的内容利用文档格式开发商提供的工具将内容设定为不可复制(word、pdf均有此功能),以避免非法使用者破坏水印信息。另外,也可以将文本扫描为图片格式,利用离散余弦变换技术嵌入水印,然后提供给用户。
4总结
在电子阅读业务的应用中,数字水印技术主要着重于发生侵权后的鉴定,还不能预防和杜绝侵权的发生。而且数字水印算法的鲁棒性还不能完全满足需求。但随着水印算法的进步,再与CA技术以及加密技术配合使用,数字水印技术在电子阅读领域必将有更广泛的应用。
本文选自lw.nseac.com原创论文网代写毕业论文