关于LZW算法的改进研究(2)

2014-01-24 01:12

导读：LZWC算法和LZW算法一样采用编码表来组织输入数据，显然LZW的编码表中包含RC和LZW两个编码器编码的编码表。我们分别称其为编码表中的RC项和LZW项。这两项

        LZWC算法和LZW算法一样采用编码表来组织输入数据，显然LZW的编码表中包含RC和LZW两个编码器编码的编码表。我们分别称其为编码表中的RC项和LZW项。这两项虽然对两个编码器来说是通用的，但实现时为了提高编码表的搜索速度，可以把两者分开处理。
        RC的编码识别很简单，只在缓冲区中进行，对于较长的重复字符，这种编码方式简便易行，效率较高。
        LZW编码器编码不连续的字符，当然是有效的，从而获得较高的压缩率。从LZWC编码过程可以看出，如果RC编码器在输入流中找不到满足条件的字符，则LZW编码器将独自编码输入数据。这时LZWC算法退化为LZW算法。
        2.2 LZWC算法的解码原理
        LZWC压缩算法的解码过程是编码过程的逆过程，以下是LZWC算法的解码过程：
        (1）读一个编码（按LZW方式确定的码长）；
        (2）如果是结束码，则结束解码过程；
        (3）如果是RC标志的编码，则按照RC编码规则解码，输出原始数据；
        (4）否则，按LZW方式解码；
        (5）译码过程结束。
        2.3 LZWC编码的算例
        下面，我们用一个例子来说明LZWC编码算的过程。例如：假设信源发出的序列为：00110000111011100011001解：依题意，有：信源序列的数据依次经过前缓冲区，则
        (1）RC编码器对进入前缓冲区的数据进行检测，x1=x2，x2≠x3，即：0重复出现2次，符合RC编码的条件，则00的LZWC编码为（1，2，0）。

（转载自科教范文网http://fw.nseac.com）

        (2）RC编码器继续对进入前缓冲区的数据进行检测，x3=x4，x4≠x5，1重复出现2次，符合RC编码的条件，则11的LZWC编码为（2，2，1）。
        (3）RC编码器继续对进入前缓冲区的数据进行检测，x5=x6，x6=x7，x7=x8，x8≠x9，0重复出现4次，符合RC编码的条件，则0000的LZWC编码为（3，4，0）。
        (4）RC编码器继续对进入前缓冲区的数据进行检测，x9=x10，x10=x11，x11≠x12，1重复出现3次，符合RC编码的条件，则111的LZWC编码为（4，3，1）。
        (5）RC编码器继续对进入前缓冲区的数据进行检测，x12≠x13，0仅出现1次，不符合RC编码的条件，所以，不能用RC编码器对其进行编码。但是，它符合LZW编码的条件，由LZW编码器，则0的LZWC编码为（5，1，0）。
        (6）RC编码器继续对进入前缓冲区的数据进行检测，x13=x14，x14=x15，x15≠x16，1重复出现3次，符合RC编码的条件，则111的LZWC编码为（6，3，1）。
        (7）RC编码器继续对进入前缓冲区的数据进行检测，x16=x17，x17=x18，x18≠x19，0重复出现3次，符合RC编码的条件，则000的LZWC编码为（7，3，0）。
        (8）RC编码器继续对进入前缓冲区的数据进行检测，x19=x20，x20≠x21，次，符合RC编码的条件，则11的LZWC编码为（8，2，1），1重复出现2次，符合RC编码的条件，则11的LZWC编码为（8，2，1）。
        (9）RC编码器继续对进入前缓冲区的数据进行检测，x21=x22，x22≠x23，次，符合RC编码的条件，则00的LZWC编码为（9，2，0）。
        (10）RC编码器继续对进入前缓冲区的数据进行检测，x23是最后一个数据，1仅出现1次，不符合RC编码的条件，所以，不能用RC编码器对其进行编码。但是，它符合LZW编码的条件，由LZW编码器，则1的LZWC编码为（10，1，1）。

（科教范文网 fw.nseac.com编辑发布）

(11）前缓冲区没有数据通过了，编码到此结束。
所以，信源序列的LZWC编码为：C′={(1，2，0)，(2，2，1)，(3，4，0)，(4，3，1)，(5，1，0)，(6，3，1)，(7，3，0)，(8，2，1)，(9，2，0)，(10，1，1)}。

       3 LZWC算法与LZW算法性能的比较
        压缩算法性能的比较一般有两个重要因素，就是平均数据压缩率和压缩时间。我们从下面例子入手，来讨论他们的压缩性能：
        例1：设输入流为：ababcbabccc
        先建立初始化字典，将信源符号a，b，c预置为字典的前3项，编码位点分别为1，2，3。编码就从这个初始字典开始。
        3.1 LZW编码过程
        (1）由于"a"已经在字典中了，而"ab"不在，输出"a"的编码，同时把"ab"添加到字典中，所以字典的第4个条目为"ab"令其编码位点为4，当前位置前移一位，变为1，当前字符变为"b"。它的LZW编码为（4，1，1）。
        (2）从输入流的第1个位置开始，"b"已在字典中了，
而"ba"不在。同理，输出"b"的编码，同时把"ba"添加到字典中，编码位点为5，当前位置变为2，当前字符为"a"它的LZW编码为（5，1，2）。
        (3）从输入流的第2个位置开始，"ab"已在字典中了，而"abc"不在。同理，输出"ab"的编码，同时把"abc"添加到字典中，编码位点为6，当前位置变为3，当前字符为"c"。它的LZW编码为（6，1，4）。（科教论文网 Lw.nsEAc.com编辑整理）
        (4）从输入流的第3个位置开始，"c"已在字典中了，而"cb"不在。同理，输出"c"的编码，同时把"cb"添加到字典中，编码位点为7，当前位置变为4，当前字符为"c"。它的LZW编码为（7，1，3）。
        (5）从输入流的第4个位置开始，"ba"已在字典中了，而"bab"不在。同理，输出"ba"的编码，同时把"bab"添加到字典中，编码位点为8，当前位置变为5，当前字符为"b"。它的LZW编码为（8，1，5）。
        (6）从输入流的第5个位置开始，"b"已在字典中了，而"bc"不在。同理，输出"b"的编码，同时把"bc"添加到字典中，编码位点为9，当前位置变为6，当前字符为"c"。它的LZW编码为（9，1，2）。
        (7）从输入流的第6个位置开始，"c"已在字典中了，而"cc"不在。同理，输出"c"的编码，同时把"cc"添加到字典中，编码位点为10，当前位置变为7，当前字符为"c"。它的LZW编码为（10，1，3）。
        (8）从输入流的第10个位置开始，"cc"已在字典中了，并且没有别的字符需要编码了。即，编码过程到此结束。
        所以，它的LZW编码为：

上一篇：浅谈《计算机组装与维护》实训课程教学改革下一篇：没有了