位映射
在下一步在数字化过程中,量化器的输出映射到一个二进制序列。一个编码可能被用来生成表二进制序列如下所示:很明显,8水平需要三个二进制数字,或部分;16个级别需要四位;和256年的水平需要八个比特。一般来说2n水平要求n位。
在256 -声音量化水平,其中每个级别是由一个8位序列,整体传播的速度是每秒8000样品乘以8位/样本,或每秒64000比特。所有8位必须传播在下次样品前出现。为了使用更多的水平,二进制样品必须挤进分配时间槽之间的连续信号样本。电路将变得更加昂贵,相应系统的带宽将变得更大。一些传播渠道(一个例子电话线)可能没有所需的带宽能力二进制样本数量的增加,扭曲了数字信号。因此,尽管所需的精度决定了使用的量化水平数量,生成的二进制序列仍然必须传输带宽内公差允许的。
源编码
中指出模拟数字转换,任何可用的通信介质有一个有限的能力数据传输。这种能力通常是测量的参数被称为带宽。自一个信号带宽的增加,每秒钟传输的比特数,数字通信系统的一个重要功能是代表了数字化信号尽可能少的部分可能是减少冗余。减少冗余是通过一个源编码器,这常常与模拟-数字转换器。
霍夫曼编码
一般来说,需要更少的平均比特如果源编码器考虑的概率不同的量子化水平可能发生。一个简单的例子将说明这个概念。假设一个量化的规模只有四个级别:1,2,3,4。通常的标准后的二进制编码,每个四层将由一个微不足道的码字映射。还假定一级发生50%的时间,2级发生25%的时间,级别3和4分别出现12.5%的时间。使用可变位码字可能导致更有效的映射实现的水平。可变位编码规则将只使用一个50%的时间,两位25%的时间,和三位25%的时间。平均将使用1.75位/样本而不是2位/示例中使用的标准代码。
因此,对于任意给定的一组和相关的概率水平,有一个最优的编码规则,最大限度地减少所需的比特数来表示源。这种编码规则被称为霍夫曼编码,在美国D.A.霍夫曼,他在1952年创建它。更高效的编码是通过分组序列水平应用霍夫曼编码在一起,这些序列。
的Lempel-Ziv算法
霍夫曼编码的设计和性能取决于设计师的了解不同层次和序列的概率水平。然而,在许多情况下,需要有一个编码系统,能够适应未知来源的可能性。一个非常有效的编码技术来源,而不需要知道他们可能出现是在1970年代开发的以色列人亚伯拉罕Lempel和雅各Ziv。的Lempel-Ziv算法作品通过构造序列之前遇到了密码本。例如,密码本可能开始一组四个12位码字代表四种可能的信号水平。如果两个水平到达序列,编码器,而不是传输两个完整的码字长度(24),将传输的码字第一级(12位),然后一个额外的两个比特来表示第二个层次。编码器将构造一个新的12码字比特序列的两个层次,这之后将使用更少位来表示特定的组合的水平。直到另一个编码器将继续读量化的水平没有码字的顺序到达。在这种情况下,序列没有过去的水平将电报密码本,但不是整个序列的水平。再次,编码器将传输的码字的初始序列水平然后一个额外的两位在过去的水平。这个过程将继续,直到所有4096可能的12位组合分配码字。
在实践中,标准算法压缩二进制文件使用12码字比特和传输1额外的位表示一个新的序列。使用这样的代码,Lempel-Ziv算法可以压缩传输英语文本的约55%,而只有43%的霍夫曼编码压缩传输。
行程长度编码
某些已知信号来源产生“,”或长序列只有1或0。在这些情况下更有效的传输代码的长度而不是所有代表跑本身。长期运行的一个来源传真机。传真机是通过扫描文档和文档的映射非常小的区域到黑色像素(象素)或白色像素。文档分为行数每英寸(大约100),与1728像素每一行(在标准分辨率)。如果所有的黑色像素被映射到1 s,所有白色像素为0,然后扫描文档将由1857600位(标准美国11英寸的页面)。在老调制解调器传输4800比特每秒的速度,需要6分钟27秒发送一个页面。然而,如果0和1的序列使用行程长度编码压缩,传输时间会显著减少。
传真机的代码实际上是一个组合的行程长度编码和霍夫曼编码;它可以解释如下:一个运行周期代码将运行长度映射到码字,码书是划分为两个部分。第一部分包含符号的运行长度是64的倍数;第二部分是由从0到63像素。任何运行长度将被表示为64的倍数加一些剩余。例如,一个205像素的运行将发送使用运行长度的码字192(3×64)+跑步的码字长度13。以这种方式运行所需的比特数来表示是显著降低。此外,某些已知的运行发生的概率更高编码短的码字长度,进一步减少需要传输的比特数。使用这种类型的编码、典型按压传真传输范围4 - 1和8 - 1之间。耦合调制解调器速度更高,这些按压减少单个页面之间的传输时间48秒,1分37秒。