徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
自由
比浏览器更快的访问!
 

前置碼

指数 前置碼

前置碼(Prefix code),又譯前綴碼,是一種編碼系統。這種編碼系統通常是可變長度碼,在其中的每個碼字,都具備「前置性質」(prefix property),也就是說,在編碼中的每個碼字,都不能被其他碼字當成前置部位。舉例而言,編碼字 具備了前置性質,但編碼字就不具備,因為其中的"5",是"59"及"55"的前置字。這也被稱為無首碼的代碼(prefix-free codes,PFC,無前綴碼)。 Category:编码理论 Category:前綴 Category:数据压缩 Category:无损压缩算法.

5 关系: 克拉夫特不等式熵編碼法香农-范诺编码UTF-8格倫布編碼

克拉夫特不等式

在编码理论,克拉夫特不等式给出了一个码字长度集合存在唯一可解编码/单义可译码(uniquely decodable code)的必要条件。因为这个不等式在前缀码和树上面应用很多,所以在计算机科学和信息学中很常用。 克拉夫特不等式对码字限制长度以保证前缀编码的可能性。这个不等式说明码字长度指数的倒数的分布和概率质量函数很相似。克拉夫特不等式can be thought of in terms of a constrained budget to be spent on codewords, with shorter codewords being more expensive.

新!!: 前置碼和克拉夫特不等式 · 查看更多 »

熵編碼法

熵編碼法是一种独立于介质的具体特征的进行无损数据压缩的方案。 一种主要类型的熵编码方式是对输入的每一个符号,创建并分配一个唯一的前缀码,然后,通过将每个固定长度的输入符号替换成相应的可变长度前缀无关(prefix-free)输出码字替换,从而达到压缩数据的目的。每个码字的长度近似与概率的负对数成比例。因此,最常见的符号使用最短的码。 根据香农的信源编码定理,一个符号的最佳码长是 −logbP,其中 b 是用来输出的码的数目,P 是输入符号出现的概率。 霍夫曼编码和算术编码是两种最常见的熵编码技术。如果预先已知数据流的近似熵特性(尤其是对于信号压缩),可以使用简单的静态码。这些静态码,包括通用密码(如Elias gamma coding或斐波那契编码)和哥伦布编码(比如元编码或Rice编码)。 一般熵編碼器与其它编码器联合使用。比如LHA首先使用LZ编码,然后将其结果进行熵編碼。Zip和Bzip的最后一级编码也是熵編碼。.

新!!: 前置碼和熵編碼法 · 查看更多 »

香农-范诺编码

在数据压缩的领域里,香农-范诺编码(Shannon–Fano coding)是一种基于一组符号集及其出現的或然率(估量或测量所得),从而构建前缀码的技术。其名稱來自於以克劳德·香农和羅伯特·法諾。在理想意义上,它与哈夫曼编码一样,并未实现码词(code word)长度的最低预期;然而,与哈夫曼编码不同的是,它确保了所有的码词长度在一个理想的理论范围 P(x)之内。这项技术是香农于1948年,在他介绍信息理论的文章“通信数学理论”中被提出的。这个方法归功于范诺,他在不久以后以技术报告发布了它。 香农-范诺编码不应该与香农编码混淆,后者的编码方法用于证明Shannon's noiseless coding theorem,或与Shannon–Fano–Elias coding(又被称作Elias coding)一起,被看做算术编码的先驱。 香农-范诺编码,符号从最大可能到最少可能排序,将排列好的信源符号分化为两大组,使两组的概率和近于相同,并各赋予一个二元码符号“0”和“1”。只要有符号剩余,以同样的过程重复这些集合以此确定这些代码的连续编码数字。依次下去,直至每一组的只剩下一个信源符号为止。当一组已经降低到一个符号,显然,这意味着符号的代码是完整的,不会形成任何其他符号的代码前缀。 这是一个行之有效的算法,它会产生相当有效的可变长度编码;当两个较小的集生产分区其实是相等的概率,一位用于区分它们的信息是最有效的使用。不幸的是,香农 - 法诺并不总是产生最优的前缀码:概率是一个将分配非优化代码的Shannon-Fano的编码的一个例子。 出于这个原因,香农 - 范诺几乎从不使用; 哈夫曼编码几乎是计算简单,生产总是达到预期最低的码字长度的制约下,每个符号是由一个整数组成一个代码代表的前缀码。这往往是不必要的,因为代码将装在首尾相连的长序列的里。如果我们认为一次的代码组,象征符号的哈夫曼编码是唯一的最佳符号的概率统计独立|独立和一些半功率,即,为\textstyle \frac。在大多数情况下,可以产生比哈夫曼或的香农-范诺更大的整体压缩,因为它可以在小数位编码,这更接近实际的符号信息内容。然而,算术编码并没有取代像霍夫曼取代的香农-范诺一样取代哈夫曼,一方面是因为算术编码的计算成本的方式,因为它是由多个专利覆盖。香农:范诺编码被用在爆聚压缩方法.

新!!: 前置碼和香农-范诺编码 · 查看更多 »

UTF-8

UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,也是一种前缀码。它可以用來表示Unicode標準中的任何字元,且其編碼中的第一個位元組仍與ASCII相容,這使得原來處理ASCII字元的軟體無須或只須做少部份修改,即可繼續使用。因此,它逐漸成為電子郵件、網頁及其他儲存或傳送文字的應用中,優先採用的編碼。 UTF-8使用一至六個位元組為每個字符編碼(尽管如此,2003年11月UTF-8被RFC 3629重新规范,只能使用原来Unicode定义的区域,U+0000到U+10FFFF,也就是说最多四個字节):.

新!!: 前置碼和UTF-8 · 查看更多 »

格倫布編碼

格倫布編碼是一種無失真資料壓縮方法,由數學家所羅門·格倫布在1960年代提出。其優點為易於編碼與解碼,另外對於擁有機率分布為幾何分佈G(p),p.

新!!: 前置碼和格倫布編碼 · 查看更多 »

重定向到这里:

前缀码前缀编码

传出传入
嘿!我们在Facebook上吧! »