前置碼

前置碼（Prefix code），又譯前綴碼，是一種編碼系統。這種編碼系統通常是可變長度碼，在其中的每個碼字，都具備「前置性質」（prefix property），也就是說，在編碼中的每個碼字，都不能被其他碼字當成前置部位。舉例而言，編碼字具備了前置性質，但編碼字就不具備，因為其中的"5"，是"59"及"55"的前置字。這也被稱為無首碼的代碼（prefix-free codes，PFC，無前綴碼）。 Category:编码理论 Category:前綴 Category:数据压缩 Category:无损压缩算法.

5 关系: 克拉夫特不等式，熵編碼法，香农-范诺编码，UTF-8，格倫布編碼。

克拉夫特不等式

在编码理论，克拉夫特不等式给出了一个码字长度集合存在唯一可解编码/单义可译码（uniquely decodable code）的必要条件。因为这个不等式在前缀码和树上面应用很多，所以在计算机科学和信息学中很常用。克拉夫特不等式对码字限制长度以保证前缀编码的可能性。这个不等式说明码字长度指数的倒数的分布和概率质量函数很相似。克拉夫特不等式can be thought of in terms of a constrained budget to be spent on codewords, with shorter codewords being more expensive.

新！!: 前置碼和克拉夫特不等式 · 查看更多 »

熵編碼法

熵編碼法是一种独立于介质的具体特征的进行无损数据压缩的方案。一种主要类型的熵编码方式是对输入的每一个符号，创建并分配一个唯一的前缀码，然后，通过将每个固定长度的输入符号替换成相应的可变长度前缀无关（prefix-free）输出码字替换，从而达到压缩数据的目的。每个码字的长度近似与概率的负对数成比例。因此，最常见的符号使用最短的码。根据香农的信源编码定理，一个符号的最佳码长是 −logbP，其中 b 是用来输出的码的数目，P 是输入符号出现的概率。霍夫曼编码和算术编码是两种最常见的熵编码技术。如果预先已知数据流的近似熵特性（尤其是对于信号压缩），可以使用简单的静态码。这些静态码，包括通用密码（如Elias gamma coding或斐波那契编码）和哥伦布编码（比如元编码或Rice编码）。一般熵編碼器与其它编码器联合使用。比如LHA首先使用LZ编码，然后将其结果进行熵編碼。Zip和Bzip的最后一级编码也是熵編碼。.

新！!: 前置碼和熵編碼法 · 查看更多 »

香农-范诺编码

在数据压缩的领域里，香农-范诺编码（Shannon–Fano coding）是一种基于一组符号集及其出現的或然率（估量或测量所得），从而构建前缀码的技术。其名稱來自於以克劳德·香农和羅伯特·法諾。在理想意义上，它与哈夫曼编码一样，并未实现码词（code word）长度的最低预期;然而，与哈夫曼编码不同的是，它确保了所有的码词长度在一个理想的理论范围 P(x)之内。这项技术是香农于1948年，在他介绍信息理论的文章“通信数学理论”中被提出的。这个方法归功于范诺，他在不久以后以技术报告发布了它。香农-范诺编码不应该与香农编码混淆，后者的编码方法用于证明Shannon's noiseless coding theorem，或与Shannon–Fano–Elias coding（又被称作Elias coding）一起，被看做算术编码的先驱。香农-范诺编码，符号从最大可能到最少可能排序，将排列好的信源符号分化为两大组，使两组的概率和近于相同，并各赋予一个二元码符号“0”和“1”。只要有符号剩余，以同样的过程重复这些集合以此确定这些代码的连续编码数字。依次下去，直至每一组的只剩下一个信源符号为止。当一组已经降低到一个符号，显然，这意味着符号的代码是完整的，不会形成任何其他符号的代码前缀。这是一个行之有效的算法，它会产生相当有效的可变长度编码;当两个较小的集生产分区其实是相等的概率，一位用于区分它们的信息是最有效的使用。不幸的是，香农 - 法诺并不总是产生最优的前缀码：概率是一个将分配非优化代码的Shannon-Fano的编码的一个例子。出于这个原因，香农 - 范诺几乎从不使用; 哈夫曼编码几乎是计算简单，生产总是达到预期最低的码字长度的制约下，每个符号是由一个整数组成一个代码代表的前缀码。这往往是不必要的，因为代码将装在首尾相连的长序列的里。如果我们认为一次的代码组，象征符号的哈夫曼编码是唯一的最佳符号的概率统计独立|独立和一些半功率，即，为\textstyle \frac。在大多数情况下，可以产生比哈夫曼或的香农-范诺更大的整体压缩，因为它可以在小数位编码，这更接近实际的符号信息内容。然而，算术编码并没有取代像霍夫曼取代的香农-范诺一样取代哈夫曼，一方面是因为算术编码的计算成本的方式，因为它是由多个专利覆盖。香农：范诺编码被用在爆聚压缩方法.

新！!: 前置碼和香农-范诺编码 · 查看更多 »

UTF-8

UTF-8（8-bit Unicode Transformation Format）是一種針對Unicode的可變長度字元編碼，也是一种前缀码。它可以用來表示Unicode標準中的任何字元，且其編碼中的第一個位元組仍與ASCII相容，這使得原來處理ASCII字元的軟體無須或只須做少部份修改，即可繼續使用。因此，它逐漸成為電子郵件、網頁及其他儲存或傳送文字的應用中，優先採用的編碼。 UTF-8使用一至六個位元組為每個字符編碼（尽管如此，2003年11月UTF-8被RFC 3629重新规范，只能使用原来Unicode定义的区域，U+0000到U+10FFFF，也就是说最多四個字节）：.

新！!: 前置碼和UTF-8 · 查看更多 »

格倫布編碼

格倫布編碼是一種無失真資料壓縮方法，由數學家所羅門·格倫布在1960年代提出。其優點為易於編碼與解碼，另外對於擁有機率分布為幾何分佈G(p),p.

新！!: 前置碼和格倫布編碼 · 查看更多 »

重定向到这里：

前缀码，前缀编码。

联盟百科是组织像一个百科全书或字典中的概念图和语义网络。它给每一个概念及其关系的简单定义。

这是用作概念图的基础的大型在线心理地图。它是免费使用，每篇文章或文档可以下载。它是一个工具，资源或学习，研究，教育，学习或教学参考书，也可以由教师，教育工作者，学生或学生; 对于学术界：学校，小学，中学，高中，初中，大学，工科学历，大专，本科，硕士或博士学位; 对于论文，报告，项目，理念，文档，调查，汇总，或论文。这里的定义是，说明中，描述，或每显著在其上需要的信息的含义，并且它们的相关概念，作为词汇列表。可在中文, 英文, 西班牙文, 葡萄牙文, 日文, 法文, 德文, 意大利文, 波兰文, 荷兰文, 俄文, 阿拉伯文, 印地文, 瑞典文, 乌克兰文, 匈牙利文, 加泰罗尼亚文, 捷克文, 希伯来文, 丹麦文, 芬兰文, 印度尼西亚文, 挪威文, 罗马尼亚文, 土耳其文, 越南文, 한국어, 泰语, 希腊语, 保加利亚语, 克罗地亚语, 斯洛伐克语, 立陶宛语, 菲律宾人, 拉脱维亚语, 爱沙尼亚语和斯洛文尼亚语。更多语言很快。

所有的信息是从维基百科提取它的知识共享署名-相同方式共享 3.0协议下可用。

联盟百科不受维基媒体基金会的认可或附属。

Google Play、Android 和 Google Play 徽标均为 Google Inc. 的商标。

隐私政策

前置碼