徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
自由
比浏览器更快的访问!
 

Unicode等價性

指数 Unicode等價性

Unicode等價性(Unicode equivalence)是為和許多現存的標準能夠相容,Unicode(統一碼)包含了許多特殊字符。在這些字符中,有些在功能上會和其它字符或字符序列等價。因此,Unicode將一些碼位序列定義成相等的。Unicode提供了兩種等價概念:標準等價和相容等價。前者是後者的一個子集。例如,字符n後接著組合字符~會(標準和相容)等價於Unicode字符ñ。而合字ff則只有相容等價於兩個f字符。 Unicode正規化是文字正規化的一種形式,是指將彼此等價的序列轉成同一列序。此序列在Unicode標準中稱作正規形式。對於每種等價概念,Unicode又定義兩種形式,一種是完全合成的,一種是完全分解的。因此,最後會有四種形式,其縮寫分別為:NFC、NFD、NFKC、NFKD。對於Unicode的文字處理程式而言,正規化是很重要的。因為它影響了比較、搜尋和排序的意義。.

18 关系: 埃格斯特朗合字子集字符尖音符串接冪等等价类組合字符片假名複雜文字編排越南語字母超文件標示語言闭包 (数学)附加符号SambaUnicodeUnicode相容字符

埃格斯特朗

埃格斯特朗(Ångström, 简称埃,符号Å)是一个长度计量单位。它不是国际制单位,但是可与国际制单位进行换算,即1 Å.

新!!: Unicode等價性和埃格斯特朗 · 查看更多 »

合字

合字、連字、連結字或合體字(Ligature),在西方字体排印学中一般表示將多於一個字母的合成一個字形。如印刷品中常常将拉丁字母两个字母fi的i上一點常與f的一鈎合併,而德語字母ß原為ss等等。漢字的合字在不同情況下也稱作合文或合體字。 合字經過演變、長時間流行後,可能被視為直接的符號、文字而非合字。如源自VV或UU,源自AE,而表示「與」的意思的「」,原是e和t的合字。.

新!!: Unicode等價性和合字 · 查看更多 »

子集

子集,為某個集合中一部分的集合,故亦稱部分集合。 若A和B为集合,且A的所有元素都是B的元素,则有:.

新!!: Unicode等價性和子集 · 查看更多 »

字符

在電腦和電信領域中,字符(Character)是一個資訊單位。對使用字母系統或音節文字等自然語言,它大約對應為一個音位、類音位的單位或符號。簡單來講就是一個漢字、假名、韓文字……,或是一個英文、其他西方語言的字母。 字符的例子有:字母、數字系統或標點符號。另外有所謂控制字符的概念,它是指:並不對應到自然語言中的某個特定符號,而是對應到語言中一些用來處理文句的概念(類似排版)。例子為列印機或其它顯示設備的命令,如Enter或Tab。.

新!!: Unicode等價性和字符 · 查看更多 »

尖音符

尖音符(acute accent;;銳音符: )是一種變音符號,主要用於拉丁字母和希臘字母上。「尖音符」在歐美文字的寫法大多源自拉丁文「acutus」(解作 尖鋭),而「acutus」本身也是希臘文「ὀξύς」的羅馬化外來語。.

新!!: Unicode等價性和尖音符 · 查看更多 »

串接

在形式語言理論(特別是編程語言),字串串接(Concatenation),又稱字串相加、連接、串連、相連,指將兩個字串的首尾相接的操作。例如「foo」和「bar」串接後便成了「foobar」。部分語言,串接的操作是透過將串接運算子放在兩個字串(運算元)之間。.

新!!: Unicode等價性和串接 · 查看更多 »

冪等

在數學裡,冪等有兩種主要的定義。.

新!!: Unicode等價性和冪等 · 查看更多 »

等价类

在数学中,假設在一个集合X上定義一个等价关系(用 \sim來表示),则X中的某個元素a的等价类就是在X中等价于a的所有元素所形成的子集: 等价类的概念有助于从已经构造了的集合构造新集合。在X中的给定等价关系 \sim的所有等价类的集合表示为X/ \sim并叫做X除以\sim的商集。这种运算可以(实际上非常不正式的)被认为是输入集合除以等价关系的活动,所以名字“商”和这种记法都是模仿的除法。商集类似于除法的一个方面是,如果X是有限的并且等价类都是等势的,则X/ \sim的序是X的序除以一个等价类的序的商。商集被认为是带有所有等价点都识别出来的集合X。 对于任何等价关系,都有从X到X/ \sim的一个规范投影映射\pi,给出为\pi(x).

新!!: Unicode等價性和等价类 · 查看更多 »

組合字符

組合字符(Combining character)在字體排印學中是用來改變其它字符所用的字符。在拉丁字母中,最常見的組合字符為附加符號(包含重音號)。 統一碼也包含許多預組字符(Precomposed character),即事先將字符組好並賦予碼位。所以有可能同時使用組合字符和預組字符。這導致了若要比較兩個統一碼字串或設計編碼轉換器時,需要先執行Unicode正規化。 在統一碼中,用於歐洲語言和國際音標的組合用附加符號為〈U+0300–U+036F〉。組合用附加符號亦存在統一碼中的多個區塊。在統一碼中,附加符號總是加在主要字符之後。因此,有可能加入多個附加符號。直到2006年,只有少數軟體能正確顯示此類組合。.

新!!: Unicode等價性和組合字符 · 查看更多 »

片假名

片假名(),是日语中表音符号(音节文字)的一种。与平假名、万叶假名等合称作假名。“片假名”一词在使用时常用“カタカナ”表示。签名时如果要表记假名,也一般使用片假名书写。.

新!!: Unicode等價性和片假名 · 查看更多 »

複雜文字編排

複雜文字編排(Complex text layout,縮寫:CTL)或者複雜文字描繪(Complex text rendering)是指字位的形狀或位置取決於與其他字位的關係的書寫系統的排版。這個辭彙用於一個字符為一個字位的軟體國際化領域。 要求複雜文字編排以適當顯示的書寫系統稱為複雜文本,例子有阿拉伯字母和婆羅米系文字的天城文或泰文。許多文本不要求複雜文字編排,例如拉丁文字和漢字可通過在一直行或直列中簡單地依次顯示每個字元來排版。然而這些文本有替代形式或者可選特性(如手寫體)時也要求複雜文字編排以在電腦上呈現。.

新!!: Unicode等價性和複雜文字編排 · 查看更多 »

越南語字母

#重定向 越南文字母.

新!!: Unicode等價性和越南語字母 · 查看更多 »

超文件標示語言

#重定向 HTML.

新!!: Unicode等價性和超文件標示語言 · 查看更多 »

闭包 (数学)

数学中,若对某个集合的成员进行一種运算,生成的仍然是这个集合的成员,则该集合被称为在這个运算下闭合。 例如,实数在减法下闭合,但自然数不行:自然数 3 和 7 的减法 3 − 7 的结果不是自然数。 类似的,一个集合被称为在某些运算的搜集下闭合,如果它在每个运算之下都闭合。 一个集合在某个运算或某些运算的搜集下闭合被称为满足闭包性质。闭包性质经常作为公理,通常叫做闭包公理。现代集合论通常这样定义:运算为在集合间的映射。所以向一个结构增加闭包性質作为公理是多余的,尽管它对于子集是否闭合的问题仍有意义。 当一个集合 S 在某个运算下不闭合的时候,我们通常可以找到包含 S 的最小的闭合集合。这个最小闭合集合被称为 S 的(关于这个运算的)闭包。例如,若把自然数集看作实数集的子集,它在减法下的闭包就是整数集。一个重要的例子是拓扑闭包。闭包的概念推广为伽罗瓦连接,进一步为。 注意集合 S 必须是闭合集合的子集,這樣才能定义闭包算子。在前面的例子中,实数在减法下闭合是重要的,减法不总是在自然数的定义域中有定义的。 闭包这个词的两种用法不应混淆。前者用来提及闭合的性质,而后者提及包含不闭合集合的最小闭合集合。简要的说,一个集合的闭包满足闭包性质。.

新!!: Unicode等價性和闭包 (数学) · 查看更多 »

附加符号

加符号或稱變音符號(diacritic、diacritical mark、diacritical point、diacritical sign),是指添加在字母上面的符號,以更改字母的發音或者以區分拼寫相似詞語。例如汉语拼音字母「ü」上面的两个小点,或「á」、「à」字母上面的标调符。 变音符号可以放在字母的上方或下方,也可以放在其他的位置。但是注意,並不是所有這些符號都是变音符号。例如字母i和j上面的點是字母本身的一部分,而不是变音符号。另外,在一種語言中,一個符號是变音符号,但是在另外一種語言中則不是。例如,在加泰罗尼亚语、葡萄牙语和西班牙语中,「u」和「ü」是相同的字母,但是在德语、爱沙尼亚语、匈牙利语、土耳其语、波兰语、维吾尔语和阿塞拜疆语中,它們表示不同的字母。.

新!!: Unicode等價性和附加符号 · 查看更多 »

Samba

Samba,是種用來讓UNIX系列的作業系統與微軟Windows作業系統的SMB/CIFS(Server Message Block/Common Internet File System)網路協定做連結的自由軟體。第三版不僅可存取及分享SMB的資料夾及印表機,本身還可以整合入Windows Server的網域,扮演為網域控制站(Domain Controller)以及加入Active Directory成員。簡而言之,此軟體在Windows與UNIX系列操作系统之間搭起一座橋樑,讓兩者的資源可互通有無。.

新!!: Unicode等價性和Samba · 查看更多 »

Unicode

Unicode(萬國-)是電腦科學領域裡的一項業界標準。它对世界上大部分的文字系統進行了整理、編碼,使得電腦可以用更為簡單的方式來呈現和處理文字。 Unicode伴隨著通用字符集的標準而發展,同時也以書本的形式對外發表。Unicode至今仍在不斷增修,每個新版本都加入更多新的字符。目前最新的版本為2018年6月5日公布的11.0.0,已經收錄超過13萬個字符(第十萬個字符在2005年獲採納)。Unicode涵蓋的資料除了視覺上的字形、編碼方法、標準的字符編碼外,還包含了字符特性,如大小寫字母。 Unicode發展由非營利機構統一碼聯盟負責,該機構致力於讓Unicode方案取代既有的字符編碼方案。因為既有的方案往往空間非常有限,亦不適用於多語環境。 Unicode備受认可,並廣泛地應用於電腦軟體的國際化與本地化過程。有很多新科技,如可扩展置标语言(Extensible Markup Language,簡稱:XML)、Java程式語言以及現代的作業系統,都採用Unicode編碼。.

新!!: Unicode等價性和Unicode · 查看更多 »

Unicode相容字符

講解和談論統一碼和UCS時,經常提到「相容字符」這個字眼。相容字符是指統一碼聯盟主張不要使用的圖像式字元,正如所說: 若不是為了與其他標準間相容和能夠雙向對應轉換,就不會在統一碼中編碼的字符。 然而,其定義實在遠比這話語有更深層和複雜的意味。每個字符都有一個标准分解(canonical decomposition)的屬性,可是大部分字符這個屬性的值是这个字符自身,但超過五千個字符的标准分解属性的值不是该字符自身。這個标准分解属性值能將相容字符對映到一個或多個的其他的非相容字符,並藉此定义这五千多个字符為統一碼中的相容字符。指定某字符為相容字符的理由各異,下面有更詳細的說明。「分解」這個用語有時會令人感到困惑,因為有些字符「分解」後還是單個字符的形態,這時該字符的分解值就是另一個相等或近似相等的字符。相容字符与其非空值的标准分解(语义上)是确切等价的。 如果一个相容字符可以用多个分解序列表示,那么采用了标准顺序(canonical order)的序列是该字符的标准分解。例如,ộ,有两种分解序列:(U+006F LATIN SMALL LETTER O) (U+0302 COMBINING CIRCUMFLEX ACCENT) (U+0323 COMBINING DOT BELOW)或者 (U+006F LATIN SMALL LETTER O) (U+0323 COMBINING DOT BELOW)(U+0302 COMBINING CIRCUMFLEX ACCENT),两个附加符号出现在分解序列中的位置是可交换的。 Unicode的另一个概念相容性分解(compatibility decomposition),是把一个相容字符映射为一個或多個的其他的非相容字符。但相容字符与相容性分解可能会有语义(如排版格式上)的损失。例如上角标数字字符⁴与普通的数字字符4。 Unicode的所有预组合字符(precomposed character)都是相容字符。即所有预组合字符都能够用其他字符或字符序列来表示。因此预组合字符的标准分解总是存在。具有不同于自身且不为空值的标准分解属性值的字符,称为标准组合字符( canonical composite)。.

新!!: Unicode等價性和Unicode相容字符 · 查看更多 »

传出传入
嘿!我们在Facebook上吧! »