徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
自由
比浏览器更快的访问!
 

Unicode相容字符

指数 Unicode相容字符

講解和談論統一碼和UCS時,經常提到「相容字符」這個字眼。相容字符是指統一碼聯盟主張不要使用的圖像式字元,正如所說: 若不是為了與其他標準間相容和能夠雙向對應轉換,就不會在統一碼中編碼的字符。 然而,其定義實在遠比這話語有更深層和複雜的意味。每個字符都有一個标准分解(canonical decomposition)的屬性,可是大部分字符這個屬性的值是这个字符自身,但超過五千個字符的标准分解属性的值不是该字符自身。這個标准分解属性值能將相容字符對映到一個或多個的其他的非相容字符,並藉此定义这五千多个字符為統一碼中的相容字符。指定某字符為相容字符的理由各異,下面有更詳細的說明。「分解」這個用語有時會令人感到困惑,因為有些字符「分解」後還是單個字符的形態,這時該字符的分解值就是另一個相等或近似相等的字符。相容字符与其非空值的标准分解(语义上)是确切等价的。 如果一个相容字符可以用多个分解序列表示,那么采用了标准顺序(canonical order)的序列是该字符的标准分解。例如,ộ,有两种分解序列:(U+006F LATIN SMALL LETTER O) (U+0302 COMBINING CIRCUMFLEX ACCENT) (U+0323 COMBINING DOT BELOW)或者 (U+006F LATIN SMALL LETTER O) (U+0323 COMBINING DOT BELOW)(U+0302 COMBINING CIRCUMFLEX ACCENT),两个附加符号出现在分解序列中的位置是可交换的。 Unicode的另一个概念相容性分解(compatibility decomposition),是把一个相容字符映射为一個或多個的其他的非相容字符。但相容字符与相容性分解可能会有语义(如排版格式上)的损失。例如上角标数字字符⁴与普通的数字字符4。 Unicode的所有预组合字符(precomposed character)都是相容字符。即所有预组合字符都能够用其他字符或字符序列来表示。因此预组合字符的标准分解总是存在。具有不同于自身且不为空值的标准分解属性值的字符,称为标准组合字符( canonical composite)。.

10 关系: 合字不换行空格國際音標統一碼等價性阿拉伯语通用字符集附加符号Unicode格式化文本数学字母数字符号

合字

合字、連字、連結字或合體字(Ligature),在西方字体排印学中一般表示將多於一個字母的合成一個字形。如印刷品中常常将拉丁字母两个字母fi的i上一點常與f的一鈎合併,而德語字母ß原為ss等等。漢字的合字在不同情況下也稱作合文或合體字。 合字經過演變、長時間流行後,可能被視為直接的符號、文字而非合字。如源自VV或UU,源自AE,而表示「與」的意思的「」,原是e和t的合字。.

新!!: Unicode相容字符和合字 · 查看更多 »

不换行空格

不换行空格是一个空格字符,用途是禁止自动换行。HTML页面显示时会自动合并多个连续的空白字符(whitespace character),但该字符是禁止合并的,因此该字符也称作“硬空格”(hard space、fixed space)。Unicode码点为:。.

新!!: Unicode相容字符和不换行空格 · 查看更多 »

國際音標

國際音標(International Phonetic Alphabet,縮寫:IPA),早期又稱萬國音標,是一套用來標音的系統,以拉丁字母為基礎,由國際語音學學會設計來作為口語聲音的標準化標示方法。International Phonetic Association (IPA), Handbook.

新!!: Unicode相容字符和國際音標 · 查看更多 »

統一碼等價性

#重定向 Unicode等價性.

新!!: Unicode相容字符和統一碼等價性 · 查看更多 »

阿拉伯语

阿拉伯语( al-ʻarabīyah 或者 ʻarabī )是除了英語、法語和西班牙語之外最多國家使用的官方語言。阿拉伯語源自公元6世纪的古典阿拉伯语。它包括书面语及流通于中东、北非和非洲之角(即索马里半岛)的各种口语。阿拉伯语属于亚非语系。 阿拉伯语的书面语称为“现代标准阿拉伯语”或“书面阿拉伯语”。书面阿拉伯语是目前唯一在官方及正式场合使用的阿拉伯语,用于大多数书面文件和讲座、新闻广播等正式讲话。但这亦因国家而异。1912年,在摩洛哥加入阿拉伯国家联盟之前,曾在正式场合使用过一段时间。 阿拉伯语属于,与亚拉姆语、希伯来语、乌加里特语和腓尼基语相近。阿拉伯语书面语不同于其所有地方的口语,且更为传统和保守。两者是双层语言的关系,用于不同的场合。 一些地方的阿拉伯语无论是书写还是口头形式,都无法互通。而所有地方的阿拉伯语被当作是一个整体。即是说,纯粹从语言学的角度来说,它们是不同的语言;但是从政治及民族的角度来说,他们又是一个整体。如果阿拉伯语被当作一个整体,则世界上估计有4.22亿人以其为母语。如果各地的阿拉伯语当作是不同的语言,则很难估计到底有多少种,因为它们是方言连续体,之间没有明确的界线。其中埃及阿拉伯语的使用人数最多,大约五千四百万人以其为母语——多于其他任何一种闪米特语言。 阿拉伯语是美国使用人数第12多的语言。 现代的书面语(现代标准阿拉伯语)源于古兰经的语言(即古典阿拉伯语),用于学校教学及工作、政府、媒体等场合。两者合起来被称为书面阿拉伯语,是伊斯兰教的。现代标准阿拉伯语的语法与古典阿拉伯语大体相同,词汇也有相同之处。但古典阿拉伯语的一些语法结构在现代标准阿拉伯语中不再使用,在口语中不使用的词汇也不在现代书面语中使用。而且现代书面语从口语中借入了一些词汇和语法现象。新的词汇大多用来表达近现代出现的概念。 阿拉伯语用阿拉伯字母从右往左书写。有时在非正式场合也可用拉丁字母从左往右书写,但没有统一的形式。 阿拉伯语往伊斯兰世界的语言(如波斯语、土耳其语、索马里语、波斯尼亞語、哈萨克语、孟加拉语、乌尔都语、马来语和豪萨语)輸出了大量词汇。中世纪时期,书面阿拉伯语成了欧洲文化的重要载体,特别是在科学、数学和哲学领域。这导致许多欧洲语言也从阿拉伯语中借入了大量词汇。阿拉伯语在词汇和语法方面对羅曼語族的语言(特别是西班牙语、葡萄牙语、加泰羅尼亞語和西西里語)影响很大。 阿拉伯语也从其他语言中借入了大量词汇,如早期从希伯来语、希腊语、波斯语、叙利亚语,中期从土耳其语,当代从欧洲语言(主要是英语和法语)。.

新!!: Unicode相容字符和阿拉伯语 · 查看更多 »

通用字符集

通用字符集(Universal Character Set, UCS)是由ISO制定的ISO 10646(或称ISO/IEC 10646)标准所定义的标准字符集。 通用字符集又称Universal Multiple-Octet Coded Character Set,中国大陆译为通用多八位编码--集,台湾译为廣用多八位--元--組編碼--集。.

新!!: Unicode相容字符和通用字符集 · 查看更多 »

附加符号

加符号或稱變音符號(diacritic、diacritical mark、diacritical point、diacritical sign),是指添加在字母上面的符號,以更改字母的發音或者以區分拼寫相似詞語。例如汉语拼音字母「ü」上面的两个小点,或「á」、「à」字母上面的标调符。 变音符号可以放在字母的上方或下方,也可以放在其他的位置。但是注意,並不是所有這些符號都是变音符号。例如字母i和j上面的點是字母本身的一部分,而不是变音符号。另外,在一種語言中,一個符號是变音符号,但是在另外一種語言中則不是。例如,在加泰罗尼亚语、葡萄牙语和西班牙语中,「u」和「ü」是相同的字母,但是在德语、爱沙尼亚语、匈牙利语、土耳其语、波兰语、维吾尔语和阿塞拜疆语中,它們表示不同的字母。.

新!!: Unicode相容字符和附加符号 · 查看更多 »

Unicode

Unicode(萬國-)是電腦科學領域裡的一項業界標準。它对世界上大部分的文字系統進行了整理、編碼,使得電腦可以用更為簡單的方式來呈現和處理文字。 Unicode伴隨著通用字符集的標準而發展,同時也以書本的形式對外發表。Unicode至今仍在不斷增修,每個新版本都加入更多新的字符。目前最新的版本為2018年6月5日公布的11.0.0,已經收錄超過13萬個字符(第十萬個字符在2005年獲採納)。Unicode涵蓋的資料除了視覺上的字形、編碼方法、標準的字符編碼外,還包含了字符特性,如大小寫字母。 Unicode發展由非營利機構統一碼聯盟負責,該機構致力於讓Unicode方案取代既有的字符編碼方案。因為既有的方案往往空間非常有限,亦不適用於多語環境。 Unicode備受认可,並廣泛地應用於電腦軟體的國際化與本地化過程。有很多新科技,如可扩展置标语言(Extensible Markup Language,簡稱:XML)、Java程式語言以及現代的作業系統,都採用Unicode編碼。.

新!!: Unicode相容字符和Unicode · 查看更多 »

格式化文本

格式化文本(英文:formatted text、styled text、rich text),与纯文本(plain text)相对,具有风格、排版等信息,如颜色、式样(黑体、斜体等)、字体尺寸、特性(如超链接)等。.

新!!: Unicode相容字符和格式化文本 · 查看更多 »

数学字母数字符号

数学字母数字符号(Mathematical Alphanumeric Symbols)是Unicode的一个码位区段(Unicode block)的正式名称。包含不同字型风格的拉丁字母、希腊字母与十进制数字在数学中用作不同指代含义的符号。例如,黑板粗体(blackboard bold),Unicode中使用的对应术语是双线体(double-struck)。 Unicode的第一辅助平面的码位区段1D000-1DFFF是“记号系统”(Notational systems),在U+1D400...

新!!: Unicode相容字符和数学字母数字符号 · 查看更多 »

重定向到这里:

Unicode兼容字符

传出传入
嘿!我们在Facebook上吧! »