徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
下载
比浏览器更快的访问!
 

字符编码

指数 字符编码

字符编码(Character encoding)、字集碼是把字符集中的字符编码为指定集合中某一对象(例如:比特模式、自然数序列、8位元组或者电脉冲),以便文本在计算机中存储和通过通信网络的传递。常见的例子包括将拉丁字母表编码成摩斯电码和ASCII。其中,ASCII将字母、数字和其它符号編號,並用7位元的二进制來表示这个整数。通常會額外使用一个扩充的位元,以便于以1个字节的方式存储。 在计算机技术发展的早期,如ASCII(1963年)和EBCDIC(1964年)这样的字符集逐漸成為標準。但这些字符集的局限很快就变得明显,于是人们开发了許多方法来扩展它们。对于支持包括东亚CJK字符家族在内的写作系统的要求能支持更大量的字符,并且需要一种系统而不是临时的方法实现这些字符的编码。.

79 关系: ASCII印度文字資訊交換碼同义词大五碼字形字符字符编码字节字节序字母对象中文資訊交換碼中文軟體中文標準交換碼序列二进制亂碼代码页位元像素Base64C语言CJKCygwin码位编号编码网络网页浏览器EBCDIC西里尔字母香港增補字符集體素越南语越南資訊交換標準代碼跨平台阿拉伯语自然数電子計算機電磁波集合通信通用字符集GB 18030GB 2312GBKIBMIconvISO/IEC 2022ISO/IEC 646...ISO/IEC 8859-1JavaKOI8-RKOI8-ULinuxLZWMACMicrosoft WindowsMIMEMozillaPunycodePythonQuoted-printableShift JISSIL國際UnicodeUTF-16UTF-32UTF-7UTF-8Windows-1252XML比特游程编码文字文本文件摩尔斯电码整数拉丁字母 扩展索引 (29 更多) »

ASCII

ASCII( ,American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语,而其擴展版本EASCII則可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646。 ASCII第一次以規範標準的型態發表是在1967年,最後一次更新則是在1986年,至今為止共定義了128個字元;其中33個字元無法顯示(一些终端提供了扩展,使得这些字符可顯示为諸如笑臉、撲克牌花式等8-bit符號),且這33個字元多數都已是陳廢的控制字元。控制字元的用途主要是用來操控已經處理過的文字。在33個字元之外的是95個可顯示的字元。用鍵盤敲下空白鍵所產生的空白字元也算1個可顯示字元(顯示為空白)。.

新!!: 字符编码和ASCII · 查看更多 »

印度文字資訊交換碼

印度文字資訊交換碼(英:Indian Script Code for Information Interchange,縮:ISCII,印度文: सूचना अन्तरविनिमय के लिए भारतीय लिपि संहिता,IS13194:1991)是一種編碼系統,其對象為多種在印度所使用的書寫系統。它包含婆羅米系文字,所支援的文字包含了:阿薩姆文、孟加拉文、天城文、古吉拉特文、古木基文、卡納達文、馬拉雅拉姆文、奧里亞文、泰米爾文和泰盧固文。 它不支援由阿拉伯文所衍生出來的印度書寫系統。 但它仍混和使用喀什米爾語、信德語、烏爾都語、波斯語、普什圖語和阿拉伯語。由阿拉伯語衍生的書寫系統則採用之後的波斯阿拉伯文字資訊交換碼。 婆羅米系書寫系統在結構上類似,只是使用不同的字母外形。此編碼將相同音的編在相同碼位。如 0xB3 0xDB 代表 。在天城文中産生 कि ,在古木基文中為 ਕਿ,在泰米爾文中則為 கி 。在富文件可以利用標記來選擇或在純文件中使用 ATR 碼。 使用此方法的動機為,它可以很容易地在不同書寫系統間做轉寫。然而,其彼此間的不相容又使得這在實作不容易。見 。 此編碼是八位元編碼。其較低的 128 碼位為純ASCII,其較高 128 碼位為此編碼專用。除了表示字符的碼位,此編碼還包括一個記憶用碼位,用來指示接下來的位元組包含兩種資訊之一。一種會改變書寫系統直到下一個書寫系統指示器或行結尾。另一種則選擇顯示模式,如粗體或斜體。此編碼並未提供預設書寫系統。.

新!!: 字符编码和印度文字資訊交換碼 · 查看更多 »

同义词

同义词(synonym)或者更学术性的称呼同义异形是世界上各种语言都存在的一种现象。它指的是表达的意义相同或相近,但是表达形式不同的词汇。例如厕所和“茅房”就是不同词汇表示同一种东西。 不仅词汇有同义现象,不同语法结构的句子也可以表示同一个意义。例如:.

新!!: 字符编码和同义词 · 查看更多 »

大五碼

Big5,又稱為大五碼或五大碼,是使用繁体中文(正--體中文)社群中最常用的電腦漢字字符集標準,共收錄13,060個漢字。 中文碼分為內碼及交換碼兩類,Big5屬中文內碼,知名的中文交換碼有CCCII、CNS11643。 Big5雖普及於台灣、香港與澳門等繁體中文通行區,但長期以來並非當地的國家/地區標準或官方標準,而只是業界標準。倚天中文系統、Windows繁體中文版等主要系統的字符集都是以Big5為基準,但廠商又各自增加不同的造字與造字區,衍生成多種不同版本。 2003年,Big5收錄到CNS11643中文標準交換碼的附錄當中,取得了較正式的地位。這個最新版本稱為Big5-2003。.

新!!: 字符编码和大五碼 · 查看更多 »

字形

字形(glyph),又稱字圖或書形,是指字的形体。中华人民共和国国家标准GB/T 16964《信息技术·字型信息交换》中定义字形为“一个可以辨认的抽象的图形符号,它不依赖于任何特定的设计”。在語言學中,字(character)是語意的最基本單位,即語素;字形是指為了表達這個意義的具體表達。同一字可以有不同的字形,而不影響其表達的意思,例如拉丁字母第一個字母可以寫作a或ɑ,漢字中的“--”、“--”。.

新!!: 字符编码和字形 · 查看更多 »

字符

在電腦和電信領域中,字符(Character)是一個資訊單位。對使用字母系統或音節文字等自然語言,它大約對應為一個音位、類音位的單位或符號。簡單來講就是一個漢字、假名、韓文字……,或是一個英文、其他西方語言的字母。 字符的例子有:字母、數字系統或標點符號。另外有所謂控制字符的概念,它是指:並不對應到自然語言中的某個特定符號,而是對應到語言中一些用來處理文句的概念(類似排版)。例子為列印機或其它顯示設備的命令,如Enter或Tab。.

新!!: 字符编码和字符 · 查看更多 »

字符编码

字符编码(Character encoding)、字集碼是把字符集中的字符编码为指定集合中某一对象(例如:比特模式、自然数序列、8位元组或者电脉冲),以便文本在计算机中存储和通过通信网络的传递。常见的例子包括将拉丁字母表编码成摩斯电码和ASCII。其中,ASCII将字母、数字和其它符号編號,並用7位元的二进制來表示这个整数。通常會額外使用一个扩充的位元,以便于以1个字节的方式存储。 在计算机技术发展的早期,如ASCII(1963年)和EBCDIC(1964年)这样的字符集逐漸成為標準。但这些字符集的局限很快就变得明显,于是人们开发了許多方法来扩展它们。对于支持包括东亚CJK字符家族在内的写作系统的要求能支持更大量的字符,并且需要一种系统而不是临时的方法实现这些字符的编码。.

新!!: 字符编码和字符编码 · 查看更多 »

字节

,通常用作计算机信息计量单位,不分数据类型。 一個字节代表八個。是程序设计语言不可缺少的基本数据类型——整數。 字节是现代计算机中连续的、固定数量的比特(二進制),即八個位元為一字节。 八个二进位经常在规范中被称为Octet(八位组),例如在一些工业标准、网络及电信技术裡。 Byte(字节)可缩写成B,例如MB表示Megabyte;Bit(位元)可缩写成b(小写),例如Mb表示。.

新!!: 字符编码和字节 · 查看更多 »

字节序

字节顺序,又称端序或尾序(Endianness)。在计算机科学领域中,是跨越多字节的程序对象的存储规则。.

新!!: 字符编码和字节序 · 查看更多 »

字母

字母是字母系統中的字位,是書寫時最基本的單位。像希腊字母及英文字母等。一個字母系統基本會有二十多至三十多個字母,例如英文字母系統中共有26個字母。 字母組成了音位,而音位表示了口语中的語音。在輔音音素文字(例如阿拉伯文)中也有字母,但其中只有輔音字母,沒有母音字母。 其他不使用字母的文字系統有音節文字(例如日文),每個符號表示一個音节,或是語素文字(例如汉字),每個符號可以表示一個字,或是由多個符號表示一個詞。.

新!!: 字符编码和字母 · 查看更多 »

对象

对象,可能指.

新!!: 字符编码和对象 · 查看更多 »

中文資訊交換碼

中文資訊交換碼(Chinese Character Code for Information Interchange,簡稱CCCII)是於中華民國政府為使中文資訊交換更加便利化,所發展的字符集和編碼方案,作為中文交換碼之用途。但由於此方案不如CNS 11643般是官方標準;更因為每個字要用上三個位元組儲存,較Big5花儲存空間,沒被電腦業界接納。現在只用於台灣、美國各大學圖書館檢索系統。香港各大學圖書館在2003年由舊有的CCCII系統換成UTF-8。.

新!!: 字符编码和中文資訊交換碼 · 查看更多 »

中文軟體

中文軟體指的是專門為了中文資訊處理使用所設計的軟體。包含但不侷限於中文系統(外掛)、中文輸入法、中文字形、中文自然語言處理、中文編程語言,如周蟒(ZhPy)等。.

新!!: 字符编码和中文軟體 · 查看更多 »

中文標準交換碼

中文標準交換碼,編號CNS 11643,舊名國家標準中文交換碼,是中華民國政府為資訊交換而制定的標準字元編碼方案,與CCCII同屬於中文交換碼。 1980年9月,行政院國家科學委員會集合編碼專家、學者在溪頭舉行會議並達成初步原則,並據此請行政院核定國家中文資訊標準交換碼編碼原則。經過多次會商,在1986年8月4日由經濟部中央標準局公佈,取名「通用漢字標準交換碼」,簡稱「通用碼」。當時的內容包括第一字面、第二字面共13,051字。 經過多年的使用意見及反映,於1992年擴編至第七字面,共48,027字,並改稱「中文標準交換碼」(CSIC, Chinese Standard Interchange Code)。此後陸續充實內容,1992年版一共十六字面,使用至第七字面;2004年版一共八十字面,使用至第十五字面。 2014年,新增第十九字面收錄新字。 1980年代萬「碼」奔騰,業界使用各種不同的內碼,如王安碼、IBM 5550碼、電信碼、倚天碼等。藉由此國家標準交換碼的公布與使用,做為各種不同內碼間的橋梁,使得不同的內碼也可以互相溝通和交換,資料可共享。.

新!!: 字符编码和中文標準交換碼 · 查看更多 »

序列

数学上,序列是被排成一列的对象(或事件);这样,每个元素不是在其他元素之前,就是在其他元素之后。这里,元素之间的顺序非常重要。.

新!!: 字符编码和序列 · 查看更多 »

二进制

在數學和數字電路中,二進制(binary)數是指用二進制記數系統,即以2為基數的記數系統表示的數字。這一系統中,通常用兩個不同的符號0(代表零)和1(代表一)來表示。以2為基數代表系統是二進位制的。數字電子電路中,邏輯門的實現直接應用了二進制,因此現代的計算機和依赖計算機的設備裡都用到二進制。每個數字稱為一個位元(二進制位)或比特(Bit,Binary digit的縮寫)。.

新!!: 字符编码和二进制 · 查看更多 »

亂碼

乱码指的是電腦系統不能顯示正確的字符,而顯示其他無意義的字符或空白,如一堆ASCII代碼。这样所顯示出來的文字統稱為亂碼。 乱码是因为「所使用的字符的源码在本地计算机上使用了错误的显示字库」,或在本地计算机的字库中找不到相应于源码所指代的字符所致。不同国家和地区的文字字库采用了相同的一段源码,或是源文件中因为文件受到破坏,致使计算机默认提取的源码错误,或是计算机没有安装相应字库,都有可能产生乱码。 例如,微软编译器产生“烫烫烫”“屯屯屯”乱码,编码字符集转换产生的“锟斤拷”“毺絞銝”“脣銝餌”乱码。如果是台湾(BIG-5)会显示“昍昍昍”,日本(Shift-JIS)会显示“フフフフフフ”。.

新!!: 字符编码和亂碼 · 查看更多 »

代码页

代码页是字符编码的别名,也稱「內碼表」,是特定语言的字符集的一张表。.

新!!: 字符编码和代码页 · 查看更多 »

位元

位元(Bit),亦称二進制位,指二进制中的一位,是資訊的最小单位。Bit是Binary digit(二进制数位)的缩写,由数学家John Wilder Tukey提出(可能是1946年提出,但有资料称1943年就提出了)。这个术语第一次被正式使用,是在香农著名的论文《通信的数学理论》(A Mathematical Theory of Communication)第1页中。 假设一事件以A或B的方式发生,且A、B发生的概率相等,都为0.5,则一个二进位可用来代表A或B之一。例如:.

新!!: 字符编码和位元 · 查看更多 »

像素

--,為影像顯示的基本單位,譯自英文「pixel」,pix是英语单词picture的常用简写,加上英语单词“元素”element,就得到pixel,故“像素”表示「畫像元素」之意,有時亦被稱為pel(picture element)。每个这样的訊息元素不是一个点或者一个方块,而是一个抽象的取樣。仔细處理的话,一幅影像中的像素可以在任何尺度上看起来都不像分离的点或者方块;但是在很多情况下,它们采用点或者方块显示。每個像素可有各自的顏色值,可採三原色顯示,因而又分成紅、綠、藍三種子像素(RGB色域),或者青、品红、黄和黑(CMYK色域,印刷行业以及打印机中常见)。照片是一个个取樣点的集合,在影像没有经过不正确的/有损的压缩或相机镜头合适的前提下,單位面積内的像素越多代表解析度越高,所顯示的影像就會接近于真实物体。.

新!!: 字符编码和像素 · 查看更多 »

Base64

Base64是一种基于64个可打印字符来表示二进制数据的表示方法。由于2 ^ 6.

新!!: 字符编码和Base64 · 查看更多 »

C语言

C是一种通用的程式語言,广泛用于系统软件与应用软件的开发。于1969年至1973年間,為了移植與開發UNIX作業系統,由丹尼斯·里奇與肯·汤普逊,以B语言为基础,在贝尔实验室設計、开发出來。 C语言具有高效、灵活、功能丰富、表达力强和較高的可移植性等特点,在程式設計中备受青睐,成为最近25年使用最为广泛的编程语言。目前,C语言編譯器普遍存在於各種不同的操作系统中,例如Microsoft Windows、macOS、Linux、Unix等。C語言的設計影響了众多後來的程式語言,例如C++、Objective-C、Java、C#等。 二十世纪八十年代,為了避免各開發廠商用的C語言語法產生差異,由美國國家標準局為C語言訂定了一套完整的國際標準語法,稱為ANSI C,作為C語言的標準。二十世纪八十年代至今的有关程式開發工具,一般都支持符合ANSI C的語法。.

新!!: 字符编码和C语言 · 查看更多 »

CJK

#重定向 中日韓統一表意文字.

新!!: 字符编码和CJK · 查看更多 »

Cygwin

Cygwin是许多自由软件的集合,最初由Cygnus Solutions开发,用于各种版本的Microsoft Windows上,运行类UNIX系统。Cygwin的主要目的是通过重新编译,将POSIX系统(例如Linux、BSD,以及其他Unix系统)上的软件移植到Windows上。Cygwin移植工作在Windows NT上比较好,在Windows 95和Windows 98上,相对差劲一些。目前Cygwin由Red Hat等负责维护。.

新!!: 字符编码和Cygwin · 查看更多 »

码位

在字符编码术语中,码位或称编码位置,即英文的code point或code position,是组成码空间(或代码页)的数值。 例如,ASCII码包含128个码位,范围是016进制到7F16进制,扩展ASCII码包含256个码位,范围是016进制到FF16进制,而Unicode包含1,114,112个码位,范围是016进制到10FFFF16进制。Unicode码空间划分为17个Unicode字符平面(基本多文种平面,16个辅助平面),每个平面有65,536(.

新!!: 字符编码和码位 · 查看更多 »

编号

编号按顺序编号数或者编定的号数。它是利用有序或无序的数字、字母等符号将一个系列的工程或项目进行整理,並附加代码,以便于记录和使用。 编号,确切来说是编号体系或编号系统在现实生活中无处不在,涉及各个学科,涵盖各个行业。重点描述各种编号体系(也包含编码、型号等)。.

新!!: 字符编码和编号 · 查看更多 »

编码

编码是信息从一种形式或格式转换为另一种形式的过程。解码,是编码的逆过程。.

新!!: 字符编码和编码 · 查看更多 »

网络

網路一詞有多種意義,可解作:.

新!!: 字符编码和网络 · 查看更多 »

网页浏览器

網頁瀏覽器(web browser),常被简稱為瀏覽器,是一種用於檢索並展示全球資訊網資訊資源的應用程式。這些資訊資源可為網頁、圖片、影音或其他內容,它們由統一資源標誌符標誌。資訊資源中的超連結可使使用者方便地瀏覽相關資訊。 網頁瀏覽器雖然主要用於使用全球資訊網,但也可用於獲取專用網絡中網頁伺服器之資訊或檔案系统內之檔案。 主流網頁瀏覽器有Mozilla Firefox、Internet Explorer、Microsoft Edge、Google Chrome、Opera及Safari。.

新!!: 字符编码和网页浏览器 · 查看更多 »

EBCDIC

EBCDIC(Extended Binary Coded Decimal Interchange Code)擴增二进式十进交換碼,为IBM於1963年-1964年间推出的字元编码表,根据早期打孔机式的二进化十进数(BCD,Bindary Coded Decimal)排列而成。是IBM迷尔級以上電腦的標準碼。 它的缺点是:英文字母不是连续地排列,中间出现多次断续,为撰写程式的人带来了一些困难。.

新!!: 字符编码和EBCDIC · 查看更多 »

西里尔字母

西里尔字母(Кирилли́ческий алфави́т或Кири́ллица,转写:Kirilličeskij alfavit或者Kirillica),也译作基里尔字母,又称斯拉夫字母,是通行于斯拉夫语族大多数民族中的字母书写系统。2011年時在歐亞大陸約有二億五千萬人的國家語言是以西里尔字母為標準文字,其中有半數在前蘇聯疆域範圍內。 西里尔字母大部分是以安色爾體希腊字母為基礎,並包括一些來自格拉哥里字母的字母,還包括一些連字。增添的字母用於古教會斯拉夫語且希臘語沒有的輔音。其名稱出於對先前創立格拉哥里字母的來自拜占庭的聖西里爾和美多德兄弟的敬意。學者們認為西里尔字母是由聖西里爾和美多德早期的門徒發展出來並規範化的。 在2007年1月1日歐盟東擴後,由於新加入的保加利亞使用西里尔字母,因此西里尔字母成為繼拉丁字母及希臘字母後的第三種歐盟官方字母。.

新!!: 字符编码和西里尔字母 · 查看更多 »

香港增補字符集

香港增補字符集(Hong Kong Supplementary Character Set,簡稱HKSCS)是香港政府基於繁體中文電腦操作環境中最流行的大五碼(Big-5)之上擴展的字符集標準,是現時香港的中文資訊交換內碼標準。 字符集所收羅的字,主要包括香港的地名、人名用漢字、粵語漢字及異體字,也有小部份簡體字。除此之外,此字符集亦把倚天中文系統收錄的日語平假名、片假名及俄語字母包括在內。此字符集由中文界面諮詢委員會管理,仍在不斷擴編之中。最新版本為HKSCS-2016,收錄5,033個字符。.

新!!: 字符编码和香港增補字符集 · 查看更多 »

體素

素或立體像素(voxel),是體積像素(volume pixel)的簡稱。概念上類似二維空間的最小單位——像素,像素用在二維電腦圖像的影像資料上。體積像素一如其名,是數位資料於三維空間分割上的最小單位,應用于三維成像、科學資料與醫學影像等領域。有些真正的三維顯示器運用體素來描述它們的解析度,舉例來說:可以顯示512×512×512體素的顯示器。 如同像素,體素本身並不含有空間中位置的資料(即它們的座標),然而卻可以從它們相對於其他體素的位置來推敲,意即它們在構成單一張體積影像的資料結構中的位置。.

新!!: 字符编码和體素 · 查看更多 »

越南语

越南語()又稱越語()、京語()及國語(),除此之外,還有一個現代少用的前法國殖民地名稱安南語()。 越南語是越南的國家語言,有85至90%的越南人將之作為母語,另外居住在海外的3百萬越僑、住在中國廣西的京族亦使用越南語。歷史上,越南語曾經使用漢字與喃字表記(即漢喃文),現代則使用以拉丁字母為基礎,添加若干個新字母及聲調符號的國語字()書寫。.

新!!: 字符编码和越南语 · 查看更多 »

越南資訊交換標準代碼

VISCII(VIetnamese Standard Code for Information Interchange,越南信息交换标准代码),是基于越南语的一套电脑编码系统。它是一个类似ISO/IEC 8859的单字节编码系统,但由於越南语附加符号有超过一百个,所以部分越南语字母,要佔用本来属於ASCII控制字符的位置。.

新!!: 字符编码和越南資訊交換標準代碼 · 查看更多 »

跨平台

跨平台泛指编程语言、软件或硬件设备可以在多种作業系統或不同硬體架構的電腦上運作。.

新!!: 字符编码和跨平台 · 查看更多 »

阿拉伯语

阿拉伯语( al-ʻarabīyah 或者 ʻarabī )是除了英語、法語和西班牙語之外最多國家使用的官方語言。阿拉伯語源自公元6世纪的古典阿拉伯语。它包括书面语及流通于中东、北非和非洲之角(即索马里半岛)的各种口语。阿拉伯语属于亚非语系。 阿拉伯语的书面语称为“现代标准阿拉伯语”或“书面阿拉伯语”。书面阿拉伯语是目前唯一在官方及正式场合使用的阿拉伯语,用于大多数书面文件和讲座、新闻广播等正式讲话。但这亦因国家而异。1912年,在摩洛哥加入阿拉伯国家联盟之前,曾在正式场合使用过一段时间。 阿拉伯语属于,与亚拉姆语、希伯来语、乌加里特语和腓尼基语相近。阿拉伯语书面语不同于其所有地方的口语,且更为传统和保守。两者是双层语言的关系,用于不同的场合。 一些地方的阿拉伯语无论是书写还是口头形式,都无法互通。而所有地方的阿拉伯语被当作是一个整体。即是说,纯粹从语言学的角度来说,它们是不同的语言;但是从政治及民族的角度来说,他们又是一个整体。如果阿拉伯语被当作一个整体,则世界上估计有4.22亿人以其为母语。如果各地的阿拉伯语当作是不同的语言,则很难估计到底有多少种,因为它们是方言连续体,之间没有明确的界线。其中埃及阿拉伯语的使用人数最多,大约五千四百万人以其为母语——多于其他任何一种闪米特语言。 阿拉伯语是美国使用人数第12多的语言。 现代的书面语(现代标准阿拉伯语)源于古兰经的语言(即古典阿拉伯语),用于学校教学及工作、政府、媒体等场合。两者合起来被称为书面阿拉伯语,是伊斯兰教的。现代标准阿拉伯语的语法与古典阿拉伯语大体相同,词汇也有相同之处。但古典阿拉伯语的一些语法结构在现代标准阿拉伯语中不再使用,在口语中不使用的词汇也不在现代书面语中使用。而且现代书面语从口语中借入了一些词汇和语法现象。新的词汇大多用来表达近现代出现的概念。 阿拉伯语用阿拉伯字母从右往左书写。有时在非正式场合也可用拉丁字母从左往右书写,但没有统一的形式。 阿拉伯语往伊斯兰世界的语言(如波斯语、土耳其语、索马里语、波斯尼亞語、哈萨克语、孟加拉语、乌尔都语、马来语和豪萨语)輸出了大量词汇。中世纪时期,书面阿拉伯语成了欧洲文化的重要载体,特别是在科学、数学和哲学领域。这导致许多欧洲语言也从阿拉伯语中借入了大量词汇。阿拉伯语在词汇和语法方面对羅曼語族的语言(特别是西班牙语、葡萄牙语、加泰羅尼亞語和西西里語)影响很大。 阿拉伯语也从其他语言中借入了大量词汇,如早期从希伯来语、希腊语、波斯语、叙利亚语,中期从土耳其语,当代从欧洲语言(主要是英语和法语)。.

新!!: 字符编码和阿拉伯语 · 查看更多 »

自然数

数学中,自然数指用于计数(如「桌子上有三个苹果」)和定序(如「国内第三大城市」)的数字。用于计数时称之为基数,用于定序时称之为序数。 自然数的定义不一,可以指正整数 (1, 2, 3, 4, \ldots),亦可以指非负整数 (0, 1, 2, 3, 4, \ldots)。前者多在数论中使用,后者多在集合论和计算机科学中使用,也是 标准中所采用的定义。 数学家一般以\mathbb代表以自然数组成的集合。自然数集是一個可數的,無上界的無窮集合。.

新!!: 字符编码和自然数 · 查看更多 »

電子計算機

--,亦稱--,计算机是一种利用数字电子技术,根据一系列指令指示其自动执行任意算术或逻辑操作序列的设备。计算机遵循被称为“程序”的一般操作集的能力使他们能够执行极其广泛的任务。 计算机被用作各种工业和消费设备的控制系统。这包括简单的特定用途设备(如微波炉和遥控器)、工业设备(如工业机器人和计算机辅助设计),以及通用设备(如个人电脑和智能手机之类的移动设备)等。尽管计算机种类繁多,但根据图灵机理论,一部具有最基本功能的计算机,应当能够完成任何其它计算机能做的事情。因此,理论上从智能手机到超级计算机都应该可以完成同样的作业(不考虑时间和存储因素)。由于科技的飞速进步,下一代计算机总是在性能上能够显著地超过其前一代,这一现象有时被称作“摩尔定律”。通过互联网,计算机互相连接,极大地提高了信息交换速度,反过来推动了科技的发展。在21世纪的现在,计算机的应用已经涉及到方方面面,各行各业了。 自古以来,简单的手动设备——就像算盘——帮助人们进行计算。在工业革命初期,各式各样的机械的出现,其初衷都是为了自动完成冗长而乏味的任务,例如织机的编织图案。更复杂的机器在20世纪初出现,通过模拟电路进行复杂特定的计算。第一台数字电子计算机出现于二战期间。自那时以来,电脑的速度,功耗和多功能性不断增加。在现代,机械计算--机的应用已经完全被电子计算机所取代。 计算机在组成上形式不一,早期计算机的体积足有一间房屋的大小,而今天某些嵌入式计算机可能比一副扑克牌还小。当然,即使在今天依然有大量体积庞大的巨型计算机为特别的科学计算或面向大型组织的事务处理需求服务。比较小的,为个人应用而设计的称为微型计算机(Personal Computer,PC),在中國地區简称為「微机」。我們今天在日常使用“计算机”一词时通常也是指此,不过现在计算机最为普遍的应用形式却是嵌入式,嵌入式计算机通常相对简单、体积小,并被用来控制其它设备——无论是飞机、工业机器人还是数码相机。 同计算机相关的技术研究叫计算--机科学,而「计算机技术」指的是将计算--机科学的成果应用于工程实践所派生的诸多技术性和经验性成果的总合。「计算机技术」与「计算机科学」是两个相关而又不同的概念,它们的不同在于前者偏重于实践而后者偏重于理论。至於由数据为核心的研究則称為信息技术。 传统上,现代计算机包括至少一个处理单元(通常是中央处理器(CPU))和某种形式的存储器。处理元件执行算术和逻辑运算,并且排序和控制单元可以响应于存储的信息改变操作的顺序。外围设备包括输入设备(键盘,鼠标,操纵杆等)、输出设备(显示器屏幕,打印机等)以及执行两种功能(例如触摸屏)的输入/输出设备。外围设备允许从外部来源检索信息,并使操作结果得以保存和检索。.

新!!: 字符编码和電子計算機 · 查看更多 »

電磁波

#重定向 电磁辐射.

新!!: 字符编码和電磁波 · 查看更多 »

集合

集合可以指:.

新!!: 字符编码和集合 · 查看更多 »

通信

通信是發送者通过某種媒體以某種格式來傳遞信息到收信者以達致某個目的。在古代,人們通過驛站、飛鴿傳書、烽火報警、符號、語言、眼神、觸碰等方式進行信息傳遞。到了今天,隨著科技水平的飛速發展,通訊基本完全利用有線或無線電完成,相繼出現了有線電話、固定電話、無線電話、手機、網際網路甚至視訊電話等各種通訊方式。通訊技術拉近了人與人之間的距離,提高了通訊的效率,深刻的改變了人類的通訊。交流也是一種方法讓其他人理解你。.

新!!: 字符编码和通信 · 查看更多 »

通用字符集

通用字符集(Universal Character Set, UCS)是由ISO制定的ISO 10646(或称ISO/IEC 10646)标准所定义的标准字符集。 通用字符集又称Universal Multiple-Octet Coded Character Set,中国大陆译为通用多八位编码--集,台湾译为廣用多八位--元--組編碼--集。.

新!!: 字符编码和通用字符集 · 查看更多 »

GB 18030

GB 18030,全称:“国家标准GB 18030-2005《--》”,是中华人民共和国现时最新的变长度多字节字符集。对GB 2312-1980完全向后兼容,与GBK基本向后兼容;支持GB 13000(Unicode)的所有码位;共收录汉字70,244个。 GB 18030主要有以下特点:.

新!!: 字符编码和GB 18030 · 查看更多 »

GB 2312

GB 2312 或 GB 2312–80 是中华人民共和国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》,通常簡稱GB,又稱GB0,由中国国家标准总局发布,1981年5月1日实施。GB 2312编码通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。.

新!!: 字符编码和GB 2312 · 查看更多 »

GBK

#重定向 汉字内码扩展规范.

新!!: 字符编码和GBK · 查看更多 »

IBM

国际商业机器股份有限公司(International Business Machines Corporation,首字母縮略字:IBM,曾译万国商用机器公司)是美國一家跨國科技公司及諮詢公司,總部位於紐約州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM雖然是一家商業公司,但在材料、化学、物理等科学领域卻也有很高的成就,利用這些學術研究為基礎,发明很多产品。比较有名的IBM发明的产品包括硬盘、自動櫃員機、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。.

新!!: 字符编码和IBM · 查看更多 »

Iconv

iconv是一个计算机程序以及一套应用程序编程接口的名称。它的作用是在多种国际编码格式之间进行文本内码的转换。支持的内码包括:.

新!!: 字符编码和Iconv · 查看更多 »

ISO/IEC 2022

ISO 2022,全称ISO/IEC 2022,由国际标准化组织(ISO)及国际电工委员会(IEC)联合制定,是一个使用7位或8位编码表示各种语言文字的通用技术规范。特别以东亚语言:汉语文字、日语文字或朝鲜文字的编码方法著称。 ISO 2022等同于欧洲标准组织(ECMA)的ECMA-35。中国国标GB 2312、日本工业规格JIS X 0202(旧称JIS C 6228)及韩国工业规格KS X 1004(旧称KS C 5620)均遵从ISO 2022。.

新!!: 字符编码和ISO/IEC 2022 · 查看更多 »

ISO/IEC 646

ISO/IEC 646是國際標準化組織(ISO)和國際電工委員會(IEC)於1972年制訂的標準。它是一個 7-位元字元的字集,來自數個國家標準,最主要來自美國的 ASCII(美国信息互换标准代码)。ISO 646 除了英語字母和數字部分,為所有國家相同外,有些使用字母的國家,可按照實際需要,把 ISO 646 修改,以定出該國的字符標準。亦因為當年 8-位元字符集並未得到普遍接納,各國把不同的字母或符號放進它們的字符集,以致部分出現在 ASCII 的字母或符號,並沒有出現在某些國家的 ISO 646 變體之中。 ISO 646为了表示欧洲各种语言的带附加符号(diacritical mark)的变音字母,由于没有码位空间去直接编码这些变音字母,所以用几个标点符号来兼作变音字母的附加符号:.

新!!: 字符编码和ISO/IEC 646 · 查看更多 »

ISO/IEC 8859-1

ISO 8859-1,正式编号为ISO/IEC 8859-1:1998,又称Latin-1或“西欧语言”,是国际标准化组织内ISO/IEC 8859的第一个8位字符集。它以ASCII为基础,在空置的0xA0-0xFF的范围内,加入96个字母及符号,藉以供使用附加符号的拉丁字母语言使用。曾推出过 ISO 8859-1:1987 版。 ISO-8859-1的别名有: iso-ir-100, csISOLatin1, latin1, l1, IBM819.

新!!: 字符编码和ISO/IEC 8859-1 · 查看更多 »

Java

Java是一種廣泛使用的電腦程式設計語言,擁有跨平台、物件導向、泛型程式設計的特性,广泛应用于企业级Web应用开发和移动应用开发。 任職於昇陽電腦的詹姆斯·高斯林等人于1990年代初开发Java語言的雛形,最初被命名为Oak,目標設定在家用电器等小型系統的程式语言,應用在电视机、电话、闹钟、烤面包机等家用电器的控制和通訊。由于这些智能化家电的市场需求没有预期的高,Sun公司放弃了该项计划。随着1990年代網際網路的发展,Sun公司看見Oak在網際網路上应用的前景,于是改造了Oak,於1995年5月以Java的名称正式发布。Java伴随着互联网的迅猛发展而发展,逐渐成为重要的网络编程语言。 Java编程语言的风格十分接近C++语言。继承了C++语言面向对象技术的核心,Java舍弃了C++语言中容易引起错误的-zh-hans:指针; zh-hant:指標;-,改以-zh-hans:引用; zh-hant:參照;-取代,同時移除了C++中的--和多重继承特性,改用接口取代,增加垃圾回收器功能。在Java SE 1.5版本中引入了泛型编程、类型安全的枚举、不定长参数和自动装/拆箱特性。昇陽電腦对Java语言的解释是:「Java编程语言是个简单、面向对象、分布式、解释性、健壮、安全与系统无关、可移植、高性能、多线程和动态的语言」 Java不同於一般的编译語言或直譯語言。它首先将源代码编译成字节码,然后依赖各种不同平台上的虚拟机来解释执行字节码,从而实现了“一次编写,到处运行”的跨平台特性。在早期JVM中,这在一定程度上降低了Java程序的运行效率。但在J2SE1.4.2发布后,Java的執行速度有了大幅提升。 与传统型態不同,Sun公司在推出Java時就将其作为开放的技术。全球数以万计的Java开发公司被要求所设计的Java软件必须相互兼容。“Java语言靠群体的力量而非公司的力量”是 Sun公司的口号之一,并获得了广大软件开发商的认同。这与微软公司所倡导的注重精英和封闭式的模式完全不同,此外,微软公司後來推出了与之竞争的.NET平台以及模仿Java的C#语言。後來Sun公司被甲骨文公司併購,Java也隨之成為甲骨文公司的產品。 現時,行動作業系統Android大部分的代碼採用Java 程式設計語言編程。.

新!!: 字符编码和Java · 查看更多 »

KOI8-R

KOI8-R是KOI-8系列的斯拉夫文字8位元编码,供俄语及保加利亚语使用。在Unicode未流行之前,KOI8-R 是最为广泛使用的俄语编码,使用率甚至比ISO/IEC 8859-5还高。 Andrey Chernov 把 KOI8-R 整理后,提交了给互联网协会(ISOC),成了 RFC 1489 文件 ("Registration of a cyrillic Character Set")。 在上表中,0x20是空格、0x9A是不换行空格。 0x95 在 RFC 1489 之中是 U+2219 (∙),但有时会使用 U+2022 (·) 以配合 Windows-1251 编码。.

新!!: 字符编码和KOI8-R · 查看更多 »

KOI8-U

KOI8-U是KOI-8系列的斯拉夫文字8位元编码,供乌克兰语使用。在Unicode未流行之前,KOI-8 系列编码是最为广泛使用的西里尔字母编码,使用率比起ISO/IEC 8859-5为高。 乌克兰有一个KOI8-U Working Group,负责维护 KOI8-U 编码。KOI8-U 编码是互联网协会(ISOC)的 RFC 2319 文件 ("Ukrainian Character Set KOI8-U")。 在上表中,0x20是空格、0x9A是不换行空格。 0xA4、0xA6、0xA7、0xAD、0xB4、0xB6、0xB7、0xBD是KOI8-U与KOI8-R版本的不同之处。 0x95 在 RFC 2319 之中是 U+2219 (∙),但有时会使用 U+2022 (·) 以配合 Windows-1251 编码。.

新!!: 字符编码和KOI8-U · 查看更多 »

Linux

Linux( )是一種自由和開放源碼的類UNIX作業系統。该操作系统的内核由林纳斯·托瓦兹在1991年10月5日首次发布。,在加上使用者空間的應用程式之後,成為Linux作業系統。Linux也是自由软件和开放源代码软件发展中最著名的例子。只要遵循GNU通用公共许可证(GPL),任何个人和机构都可以自由地使用Linux的所有底层源代码,也可以自由地修改和再发布。大多數Linux系統還包括像提供GUI的X Window之類的程序。除了一部分專家之外,大多數人都是直接使用Linux發行版,而不是自己選擇每一樣組件或自行設置。 Linux嚴格來說是單指作業系統的内核,因作業系統中包含了許多用戶圖形介面和其他实用工具。如今Linux常用来指基于Linux的完整操作系统,內核則改以Linux内核稱之。由于这些支持用户空间的系统工具和库主要由理查德·斯托曼于1983年发起的GNU计划提供,自由软件基金会提议将其组合系统命名为GNU/Linux,但Linux不屬於GNU計劃,這個名稱並沒有得到社群的一致認同。 Linux最初是作为支持英特尔x86架构的个人电脑的一个自由操作系统。目前Linux已经被移植到更多的计算机硬件平台,远远超出其他任何操作系统。Linux可以运行在服务器和其他大型平台之上,如大型主机和超级计算机。世界上500个最快的超级计算机90%以上运行Linux发行版或变种,包括最快的前10名超级电脑运行的都是基于Linux内核的操作系统。Linux也广泛应用在嵌入式系统上,如手机(Mobile Phone)、平板电脑(Tablet)、路由器(Router)、电视(TV)和电子游戏机等。在移动设备上广泛使用的Android操作系统就是建立在Linux内核之上。 通常情况下,Linux被打包成供个人计算机和服务器使用的Linux发行版,一些流行的主流Linux发布版,包括Debian(及其衍生版本Ubuntu、Linux Mint)、Fedora(及其相关版本Red Hat Enterprise Linux、CentOS)和openSUSE等。Linux发行版包含Linux内核和支撑内核的实用程序和库,通常还带有大量可以满足各类需求的应用程序。个人计算机使用的Linux发行版通常包含X Window和一个相应的桌面环境,如GNOME或KDE。桌面Linux操作系统常用的应用程序,包括Firefox网页浏览器、LibreOffice办公软件、GIMP图像处理工具等。由于Linux是自由软件,任何人都可以创建一个符合自己需求的Linux发行版。.

新!!: 字符编码和Linux · 查看更多 »

LZW

藍波-立夫-衛曲編碼法(Lempel-Ziv-Welch,縮寫LZW),是、与共同提出的一種無損数据压缩演算法。 它在1984年由泰瑞·衛曲改良亞伯拉罕·藍與傑可布·立夫在1978年发表的LZ78的版本而來(主要是基於藍波、立夫的壓縮概念,設計出一套具有可逆推的邏輯程序)。 與霍夫曼編碼相比,藍波-立夫-衛曲編碼法被視作將不同長度字串以固定長的碼編輯(霍夫曼編碼將固定長度字元用不同長度的碼編輯)。其優點在於此方法只需儲存一個相當小的表格,即可儲存資料還原時相對應的值,所以所需成本相對地低;然而,这种算法的設計著重在实现的速度,由于它并没有对数据做任何分析,所以并不一定是最好的演算法(參考LZMA,LZ77)。.

新!!: 字符编码和LZW · 查看更多 »

MAC

Mac或MAC可以指:; 计算机.

新!!: 字符编码和MAC · 查看更多 »

Microsoft Windows

Microsoft Windows(中文有时譯作微軟--,通常不做翻译)是微軟公司推出的一系列操作系统。它問世於1985年,起初是MS-DOS之下的桌面環境,其後續版本逐漸發展成為主要为個人電腦和服务器用户設計的操作系統,并最终获得了世界个人电脑操作系統的垄断地位。此操作系統可以在几种不同类型的平台上运行,如个人电脑(PC)、移动裝置、服务器(Server)和嵌入式系統等等,其中在个人电脑的领域应用内最为普遍。在2004年國際數據資訊公司一次有关未来发展趋势的会议上,副董事长Avneesh Saxena宣布Windows拥有终端操作系统大约70%的市场份额 www.linuxworld.com.au。 Windows操作系統目前最新的穩定版是於2015年7月29日發佈的 Windows 10。Windows Server目前最新的穩定版是2016年9月26日發佈的Windows Server 2016。.

新!!: 字符编码和Microsoft Windows · 查看更多 »

MIME

#重定向 多用途互聯網郵件擴展.

新!!: 字符编码和MIME · 查看更多 »

Mozilla

Mozilla是一个自由軟體社群,由網景通訊公司的成員於1998年創立。在非正式的場合下,「Mozilla」這個名字常用於不同的事物上。這些事物大都與現已歇業的網景通訊公司及其旗下的應用軟體相關。許多其它「Mozilla」名詞的用法請見下方敘述。.

新!!: 字符编码和Mozilla · 查看更多 »

Punycode

Punycode(譯為:域名代码)是一种表示Unicode码和ASCII码的有限的字符集。例如:“münchen”(德国慕尼黑)会被编码为“mnchen-3ya”。 Punycode的目的是在于国际化域名标签(IDNA)的框架中,使这些(多语言)的域名可以编码为ASCII。编码语法在文档RFC3492中规定。.

新!!: 字符编码和Punycode · 查看更多 »

Python

Python( ),是一种广泛使用的高级编程语言,属于通用型编程语言,由吉多·范罗苏姆创造,第一版发布于1991年。可以視之為一種改良(加入一些其他程式語言的優點,如物件導向)的LISP。作为一种解释型语言,Python的设计哲学强调代码的可读性和简洁的语法(尤其是使用空格缩进划分代码块,而非使用大括号或者关键词)。相比於C++或Java,Python让开发者能够用更少的代码表达想法。不管是小型还是大型程序,该语言都试图让程序的结构清晰明了。 与Scheme、Ruby、Perl、Tcl等动态类型编程语言一样,Python拥有动态类型系统和垃圾回收功能,能够自动管理内存使用,并且支持多种编程范式,包括面向对象、命令式、函数式和过程式编程。其本身拥有一个巨大而广泛的标准库。 Python 解释器本身几乎可以在所有的操作系统中运行。Python的正式直譯器CPython是用C语言编写的、是一個由社群驱动的自由软件,目前由Python软件基金会管理。.

新!!: 字符编码和Python · 查看更多 »

Quoted-printable

Quoted-printable或QP encoding,没有规范的中文译名,可译为可打印字符引用编码或使用可打印字符的编码。Quoted-printable是使用可打印的ASCII字符 (如字母、数字与".

新!!: 字符编码和Quoted-printable · 查看更多 »

Shift JIS

Shift_JIS是日本电脑系统常用的编码表,能容纳全形及半形拉丁字母、平假名、片假名、符号及日语汉字。 命名为Shift_JIS的原因,是在放置全形字符时,要避开原本在0xA1-0xDF放置的半角假名字符。 微软及IBM的日语电脑系统即使用了这个编码表,称为CP932。.

新!!: 字符编码和Shift JIS · 查看更多 »

SIL國際

美国國際语言暑期学院(SIL International)是一個國際性、非牟利、宗教性的科學組織,主要在研習、開發及記錄一些比較鮮為人知的語言,藉以擴展語言學知識、推動世界識字率及扶助少數族裔的語文發展。它透過它的旗艦網站「民族語」來為網民提供其各項研究數據。 SIL是英語Summer Institute of Linguistics的簡寫,意即“暑期語言學院”的意思。它於1934年在美國阿肯色州開辦,原來的用意是為接受差傳事工的宣教士提供一個暑期語言訓練,使他們掌握基本的語言學、人類學及翻譯學的基本原理,以便其後參與聖經的翻譯工作。這些受訓後的翻譯事工其後被稱為“威克理夫圣经翻译会”。SIL的創辦人是金纶·汤逊(1896年-1982年),是一位被派往危地馬拉的宣教士。在他的第一屆學生中,有一位名叫(1912年-2000年),後來成為了SIL歷史上最重要的人物。他在1942年至1979年期間一直擔任SIL的總裁,之後擔任名譽總裁,直到2000年他逝世為止。派克曾於1982年至1996年連續15年獲提名諾貝爾和平獎。SIL的現任總裁是2008年上任的Dr. John Watters。他從2000年至2007年間擔任執行長。 SIL到現在仍然是聯合國及UNESCO的正式顧問。SIL亦於世界多個高等院校為世界各國的非政府組織提供語言學課程的導師及教材。在美國,這些課程主要於以下大學舉辦:.

新!!: 字符编码和SIL國際 · 查看更多 »

Unicode

Unicode(萬國-)是電腦科學領域裡的一項業界標準。它对世界上大部分的文字系統進行了整理、編碼,使得電腦可以用更為簡單的方式來呈現和處理文字。 Unicode伴隨著通用字符集的標準而發展,同時也以書本的形式對外發表。Unicode至今仍在不斷增修,每個新版本都加入更多新的字符。目前最新的版本為2018年6月5日公布的11.0.0,已經收錄超過13萬個字符(第十萬個字符在2005年獲採納)。Unicode涵蓋的資料除了視覺上的字形、編碼方法、標準的字符編碼外,還包含了字符特性,如大小寫字母。 Unicode發展由非營利機構統一碼聯盟負責,該機構致力於讓Unicode方案取代既有的字符編碼方案。因為既有的方案往往空間非常有限,亦不適用於多語環境。 Unicode備受认可,並廣泛地應用於電腦軟體的國際化與本地化過程。有很多新科技,如可扩展置标语言(Extensible Markup Language,簡稱:XML)、Java程式語言以及現代的作業系統,都採用Unicode編碼。.

新!!: 字符编码和Unicode · 查看更多 »

UTF-16

UTF-16是Unicode字符编码五层次模型的第三层:字符编码表(Character Encoding Form,也称为"storage format")的一种实现方式。即把Unicode字符集的抽象码位映射为16位长的整数(即码元)的--,用于数据存储或传递。Unicode字符的码位,需要1个或者2个16位长的码元来表示,因此这是一个变长表示。 UTF是"Unicode/UCS Transformation Format"的首字母缩写,即把Unicode字符转换为某種格式之意。UTF-16正式定義於ISO/IEC 10646-1的附錄C,而RFC2781也定義了相似的做法。.

新!!: 字符编码和UTF-16 · 查看更多 »

UTF-32

UTF-32是32位Unicode转换格式(Unicode Transformation Formats, 或UTF)的缩写。UTF-32是一种用于编码Unicode的协定,该协定使用32位比特对每个Unicode码位进行编码(但前导比特数必须为零,故仅能表示221个Unicode码位)。与其他可变长度的Unicode转换格式(UTF)相比,UTF-32编码长度是固定的,UTF-32中的每个32位值代表一个Unicode码位,并且与该码位的数值完全一致。 UTF-32的主要优点是可以直接由Unicode码位来索引。在编码序列中查找第N个编码是一个常数时间操作。相比之下,其他可变长度编码需要进行循序存取操作才能在编码序列中找到第N个编码。这使得在计算机程序设计中,编码序列中的字符位置可以用一个整数来表示,整数加一即可得到下一个字符的位置,就和ASCII字符串一样简单。 UTF-32的主要缺点是每个码位使用四个字节,空间浪费较多。在大多数文本中,非基本多文種平面的字符非常罕见,这使得UTF-32所需空间接近UTF-16的两倍和UTF-8的四倍(具体取决于文本中ASCII字符的比例)。 尽管每一個碼位使用固定長度的位元組看似方便,但UTF-32並不如其它Unicode編碼使用廣泛。與UTF-8及UTF-16相比,UTF-32更容易遭到截斷。即使使用了"定寬"字型,在大多数情况下用UTF-32計算顯示字串的寬度也并不比其他编码更加容易。主要原因是,存在著一個字符位置會有多於一種可能的碼點(結合字符)或一個碼點用多於一個字符位置(如CJK表意字符)。結合符號也意味著,文書編輯者不能將一個码位視同一個編輯上的單位。.

新!!: 字符编码和UTF-32 · 查看更多 »

UTF-7

UTF-7(全称:7位元Unicode轉換格式)是一種可變長度字元編碼方式,用以將Unicode字元以ASCII編碼的字元串來呈現,可以應用在電子郵件傳輸之類的應用。 SMTP為基本的電子郵件傳輸標準之一,其指明了傳輸格式為US-ASCII,並且不允許超過ASCII所定義的字元範圍以外的位元值,也就是說八位元的字串將無法正常的被傳輸。MIME(RFC 2045 ~ 2049)擴展了網路郵件以支援不同的媒體類型以及字元集,包含UTF-8與UTF-16的字元集皆可被指定使用。但由於MIME並未明確將Unicode定義為可支援的字元集,並且也沒有說明其應如何編碼,這使得既有的SMTP傳輸架構下仍舊無法保證可正確的處理8位元資料。base64編碼也有其問題,例如甚至連純英文的US-ASCII字元也可能會變成不可辨認;至於像是UTF-8與quoted-printable的編碼結合,則需要6~9個位元來為非ASCII的字元(Unicode的基本多文種平面中定義的字元)進行編碼,至於在基本多文種平面(BMP)以外的字原則需要多達12位元的長度才能完成編.

新!!: 字符编码和UTF-7 · 查看更多 »

UTF-8

UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,也是一种前缀码。它可以用來表示Unicode標準中的任何字元,且其編碼中的第一個位元組仍與ASCII相容,這使得原來處理ASCII字元的軟體無須或只須做少部份修改,即可繼續使用。因此,它逐漸成為電子郵件、網頁及其他儲存或傳送文字的應用中,優先採用的編碼。 UTF-8使用一至六個位元組為每個字符編碼(尽管如此,2003年11月UTF-8被RFC 3629重新规范,只能使用原来Unicode定义的区域,U+0000到U+10FFFF,也就是说最多四個字节):.

新!!: 字符编码和UTF-8 · 查看更多 »

Windows-1252

Windows-1252 或 CP-1252 是拉丁字母的字元編碼,主要用於英文或某些其他西方文字版本 Microsoft Windows 的預設編碼,為Windows代碼頁之一。LaTeX軟件稱之為「ansinew」。.

新!!: 字符编码和Windows-1252 · 查看更多 »

XML

可扩展标记语言(Extensible Markup Language,简称:XML),是一种标记语言。标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等。如何定义这些标记,既可以选择国际通用的标记语言,比如HTML,也可以使用像XML这样由相关人士自由决定的标记语言,这就是语言的可扩展性。XML是从标准通用标记语言(SGML)中简化修改出来的。它主要用到的有可扩展标记语言、可扩展样式语言(XSL)、XBRL和XPath等。.

新!!: 字符编码和XML · 查看更多 »

比特

比特可以指:.

新!!: 字符编码和比特 · 查看更多 »

游程编码

游程編碼(RLE,run-length encoding),又称行程長度編碼或變動長度編碼法,是一種與資料性質無關的无损数据压缩技术。 變動長度編碼法為一種「使用變動長度的碼來取代連續重複出現的原始資料」的壓縮技術。.

新!!: 字符编码和游程编码 · 查看更多 »

文字

原始文字是人类用来紀錄特定事物、簡化圖像而成的書寫符號。文字在发展早期都是图画形式的,有些是以形表意,有些是以形表音,其中有表意文字(象形文字,即以形表意的文字),與語音無甚關係,中國文字便是從此漸次演變而成。有些中文字可以從表面、部首、字旁看到一些聯繫旁通的字義。而這些特色是拼音文字所沒有的。所以古代中國文字在不同的語系區域是擁有不同發音的,即方言的存在。漢朝已經被鄰近的族群借用其文字用作為書寫紀錄。一般认为,文字是文明社会的标志。马克思主义者认为文字是在阶级社会出現后产生的。 有些文字是以形表音的图画文字,其后歷經不同演變,部分發展成语言的符号系统,後亦可用來紀錄人生經驗與見聞。 以形表音的图画文字经过不断的发展,從古埃及文、羅馬文字、及拉丁文字則发展到后期都成为語音符號,即外文的字母,不同的外文字母合併成一個外國文字。由於不同字母分別付予一個音,不同的字母合併成切音(混音),形成音節,合併不合的音節,成為了记录语音的表音文字。.

新!!: 字符编码和文字 · 查看更多 »

文本文件

文本文件一般指只有字符原生编码构成的二进制计算机文件,與富文本相比,其不包含字样样式的控制元素,能够被最简单的文本编辑器直接读取。.

新!!: 字符编码和文本文件 · 查看更多 »

摩尔斯电码

摩尔斯电码(Morse code)是一种时通时断的信号代码,通过不同的排列顺序来表达不同的英文字母、數--字和标点符号。是由美國人艾爾菲德·維爾與萨缪尔·摩尔斯在1836年发明。 摩尔斯电码是一种早期的數碼化通信形式,但是它不同於现代只使用0和1两种状态的二进制代码,它的代码包括五种:.

新!!: 字符编码和摩尔斯电码 · 查看更多 »

整数

整数,是序列中所有的数的统称,包括负整数、零(0)与正整数。和自然數一樣,整數也是一個可數的無限集合。這個集合在数学上通常表示粗體Z或\mathbb,源于德语单词Zahlen(意为“数”)的首字母。 在代數數論中,這些屬於有理數的一般整數會被稱為有理整數,用以和高斯整數等的概念加以區分。.

新!!: 字符编码和整数 · 查看更多 »

拉丁字母

拉丁字母(也稱為罗马字母)是多數歐洲語言采用的字母系统,是世界上最通行的字母文字系統。拉丁字母作為羅馬文明的成果之一,隨著征服推廣到西歐廣大地區。.

新!!: 字符编码和拉丁字母 · 查看更多 »

重定向到这里:

字符集字集字集碼码元

传出传入
嘿!我们在Facebook上吧! »