徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
自由
比浏览器更快的访问!
 

UTF-8

指数 UTF-8

UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,也是一种前缀码。它可以用來表示Unicode標準中的任何字元,且其編碼中的第一個位元組仍與ASCII相容,這使得原來處理ASCII字元的軟體無須或只須做少部份修改,即可繼續使用。因此,它逐漸成為電子郵件、網頁及其他儲存或傳送文字的應用中,優先採用的編碼。 UTF-8使用一至六個位元組為每個字符編碼(尽管如此,2003年11月UTF-8被RFC 3629重新规范,只能使用原来Unicode定义的区域,U+0000到U+10FFFF,也就是说最多四個字节):.

75 关系: ASCII十六进制子集字串搜尋演算法字元編碼字节它拿字母寬字元希伯来语希腊字母希腊语万维网联盟亚美尼亚语序列化二进制互联网互联网工程任务组位元位元組順序記號微軟区域设置儲存裝置前置碼CABC语言CJK科普特语空字符網頁美國羅勃·派克統一碼聯盟电子邮件直譯器DEFLATE聖地牙哥西里尔字母貝爾實驗室貝爾實驗室九號計畫软件阿拉伯字母阿拉伯语肯·汤普逊通用字符集附加符号GB 18030GNU通用公共许可证IBMISO/IEC 8859Java...JavaScriptLinuxMac OS XMariaDBMicrosoft WindowsMySQLRed Hat LinuxShift JISSUSEUnicodeUnicode字符平面映射Universal Character SetUSENIXUTF-16X/OpenXML正则表达式汉字最高有效位新泽西州文件系统操作系统数据压缩拉丁字母拉丁语 扩展索引 (25 更多) »

ASCII

ASCII( ,American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语,而其擴展版本EASCII則可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646。 ASCII第一次以規範標準的型態發表是在1967年,最後一次更新則是在1986年,至今為止共定義了128個字元;其中33個字元無法顯示(一些终端提供了扩展,使得这些字符可顯示为諸如笑臉、撲克牌花式等8-bit符號),且這33個字元多數都已是陳廢的控制字元。控制字元的用途主要是用來操控已經處理過的文字。在33個字元之外的是95個可顯示的字元。用鍵盤敲下空白鍵所產生的空白字元也算1個可顯示字元(顯示為空白)。.

新!!: UTF-8和ASCII · 查看更多 »

十六进制

十六进制(简写为hex或下標16)在数学中是一种逢16进1的进位制。一般用数字0到9和字母A到F(或a~f)表示,其中:A~F表示10~15,这些称作十六进制数字。 例如十进制數57,在二进制寫作111001,在16进制寫作39。 在历史上,中国曾经在重量单位上使用过16进制,比如,规定16两为一斤。 现在的16进制则普遍应用在计算机领域,这是因為將4個位元(Bit)化成單獨的16进制數字不太困難。1字節可以表示成2個連續的16进制數字。可是,這種混合表示法容易令人混淆,因此需要一些字首、字尾或下標來顯示。.

新!!: UTF-8和十六进制 · 查看更多 »

子集

子集,為某個集合中一部分的集合,故亦稱部分集合。 若A和B为集合,且A的所有元素都是B的元素,则有:.

新!!: UTF-8和子集 · 查看更多 »

字串搜尋演算法

字串搜尋演算法(String searching algorithms)又稱字串比對演算法(string matching algorithms)是一种搜索算法,是字串演算法中的一類,用以試圖在一長字符串或文章中,找出其是否包含某一個或多個字符串,以及其位置。 最直觀的解法是比對,如下例中,在字符串haystack中找出字符串needle char* haystack; char* needle; int hlen, nlen, found; int i,j,k; found.

新!!: UTF-8和字串搜尋演算法 · 查看更多 »

字元編碼

#重定向 字符编码.

新!!: UTF-8和字元編碼 · 查看更多 »

字节

,通常用作计算机信息计量单位,不分数据类型。 一個字节代表八個。是程序设计语言不可缺少的基本数据类型——整數。 字节是现代计算机中连续的、固定数量的比特(二進制),即八個位元為一字节。 八个二进位经常在规范中被称为Octet(八位组),例如在一些工业标准、网络及电信技术裡。 Byte(字节)可缩写成B,例如MB表示Megabyte;Bit(位元)可缩写成b(小写),例如Mb表示。.

新!!: UTF-8和字节 · 查看更多 »

它拿字母

它拿字母(迪维希语名:ތާނަ,拉丁名:Tāna)用於拼寫馬爾代夫官方語言迪維希語。文章從右向左書寫。.

新!!: UTF-8和它拿字母 · 查看更多 »

寬字元

寬字元(Wide character) 是计算机抽象術語(没有规定具体实现细节),表示比8位元字元還寬的資料類型。不同於Unicode。.

新!!: UTF-8和寬字元 · 查看更多 »

希伯来语

希伯来语( -,读音:)属于亚非语系闪米特语族,為具有古代猶太民族(以色列民族或希伯來民族)意識之現代人民的民族語言、也是犹太教的宗教语言。过去2500年,希伯来语主要用于《圣经》与相关宗教方面的研究,自从20世纪特别是以色列复国以来,“希伯来语”作为口语在犹太人中复活,渐渐取代阿拉伯语、拉迪諾語和意第绪语,以色列復国后将“希伯来语”定为官方语言之一,採用希伯来语字母書寫;另一种官方语言是阿拉伯语。希伯来語亦如同其它大部分的閃語族语言般,其拼寫法為橫寫由右到左。.

新!!: UTF-8和希伯来语 · 查看更多 »

希腊字母

希臘字母源自腓尼基字母。腓尼基字母只有辅音,從右向左寫。希臘語的元音发达,希臘人增添了元音字母。因為希臘人的書寫工具是蠟板,有时前一行從右向左寫完後順势就從左向右寫,變成所謂“耕地”式書寫,後來逐漸演變成全部從左向右寫。字母的方向也顛倒了。罗马人引進希臘字母,略微改變變為拉丁字母,在世界廣為流行。希臘字母廣泛應用到學術領域,如數學等。.

新!!: UTF-8和希腊字母 · 查看更多 »

希腊语

希臘語(Ελληνικά)是一种印歐語系的语言,广泛用于希臘、阿尔巴尼亚、塞浦路斯等国,与土耳其包括小亚细亚一帶的某些地区。 希臘语言元音发达,希臘人增添了元音字母。古希臘語原有26个字母,荷马时期后逐渐演变并确定为24个,一直沿用到現代希臘語中。后世希腊语使用的字母最早发源于爱奥尼亚地区(今土耳其西部沿海及希腊东部岛屿)。雅典于前405年正式采用之。.

新!!: UTF-8和希腊语 · 查看更多 »

万维网联盟

万维网联盟(World Wide Web Consortium,W3C),又称W3C理事会,是全球資訊網的主要國際標準組織。.

新!!: UTF-8和万维网联盟 · 查看更多 »

亚美尼亚语

亞美尼亞語(Հայերեն或Hayerēn)是亞美尼亞共和國及不被普遍承认的納戈爾諾-卡拉巴赫共和國的官方语言,屬於印欧语系的一支,但它沒有任何近似語言,其38個字母的拼音系統更是獨特的,不少語言學家因此對亞美尼亞語產生興趣。 亞美尼亞語目前廣泛被亞美尼亞人使用。 語言學家將亞美尼亞語歸為印歐語系的一個獨立語族。亞美尼亞語與希臘語有一些共有衍徵。部分語言學家將亞美尼亞語、弗里吉亞語(Phrygian)及印度-伊朗語族歸類於印歐語系之下,因為它們有一些共有衍徵。最近亦有一些語言學家提出將希臘語、亞美尼亞語、弗里吉亞語(Phrygian)及阿爾巴尼亞語歸入印歐語系下的一個「巴爾幹語族」(Balkan)。 亞美尼亞語有一個漫長的文學史,其現存最古老的文學作品是五世紀的聖經翻譯。它的詞彙在其歷史上受伊朗的語言影響,特別是帕提亞語(Pathian),此外還受希臘語,拉丁語,古法語,波斯語,阿拉伯語,土耳其語和其他語言影響。現代亞美尼亞語有兩種規範的形式,東亞美尼亞語和西亞美尼亞語,兩者都可以用於理解當代亞美尼亞方言。幾乎絕跡的Lomavren語是一個深受羅姆語(吉普賽語)影響的方言,使用亞美尼亞語的語法及大量由羅姆語演變而來的詞彙,例如數字。.

新!!: UTF-8和亚美尼亚语 · 查看更多 »

序列化

序列化(serialization)在計算機科學的資料處理中,是指將資料結構或物件狀態轉換成可取用格式(例如存成檔案,存於緩衝,或經由網絡中傳送),以留待後續在相同或另一台計算機環境中,能恢復原先狀態的過程。依照序列化格式重新獲取位元組的結果時,可以利用它來產生與原始物件相同語義的副本。對於許多物件,像是使用大量參照的複雜物件,這種序列化重建的過程並不容易。物件導向中的物件序列化,並不概括之前原始物件所關聯的函式。這種過程也稱為物件編組(marshalling)。從一系列位元組提取資料結構的反向操作,是反序列化(也稱為解編組, deserialization, unmarshalling)。 序列化在计算机科学中通常有以下定義.

新!!: UTF-8和序列化 · 查看更多 »

二进制

在數學和數字電路中,二進制(binary)數是指用二進制記數系統,即以2為基數的記數系統表示的數字。這一系統中,通常用兩個不同的符號0(代表零)和1(代表一)來表示。以2為基數代表系統是二進位制的。數字電子電路中,邏輯門的實現直接應用了二進制,因此現代的計算機和依赖計算機的設備裡都用到二進制。每個數字稱為一個位元(二進制位)或比特(Bit,Binary digit的縮寫)。.

新!!: UTF-8和二进制 · 查看更多 »

互联网

互联网(Internet),是網路與網路之間所串連成的龐大網路,這些網路以一組標準的網路TCP/IP协议族相連,連接全世界幾十億個設備,形成邏輯上的單一巨大國際網络。,它是由從地方到全球範圍內幾百萬個私人的、學術界的、企業的和政府的網络所構成,通過電子,無線和光纖網絡技術等等一系列廣泛的技術聯繫在一起。这种将计算机网络互相联接在一起的方法可称作「网络互联」,在這基础上发展出覆蓋全世界的全球性互联網絡稱互聯網,即是互相連接一起的网络。互聯網並不等同万维网(WWW),万维网只是一個基於超文本相互鏈接而成的全球性系統,且是互聯網所能提供的服務其中之一。互聯網帶有範圍廣泛的信息資源和服務,例如相互關聯的超文本文件,还有萬維網的應用,支持電子郵件的基礎設施,對等網絡,文件共享,以及IP電話服務。.

新!!: UTF-8和互联网 · 查看更多 »

互联网工程任务组

互联网工程任务小组(Internet Engineering Task Force,縮寫為 IETF)负责互联网标准的开发和推动。 它的组织形式主要是大量负责特定议题的工作组,每个都有一个指定主席(或者若干副主席)。工作组再用主题组织为领域(area);每个领域都有一个领域指导(area director,AD),大多数领域还有两个副AD;AD任命工作组主席。AD和IETF主席构成Internet Engineering Steering Group(IESG),负责IETF的整体运作。.

新!!: UTF-8和互联网工程任务组 · 查看更多 »

位元

位元(Bit),亦称二進制位,指二进制中的一位,是資訊的最小单位。Bit是Binary digit(二进制数位)的缩写,由数学家John Wilder Tukey提出(可能是1946年提出,但有资料称1943年就提出了)。这个术语第一次被正式使用,是在香农著名的论文《通信的数学理论》(A Mathematical Theory of Communication)第1页中。 假设一事件以A或B的方式发生,且A、B发生的概率相等,都为0.5,则一个二进位可用来代表A或B之一。例如:.

新!!: UTF-8和位元 · 查看更多 »

位元組順序記號

位元組順序記號(byte-order mark,BOM)是位於碼點U+FEFF的統一碼字符的名称。當以UTF-16或UTF-32來將UCS/統一碼字符所組成的字串編碼時,這個字符被用來標示其位元組序。它常被用來當做標示文件是以UTF-8、UTF-16或UTF-32編碼的記號。.

新!!: UTF-8和位元組順序記號 · 查看更多 »

微軟

#重定向 微软.

新!!: UTF-8和微軟 · 查看更多 »

区域设置

区域设置(locale),也称作“本地化策略集”、“本地环境”,是表达程序用户地区方面的软件设定。不同系统、平台、与软件有不同的区域设置处理方式和不同的--范围,但是一般区域设置最少也会包括语言和地区。操作系统的区域设置通常比较复杂。区域设置的内容包括:数据格式、货币金额格式、小数点符号、千分位符号、度量衡单位、通货符号、日期写法、日历类型、文字排序、姓名格式、地址等等。 区域设置的主要目标是让用户选择最适合他自己的设定。比如用以上的Windows作比喻:在控制面板的区域和语言选择中,用户可以选择自己的字符集排序方法;当浏览文件时,系统会使用「用户选择的排序」来排列文件。.

新!!: UTF-8和区域设置 · 查看更多 »

儲存裝置

儲存裝置是用于储存資訊的设备或裝置。通常是將資訊數位化後再以利用電、磁或光學等方式的媒體加以儲存。 常見的儲存裝置(電腦數據存貯器)有:.

新!!: UTF-8和儲存裝置 · 查看更多 »

前置碼

前置碼(Prefix code),又譯前綴碼,是一種編碼系統。這種編碼系統通常是可變長度碼,在其中的每個碼字,都具備「前置性質」(prefix property),也就是說,在編碼中的每個碼字,都不能被其他碼字當成前置部位。舉例而言,編碼字 具備了前置性質,但編碼字就不具備,因為其中的"5",是"59"及"55"的前置字。這也被稱為無首碼的代碼(prefix-free codes,PFC,無前綴碼)。 Category:编码理论 Category:前綴 Category:数据压缩 Category:无损压缩算法.

新!!: UTF-8和前置碼 · 查看更多 »

CAB

在计算机领域,CAB是微软视窗自带的压缩文件格式,它支援压缩与数字签名并在几种不同的微软安装工具中都有应用:Setup API、、(用于从Internet Explorer安装ActiveX组件)以及Windows Installer。 CAB文件格式与需使用三种数据压缩方法:.

新!!: UTF-8和CAB · 查看更多 »

C语言

C是一种通用的程式語言,广泛用于系统软件与应用软件的开发。于1969年至1973年間,為了移植與開發UNIX作業系統,由丹尼斯·里奇與肯·汤普逊,以B语言为基础,在贝尔实验室設計、开发出來。 C语言具有高效、灵活、功能丰富、表达力强和較高的可移植性等特点,在程式設計中备受青睐,成为最近25年使用最为广泛的编程语言。目前,C语言編譯器普遍存在於各種不同的操作系统中,例如Microsoft Windows、macOS、Linux、Unix等。C語言的設計影響了众多後來的程式語言,例如C++、Objective-C、Java、C#等。 二十世纪八十年代,為了避免各開發廠商用的C語言語法產生差異,由美國國家標準局為C語言訂定了一套完整的國際標準語法,稱為ANSI C,作為C語言的標準。二十世纪八十年代至今的有关程式開發工具,一般都支持符合ANSI C的語法。.

新!!: UTF-8和C语言 · 查看更多 »

CJK

#重定向 中日韓統一表意文字.

新!!: UTF-8和CJK · 查看更多 »

科普特语

科普特语(Coptic language)是古埃及语言发展的最末阶段,形成于纪元前。纪元伊始,人们开始借鉴希臘文字,创造出科普特字母。公元3世纪,出现大量用科普特语誊抄的希腊文献,尤其是基督教经文。迦克墩公會議后,亚历山大学派反对确立耶稣「一位二性」的信经,与罗马天主教分道扬镳,出现了科普特教派。科普特语言文字在科普特教派的信徒的使用中得到继承发扬。科普特语曾在埃及各地广泛使用,但后来逐渐被阿拉伯语取代。现在,科普特语只在埃及科普特人的教堂中使用。.

新!!: UTF-8和科普特语 · 查看更多 »

空字符

字符(Null character)又稱結束符,縮寫NUL,是一個數值為0的控制字符。在許多字符编码中都包括空字符,包括ISO/IEC 646(ASCII)、、通用字符集、Unicode和EBCDIC等,幾乎所有主流的程式語言都包括有空字符。 這個字符原來的意思類似NOP指令,當送到列表機或終端機時,設備不需作任何的動作(不過有些設備會錯誤的列印或顯示一個空白)。 空字符在C語言及其衍生語言及許多資料型態中都非常的重要,在C語言中空字符是字串的結束碼,這樣的字串稱為空字符終止字串或ASCIIZ字串。因此字串的長度可以為任意自然數,但需多增加一個字元的空間儲存空字元。.

新!!: UTF-8和空字符 · 查看更多 »

網頁

网页(web page)是一个適用於全球資訊網和網頁瀏覽器的文件,它存放在世界某个角落的某一部或一組计算机中,而这部计算机必须是与互联网相连。网页经由网址(URL)来识别与存取,当我们在网页浏览器输入网址后,经过一段复杂而又快速的程序,网页文件会被传送到用户家的计算机,然后再通过浏览器解释网页的内容,再展示给用户。是網路中的一「頁」,通常是HTML格式,但現今已經有愈來愈多、各色各樣的網頁格式和標準出現。網頁通常用圖像檔來提供圖畫。網頁要透過網頁瀏覽器來閱讀。.

新!!: UTF-8和網頁 · 查看更多 »

美國

#重定向 美国.

新!!: UTF-8和美國 · 查看更多 »

羅勃·派克

羅勃特·派克(Robert C. Pike,),暱稱為羅勃·派克(Rob Pike),來自加拿大的程式設計師,曾經加入貝爾實驗室,為 UNIX小組的成員。曾經參與過貝爾實驗室九號計畫、Inferno,與程式語言 Limbo的開發。 他與肯·汤普逊共同開發了UTF-8。 目前為 google的工程師,參與程式語言 Go與Sawzall的研發工作。.

新!!: UTF-8和羅勃·派克 · 查看更多 »

統一碼聯盟

統一碼聯盟(The Unicode Consortium;le Consortium Unicode)是一個統籌統一碼(Unicode)發展的非營利機構,其宗旨為最終以統一碼取代現存的字符編碼,因為現存編碼不能夠在多語言電腦環境中使用,而且字符數有侷限。同時它也制定了數種統一碼轉換格式(UTF,Unicode Transformation Format)。統一碼的成功讓電腦使用進入了一個新紀元,並應用於很多新技術,如XML、Java程式語言和現今的作業系統。 統一碼聯盟有來自多個國家政府和各大軟件商的代表參與。統一碼聯盟積極與各標準制訂機構合作,包括國際標準化組織(ISO)、國際電工委員會(IEC)、萬維網聯盟(W3C)、網際網路工程工作小組(IETF)和歐洲計算機製造協會(ECMA)等。.

新!!: UTF-8和統一碼聯盟 · 查看更多 »

电子邮件

@符号,是所有简单邮件传输协议电邮位址的组成部分 电子邮件 (Electronic Mail),簡稱電郵 (email or e-mail),是指一種由一寄件人將數位信息傳送給一個人或多個人的信息交換方式,一般會通过網際網路或其他電腦網路进行书写、发送和接收信件,目的是达成发信人和收信人之间的信息交互。一些早期的電子郵件需要寄件人和收件人同時在線,類似即時通訊。現在的電子郵件系統以是的模型為基礎。郵件伺服器接受、轉發、送出及儲存郵件。寄信人、收信人及他們的電腦都不用同時在線。寄信人和收信人只需在寄信或收信時簡短的連線到郵件伺服器即可。 以往电子邮件會用來泛指所有電子式的文件轉送。例如在1970年代初期有幾位作家用「电子邮件」來描述文件的傳真。因此很難確定什麼時候開始用「电子邮件」來描述符合現在定義的电子邮件。 电子邮件(符合現代定義,下同)包括三個部份,訊息的「信封」、郵件標頭及郵件內容。標頭會至少包括一些傳遞郵件相關的資訊,例如寄信人的郵件地址及一至多個收信人的郵件地址,一般會包括一些敘述性的內容,例如郵件的標題以及時間等。 电子邮件最早是純文字(ASCII)的溝通媒介,但後來擴展像可以加入多媒體的附件、其他字元集的文字,其程序RFC2045到2049中,同時也產生了多用途網際網路郵件擴展(MIME)。.

新!!: UTF-8和电子邮件 · 查看更多 »

直譯器

譯器(interpreter),是一種電腦程式,能夠把高階程式語言一行一行直接轉譯執行。直譯器像是一位「中間人」,每次執行程式時都要先轉成另一種語言再作執行,因此直譯器的程式運行速度比較緩慢。它不會一次把整個程式轉譯出來,而是每轉譯一行程式敘述就立刻執行,然後再轉譯下一行,再執行,如此不停地進行下去。 直譯器的好處是它消除了編譯整個程式的負擔,程式可以拆分成多個部分來模組化,但這會讓執行時的效率打了折扣。相對地,編譯器已一次將所有原程式碼翻譯成另一種語言,如機械碼,執行時便無需再依賴編譯器或額外的程式,故而其運行速度比較快。.

新!!: UTF-8和直譯器 · 查看更多 »

DEFLATE

DEFLATE是同时使用了LZ77算法与哈夫曼编码(Huffman Coding)的一个无损数据压缩算法。它最初是由菲尔·卡茨(Phil Katz)为他的PKZIP软件第二版所定义的,后来被标准化。 菲尔·卡茨及其所拥有的为该算法申请了。人们普遍认为DEFLATE不受任何专利所覆盖,并且在LZW(GIF文件格式使用)相关的专利失效之前,这种格式除了在ZIP文件格式中得到应用之外也在gzip压缩文件以及PNG图像文件中得到了应用。 DEFLATE压缩与解压的源代码可以在自由、通用的压缩库zlib上找到。 更高压缩率的DEFLATE是7-zip所实现的。AdvanceCOMP也使用这种实现,它可以对gzip、PNG、MNG以及ZIP文件进行压缩从而得到比zlib更小的文件大小。在Ken Silverman的KZIP与PNGOUT中使用了一种更加高效同时要求更多用户输入的DEFLATE程序。.

新!!: UTF-8和DEFLATE · 查看更多 »

聖地牙哥

聖地--亞哥或聖地--牙哥(Santiago,、),本是西班牙語對聖雅各的稱呼,後逐漸演化用在各種常用事物的命名。.

新!!: UTF-8和聖地牙哥 · 查看更多 »

西里尔字母

西里尔字母(Кирилли́ческий алфави́т或Кири́ллица,转写:Kirilličeskij alfavit或者Kirillica),也译作基里尔字母,又称斯拉夫字母,是通行于斯拉夫语族大多数民族中的字母书写系统。2011年時在歐亞大陸約有二億五千萬人的國家語言是以西里尔字母為標準文字,其中有半數在前蘇聯疆域範圍內。 西里尔字母大部分是以安色爾體希腊字母為基礎,並包括一些來自格拉哥里字母的字母,還包括一些連字。增添的字母用於古教會斯拉夫語且希臘語沒有的輔音。其名稱出於對先前創立格拉哥里字母的來自拜占庭的聖西里爾和美多德兄弟的敬意。學者們認為西里尔字母是由聖西里爾和美多德早期的門徒發展出來並規範化的。 在2007年1月1日歐盟東擴後,由於新加入的保加利亞使用西里尔字母,因此西里尔字母成為繼拉丁字母及希臘字母後的第三種歐盟官方字母。.

新!!: UTF-8和西里尔字母 · 查看更多 »

貝爾實驗室

#重定向 贝尔实验室.

新!!: UTF-8和貝爾實驗室 · 查看更多 »

貝爾實驗室九號計畫

貝爾實驗室九號計畫(Plan 9 from Bell Labs)是一个分布式操作系统,由贝尔实验室的计算科学研究中心在1980年代中期至2002年开发,以作为UNIX的后继者。它现在仍然被操作系统的研究者和爱好者开发使用。 Plan 9的特色功能有:将所有本地和远程资源以文件形式组织的9P协议,union mounts,改进的进程文件系统以及原生的Unicode支持。在Plan 9中,所有的系统接口(如网络和用户界面接口),都是作为文件系统的一部分呈现,而不像其他操作系统上一样拥有自己独立的接口。 Plan 9得名于艾德·伍德1959年拍摄的B级科幻电影外太空九号计划 ,而它的标志格伦达来自同一导演拍摄的另一部电影忽男忽女。.

新!!: UTF-8和貝爾實驗室九號計畫 · 查看更多 »

软件

軟體(software)是一系列按照特定顺序组织的電腦数据和指示,是電腦中的非有形部分。電腦中的有形部分稱為硬體,由電腦的外殼及各零件及電路所組成。電腦軟體需有硬體才能運作,反之亦然,軟體和硬體都無法在不互相配合的情形下進行實際的運作。 一般来說,计算机软件划分为程式語言、系统软件、应用软件和介于这两者之间的中介軟體。其中系统软件为计算机使用提供最基本的功能,但是并不针对某一特定应用领域。而应用软件则恰好相反,不同的应用软件根据用户和所服务的领域提供不同的功能。 软件包括所有在電腦執行的程式,和其架構無關,例如執行檔、函式庫及腳本語言都屬於软件。軟體不分架構,有其共通的特性,在執行後可以讓硬體執行依設計時要求的機能。軟體儲存在記憶體中,軟體不是可以碰觸到的實體,可以碰觸到的都只是儲存軟體的零件(記憶體)或是媒介(光碟或磁片等)。 软件并不一定只包括可以在计算机上运行的電腦程式,有些定義中,与電腦程式相关的文档,一般也被认为是软件的一部分。简单的说软件就是程式加文档的集合体。软件被应用于世界的各个领域,对人们的生活和工作都产生了深远的影响。.

新!!: UTF-8和软件 · 查看更多 »

阿拉伯字母

阿拉伯语字母,也作天方字母(أَبْجَدِيَّة عَرَبِيَّة,),为阿拉伯语的书写形式,类似于亚兰字母,除了阿拉伯语之外,世界上(尤其是伊斯兰教势力比较兴盛的地区)尚有别的语言使用阿拉伯字母,如波斯语、达里语、中国的维吾尔语、哈萨克语等等。在中国,回族地区偶尔也用阿拉伯字母记写汉语,这叫做“小儿经”。目前阿拉伯语字母是僅次於拉丁字母後世界上第二多人使用的拼音文字。 阿拉伯字母本身不包含短元音,所以在阿拉伯语和波斯语、达里语、普什图语等语言的很多书籍和杂志中,短元音并不被标出,所以人们必须从文中推测出这些元音。出现这种现象的原因是闪族语更多的使用辅音和长元音来区分词义。 值得注意的是,有的语言通过修订阿拉伯字母,使得所有的元音均可表示出来,人们阅读文章时不再从文中推测读音,例如维吾尔语。 阿拉伯字母属于亞蘭字母体系,共有28个表示辅音的字母,通常在《古兰经》,幼儿读物,或者给外国人阅读的书籍中才加元音符号。 阿拉伯语是连续书写的(从右到左),不同于每个文字都单独书写的象形文字,因此每个阿拉伯字母的书写形式会受到词法的影响。 在阿拉伯字母中,两个相同辅音相连,并且前一个读静音的时候,则在该字母上使用一个tashdeed(类似于w的符号)表明,称为叠音。 《古兰经》是用使用阿拉伯字母的古典阿拉伯语书写的,参看阿拉伯书法。.

新!!: UTF-8和阿拉伯字母 · 查看更多 »

阿拉伯语

阿拉伯语( al-ʻarabīyah 或者 ʻarabī )是除了英語、法語和西班牙語之外最多國家使用的官方語言。阿拉伯語源自公元6世纪的古典阿拉伯语。它包括书面语及流通于中东、北非和非洲之角(即索马里半岛)的各种口语。阿拉伯语属于亚非语系。 阿拉伯语的书面语称为“现代标准阿拉伯语”或“书面阿拉伯语”。书面阿拉伯语是目前唯一在官方及正式场合使用的阿拉伯语,用于大多数书面文件和讲座、新闻广播等正式讲话。但这亦因国家而异。1912年,在摩洛哥加入阿拉伯国家联盟之前,曾在正式场合使用过一段时间。 阿拉伯语属于,与亚拉姆语、希伯来语、乌加里特语和腓尼基语相近。阿拉伯语书面语不同于其所有地方的口语,且更为传统和保守。两者是双层语言的关系,用于不同的场合。 一些地方的阿拉伯语无论是书写还是口头形式,都无法互通。而所有地方的阿拉伯语被当作是一个整体。即是说,纯粹从语言学的角度来说,它们是不同的语言;但是从政治及民族的角度来说,他们又是一个整体。如果阿拉伯语被当作一个整体,则世界上估计有4.22亿人以其为母语。如果各地的阿拉伯语当作是不同的语言,则很难估计到底有多少种,因为它们是方言连续体,之间没有明确的界线。其中埃及阿拉伯语的使用人数最多,大约五千四百万人以其为母语——多于其他任何一种闪米特语言。 阿拉伯语是美国使用人数第12多的语言。 现代的书面语(现代标准阿拉伯语)源于古兰经的语言(即古典阿拉伯语),用于学校教学及工作、政府、媒体等场合。两者合起来被称为书面阿拉伯语,是伊斯兰教的。现代标准阿拉伯语的语法与古典阿拉伯语大体相同,词汇也有相同之处。但古典阿拉伯语的一些语法结构在现代标准阿拉伯语中不再使用,在口语中不使用的词汇也不在现代书面语中使用。而且现代书面语从口语中借入了一些词汇和语法现象。新的词汇大多用来表达近现代出现的概念。 阿拉伯语用阿拉伯字母从右往左书写。有时在非正式场合也可用拉丁字母从左往右书写,但没有统一的形式。 阿拉伯语往伊斯兰世界的语言(如波斯语、土耳其语、索马里语、波斯尼亞語、哈萨克语、孟加拉语、乌尔都语、马来语和豪萨语)輸出了大量词汇。中世纪时期,书面阿拉伯语成了欧洲文化的重要载体,特别是在科学、数学和哲学领域。这导致许多欧洲语言也从阿拉伯语中借入了大量词汇。阿拉伯语在词汇和语法方面对羅曼語族的语言(特别是西班牙语、葡萄牙语、加泰羅尼亞語和西西里語)影响很大。 阿拉伯语也从其他语言中借入了大量词汇,如早期从希伯来语、希腊语、波斯语、叙利亚语,中期从土耳其语,当代从欧洲语言(主要是英语和法语)。.

新!!: UTF-8和阿拉伯语 · 查看更多 »

肯·汤普逊

肯尼斯·蓝·汤普逊(Kenneth Lane Thompson,)小名肯·汤普逊(Ken Thompson),美国计算机科学学者和工程师。駭客文化圈子通常称他为“ken”。在贝尔实验室工作期间,汤普逊设计和实现了Unix操作系统。他创造了B语言——C语言的前身,而且他是Plan 9操作系统的创造者和开发者之一。2006年,汤普逊进入Google公司工作,与他人共同设计了Go语言。他與丹尼斯·里奇同為1983年圖靈獎得主。 此外,肯·汤普逊还参与过正则表达式和UTF-8编码的设计,改进了文本编辑器,创造了编辑器。他曾制造过专门用于下国际象棋的电脑“”,并建立了。.

新!!: UTF-8和肯·汤普逊 · 查看更多 »

通用字符集

通用字符集(Universal Character Set, UCS)是由ISO制定的ISO 10646(或称ISO/IEC 10646)标准所定义的标准字符集。 通用字符集又称Universal Multiple-Octet Coded Character Set,中国大陆译为通用多八位编码--集,台湾译为廣用多八位--元--組編碼--集。.

新!!: UTF-8和通用字符集 · 查看更多 »

附加符号

加符号或稱變音符號(diacritic、diacritical mark、diacritical point、diacritical sign),是指添加在字母上面的符號,以更改字母的發音或者以區分拼寫相似詞語。例如汉语拼音字母「ü」上面的两个小点,或「á」、「à」字母上面的标调符。 变音符号可以放在字母的上方或下方,也可以放在其他的位置。但是注意,並不是所有這些符號都是变音符号。例如字母i和j上面的點是字母本身的一部分,而不是变音符号。另外,在一種語言中,一個符號是变音符号,但是在另外一種語言中則不是。例如,在加泰罗尼亚语、葡萄牙语和西班牙语中,「u」和「ü」是相同的字母,但是在德语、爱沙尼亚语、匈牙利语、土耳其语、波兰语、维吾尔语和阿塞拜疆语中,它們表示不同的字母。.

新!!: UTF-8和附加符号 · 查看更多 »

GB 18030

GB 18030,全称:“国家标准GB 18030-2005《--》”,是中华人民共和国现时最新的变长度多字节字符集。对GB 2312-1980完全向后兼容,与GBK基本向后兼容;支持GB 13000(Unicode)的所有码位;共收录汉字70,244个。 GB 18030主要有以下特点:.

新!!: UTF-8和GB 18030 · 查看更多 »

GNU通用公共许可证

GNU通用公共授權條款(GNU General Public License,简称 GNU GPL、GPL)是廣泛使用的免費軟件許可證,可以保證終端用戶得自由運行,學習,共享和修改軟件。許可證最初由GNU項目的自由軟件基金會 (FSF)的理查德·斯托曼(Richard Matthew Stallman)撰寫,並授予計算機程序的收件人自由軟件定義的權利。 GPL是一個Copyleft許可證,這意味著衍生作品只能以相同的許可條款分發。 這與許可免費軟件許可證有所區別 ,其中BSD許可證和MIT許可證是廣泛使用的示例。 GPL是第一個普遍使用的Copyleft許可證。 歷史上,GPL許可證系列一直是免費和開源軟件領域最受歡迎的軟件許可之一。 根據GPL許可的優異自由軟件程序的例子有Linux內核和GNU編譯器集合 (GCC)。 David A. Wheeler認為,GPL提供的Copyleft對於基於Linux的系統的成功至關重要,給予向內核貢獻的程序員保證他們的工作將有益於整個世界並保持自由,而不至於被不提供回饋給社群的不肖軟件公司所剝削。 2007年,發布了第三版許可證(GNU GPLv3),以解決在長期使用期間發現的第二版(GNU GPLv2)所發生的一些困擾。 為了使許可證保持最新狀態,GPL許可證包含一個可選的“並延伸到未來版本”條款,允許用戶在FSF更新的原始條款或新版本之間進行選擇。 有些開發人員在軟件授權使用時,選擇省略它; 例如,Linux內核已經在GPLv2下獲得許可,就不需包括“並延伸到未來版本”的聲明。 GPL授予程序接受人以下權利,或稱“自由”,或稱“copyleft”:.

新!!: UTF-8和GNU通用公共许可证 · 查看更多 »

IBM

国际商业机器股份有限公司(International Business Machines Corporation,首字母縮略字:IBM,曾译万国商用机器公司)是美國一家跨國科技公司及諮詢公司,總部位於紐約州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM雖然是一家商業公司,但在材料、化学、物理等科学领域卻也有很高的成就,利用這些學術研究為基礎,发明很多产品。比较有名的IBM发明的产品包括硬盘、自動櫃員機、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。.

新!!: UTF-8和IBM · 查看更多 »

ISO/IEC 8859

ISO 8859,全称ISO/IEC 8859,是国际标准化组织(ISO)及国际电工委员会(IEC)联合制定的一系列8位元字符集的标准,现时定义了15个字符集。.

新!!: UTF-8和ISO/IEC 8859 · 查看更多 »

Java

Java是一種廣泛使用的電腦程式設計語言,擁有跨平台、物件導向、泛型程式設計的特性,广泛应用于企业级Web应用开发和移动应用开发。 任職於昇陽電腦的詹姆斯·高斯林等人于1990年代初开发Java語言的雛形,最初被命名为Oak,目標設定在家用电器等小型系統的程式语言,應用在电视机、电话、闹钟、烤面包机等家用电器的控制和通訊。由于这些智能化家电的市场需求没有预期的高,Sun公司放弃了该项计划。随着1990年代網際網路的发展,Sun公司看見Oak在網際網路上应用的前景,于是改造了Oak,於1995年5月以Java的名称正式发布。Java伴随着互联网的迅猛发展而发展,逐渐成为重要的网络编程语言。 Java编程语言的风格十分接近C++语言。继承了C++语言面向对象技术的核心,Java舍弃了C++语言中容易引起错误的-zh-hans:指针; zh-hant:指標;-,改以-zh-hans:引用; zh-hant:參照;-取代,同時移除了C++中的--和多重继承特性,改用接口取代,增加垃圾回收器功能。在Java SE 1.5版本中引入了泛型编程、类型安全的枚举、不定长参数和自动装/拆箱特性。昇陽電腦对Java语言的解释是:「Java编程语言是个简单、面向对象、分布式、解释性、健壮、安全与系统无关、可移植、高性能、多线程和动态的语言」 Java不同於一般的编译語言或直譯語言。它首先将源代码编译成字节码,然后依赖各种不同平台上的虚拟机来解释执行字节码,从而实现了“一次编写,到处运行”的跨平台特性。在早期JVM中,这在一定程度上降低了Java程序的运行效率。但在J2SE1.4.2发布后,Java的執行速度有了大幅提升。 与传统型態不同,Sun公司在推出Java時就将其作为开放的技术。全球数以万计的Java开发公司被要求所设计的Java软件必须相互兼容。“Java语言靠群体的力量而非公司的力量”是 Sun公司的口号之一,并获得了广大软件开发商的认同。这与微软公司所倡导的注重精英和封闭式的模式完全不同,此外,微软公司後來推出了与之竞争的.NET平台以及模仿Java的C#语言。後來Sun公司被甲骨文公司併購,Java也隨之成為甲骨文公司的產品。 現時,行動作業系統Android大部分的代碼採用Java 程式設計語言編程。.

新!!: UTF-8和Java · 查看更多 »

JavaScript

JavaScript,一种高级编程语言,通过解释执行,是一门动态类型,面向对象(基于原型)的直譯語言。它已经由ECMA(欧洲电脑制造商协会)通过ECMAScript实现语言的标准化。它被世界上的绝大多数网站所使用,也被世界主流浏览器(Chrome、IE、Firefox、Safari、Opera)支持。JavaScript是一门基于原型、函数先行的语言,是一门多范式的语言,它支持面向对象编程,命令式编程,以及函数式编程。它提供语法来操控文本、数组、日期以及正则表达式等,不支持I/O,比如网络、存储和图形等,但这些都可以由它的宿主环境提供支持。 虽然JavaScript与Java这门语言不管是在名字上,或是在语法上都有很多相似性,但这两门编程语言从设计之初就有很大的不同,JavaScript的语言设计主要受到了Self(一种基于原型的编程语言)和Scheme(一门函数式编程语言)的影响。在语法结构上它又与C语言有很多相似(例如if条件语句、while循环、switch语句、do-while循环等)。 在客户端,JavaScript在传统意义上被实现为一种解释语言,但在最近,它已经可以被即时编译(JIT)执行。随着最新的HTML5和CSS3语言标准的推行它还可用于游戏、桌面和移动应用程序的开发和在服务器端网络环境运行,如Node.js。.

新!!: UTF-8和JavaScript · 查看更多 »

Linux

Linux( )是一種自由和開放源碼的類UNIX作業系統。该操作系统的内核由林纳斯·托瓦兹在1991年10月5日首次发布。,在加上使用者空間的應用程式之後,成為Linux作業系統。Linux也是自由软件和开放源代码软件发展中最著名的例子。只要遵循GNU通用公共许可证(GPL),任何个人和机构都可以自由地使用Linux的所有底层源代码,也可以自由地修改和再发布。大多數Linux系統還包括像提供GUI的X Window之類的程序。除了一部分專家之外,大多數人都是直接使用Linux發行版,而不是自己選擇每一樣組件或自行設置。 Linux嚴格來說是單指作業系統的内核,因作業系統中包含了許多用戶圖形介面和其他实用工具。如今Linux常用来指基于Linux的完整操作系统,內核則改以Linux内核稱之。由于这些支持用户空间的系统工具和库主要由理查德·斯托曼于1983年发起的GNU计划提供,自由软件基金会提议将其组合系统命名为GNU/Linux,但Linux不屬於GNU計劃,這個名稱並沒有得到社群的一致認同。 Linux最初是作为支持英特尔x86架构的个人电脑的一个自由操作系统。目前Linux已经被移植到更多的计算机硬件平台,远远超出其他任何操作系统。Linux可以运行在服务器和其他大型平台之上,如大型主机和超级计算机。世界上500个最快的超级计算机90%以上运行Linux发行版或变种,包括最快的前10名超级电脑运行的都是基于Linux内核的操作系统。Linux也广泛应用在嵌入式系统上,如手机(Mobile Phone)、平板电脑(Tablet)、路由器(Router)、电视(TV)和电子游戏机等。在移动设备上广泛使用的Android操作系统就是建立在Linux内核之上。 通常情况下,Linux被打包成供个人计算机和服务器使用的Linux发行版,一些流行的主流Linux发布版,包括Debian(及其衍生版本Ubuntu、Linux Mint)、Fedora(及其相关版本Red Hat Enterprise Linux、CentOS)和openSUSE等。Linux发行版包含Linux内核和支撑内核的实用程序和库,通常还带有大量可以满足各类需求的应用程序。个人计算机使用的Linux发行版通常包含X Window和一个相应的桌面环境,如GNOME或KDE。桌面Linux操作系统常用的应用程序,包括Firefox网页浏览器、LibreOffice办公软件、GIMP图像处理工具等。由于Linux是自由软件,任何人都可以创建一个符合自己需求的Linux发行版。.

新!!: UTF-8和Linux · 查看更多 »

Mac OS X

#重定向 MacOS.

新!!: UTF-8和Mac OS X · 查看更多 »

MariaDB

MariaDB数据库管理系统是MySQL的一个分支,主要由开源社区在维护,采用GPL授权许可。开发这个分支的原因之一是:甲骨文公司收购了MySQL后,有将MySQL闭源的潜在风险,因此社区采用分支的方式来避开这个风险。 MariaDB的目的是完全兼容MySQL,包括API和命令行,使之能轻松成为MySQL的代替品。在存储引擎方面,10.0.9版起使用XtraDB(名稱代號為)来代替MySQL的InnoDB。 MariaDB由MySQL的创始人主导开发,他早前曾以10亿美元的价格,将自己创建的公司MySQL AB卖给了SUN,此后,随着SUN被甲骨文收购,MySQL的所有权也落入Oracle的手中。MariaDB名称来自麥克爾·維德紐斯的女儿瑪麗亞(Maria)的名字。.

新!!: UTF-8和MariaDB · 查看更多 »

Microsoft Windows

Microsoft Windows(中文有时譯作微軟--,通常不做翻译)是微軟公司推出的一系列操作系统。它問世於1985年,起初是MS-DOS之下的桌面環境,其後續版本逐漸發展成為主要为個人電腦和服务器用户設計的操作系統,并最终获得了世界个人电脑操作系統的垄断地位。此操作系統可以在几种不同类型的平台上运行,如个人电脑(PC)、移动裝置、服务器(Server)和嵌入式系統等等,其中在个人电脑的领域应用内最为普遍。在2004年國際數據資訊公司一次有关未来发展趋势的会议上,副董事长Avneesh Saxena宣布Windows拥有终端操作系统大约70%的市场份额 www.linuxworld.com.au。 Windows操作系統目前最新的穩定版是於2015年7月29日發佈的 Windows 10。Windows Server目前最新的穩定版是2016年9月26日發佈的Windows Server 2016。.

新!!: UTF-8和Microsoft Windows · 查看更多 »

MySQL

MySQL(官方發音為“My S-Q-L”,但也经常读作“My Sequel”)原本是一個開放源碼的關聯式資料庫管理系統,原開發者為瑞典的MySQL AB公司,该公司于2008年被昇陽微系統(Sun Microsystems)收购。2009年,甲骨文公司(Oracle)收购昇陽微系統公司,MySQL成为Oracle旗下产品。 MySQL在過去由于性能高、成本低、可靠性好,已经成为最流行的开源数据库,因此被廣泛地應用在Internet上的中小型網站中。随着MySQL的不断成熟,它也逐渐用于更多大规模网站和应用,比如维基百科、Google和Facebook等网站。非常流行的开源软件组合LAMP中的“M”指的就是MySQL。 但被甲骨文公司收購後,Oracle大幅調漲MySQL商業版的售價,且甲骨文公司不再支持另一個自由軟體專案OpenSolaris的發展,因此導致自由軟體社群們對於Oracle是否還會持續支援MySQL社群版(MySQL之中唯一的免費版本)有所隱憂,MySQL的創始人麥克爾·維德紐斯以MySQL為基礎,成立分支計劃MariaDB。而原先一些使用MySQL的開源軟體逐漸轉向MariaDB或其它的資料庫。例如维基百科已于2013年正式宣布将从MySQL迁移到MariaDB数据库。.

新!!: UTF-8和MySQL · 查看更多 »

Red Hat Linux

Red Hat Linux是由Red Hat公司發行的一个Linux发行套件。 Red Hat Linux可算是一個「中年」的Linux發行套件,其1.0版本於1994年11月3日發行。雖然其歷史不及Slackware般悠久,但比起很多的Linux發行套件,Red Hat的歷史悠久得多。 Red Hat Linux中的RPM软件包格式可以说是Linux社区的一个事实标准,被廣泛使用於其他Linux发行套件中。 以Red Hat Linux为基礎派生的Linux發行套件有很多,其中包括以桌面用戶為目標的Mandrake Linux(原為包含KDE的Red Hat Linux),Yellow Dog Linux(開始時為支援PowerPC的Red Hat Linux)和ASPLinux(對非拉丁字元有較好支援的Red Hat Linux)。 自从Red Hat 9.0版本发布后,Red Hat公司就不再开发桌面版的Linux发行套件,而将全部力量集中在服务器版的开发上,也就是Red Hat Enterprise Linux版。2004年4月30日,Red Hat公司正式停止對Red Hat 9.0版本的支援,標誌著Red Hat Linux的正式完結。原本的桌面版Red Hat Linux發行套件則與來自民間的Fedora計劃合併,成為Fedora Core發行版本。.

新!!: UTF-8和Red Hat Linux · 查看更多 »

Shift JIS

Shift_JIS是日本电脑系统常用的编码表,能容纳全形及半形拉丁字母、平假名、片假名、符号及日语汉字。 命名为Shift_JIS的原因,是在放置全形字符时,要避开原本在0xA1-0xDF放置的半角假名字符。 微软及IBM的日语电脑系统即使用了这个编码表,称为CP932。.

新!!: UTF-8和Shift JIS · 查看更多 »

SUSE

SUSE(發音/ˈsuːsə/)是Linux作業系統的發行版之一,也是德國的一個發行版。SUSE屬於Novell旗下的業務,它同時亦是Desktop Linux Consortium的發起成員之一。.

新!!: UTF-8和SUSE · 查看更多 »

Unicode

Unicode(萬國-)是電腦科學領域裡的一項業界標準。它对世界上大部分的文字系統進行了整理、編碼,使得電腦可以用更為簡單的方式來呈現和處理文字。 Unicode伴隨著通用字符集的標準而發展,同時也以書本的形式對外發表。Unicode至今仍在不斷增修,每個新版本都加入更多新的字符。目前最新的版本為2018年6月5日公布的11.0.0,已經收錄超過13萬個字符(第十萬個字符在2005年獲採納)。Unicode涵蓋的資料除了視覺上的字形、編碼方法、標準的字符編碼外,還包含了字符特性,如大小寫字母。 Unicode發展由非營利機構統一碼聯盟負責,該機構致力於讓Unicode方案取代既有的字符編碼方案。因為既有的方案往往空間非常有限,亦不適用於多語環境。 Unicode備受认可,並廣泛地應用於電腦軟體的國際化與本地化過程。有很多新科技,如可扩展置标语言(Extensible Markup Language,簡稱:XML)、Java程式語言以及現代的作業系統,都採用Unicode編碼。.

新!!: UTF-8和Unicode · 查看更多 »

Unicode字符平面映射

前的Unicode字元分為17組編排,每組稱為平面(Plane),而每平面擁有65536(即216)個代碼點。然而目前只用了少數平面。 要有更詳細的描述,請參閱:基本多文種平面與補充平面。.

新!!: UTF-8和Unicode字符平面映射 · 查看更多 »

Universal Character Set

#重定向 通用字符集.

新!!: UTF-8和Universal Character Set · 查看更多 »

USENIX

USENIX成立于1975年,当时的名字叫做Unix用户群,其主要目的是学习和开发Unix以及类似系统。1977 年 6 月,美国电话电报公司的律师告诉用户群他们不能继续使用UNIX这个名字,因为UNIX是美国电话电报公司所拥有的一个商标。所以这个用户群更名为“USENIX”。此后,USENIX逐渐发展成一个倍受尊敬的由计算机操作系统用户,开发者和研究者所组成的机构。USENIX从创建之初就出版一份技术杂志名叫 USENIX在其内为系统管理员另辟一个特殊兴趣小组,名叫大型系统安装管理会议。 USENIX每年赞助好几个学术会议和工作室会议,其中最有名的是USENIX操作系统设计与实现座谈会(OSDI),USENIX联网系统设计和实现座谈会(NSDI),USENIX安全座谈会,USENIX年度技术会议,USENIX文件和存储技术会议(FAST)。 USENIX的创始总裁名叫Lou Katz。.

新!!: UTF-8和USENIX · 查看更多 »

UTF-16

UTF-16是Unicode字符编码五层次模型的第三层:字符编码表(Character Encoding Form,也称为"storage format")的一种实现方式。即把Unicode字符集的抽象码位映射为16位长的整数(即码元)的--,用于数据存储或传递。Unicode字符的码位,需要1个或者2个16位长的码元来表示,因此这是一个变长表示。 UTF是"Unicode/UCS Transformation Format"的首字母缩写,即把Unicode字符转换为某種格式之意。UTF-16正式定義於ISO/IEC 10646-1的附錄C,而RFC2781也定義了相似的做法。.

新!!: UTF-8和UTF-16 · 查看更多 »

X/Open

X/Open是1984年由多个公司联合创建的一个用于定义和推进信息技术领域开放标准的公司,X/Open和開放軟體基金會合併為The Open Group,并在1993-1996管理UNIX这个商标。 Category:基金会 Category:自由軟件組織 Category:标准制订机构 Category:Unix Category:非营利组织.

新!!: UTF-8和X/Open · 查看更多 »

XML

可扩展标记语言(Extensible Markup Language,简称:XML),是一种标记语言。标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等。如何定义这些标记,既可以选择国际通用的标记语言,比如HTML,也可以使用像XML这样由相关人士自由决定的标记语言,这就是语言的可扩展性。XML是从标准通用标记语言(SGML)中简化修改出来的。它主要用到的有可扩展标记语言、可扩展样式语言(XSL)、XBRL和XPath等。.

新!!: UTF-8和XML · 查看更多 »

正则表达式

正则表达式(Regular Expression,在代码中常简写为regex、regexp或RE),又称--、正規表示法、正規運算式、規則運算式、常規表示法,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器裡,正則表达式通常被用来检索、替换那些符合某个模式的文本。 许多程序设计语言都支持利用正則表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正則表达式引擎。正則表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成regex,单数有regexp、regex,复数有regexps、regexes、regexen。.

新!!: UTF-8和正则表达式 · 查看更多 »

汉字

漢字,在中國亦称中文字、国字、唐字、方塊字,是漢字文化圈廣泛使用的一種文字,是世界上独有的一种指示会意文字--体系,也是世界上唯一仍被廣泛使用並高度發展的語素文字Defrancis (1990); 蔣為文 (2005), (2007)",為中國上古時代的汉族先民所發明創製,其字體也歷經過長久改進及演變。目前确切歷史,可追溯至約公元前1300年商朝的甲骨文、籀文、金文,再到春秋戰國與秦朝的籀文、小篆,發展至漢朝隸變,產生隶书、草书以及楷书(以及衍生的行书),至唐代楷化為今日所用的手寫字體標準——正楷,也是今日普遍使用的現代漢字。漢字在古文中只稱「字」,為與少數民族文字區別而稱「漢字」,指漢人使用的文字,後者稱法在近代才開始通用,為日文借詞。 作為華語的書寫文字,汉字是迄今为止连续使用时间最长的主要文字,也是上古时期各大文字体系中唯一传承至今的,相较而言,古埃及、古巴比伦、古印度文字都早已消亡,所以有學者認為漢字是維繫中國南北長期處於統一狀態的關鍵元素之一,亦有學者將漢字列為中國第五大發明。中國歷代皆以漢字為主要官方文字,現時在中華民國與中華人民共和國均為實務上的官方文字。漢字在古代已發展至高度完備的水準,不單中國使用,在很長時期內還充當東亞地區唯一的國際通用文字,在20世紀前都是朝鮮半島、越南、琉球和日本等國家的書面規範文字。除了漢語之外,古代東亞諸國都有一定程度地自行創製漢字。 現代漢語漢字大致分成中文字與簡體字兩個體系,前者主要用於香港、澳門以及臺灣,而後者由中国大陆制定使用,并为新加坡、馬來西亞、印度尼西亚等國家采用。非漢語体系中,日本对部分汉字进行了简化、称为新字体,韓國也製定了官方的朝鮮漢字使用規範;而歷史上曾使用過漢字的越南、北韓、蒙古等國,漢字現今已不再具有官方規範地位。 華语及簡化汉字是聯合國的六個工作語言之一。.

新!!: UTF-8和汉字 · 查看更多 »

最高有效位

最高有效位(Most Significant Bit,msb),是指一个n位二进制数字中的n-1位,具有最高的权值2^。与之相反的称之为最低有效位。在大端序中,msb即指最左端的位。 对于有符号二进制数,负数采用反码或补码形式,此时msb用来表示符号,msb为1表示负数,0表示正数。 MSB(全大写)有时也指Most Significant Byte,指多字节序列中具有最大权重的字节。.

新!!: UTF-8和最高有效位 · 查看更多 »

新泽西州

新澤西州(State of New Jersey),或譯為--州,是美國第四小以及人口密度最高的州,邮政縮寫NJ。其命名源自位於英吉利海峽中的澤西島;其暱稱為“花園州”。 新泽西州通常被劃分在美国的中大西洋地區;亦為东部的一个州;也可以劃分為東北部區域下。北接紐約州,東面大西洋,南向德拉瓦州,並西臨賓夕法尼亞州。新澤西部份地區是被劃分在幾個主要都會區之下,其中屬紐約都會區最大,其他還有費城以及德拉瓦河谷地區。本州海拔最高處是(High Point)。其海拔為550公尺(1803英尺)。 在美洲原住民於美洲活動了11,000-50,000年之後,瑞典和荷蘭殖民者於17世紀先後來到新澤西。之後,英國殖民者爵士與勛爵從瑞典和荷蘭殖民者處取得了新澤西地區的控制權。在美國獨立戰爭之中,有許多重要的戰役即是在新澤西各地發生的。於19世紀時,許多類似派特森市的城市對幫助推動美國的工業革命有著相當重要的貢獻。進入20世紀後,新泽西州的經濟於1920年代快速繁榮。但由於1930年代的大蕭條,經濟隨之沉淪而下。新泽西州的地理位置恰好位於波士頓-華盛頓城市帶這一超級都會區群的正中央,並被紐約市、費城、巴爾的摩、以及哥倫比亞特區等大都會區所圍繞。這種便利的地理位置更促使1950年代後的郊區的快速產生與發展。.

新!!: UTF-8和新泽西州 · 查看更多 »

文件系统

计算机的文件系统是一种存储和组织计算机数据的方法,它使得对其存取和查找变得容易,文件系统使用文件和树形目录的抽象逻辑概念代替了硬盘和光盘等物理设备使用数据块的概念,用户使用文件系统来保存数据不必关心数据实际保存在硬盘(或者光盘)的地址为多少的数据块上,只需要记住这个文件的所属目录和文件名。在写入新数据之前,用户不必关心硬盘上的那个块地址没有被使用,硬盘上的存储空间管理(分配和释放)功能由文件系统自动完成,用户只需要记住数据被写入到了哪个文件中。 文件系统通常使用硬盘和光盘这样的存储设备,并维护文件在设备中的物理位置。但是,实际上文件系统也可能仅仅是一种存取資料的界面而已,实际的数据是通过网络协议(如NFS、SMB、9P等)提供的或者内存上,甚至可能根本沒有对应的文件(如proc文件系统)。 严格地说,文件系统是一套实现了数据的存储、分级组织、存取和获取等操作的抽象数据类型(Abstract data type)。.

新!!: UTF-8和文件系统 · 查看更多 »

操作系统

操作系统(operating system,縮寫作 OS)是管理计算机硬件與软件資源的计算机程序,同时也是计算机系统的核心与基石。操作系统需要处理如管理與配置内存、決定系統資源供需的優先次序、控制輸入與輸出裝置、操作网络與管理文件系统等基本事務。操作系统也提供一個讓使用者與系統互動的操作界面。 操作系统的型態非常多樣,不同機器安裝的操作系统可從簡單到複雜,可從行動電話的嵌入式系统到超級電腦的大型作業系統。許多操作系统製造者對它涵盖范畴的定义也不尽一致,例如有些操作系统整合了图形用户界面,而有些僅使用命令行界面,而將图形用户界面視為一種非必要的應用程式。 操作系统理论在计算机科学中,為歷史悠久的分支;。.

新!!: UTF-8和操作系统 · 查看更多 »

数据压缩

在计算机科学和信息论中,数据压缩或者源编码是按照特定的编码机制用比未经编码少的数据位元(或者其它信息相关的单位)表示信息的过程。例如,如果我们将「compression」编码为「comp」那么这篇文章可以用较少的数据位表示。常見的例子是ZIP文件格式,此格式不仅仅提供压缩功能,还可作为归档工具(Archiver),能够将许多文件存储到同一个文件中。.

新!!: UTF-8和数据压缩 · 查看更多 »

拉丁字母

拉丁字母(也稱為罗马字母)是多數歐洲語言采用的字母系统,是世界上最通行的字母文字系統。拉丁字母作為羅馬文明的成果之一,隨著征服推廣到西歐廣大地區。.

新!!: UTF-8和拉丁字母 · 查看更多 »

拉丁语

拉丁语(lingua latīna,),羅馬帝國的奧古斯都皇帝時期使用的書面語稱為「古典拉丁語」,屬於印欧语系意大利語族。是最早在拉提姆地区(今意大利的拉齐奥区)和罗马帝国使用。虽然现在拉丁语通常被认为是一种死语言,但仍有少数基督宗教神职人员及学者可以流利使用拉丁语。罗马天主教传统上用拉丁语作为正式會議的语言和礼拜仪式用的语言。此外,许多西方国家的大学仍然提供有关拉丁语的课程。 在英语和其他西方语言创造新词的过程中,拉丁语一直得以使用。拉丁语及其后代罗曼诸语是意大利语族中仅存的一支。通过对早期意大利遗留文献的研究,可以证实其他意大利语族分支的存在,之后这些分支在罗马共和国时期逐步被拉丁语同化。拉丁语的亲属语言包括法利斯克语、奥斯坎语和翁布里亚语。但是,威尼托语可能是一个例外。在罗马时代,作为威尼斯居民的语言,威尼托语得以和拉丁语并列使用。 拉丁语是一种高度屈折的语言。它有三种不同的性,名词有七格,动词有四种词性变化、六种时态、六种人称、三种语气、三种语态、两种体、两个数。七格当中有一格是方位格,通常只和方位名词一起使用。呼格与主格高度相似,因此拉丁语一般只有五个不同的格。不同的作者在行文中可能使用五到七种格。形容词与副词类似,按照格、性、数曲折变化。虽然拉丁语中有指示代词指代远近,它却没有冠词。后来拉丁语通过不同的方式简化词尾的曲折变化,形成了罗曼语族。 拉丁语與希腊语同為影響歐美學術與宗教最深的语言。在中世纪,拉丁语是当时欧洲不同国家交流的媒介语,也是研究科学、哲学和神學所必须的语言。直到近代,通晓拉丁语曾是研究任何人文学科教育的前提条件;直到20世纪,拉丁语的研究才逐渐衰落,重点转移到对當代语言的研究。.

新!!: UTF-8和拉丁语 · 查看更多 »

重定向到这里:

UTF8Utf-8Utf8

传出传入
嘿!我们在Facebook上吧! »