我们正在努力恢复Google Play商店上的Unionpedia应用程序
传出传入
🌟我们简化了设计以优化导航!
Instagram Facebook X LinkedIn

UTF-8

指数 UTF-8

UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,也是一种前缀码。它可以用來表示Unicode標準中的任何字元,且其編碼中的第一個位元組仍與ASCII相容,這使得原來處理ASCII字元的軟體無須或只須做少部份修改,即可繼續使用。因此,它逐漸成為電子郵件、網頁及其他儲存或傳送文字的應用中,優先採用的編碼。 UTF-8使用一至六個位元組為每個字符編碼(尽管如此,2003年11月UTF-8被RFC 3629重新规范,只能使用原来Unicode定义的区域,U+0000到U+10FFFF,也就是说最多四個字节):.

目录

  1. 116 关系: ANSI转义序列APE tagß压缩软件比较偽春菜十六进制编辑器比较字符字符编码字符集探测字面常量 (C语言)属性列表左至右符號不换行空格中文亂碼中文資訊交換碼中文軟體交換碼亂碼代理自动配置代码代码页位元組順序記號德语快速路徑俄语內碼克罗地亚语和波斯尼亚语字母BencodeC++11Canonical XMLCassandraCEDICTC风格字符串ChatZilla码位简体中文简化字網誌繁体字羅勃·派克百分号编码DokuWikiElixirEmacsEPUB香港增補字符集記事本诺基亚7210 Classic貝爾實驗室九號計畫越南文字母... 扩展索引 (66 更多) »

ANSI转义序列

ANSI转义序列是一种的转义序列标准,用于控制视频文本终端上的光标位置、颜色和其他选项。在文本中嵌入确定的字节序列,大部分以ESC转义字符和".

查看 UTF-8和ANSI转义序列

APE tag

APE tag是一種用來描述数字音乐檔案元数据的標籤。起初是為了讓Monkey's Audio使用而開發,不過目前已經有Musepack、WavPack、 OptimFROG,以及TAK等其他音樂檔案格式使用。.

查看 UTF-8和APE tag

ß

ß,是德文字母之一,德語讀作 eszett(也就是德語字母S和Z的連讀,國際音標讀作),又稱為 scharfes S(清S)。這個字母在世界目前的語言和書寫格式僅有德語字母採用。ß是在特殊的狀況下從ss演變而來,在無法使用ß書寫的場合,例如其他語言的電腦使用者不方便輸入此字母時,可以「ss」代替。之前,ß在西方字母中也是比較特殊的一個,它只有小寫體,而且沒有相互對應的大寫字母。2008年4月,Unicode正式收录了其大写字母。.

查看 UTF-8和ß

压缩软件比较

下列的表格比較各数据压缩软件的一般及技術性資料。欲知詳情,請參見各產品的條目。本條目並不包含全部資料,亦不一定是最新資訊。除非於註腳中另有指定,否則一切比較,皆基於穩定版及沒有其他增益集、附加元件、附加程式、擴充套件或外部程式。.

查看 UTF-8和压缩软件比较

偽春菜

偽春菜,常見的別名又稱伺か、何か、任意、さくら。是一種電腦的桌面程式。視其功能的不同,從站在那陪使用者聊聊天解解悶,或報時對時收郵件,甚至處理電腦中大大小小的事都有可能辦到。常見的搭配是一位少女加上一隻使魔。但也有些奇奇怪怪的搭配(例如沒有使魔、男性、或甚至是兄貴)。 註:由於偽春菜的發展幾乎都是在網際網路上的交流,所以下文中所提到的人名幾乎都是暱稱。.

查看 UTF-8和偽春菜

十六进制编辑器比较

以下表格比较常用的十六进制编辑器。.

查看 UTF-8和十六进制编辑器比较

字符

在電腦和電信領域中,字符(Character)是一個資訊單位。對使用字母系統或音節文字等自然語言,它大約對應為一個音位、類音位的單位或符號。簡單來講就是一個漢字、假名、韓文字……,或是一個英文、其他西方語言的字母。 字符的例子有:字母、數字系統或標點符號。另外有所謂控制字符的概念,它是指:並不對應到自然語言中的某個特定符號,而是對應到語言中一些用來處理文句的概念(類似排版)。例子為列印機或其它顯示設備的命令,如Enter或Tab。.

查看 UTF-8和字符

字符编码

字符编码(Character encoding)、字集碼是把字符集中的字符编码为指定集合中某一对象(例如:比特模式、自然数序列、8位元组或者电脉冲),以便文本在计算机中存储和通过通信网络的传递。常见的例子包括将拉丁字母表编码成摩斯电码和ASCII。其中,ASCII将字母、数字和其它符号編號,並用7位元的二进制來表示这个整数。通常會額外使用一个扩充的位元,以便于以1个字节的方式存储。 在计算机技术发展的早期,如ASCII(1963年)和EBCDIC(1964年)这样的字符集逐漸成為標準。但这些字符集的局限很快就变得明显,于是人们开发了許多方法来扩展它们。对于支持包括东亚CJK字符家族在内的写作系统的要求能支持更大量的字符,并且需要一种系统而不是临时的方法实现这些字符的编码。.

查看 UTF-8和字符编码

字符集探测

字符编码探测、字符集探测又稱為代码页检测是個启发式猜测代表文字的一系列字节的字符编码。其算法通常依据对字节样式的统计分析。这并不是一个万无一失的方法因为它依赖于统计数据——比如有些Windows版本会误把ASCII编码的"Bush hid the facts"当作中文UTF-16LE。 为数不多的能可靠探测的情况之一是探测UTF-8。这是因为UTF-8中有大量的无效字节序列,所以当其他编码方式使用字节中的高位bit时极不可能通过UTF-8有效性测试。不幸的是不完善的字符集探测程序不优先进行可靠的UTF-8测试于是把UTF-8定为其他编码。.

查看 UTF-8和字符集探测

字面常量 (C语言)

字面常量(literal constant),是C程序设计语言与C++语言的词法上的概念(lexical conventions),是指源程序中表示固定值的符号(token)。 下述内容遵从C11与C++11语言标准。.

查看 UTF-8和字面常量 (C语言)

属性列表

在OS X的Cocoa,NeXTSTEP和GNUstep编程框架中,属性列表(Property List)文件是一种用来存储序列化后的对象的文件。属性列表文件的文件扩展名为.plist,因此通常被称为plist文件。 Plist文件通常用于储存用户设置,也可以用于存储捆绑的信息,该功能在旧式的Mac OS中是由资源分支提供的。.

查看 UTF-8和属性列表

左至右符號

左至右符號(Left-to-right mark,LRM)是一種控制字符,或者說是不可見的排版符號。用于計算機的雙向文稿排版中。雙向文稿是指包含左至右的文字(如:英文或天城文),及右至左的文字(如:阿拉伯文或希伯來文)。.

查看 UTF-8和左至右符號

不换行空格

不换行空格是一个空格字符,用途是禁止自动换行。HTML页面显示时会自动合并多个连续的空白字符(whitespace character),但该字符是禁止合并的,因此该字符也称作“硬空格”(hard space、fixed space)。Unicode码点为:。.

查看 UTF-8和不换行空格

中文亂碼

中文亂碼是中文系統的一種現象,這在過去未有一套統一的中文內碼標準時,情況尤其嚴重。而隨着互聯網的普及,兩岸之間或世界各地用戶交流之際,亂碼現象亦因為各方使用的內碼不同而產生相衝的現象。.

查看 UTF-8和中文亂碼

中文資訊交換碼

中文資訊交換碼(Chinese Character Code for Information Interchange,簡稱CCCII)是於中華民國政府為使中文資訊交換更加便利化,所發展的字符集和編碼方案,作為中文交換碼之用途。但由於此方案不如CNS 11643般是官方標準;更因為每個字要用上三個位元組儲存,較Big5花儲存空間,沒被電腦業界接納。現在只用於台灣、美國各大學圖書館檢索系統。香港各大學圖書館在2003年由舊有的CCCII系統換成UTF-8。.

查看 UTF-8和中文資訊交換碼

中文軟體

中文軟體指的是專門為了中文資訊處理使用所設計的軟體。包含但不侷限於中文系統(外掛)、中文輸入法、中文字形、中文自然語言處理、中文編程語言,如周蟒(ZhPy)等。.

查看 UTF-8和中文軟體

交換碼

交換碼是指用於交換文件所使用的編碼。 對於計算機而言,不同的系統有可能使用不同的內碼。但如果不同系統間要交換文件,則會發生亂碼現象。解決方法則為,在交換文件前,文件提供者先將由內碼形式儲存的文件轉換成交換碼形式再做交換。在接收文件後,文件接收者再由交換碼轉成內碼。 為了方便起見,許多系統的內碼則直接使用交換碼,如ASCII廣為各種系統所使用。.

查看 UTF-8和交換碼

亂碼

乱码指的是電腦系統不能顯示正確的字符,而顯示其他無意義的字符或空白,如一堆ASCII代碼。这样所顯示出來的文字統稱為亂碼。 乱码是因为「所使用的字符的源码在本地计算机上使用了错误的显示字库」,或在本地计算机的字库中找不到相应于源码所指代的字符所致。不同国家和地区的文字字库采用了相同的一段源码,或是源文件中因为文件受到破坏,致使计算机默认提取的源码错误,或是计算机没有安装相应字库,都有可能产生乱码。 例如,微软编译器产生“烫烫烫”“屯屯屯”乱码,编码字符集转换产生的“锟斤拷”“毺絞銝”“脣銝餌”乱码。如果是台湾(BIG-5)会显示“昍昍昍”,日本(Shift-JIS)会显示“フフフフフフ”。.

查看 UTF-8和亂碼

代理自动配置

代理自动配置(Proxy auto-config,简称PAC)是一种网页浏览器技术,用于定义浏览器该如何自动选择适当的代理服务器来访问一个网址。 一个PAC文件包含一个JavaScript形式的函数“FindProxyForURL(url, host)”。这个函数返回一个包含一个或多个访问规则的字符串。用户代理根据这些规则适用一个特定的代理器或者直接访问。当一个代理服务器无法响应的时候,多个访问规则提供了其他的后备访问方法。浏览器在访问其他页面以前,首先访问这个PAC文件。PAC文件中的URL可能是手工配置的,也可能是是通过网页的网络代理自动发现协议(WPAD)自动配置的。.

查看 UTF-8和代理自动配置

代码

在通信和資訊處理中,代码(code)是指一套转换信息的规则系统,例如将一个字母、單詞、声音、图像或手势转换为另一种形式或表达,有时还会缩短或加密以便通过某种信道或存储媒体通信。一个最早的例子是語言的发明,它使人可以通过说话将他看到、听到、感受到或想到的事情表达给其他人。但是,说话的通信范围局限于声音可以有效传播、辨识的范围,并且发言只能传达给现有的听众。将言谈转化为视觉符号的寫作扩大了跨越时间、空间的通信表达。代码有时亦称代号等。 而编码(encoding)能将的信息转化为便于通信或存储的符号。解码(Decoding)则是将其逆向还原的过程,将代码符号转化回收件人可以理解的形式。 编码的其中一个原因是在、口语或写作难以实现实现的情况下进行通信。例如,旗语可以用特定标记表达特定信息,站在远处的另一个人可以解读标识来重现该信息。.

查看 UTF-8和代码

代码页

代码页是字符编码的别名,也稱「內碼表」,是特定语言的字符集的一张表。.

查看 UTF-8和代码页

位元組順序記號

位元組順序記號(byte-order mark,BOM)是位於碼點U+FEFF的統一碼字符的名称。當以UTF-16或UTF-32來將UCS/統一碼字符所組成的字串編碼時,這個字符被用來標示其位元組序。它常被用來當做標示文件是以UTF-8、UTF-16或UTF-32編碼的記號。.

查看 UTF-8和位元組順序記號

德语

德语(德语:Deutsch,)是印欧语系西日耳曼語支的一门语言。以使用國家數量來算是世界排名第六的語言,也是世界大國語言之一以及欧盟内使用最广的母语,德语拥有9000万到9800万使用者。德语标准共同语的形成可以追溯到马丁·路德对拉丁文《圣经》的翻译工作。大多数德语词汇源于印欧语系日耳曼语族的语言,一些词汇来自拉丁语和希腊语,还有部分来自法语和英语。 德语母语使用者的主要分布在德国、奥地利、瑞士北部、列支敦士登和卢森堡。欧洲许多地区(如意大利北部、比利时东部以及波兰等地)和作为原德国殖民地的纳米比亚也有大量的德语使用者,主要为作为当地少数民族的日耳曼人。 德语书写使用拉丁字母。德文字母除去标准的26个拉丁字母外,另有三个带分音符的元音Ä/ä、Ö/ö、Ü/ü以及一个特殊字母ß。.

查看 UTF-8和德语

快速路徑

在程式設計中,快速路徑(fast path)是指在一個程式中比起一般路徑有更短的路徑。有效的快速路徑會在處理最常出現的的情形上比一般路徑更有效率,讓一般路徑處理特殊情形、邊角情形、錯誤處理與其它反常狀況。快速路徑是的一種形式。.

查看 UTF-8和快速路徑

俄语

俄语(russkij jazyk,发音)為聯合國官方語言之一。俄語属于斯拉夫语族的东斯拉夫语支,是斯拉夫语族中使用人数最多的语言,是俄羅斯、白俄羅斯、吉尔吉斯斯坦及哈萨克斯坦的官方語言,主要在俄羅斯等前苏联加盟共和国中使用,且在華沙公約組織的成员国裡曾經被学校广泛列为第一外语教学。在蘇联時代,苏联加盟共和国和自治共和国非常强调俄语的重要性。虽然这些苏联的加盟共和国现在很多开始强调使用当地语言的重要性,在部分國家俄語已不再是官方語言,但俄语仍然是这些地区最广泛使用的共通语言。俄语屬於印欧语系,是东斯拉夫语支中三個目前仍在使用的語言之一。目前發現最早的古東斯拉夫語文字是在第十世紀的內容。 俄语是歐亞大陸中分布區域最廣的語言,也是斯拉夫語中最多人使用的語言。俄语也是歐洲最多人使用的母語,是俄羅斯、白俄羅斯、烏克蘭1.44億人的母語。俄语是母語人口排名的第八名,是以人口排列的語言列表中的第七名。.

查看 UTF-8和俄语

內碼

在計算機科學及相關領域當中,內碼指的是「將資訊編碼後,透過某種方式儲存在特定記憶裝置時,裝置內部的編碼形式」。在不同的系統中,會有不同的內碼。 在以往的英文系統中,內碼為ASCII。 在繁體中文系統中,目前常用的內碼為大五碼。在簡體中文系統中,內碼則為國標碼。 為了軟體開發方便,如國際化與本地化,現在許多系統會使用Unicode做為內碼,常見的作業系統Windows、Mac OS X、Linux皆如此。許多程式語言也採用Unicode為內碼,如Java、Python 3。.

查看 UTF-8和內碼

克罗地亚语和波斯尼亚语字母

克罗地亚语和波斯尼亚语采用相同的拉丁字母表,这个字母表也是在南斯拉夫解体之前的塞尔维亚-克罗地亚语的两种文字之一,源自克罗地亚语言学家和政治家(Ljudevit Gaj)在1830年写成的书 Kratka osnova horvatsko-slavenskog pravopisanja(克罗地亚-斯拉夫拼字法的一个简短刚要)。一个稍为修改过的字母版本亦用来书写斯洛文尼亚语。 它包含30个大写和小写字母。下表附了塞尔维亚语使用的西里尔字母以作对比: 原本的盖伊字母还有一个二合字母 ,后来被 取代。.

查看 UTF-8和克罗地亚语和波斯尼亚语字母

Bencode

Bencode(發音為Bee-Encode)是BitTorrent用在傳輸資料結構的編碼方式。這種編碼方式支援四種資料型態:.

查看 UTF-8和Bencode

C++11

C++11,先前被稱作C++0x,即ISO/IEC 14882:2011,是C++程式語言的一个標準。它取代第二版標準ISO/IEC 14882:2003(第一版ISO/IEC 14882:1998公開於1998年,第二版於2003年更新,分别通稱C++98以及C++03,两者差异很小),且已被C++14取代。相比于C++03,C++11標準包含核心語言的新機能,而且擴展C++標準程式庫,併入了大部分的C++ Technical Report 1程式庫(數學的特殊函式除外)。 ISO/IEC JTC1/SC22/WG21 C++標準委員會計劃在2010年8月之前完成對最終委員會草案的投票,以及於2011年3月召開的標準會議完成國際標準的最終草案。然而,WG21預期ISO將要花費六個月到一年的時間才能正式發佈新的C++標準。為了能夠如期完成,委員會決定致力於直至2006年為止的提案,忽略新的提案。最终于2011年8月12日公布,并于2011年9月出版。 2012年2月28日的國際標準草案是最接近于C++11标准的草案,差异仅有编辑上的修正。 像C++這樣的程式語言,透過一種演化的的過程來發展其定義。這個過程不可避免地將引發與現有程式碼的相容問題,在C++的發展過程中偶爾會發生。不過根據比雅尼·斯特劳斯特鲁普(C++的創始人並且是委員會的一員)表示,新的標準將幾乎100%相容於現有標準。.

查看 UTF-8和C++11

Canonical XML

Canonical XML(规范化形式的XML)XML规范的一个子集。任何XML文档都可以转换为规范化形式的XML,因此将特定类型的微小差异去除却仍是该XML文档。由于这些特定的差异通常不认为是有意义的,转换成规范化形式的XML是判断两个XML文档逻辑上是否是同一个文档的好办法。 举例来说,XML允许在开始标签(tag)的不同点出现,属性可以按任何顺序书写,这些差异很少用来表达含义,因此这些形式通常被认为是相等的 在将一个任意XML文档到规范化形式的XML的转换中,属性将按标准书序(名字的字母顺序)排列,空格和引号被标准化。 这样上面的第二种形式将转换成第一种。 Canonical XML定义了一些规范化形式的规则,包括:.

查看 UTF-8和Canonical XML

Cassandra

Apache Cassandra(社区内一般简称为C*)是一套开源分布式NoSQL数据库系统。它最初由Facebook开发,用于储存收件箱等简单格式数据,集Google BigTable的数据模型与Amazon Dynamo的完全分布式架构于一身。Facebook于2008将 Cassandra 开源,此后,由于Cassandra良好的可扩展性和性能,被 Apple, Comcast,Instagram, Spotify, eBay, Rackspace, Netflix等知名网站所采用,成为了一种流行的分布式结构化数据存储方案。 在数据库排行榜“DB-Engines Ranking”中,Cassandra排在第七位,是非关系型数据库中排名第二高的(仅次于MongoDB)。.

查看 UTF-8和Cassandra

CEDICT

CEDICT計畫由Paul Denisowski由1997年開創,目標是提供一份以漢語拼音為中文輔助的漢英辭典。.

查看 UTF-8和CEDICT

C风格字符串

C风格字符串特指在C语言中字符串的存储方式。 在编程语言中,常常需要表示一段字符,如“今天你吃了么”,“how are you?”,“afjsa234234(*&(*(”等等。同一种字符串的写法在不同的编程语言中表示的字面值都是一样的,即引号中间的内容,但是在存储的处理上往往不一样。.

查看 UTF-8和C风格字符串

ChatZilla

ChatZilla是一个基于Mozilla网络浏览器的IRC客户端软件,它是由XUL和JavaScript语言编写的。ChatZilla程序本身十分轻巧,同时由于它是基于Mozilla网络浏览器,所以ChatZilla是跨平台的,可以支持多操作系统下的使用。ChatZilla支持大部IRC客户端软件的特性,如可以同时连接多个IRC服务器,支持UTF-8等等。ChatZilla支持JavaScript作为脚本语言。ChatZilla可以作为Firefox,Mozilla,SeaMonkey网络浏览器的插件使用。.

查看 UTF-8和ChatZilla

码位

在字符编码术语中,码位或称编码位置,即英文的code point或code position,是组成码空间(或代码页)的数值。 例如,ASCII码包含128个码位,范围是016进制到7F16进制,扩展ASCII码包含256个码位,范围是016进制到FF16进制,而Unicode包含1,114,112个码位,范围是016进制到10FFFF16进制。Unicode码空间划分为17个Unicode字符平面(基本多文种平面,16个辅助平面),每个平面有65,536(.

查看 UTF-8和码位

简体中文

体中文(Simplified Chinese,網頁語言代碼:zh-Hans),传统上使用GB2312、GBK或GB18030编码(但亦有使用UTF-8等编码),作为计算机术语在计算机媒介上被广泛使用,如各种软件操作界面或文档的“简体中文版”。而“繁体中文版”(又称“正体中文版”,通常使用“BIG5编码”)是另一个独立中文版本,跟简体中文版互不相容。 「簡體字」是中華民國《第一批简体字表》所用的名稱(中華人民共和國官方的稱呼上一向是「簡化字」,參考《简化字总表》)。由於使用簡體中文软件的主要是针对中国大陆用户,故而这里的“簡體中文”事实上等同于“GB2312编码”或“GB18030编码”,意即絕大部份軟件的“簡體中文版”采用中国普通话的汉字编码,特别是IT术语的翻譯,与海外之简体中文也不尽相同。 中国大陸官方标准「汉字」的正式稱呼是「規範漢字」(包括簡化字和传承字),目前简化字主要在中国大陆、新加坡以及少部分东南亚的华人社区中使用。至于马来西亚,当地各大华文报刊和官方文字采取“简繁并用”(即标题繁体,内容简体),而当地华校则教授简体中文。需要注意的是中国大陆官方将简化之前的本字称作“繁体字”。由于人们对“简化字”、“简体字”与“简体中文”等术语的混淆,简体中文也常被泛指以「規範漢字」书写的现代标准汉语。在这种情况下,“簡體中文”與“繁體中文”都没有需要遵从任何一个地方的语文规范。而在现代标准汉语的规范下,只能视作个人的用字用语习惯不同,而非作为两种语文标准。 在中國大陸,仍有一些漢字並未被簡化而继续沿用,這些與繁體中文共通的漢字被称为传承字。.

查看 UTF-8和简体中文

简化字

化字(simplified Hanzi《计算机科学技术名词》(第二版),simplified Chinese characters),指大陆地區的汉字简化过程中已经被简化了的汉字。目前《通用规范汉字表》中收录的简化字是大陆地區最新的简化字规范。 《简化字总表》中收录的简化字大约有两千二百余个,《通用规范汉字表》中大约有简化字两千五百左右。 大多数汉字并没有被简化,被称为傳承字。 在不同的语言背景之下,简化字有时会被不精确的称为殘体字、简笔字或者俗体字。 简化字的字形一些是古來有之,如「--」與「--」本義相同,是異體字的關係,並主要來自于行书与草书的楷书化、許多偏旁等來自草書,其類推簡化字也因而來自草書。 自1976年起,新加坡教育部发布的简体字表与大陆的简化字完全相同。.

查看 UTF-8和简化字

網誌

網誌(Blog)是一種由个人管理、張貼新的文章、圖片或影片的網站或線上日記,用來紀錄、抒發情感或分享資訊林東清,管理資訊系統,。網誌上的文章通常根據張貼時間,以倒序方式由新到舊排列。 许多博客作者專注评论特定的--或新闻,其他則作为個人日记。一个典型的博客结合了文字、--、其他博客或网站的超連結、及其它與主题相关的媒体。能够让读者以互动的方式留下意见,是许多博客的重要要素。大部分的博客內容以文字为主,也有一些博客專注艺术、攝影、视频、音乐、播客等各種主題。網誌是社会媒体网络的一部分。.

查看 UTF-8和網誌

繁体字

本文介绍的是与简化字对应的汉字字汇。 繁体字(unsimplified Hanzi《计算机科学技术名词》(第二版),unsimplified Chinese characters),与简化字相对,指已有简化字代替的通常笔画较多的汉字。计算机科学技术百科全书 清华大学出版社 277页在实际生活中谈到的繁体字,实际上是指繁体字和传承字的集合。 ,或作傳統中文,與簡體中文(Simplified Chinese)相對,是使用繁體字作为書寫的最基本單元的文字系统。.

查看 UTF-8和繁体字

羅勃·派克

羅勃特·派克(Robert C. Pike,),暱稱為羅勃·派克(Rob Pike),來自加拿大的程式設計師,曾經加入貝爾實驗室,為 UNIX小組的成員。曾經參與過貝爾實驗室九號計畫、Inferno,與程式語言 Limbo的開發。 他與肯·汤普逊共同開發了UTF-8。 目前為 google的工程師,參與程式語言 Go與Sawzall的研發工作。.

查看 UTF-8和羅勃·派克

百分号编码

分号编码(Percent-encoding), 也称作URL编码(URL encoding), 是特定上下文的统一资源定位符 (URL)的编码机制.

查看 UTF-8和百分号编码

DokuWiki

DokuWiki是一个针对小公司文件需求而開發的Wiki引擎,用程序设计语言PHP开发,并以GPL 2发布。 DokuWiki基于文本存储,所以不需要数据库,其数据文件在Wiki系统外也是可读的。 DokuWiki的功能齐全,支持UTF-8,支持中文链接,能够单独编辑页面中的某个章节,能够自动生成目录,适合中小企业和个人使用,用作资料网站、归档、指南、读书笔记等。 DokuWiki的安装很简单,預設提供配置工具。.

查看 UTF-8和DokuWiki

Elixir

Elixir是一个基于Erlang虚拟机的函数式、面向并行的通用编程语言。Elixir以Erlang为基础,支持分布式、高容错、实时应用程序的开发,亦可通过宏实现元编程对其进行扩展,并通过协议支持多态。.

查看 UTF-8和Elixir

Emacs

Emacs(,源自Editor MACroS,宏编辑器),是一个文本编辑器家族,具有强大的可扩展性,在程序员和其他以技术工作为主的计算机用户中广受欢迎。最初由Richard Stallman於1975年在MIT协同蓋伊·史提爾二世共同完成。这一创意的灵感来源于TECO宏编辑器TECMAC和TMACS,它们是由蓋伊·史提爾二世、Dave Moon、Richard Greenblatt、Charles Frankston等人编写的宏文本编辑器。 自诞生以来,Emacs演化出了众多分支,其中使用最广泛的两种分别是:1984年由理查·斯托曼发起并由他维护至2008年的GNU Emacs,以及1991年发起的XEmacs。XEmacs是GNU Emacs的分支,至今仍保持着相当的兼容性。它们都使用了Emacs Lisp这种有着极强扩展性的编程语言,从而实现了包括编程、编译乃至网络浏览等等功能的扩展。 在Unix文化裡,Emacs是黑客们关于编辑器之战的两大主角之一,它的对手是vi(Vim)。.

查看 UTF-8和Emacs

EPUB

EPUB(Electronic Publication的缩写,電子出版)是一種電子圖書標準,由國際數位出版論壇(IDPF)提出;其中包括3種文件格式標準(文件的附檔名.epub),這個格式已取代了先前的Open eBook開放電子書標準。.

查看 UTF-8和EPUB

香港增補字符集

香港增補字符集(Hong Kong Supplementary Character Set,簡稱HKSCS)是香港政府基於繁體中文電腦操作環境中最流行的大五碼(Big-5)之上擴展的字符集標準,是現時香港的中文資訊交換內碼標準。 字符集所收羅的字,主要包括香港的地名、人名用漢字、粵語漢字及異體字,也有小部份簡體字。除此之外,此字符集亦把倚天中文系統收錄的日語平假名、片假名及俄語字母包括在內。此字符集由中文界面諮詢委員會管理,仍在不斷擴編之中。最新版本為HKSCS-2016,收錄5,033個字符。.

查看 UTF-8和香港增補字符集

記事本

記事本是一個簡單的文本编辑器,自1985年發佈的Windows 1.0開始,所有的Microsoft Windows版本都內建這個軟體。.

查看 UTF-8和記事本

诺基亚7210 Classic

诺基亚 7210 Classic(诺基亚 7210c,内部代号为RM-436)是诺基亚于2008年7月发布的一款超薄直板手机,是摩登波普系列中的入门级机型。在欧美发行的同型手机是诺基亚 7210 Supernova。支持GSM 900/1800/1900。它拥有2百万像素摄像头,支持全速 USB 2.0 , 蓝牙 2.0, Flash Lite 3.0 和 MIDP Java 2.1 与额外的Java APIs。.

查看 UTF-8和诺基亚7210 Classic

貝爾實驗室九號計畫

貝爾實驗室九號計畫(Plan 9 from Bell Labs)是一个分布式操作系统,由贝尔实验室的计算科学研究中心在1980年代中期至2002年开发,以作为UNIX的后继者。它现在仍然被操作系统的研究者和爱好者开发使用。 Plan 9的特色功能有:将所有本地和远程资源以文件形式组织的9P协议,union mounts,改进的进程文件系统以及原生的Unicode支持。在Plan 9中,所有的系统接口(如网络和用户界面接口),都是作为文件系统的一部分呈现,而不像其他操作系统上一样拥有自己独立的接口。 Plan 9得名于艾德·伍德1959年拍摄的B级科幻电影外太空九号计划 ,而它的标志格伦达来自同一导演拍摄的另一部电影忽男忽女。.

查看 UTF-8和貝爾實驗室九號計畫

越南文字母

越南文字母,亦称國語字(,常縮寫為Quốc Ngữ),是越南语的现代書寫方法。.

查看 UTF-8和越南文字母

轻型目录访问协议

轻型目录访问协议(英文:Lightweight Directory Access Protocol,缩写:LDAP,)是一个开放的,中立的,工业标准的应用协议,通过IP协议提供访问控制和维护分布式信息的目录信息。 目录服务在开发内部网和与互联网程序共享用户、系统、网络、服务和应用的过程中占据了重要地位。例如,目录服务可能提供了组织有序的记录集合,通常有层级结构,例如公司电子邮件目录。同理,也可以提供包含了地址和电话号码的电话簿。 LDAP由互联网工程任务组(IETF)的文档RFC定义,使用了描述语言ASN.1定义。最新的版本是版本3,由RFC 4511所定义。例如,一个用语言描述的LDAP的搜索如:“在公司邮件目录中搜索公司位于那什维尔名字中含有“Jessy”的有邮件地址的所有人。请返回他们的全名,电子邮件,头衔和简述。”.

查看 UTF-8和轻型目录访问协议

蘋果開發工具

苹果开发工具是苹果为给Mac OS X平台编写软件的工程师们设计的一系列软件。.

查看 UTF-8和蘋果開發工具

肯·汤普逊

肯尼斯·蓝·汤普逊(Kenneth Lane Thompson,)小名肯·汤普逊(Ken Thompson),美国计算机科学学者和工程师。駭客文化圈子通常称他为“ken”。在贝尔实验室工作期间,汤普逊设计和实现了Unix操作系统。他创造了B语言——C语言的前身,而且他是Plan 9操作系统的创造者和开发者之一。2006年,汤普逊进入Google公司工作,与他人共同设计了Go语言。他與丹尼斯·里奇同為1983年圖靈獎得主。 此外,肯·汤普逊还参与过正则表达式和UTF-8编码的设计,改进了文本编辑器,创造了编辑器。他曾制造过专门用于下国际象棋的电脑“”,并建立了。.

查看 UTF-8和肯·汤普逊

苹果归档协议

苹果归档协议(Apple Filing Protocol,缩写AFP)也称Apple文件协议、Apple归档协议,以前称为AppleTalk Filing Protocol,它是一个网络协议,并且是Apple File Service(苹果文件服务,缩写AFS)的一部分,为macOS和经典Mac OS提供文件服务。在macOS中,AFP是受支持的数种文件服务之一,其他包括伺服器訊息區塊(SMB)、网络文件系统(NFS)、文件传输协议(FTP)和WebDAV。AFP目前支持Unicode文件名、POSIX和存取控制串列权限、、扩展属性名称、高级文件锁定。在Mac OS 9及更早版本中,AFP是文件服务的主要协议。.

查看 UTF-8和苹果归档协议

F2blog

F2blog是PHP語言的中文部落格平台,以Tatter Tools為藍本設計,同時也參考了WordPress等部落格,把多個平台的優點整合而成。支援建構在Linux和Windows server的PHP+MySQL,目前最新版本是 1.2 build 03.01 版。 開發理念:F2BLOG 自由誌,一班為興趣而開發的BLOG程式,我們不是為了獲利,也不收分毫,只想給大家知道華人也有好的程序。.

查看 UTF-8和F2blog

FCITX

Fcitx(,源自“Free Chinese Input Toy for X”,又作“Flexible Context-aware Input Tool with eXtension”或“Flexible Input Method Framework”,暂无正式英文全称,中文名称为“小企鹅输入法”)是一个在X Window中使用的输入法框架,在源码包内包含了拼音,五笔字型以及区位、二笔的支持。可以输入UTF-8编码中的文字。可以在Linux、FreeBSD中运行。采用GPL授权。支持XIM、GTK(版本2和3)和Qt的输入法模块。 因云帆论坛有人批评Fcitx代码写的很差,原作者于2007年7月10日决定终止本项目。 不过2008年9月开始作者又加入离开后爱好者建立的Google Code项目并频繁更新,他发文谈到无法忘记fcitx。 除了原作者之外,还有一些爱好者共同维护Fcitx。现在Fcitx代码托管在GitLab平台上进行开发。.

查看 UTF-8和FCITX

FluxBB

FluxBB是個快速、輕巧的PHP架構的網路論壇系統,以GPL協議發行。FluxBB的宗旨是變得與別的論壇系統相比更快、更小、少圖形,也具有較少的功能與更精簡的程式碼。大多數“沒有”的功能,有需要時可藉由插件來實現。FluxBB的頁面完整符合XHTML與CSS標準。 目前FluxBB可以在各種作業系統下運作,並支援MySQL、PostgreSQL、SQLite等資料庫系統。 FluxBB於2008年5月9日從PunBB獨立成。為了相容性,PunBB 1.3開發過程從FluxBB 1.3 SVN版本複製許多程式碼。.

查看 UTF-8和FluxBB

Freedb

freedb是一個光碟音軌清單資料庫,所有內容均以GNU通用公共許可證發佈,最初基於現時為專有軟體的光碟資料庫(下簡稱CDDB)。至2006年4月24日為止該資料庫只收錄了少於200萬張光碟的資料。要透過互聯網尋找光碟資訊,客戶端程式會計算一個近乎唯一的光碟識別號然後查詢資料庫,如資料庫中收錄了該光碟的資料客戶端程式可接收及顯示歌手、專輯標題、軌道清單與一些額外的資訊。 2006年7月1日兩名主要的freedb開發者辭職。雖然這引起了許多人擔憂該計劃的將來,但在2006年7月7日宣佈 已有很可能為freedb尋找新根據地並將繼續照常運作的適當計劃。 2006年10月4日freedb的所有者Michael Kaiser宣佈 freedb已被 收購。.

查看 UTF-8和Freedb

GB 18030

GB 18030,全称:“国家标准GB 18030-2005《--》”,是中华人民共和国现时最新的变长度多字节字符集。对GB 2312-1980完全向后兼容,与GBK基本向后兼容;支持GB 13000(Unicode)的所有码位;共收录汉字70,244个。 GB 18030主要有以下特点:.

查看 UTF-8和GB 18030

Gedit

gedit是一个GNOME桌面环境下兼容UTF-8的文本编辑器。它简单易用,有良好的语法高亮,对中文支持很好,支持包括GB2312、GBK在内的多种字符编码。gedit是一款自由软件。.

查看 UTF-8和Gedit

GTK+

GTK+最初是GIMP的专用开发库(GIMP Toolkit),后来发展为Unix-like系統下开发图形界面的应用程序的主流开发工具之一。GTK+是自由软件,并且是GNU计划的一部分。.

查看 UTF-8和GTK+

Haml

Haml('''H'''TML Abstraction Markup Language,HTML抽象标记语言)是一种模板系统,它可以避免在Web文档中内嵌代码,使HTML更简易和干净。Haml为HTML中提供了一些动态内容的灵活性。类似其他Web语言(如PHP、ASP、JSP)和模板系统(如eRuby),Haml也嵌入一些在运行时执行的代码并生成HTML代码,从而提供一些动态内容。为运行Haml代码,文件需要采.haml扩展名。这些文件类似.erb或eRuby文件,这有助于在开发时网络应用程序嵌入Ruby代码。在解析代码注释时,Haml采用与Ruby 1.9或之后版本相同的规则。Haml只能理解兼容ASCII的编码(例如UTF-8),而不能理解不兼容ASCII的UTF-16与UTF-32。Haml可以在命令行界面中使用,也可以作为一个单独的Ruby模块或在一个Ruby on Rails应用程序中使用,这使Haml可用于广泛的应用程序。.

查看 UTF-8和Haml

Hatena

Hatena(はてな)是日本的一家網路服務公司,2001年7月19日在京都市成立,創建人是日本企業家近藤淳也。Hatena提供了包括日本有名的社會性書籤在內的多項服務內容。Hatena是公司各項服務的共用名。2004年4月10日,公司將總部移到東京都澀谷區,但2008年4月又搬回京都市。2012年Hatena在日本IT界企業當中排名第28名。.

查看 UTF-8和Hatena

HTML

超文本标记语言(HyperText Markup Language,简称:HTML)是一种用于创建网页的标准标记语言。HTML是一种基础技术,常与CSS、JavaScript一起被众多网站用于设计令人赏心悦目的网页、网页应用程序以及移动应用程序的用户界面。网页浏览器可以读取HTML文件,并将其渲染成可视化网页。HTML描述了一个网站的结构语义随着线索的呈现,使之成为一种标记语言而非编程语言。 HTML元素是构建网站的基石。HTML允许嵌入图像与对象,并且可以用于创建交互式表单,它被用来结构化信息——例如标题、段落和列表等等,也可用来在一定程度上描述文档的外观和语义。HTML的语言形式为尖括号包围的HTML元素(如),浏览器使用HTML标签和脚本来诠释网页内容,但不会将它们显示在页面上。 HTML可以嵌入如JavaScript的脚本语言,它们会影响HTML网页的行为。网页浏览器也可以引用层叠样式表(CSS)来定义文本和其它元素的外观与布局。维护HTML和CSS标准的组织万维网联盟(W3C)鼓励人们使用CSS替代一些用于表现的HTML元素。.

查看 UTF-8和HTML

Hunspell

Hunspell是一个为拥有多态和复杂组合词的语言所设计的拼写检查器,原本为匈牙利语设计。 Hunspell是一个自由软件,在GPL、LGPL和MPL三许可证下发行。Hunspell对主要平台和编程语言都有接口和封装。 Hunspell基于MySpell,并且与MySpell词典后端兼容。MySpell使用单字节字符编码,而Hunspell则可以使用Unicode UTF-8编码的词典。.

查看 UTF-8和Hunspell

ICalendar

iCalendar是“日曆數據交換”的標準(RFC 5545)。 此標準有時指的是“iCal”,即蘋果公司的出品的一款同名日曆軟件(見iCal),這個軟件也是此標準的一種實現方式。 iCalendar允許用戶通過電子郵件的方式發送“會議請求”或“任務”。收信人使用支持iCalendar郵件客戶端,便可以很方便地回應發件人,接受請求或另外提議一個新的會議時間。 iCalendar已得到很多產品的支持。通常情況下,iCalendar數據是使用電子郵件交換,但它也可以獨立使用,而不局限於某種傳輸協議。例如,可以通過WebDav伺服器或SyncML來進行共享與修改。簡單的網頁伺服器(只使用HTTP協議)也常常被用來分發公共事件的iCalendar數據,或發佈個人的時間謀劃安排。發佈者可以使用hCalendar把iCalendar數據嵌入到網頁中。(hCalendar是一種通過(X)HTML來表現iCalendar的微格式).

查看 UTF-8和ICalendar

Iconv

iconv是一个计算机程序以及一套应用程序编程接口的名称。它的作用是在多种国际编码格式之间进行文本内码的转换。支持的内码包括:.

查看 UTF-8和Iconv

ID3

ID3是一种metadata容器,多应用于MP3格式的音频文件中。它可以将相关的曲名、演唱者、专辑、音轨数等信息存储在MP3文件中,又稱作「ID3Tags」。 ID3也被蘋果公司指定為HTTP Live Streaming中的時間後設資料,在主要的傳輸流或單獨的音頻傳輸流中作為乘載。 ID3一般位于一个mp3文件的开头或末尾的若干字节内,附加了关于该mp3的歌手,标题,专辑名称,年代,风格等信息,该信息就被称为ID3信息。ID3信息分为两个版本,v1和v2版。其中: v1版的ID3在mp3文件的末尾128字节,以TAG三个字符开头,后面跟上歌曲信息。v1.1版將「評論」欄位縮短,增設「曲目」欄位。v2版則和v1版截然不同,其通常將一系列可擴展的資料框架(frames)儲存在檔案開頭,而每一塊資料框架都有當作辨識標籤的、大小約3到4個位元組的字串,以及其所儲存的資料。在最新的ID3v2.4版本中,總共宣告有83種資料框架,而使用者也可以自訂屬於自己的資料框架。目前總共有三種版本的ID3v2,其中每一版都有對資料框架的定義進行擴展。 ID3是mp3檔案後設資料自然而然發展出來的事實標準;其成品並沒有包含任何的實質規範,也沒有任何組織給予其正式的批准或認證。其與APE tag在音樂檔案的後設資料標籤領域互相角逐。.

查看 UTF-8和ID3

ISO/IEC 8859-1

ISO 8859-1,正式编号为ISO/IEC 8859-1:1998,又称Latin-1或“西欧语言”,是国际标准化组织内ISO/IEC 8859的第一个8位字符集。它以ASCII为基础,在空置的0xA0-0xFF的范围内,加入96个字母及符号,藉以供使用附加符号的拉丁字母语言使用。曾推出过 ISO 8859-1:1987 版。 ISO-8859-1的别名有: iso-ir-100, csISOLatin1, latin1, l1, IBM819.

查看 UTF-8和ISO/IEC 8859-1

Java本地接口

在编程领域, JNI (Java Native Interface,Java本地接口)是一种编程框架,使得Java虚拟机中的Java程序可以调用本地应用/或库,也可以被其他程序调用。 本地程序一般是用其它语言(C、C++或汇编语言等)编写的, 并且被编译为基于本机硬件和操作系统的程序。.

查看 UTF-8和Java本地接口

JEdit

jEdit是一个用Java语言开发的文本编辑器,在GPL下发布。它可以在Windows、Linux、Mac OS等多种平台下运行,并且有很多插件,可以扩充基本功能。它也支持80多种文件类型的文法加亮显示。支持包括UTF-8在内的多种字符编码。 jEdit也有很方便的宏定义功能,可以用BeanShell、Jython和JavaScript等脚本语言。.

查看 UTF-8和JEdit

Julia (编程语言)

Julia是一个面向科学计算的高性能动态高级程序设计语言。其语法与其他科学计算语言相似。在许多情况下拥有能与编译语言相媲美的性能。.

查看 UTF-8和Julia (编程语言)

LimeSurvey

LimeSurvey(前身为PHPSurveyor)是一款开源的在线问卷调查程序,它用PHP语言编写并可以使用MySQL,PostgreSQL或者MSSQL等多种数据库,它集成了调查程序开发、调查问卷的发布以及数据收集等功能,使用它,用户不必了解这些功能的编程细节。 本系统包括了分支、自定义页面布局和设计(使用),并且提供了基本的统计分析功能。调查可以匿名访问也可以限制为拥有“访问一次”令牌的用户参加,从而我们能得到匿名数据或者参与者与结果相分离的数据。 有大量的网页托管主机可以托管LimeSurvey,包括自己安装的主机也包括通过面板安装的主页空间,例如有Fantastico的cPanel,Plesk和Virtualmin专业版。LimeSurvey已经被(第三方)移植到许多CMS(内容管理系统)上, 如PostNuke,XOOPS和Joomla。.

查看 UTF-8和LimeSurvey

LRC格式

LRC是一個可以跟音樂檔案做同步的檔案格式。當一個音樂檔案(如MP3、Vorbis或WMA等)被電腦音樂播放程式(如foobar2000與千千靜聽等)或現代的MP3隨身聽以及DVD播放機等裝置播放時,歌詞可以被同步顯示出來。歌詞檔案通常和音樂檔案有同樣的檔案名稱,但是副檔名不同。例如:song.mp3和song.lrc。LRC格式是一種文字格式,與電視和電影的字幕檔很相似。由於中、日、韓文歌詞在ANSI格式裡可能產生亂碼,可以使用UTF-8或Unicode文字編碼避免。.

查看 UTF-8和LRC格式

M3U

M3U是一种播放多媒体列表的檔案格式,它的设计初衷是为了播放音频文件,比如MP3,但是越来越多的软件现在用来播放视频文件列表,M3U也可以指定在线流媒体音频源。很多播放器和软件都支持M3U文件格式。.

查看 UTF-8和M3U

MediaWiki版本歷史

MediaWiki是一套开放源代码的Wiki引擎。第一个版本1.1,发布于2003年12月。MediaWiki 1.31.0是当前稳定版本,发布于2018年6月。 下表包含了MediaWiki的版本历史,展示了该软件所有的发行版本。.

查看 UTF-8和MediaWiki版本歷史

Mlterm

Mlterm是一个基于X Window系统的支持多语言的终端软件,在中文方面,它支持GB 2312,GBK,GB 18030,Big5和UTF-8。 Mlterm会检查当前的locale并选择恰当的编码。Mlterm还支持AA字体抗锯齿和多种XIM。 Category:终端软件.

查看 UTF-8和Mlterm

Notepad++

Notepad++是一套為自由軟體的純文字編輯器,由侯今吾基于同是開放原始碼的Scintilla文本编辑组件並獨力研發,整个项目起初托管于SourceForge.net之上,截止到2011年,已被下載超過2700萬次,并两度获得SourceForge社群選擇獎——最佳開發工具。2010年6月托管于TuxFamily,现由GitHub托管。 該軟體以GPL發佈,有完整的中文化介面及支援多國語言撰寫的功能(採用UTF-8编码)。它的功能比Windows中的記事本(Notepad)強大,除了可以用來製作一般的純文字的說明文件,也十分適合用作撰寫電腦程式的編輯器。由6.2.3版本起,Notepad++的文件預設文字格式由ANSI改為除去BOM的UTF8(UTF8 without BOM)。Notepad++不僅有語法高亮度顯示,也有語法摺疊功能,並且支援巨集以及擴充基本功能的外掛模組。.

查看 UTF-8和Notepad++

Notepad2

Notepad2是发布在Microsoft Windows平台下的开放源代码的文本编辑器。于2004年4月推出第一个版本。作者参照了微软的Notepad原则:小巧、快速、朴实。自3.0.20版起,Notepad2已經變成完全基於Unicode的程式,因此對各種字元的處理有很良好的表現。由于Notepad2在资源消耗方面与微软的Notepad大体相当,而功能更强大,网上亦有人发起用Notepad2或Notepad++替换Notepad的活动。 Notepad2为以下的程序语言提供语法高亮标--:ASP、C语言、C++、C#、CGI、CSS、HTML、Java、JavaScript、NSIS、Pascal、Perl、PHP、Python、SQL、VB、VBScript、XHTML、XML以及汇编语言。他亦支持部分文本格式的语法高亮标--:BAT、DIFF、INF、INI、REG等。 Notepad2还有其他特性:常规编辑:查找和替换;文字编码转换:在ASCII、UTF-8和UTF-16之间互相转换;半透明效果;页面缩放;括弧匹配和自动缩进等。.

查看 UTF-8和Notepad2

NTFS-3G

NTFS-3G是一個由Tuxera公司開發並維護的自由軟體項目,採用GNU通用公共許可證釋出,旨在為非微軟Windows NT系的作業系統提供安全快速、具備讀寫功能的NTFS檔案系統驅動程式。 NTFS-3G最初由資深Linux驅動程式開發者Szabolcs Szakacsits()於2006年發起並主導,2007年初公佈了第一個穩定版本ntfs-3g-2007.02.21,原始碼託管於SourceForge。隨後NTFS-3G團隊成立了Tuxera Inc.,負責NTFS-3G的進一步發展、商業推廣以及爲專案提供開發資金。目前Tuxera公司還推出了NTFS-3G的商用版本Tuxera NTFS及NTFS for Mac,後兩者除了NTFS-3G的原始碼以外還有一些非Tuxera開發的用以加強存取效能的專有元件。.

查看 UTF-8和NTFS-3G

OddMuse

Oddmuse是Alex Schroeder依據UseModWiki的原始碼所修改而成的Wiki引擎,它採用Perl做為開發的程式語言,並且不採用任何的資料庫管理系統儲存頁面資料,只儲存於檔案系統內,它的特色除了加強UTF-8的支援性外,並且也提供眾多的擴充程式以補強其功能。.

查看 UTF-8和OddMuse

OpenOffice.org

OpenOffice.org,一般称呼为OpenOffice,简写作OOo,是一个开源的办公套件软件。起源於昇陽電腦1999年從StarDivision收購的StarOffice。 OpenOffice包含了文字处理器(Writer)、電子試算表(Calc)、程序(Impress)、绘图软件(Draw)、数学公式编辑器(Math)以及關聯式資料庫管理系統(Base)。它文件格式默认为开放文档格式(ODF)。该格式从OpenOffice.org发起,后来成为ISO/IEC标准格式。它也可读取许多不同的文件格式,尤其是Microsoft Office生成的那些。 升阳电脑在2000年7月将StarOffice开源,发布OpenOffice.org,以此与Microsoft Office竞争。2002年5月1日,软件版本1.0公布。 2011年,昇陽電腦的所有者甲骨文公司宣布,他们将不再为OpenOffice的商业版提供支持,旋即将该项目捐赠给了Apache软件基金会。Apache将软件重新命名为Apache OpenOffice。 OpenOffice.org主要为Linux、Microsoft Windows和Solaris操作系统设计,后来又加入了OS X版,并可移植到其他操作系统上。软件在GNU宽通用公共许可证第3版(LGPL)下授权。早期的版本也有过(SISSL)的授权方式。.

查看 UTF-8和OpenOffice.org

PCMan

PCMan是一系列免費且開放程式碼的Telnet軟體,並針對電子布告欄BBS進行最佳化設置,原始作者是洪任諭。目前此軟體為臺灣的BBS用戶廣泛使用。 2007年1月1日,作者將原始碼公開,成為開放原始碼軟體。2007年6月1日,Open PCMAN 2007正式版發佈。.

查看 UTF-8和PCMan

PCMan檔案管理程式

PCMan檔案管理程式(PCMan File Manager)是一個以輕巧快速為設計目的的檔案管理器,为LXDE桌面环境的默认档案管理器。.

查看 UTF-8和PCMan檔案管理程式

Peppermint Linux OS

Peppermint Linux OS 是一个以云为中心的操作系统,它基于Ubuntu Linux 操作系统的派生Lubuntu, 使用LXDE 桌面环境.

查看 UTF-8和Peppermint Linux OS

Pluma

Pluma ("羽毛")是Linux发行版本中MATE桌面环境的默认文本编辑器,为gedit 2的复刻。Pluma拥有通用文本编辑器的大多数标准特性。同时,基于Mate项目的设计理念,它提供给用户一套清爽直观的界面,致力于提升操作的简捷与便利。Pluma为自由及开放源代码软件,以GNU通用公共许可协议发布。 Pluma是一款图形化应用软件,支持在单个窗口内编辑多个文本文件。Pluma使用UTF-8字符编码,因此完全支持国际化的文本。其核心特性包括了代码高亮、自动缩进、打印预览等。.

查看 UTF-8和Pluma

PunBB

PunBB是个快速、轻量的PHP架构网络论坛,以GNU的标准释放。它的首要原则为快速、轻巧、与其它论坛相比更少量的图像。PunBB比起其它论坛功能较少,但也因此更快速、更小巧,并正确的支持XHTML与CSS架构页面。 此外,PunBB可在任何支持PHP语言的作业系统上运作,PunBB可以在MySQL、PostgreSQL、SQLite等数据库下储存信息。.

查看 UTF-8和PunBB

QR碼

QR圖碼(全稱為快速響應矩陣圖碼;Quick Response Code)是二維條碼的一種,於1994年由日本DENSO WAVE公司發明。QR來自英文Quick Response的縮寫,即快速反應,因為發明者希望QR碼可以讓其內容快速被解碼。QR碼使用四種標準化編碼模式(數字、字母數字、字節(二進制)和漢字)來存儲數據。QR碼常見於日本,為目前日本最通用的二維空間條碼,在中國也普遍使用。QR碼比較普通條碼可以儲存更多資料,也無需要像普通條碼般在掃描時需要直線對準掃描器。因此其應用範圍已經擴展到包括產品跟踪,物品識別,文檔管理,營銷等方面。.

查看 UTF-8和QR碼

Red Hat Linux

Red Hat Linux是由Red Hat公司發行的一个Linux发行套件。 Red Hat Linux可算是一個「中年」的Linux發行套件,其1.0版本於1994年11月3日發行。雖然其歷史不及Slackware般悠久,但比起很多的Linux發行套件,Red Hat的歷史悠久得多。 Red Hat Linux中的RPM软件包格式可以说是Linux社区的一个事实标准,被廣泛使用於其他Linux发行套件中。 以Red Hat Linux为基礎派生的Linux發行套件有很多,其中包括以桌面用戶為目標的Mandrake Linux(原為包含KDE的Red Hat Linux),Yellow Dog Linux(開始時為支援PowerPC的Red Hat Linux)和ASPLinux(對非拉丁字元有較好支援的Red Hat Linux)。 自从Red Hat 9.0版本发布后,Red Hat公司就不再开发桌面版的Linux发行套件,而将全部力量集中在服务器版的开发上,也就是Red Hat Enterprise Linux版。2004年4月30日,Red Hat公司正式停止對Red Hat 9.0版本的支援,標誌著Red Hat Linux的正式完結。原本的桌面版Red Hat Linux發行套件則與來自民間的Fedora計劃合併,成為Fedora Core發行版本。.

查看 UTF-8和Red Hat Linux

Ren'Py

Ren'Py視覺小說引擎是一款開放原始碼的自由软件引擎,用來創作透過電腦敘述故事的視覺小說。Ren'Py之名是Ren'ai与Python兩詞混合而成。Ren'ai為日文,意指「戀愛」,而Python是Ren'Py所使用的語言環境。 和其他流行的視覺小說引擎(例如NScripter)不同,Ren'Py是在英語文化圈中開發,所以较受英語使用者的青睞。至2013年8月,官方网站已登记超过500个使用Ren'Py的游戏。.

查看 UTF-8和Ren'Py

SCIM

SCIM(Smart Common Input Method)是一個支援多國語言的輸入法平台,虽然它的设计着眼于通用性,但是鉴于Windows之类的桌面OS有较完整的原生机制,所以SCIM更多还是用在UNIX/类UNIX环境中。它曾經作爲多數Linux發行版中文默認輸入法。.

查看 UTF-8和SCIM

String.h

string.h是C标准库的头文件,其中包含了宏(巨集)定义、常量以及函数和类型的声明,涉及的内容除了字符串处理之外,还包括大量的内存处理函数;因此,string.h这个命名是不恰当的。 在string.h中定义的函数十分常用,作为C标准库的一部分,它们被强制要求可以在任何支持C语言的平台上运行。但是,部分函数存在一些安全隐患,例如缓存溢出等,导致程序员宁愿使用一些更安全的函数而放弃一定的可移植性。同时,这些字符串函数只能处理ASCII字符集或兼容ASCII的字符集,如ISO-8859-1;在处理存在多字节字符的字符集,如UTF-8时,会产生一个警告,指出对字符串“长度”的计算是以字节而不是以Unicode字符为单位。非ASCII兼容字符集的字符串处理函数一般位于wchar.h中。.

查看 UTF-8和String.h

TCPDF

TCPDF 是一个流行的用于生成 PDF 文档的 PHP 类。TCPDF是当前唯一完整支持 UTF-8 Unicode 以及从右至左书写的语言包括双向文稿的 PHP 库。 TCPDF 是 SourceForge 上最活跃的项目之一。 TCPDF 也是最多人使用的 PHP 库之一,因为最流行的一些基于 PHP 的 内容管理系统 中都带有TCPDF,包括: Joomla, Drupal, Moodle, phpMyAdmin, TCExam, Xoops,, ImpressCMS,, SugarCRM, Symfony, TYPO3, Vtiger CRM, Yii Framework, 等。 TCPDF 类是源自于 公有领域 的 FPDF。FPDF 的开发者是 Olivier Plathey,但 TCPDF 已经几乎被重写,并且添加了数百个新的特性。.

查看 UTF-8和TCPDF

TrueType

TrueType是由美国苹果公司和微软公司共同开发的一种电脑轮廓字体(曲線描邊字)类型标准。这种类型字体文件的扩展名是.ttf,类型代码是tfil。 早在1980年代末,苹果公司为了对抗Adobe公司的Type 1PostScript字体,设计开发了TrueType。之後微软加入了开发,Windows作業系统的字体格式基本上都统一成TrueType,而在苹果的Mac OS却成了PostScript和TrueType对立的局面。TrueType后来也被Linux等系统使用,成为标准字体。TrueType的主要强项在于它能给开发者提供关于字体显示、不同字體大小的像素級显示等的高级控制。 在新开发的OpenType类型字体中,可以选择PostScript还是TrueType作为记述方式。.

查看 UTF-8和TrueType

Uliweb

Uliweb(UnLimited Web Framework)是一款由国人开发的中型Python web框架。 框架采用与Django相同的MVT模式和的模板,底层基于Werkzeug,数据库ORM则对SQLAlchemy进行了封装。Uliweb使用BSD授权。.

查看 UTF-8和Uliweb

Unicode

Unicode(萬國-)是電腦科學領域裡的一項業界標準。它对世界上大部分的文字系統進行了整理、編碼,使得電腦可以用更為簡單的方式來呈現和處理文字。 Unicode伴隨著通用字符集的標準而發展,同時也以書本的形式對外發表。Unicode至今仍在不斷增修,每個新版本都加入更多新的字符。目前最新的版本為2018年6月5日公布的11.0.0,已經收錄超過13萬個字符(第十萬個字符在2005年獲採納)。Unicode涵蓋的資料除了視覺上的字形、編碼方法、標準的字符編碼外,還包含了字符特性,如大小寫字母。 Unicode發展由非營利機構統一碼聯盟負責,該機構致力於讓Unicode方案取代既有的字符編碼方案。因為既有的方案往往空間非常有限,亦不適用於多語環境。 Unicode備受认可,並廣泛地應用於電腦軟體的國際化與本地化過程。有很多新科技,如可扩展置标语言(Extensible Markup Language,簡稱:XML)、Java程式語言以及現代的作業系統,都採用Unicode編碼。.

查看 UTF-8和Unicode

UTF-1

UTF-1是一种将ISO 10646 / Unicode转化成字节流的方式。由于其本身的设计问题,如果自中间的一个字符开始解码,UTF-1將無法重新同步(這造成擷取的困難),而且UTF-1也沒辦法進行可靠的字节搜索。又因为UTF-1使用的除数不是2的幂,所以转化得也相当​​缓慢。由于以上这些问题,UTF-1从来没有得到广泛採用,并已被UTF-8所取代。.

查看 UTF-8和UTF-1

UTF-16

UTF-16是Unicode字符编码五层次模型的第三层:字符编码表(Character Encoding Form,也称为"storage format")的一种实现方式。即把Unicode字符集的抽象码位映射为16位长的整数(即码元)的--,用于数据存储或传递。Unicode字符的码位,需要1个或者2个16位长的码元来表示,因此这是一个变长表示。 UTF是"Unicode/UCS Transformation Format"的首字母缩写,即把Unicode字符转换为某種格式之意。UTF-16正式定義於ISO/IEC 10646-1的附錄C,而RFC2781也定義了相似的做法。.

查看 UTF-8和UTF-16

UTF-32

UTF-32是32位Unicode转换格式(Unicode Transformation Formats, 或UTF)的缩写。UTF-32是一种用于编码Unicode的协定,该协定使用32位比特对每个Unicode码位进行编码(但前导比特数必须为零,故仅能表示221个Unicode码位)。与其他可变长度的Unicode转换格式(UTF)相比,UTF-32编码长度是固定的,UTF-32中的每个32位值代表一个Unicode码位,并且与该码位的数值完全一致。 UTF-32的主要优点是可以直接由Unicode码位来索引。在编码序列中查找第N个编码是一个常数时间操作。相比之下,其他可变长度编码需要进行循序存取操作才能在编码序列中找到第N个编码。这使得在计算机程序设计中,编码序列中的字符位置可以用一个整数来表示,整数加一即可得到下一个字符的位置,就和ASCII字符串一样简单。 UTF-32的主要缺点是每个码位使用四个字节,空间浪费较多。在大多数文本中,非基本多文種平面的字符非常罕见,这使得UTF-32所需空间接近UTF-16的两倍和UTF-8的四倍(具体取决于文本中ASCII字符的比例)。 尽管每一個碼位使用固定長度的位元組看似方便,但UTF-32並不如其它Unicode編碼使用廣泛。與UTF-8及UTF-16相比,UTF-32更容易遭到截斷。即使使用了"定寬"字型,在大多数情况下用UTF-32計算顯示字串的寬度也并不比其他编码更加容易。主要原因是,存在著一個字符位置會有多於一種可能的碼點(結合字符)或一個碼點用多於一個字符位置(如CJK表意字符)。結合符號也意味著,文書編輯者不能將一個码位視同一個編輯上的單位。.

查看 UTF-8和UTF-32

UTF-7

UTF-7(全称:7位元Unicode轉換格式)是一種可變長度字元編碼方式,用以將Unicode字元以ASCII編碼的字元串來呈現,可以應用在電子郵件傳輸之類的應用。 SMTP為基本的電子郵件傳輸標準之一,其指明了傳輸格式為US-ASCII,並且不允許超過ASCII所定義的字元範圍以外的位元值,也就是說八位元的字串將無法正常的被傳輸。MIME(RFC 2045 ~ 2049)擴展了網路郵件以支援不同的媒體類型以及字元集,包含UTF-8與UTF-16的字元集皆可被指定使用。但由於MIME並未明確將Unicode定義為可支援的字元集,並且也沒有說明其應如何編碼,這使得既有的SMTP傳輸架構下仍舊無法保證可正確的處理8位元資料。base64編碼也有其問題,例如甚至連純英文的US-ASCII字元也可能會變成不可辨認;至於像是UTF-8與quoted-printable的編碼結合,則需要6~9個位元來為非ASCII的字元(Unicode的基本多文種平面中定義的字元)進行編碼,至於在基本多文種平面(BMP)以外的字原則需要多達12位元的長度才能完成編.

查看 UTF-8和UTF-7

Vorbis注释

Vorbis注释(Vorbis comment)是一种元数据容器,被应用于 Vorbis、FLAC、Theora、Speex 和 Opus codec 文件格式中。它存储诸如标题、演唱者、轨道数等关于文件的信息并将他们一同存入文件中。.

查看 UTF-8和Vorbis注释

Win32控制台

Win32控制台(Win32 console)是Windows API系统内运行控制台应用程序的的实现。每个Win32控制台有一个屏幕缓冲区和一个输入缓冲区,并可在視窗或的屏幕下使用,使用Alt+Enter键可在两者间切换。 Win32控制台通常用于不需要显示图像但可能使用颜色的应用程序。以命令行界面工具举例:命令行解释器有Windows命令行提示符、Windows PowerShell;文件管理器有和;编辑器有。.

查看 UTF-8和Win32控制台

XeTeX

(或,文本模式下写作XeTeX)是一种使用Unicode的TeX排版引擎,并支持一些现代字体技术,例如OpenType、Graphite和Apple Advanced Typography(AAT)。其作者和维护者是Jonathan Kew,并以X11自由软件许可证发布。 虽然最初只是为Mac OS X所开发,但它现在在各主要平台上都可以运作。它原生支持Unicode,并默认其输入文件为UTF-8编码。可以在不进行额外配置的情况下直接使用操作系统中安装的字体,因此可以直接利用OpenType、Graphite中的高级特性,例如额外的字形,花体,合字,可变的文本粗细等等。提供了对OpenType中本地排版约定(locl标签)的支持,也允许向字体传递OpenType的元标签。它亦支持使用包含特殊数学字符的Unicode字体排版数学公式,例如使用Cambria Math或Asana Math字体代替传统的TeX字体。.

查看 UTF-8和XeTeX

XOOPS

XOOPS是一種開放原始碼的内容管理系統,衍生自PHP-Nuke,採用PHP語言跟MySQL資料庫。功能、界面全部模組化設計,可用於建構各種網路社區。 XOOPS的發布採用GPL協議,可免費使用和修改;在遵循GPL相關條款的前提下,可自由再發布。 XOOPS是 eXtensible Object Oriented Portal System 的縮寫,按照英語規則,XOOPS應該讀作“zoo'ps”。 XOOPS的用途很廣泛,對於個人使用者,可以啟用XPress--(針對XOOPS的WordPress),作為個人的網誌。對於較大規模的網站,可以根據需要,安裝更多的--,如新聞發布、論壇、資源下载、友情連結,以及線上購物、廣告管理等,對於Wiki、RSS,XOOPS也有相應的--。 在國際語言支持方面,XOOPS有二十種以上的語言版本,包括英文、繁體中文、簡體中文,編碼可自由選擇採用GB 2312、BIG 5或是UTF-8。.

查看 UTF-8和XOOPS

YAML

YAML(,尾音類似camel駱駝)是一個可讀性高,用來表達資料序列的格式。YAML參考了其他多種語言,包括:C語言、Python、Perl,並從XML、電子郵件的數據格式(RFC )中獲得靈感。Clark Evans在2001年首次發表了這種語言,另外Ingy döt Net與Oren Ben-Kiki也是這語言的共同設計者。目前已經有數種程式語言或腳本語言支援(或者說解析)這種語言。 YAML是"YAML Ain't a Markup Language"(YAML不是一種标记語言)的遞迴縮寫。在開發的這種語言時,YAML 的意思其實是:"Yet Another Markup Language"(仍是一種标记語言),但為了強調這種語言以數據做為中心,而不是以标记語言為重點,而用反向缩略语重新命名。.

查看 UTF-8和YAML

格式化文本

格式化文本(英文:formatted text、styled text、rich text),与纯文本(plain text)相对,具有风格、排版等信息,如颜色、式样(黑体、斜体等)、字体尺寸、特性(如超链接)等。.

查看 UTF-8和格式化文本

楚瓦什語

楚瓦什語是楚瓦什人使用的語言,屬於阿爾泰語系突厥語族保加爾語支,而且是保加爾語支中僅有的還在使用中的語言。這種語言的人口都位於俄羅斯聯邦中部、烏拉爾山脈以西的地方,包括有楚瓦什共和国、鞑靼斯坦共和国、巴什科尔托斯坦共和国、薩馬拉州、奧倫堡州及乌里扬诺夫斯克州等地。在楚瓦什共和国享有官方語言的地位。現時語言人口估計約200萬人。 現時楚瓦什語的書寫系統採用西里爾字母,除了包括有俄語的所有字母之外,還有四個額外的字母:Ӑ、Ӗ、Ҫ、Ӳ。.

查看 UTF-8和楚瓦什語

汉字内码扩展规范

汉字内码扩展规范,称GBK,全名为《汉字内码扩展规范(GBK)》1.0版,由中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司和电子工业部科技与质量监督司1995年12月15日联合以《技术标函229号》文件的形式公布。 GBK共收录21886个汉字和图形符号,其中汉字(包括部首和构件)21003个,图形符号883个。 GBK的K为汉语拼音Kuo Zhan(扩展)中“扩”字的声母。英文全称Chinese Internal Code Extension Specification。 GBK 只为“技术规范指导性文件”,不属于国家标准。国家质量技术监督局于2000年3月17日推出了GB 18030-2000标准,以取代GBK。GB 18030-2000除保留全部GBK编码汉字,在第二字节把能使用范围再度进行扩展,增加了大约一百个汉字及四位元组编码空间,但是将GBK作为子集全部保留。请参看GB 18030。.

查看 UTF-8和汉字内码扩展规范

汉字编码字符集

汉字编码字符集,在中文信息处理领域,指按照规则定义的汉字的有序集合。指定字符集中的漢字編碼是指汉字在该字符集中对应的字符编码。 常见的包含汉字的编码字符集有:.

查看 UTF-8和汉字编码字符集

我能吞下玻璃而不伤身体

我能吞下玻璃而不伤身体(I Can Eat Glass)是由 Ethan Mollick 在早期互联网上发起的语言学项目。该项目的目的是收集不同语言中「我能吞下玻璃而不伤身体」这句话的翻译。该项目的原始网页于 2004 年消失。 Mollick 解释道,旅行者到达外国时,会有一种「不可抑制的冲动」想要用当地语言说些什么,但无论说什么都会让当地人认为他只是个游客。但是,如果旅行者能用地道地当地语言说一句类似「我能吞下玻璃而不伤身体」这样不同寻常的话,则能让旅行者「获得当地人的尊重」。 该项目在志愿者的贡献下增长到超过 150 种语言,包括不少人造或虚构语言,以及多种计算机语言。它最终变成了一个网络迷因。.

查看 UTF-8和我能吞下玻璃而不伤身体

星號

星號(英文:asterisk,拉丁文:asteriscum,意謂「小星星」,來自希臘文 ἀστερίσκος)是印刷符號或字形。之所以稱為星號是因為與一般人印象中的星星相似。電腦科學家與數學家常稱之為「star」或「星」(例如「A*搜尋演算法」和「C*-代數」)。 星號起源於歐洲封建時代,族譜印製者要表示出生日期的符號。最初的形狀是六芒,每一芒都像是由中央散開的淚珠。因此,有些電腦界的圈子稱之為「splat」(狀聲詞,類似中文的「啪」),或許是因為許多早期的列式印表機印出來的星號看起來像是被壓扁的蟲子。 很多文化有自己獨特的星號。中国与日本用的是「※」,看起來像是漢字的「米」。阿拉伯式的星號是六芒星。於某些字體,星號是五芒,阿拉伯星號則為八芒。.

查看 UTF-8和星號

文件编辑器比较

下面的表格对部分文本编辑器各方面进行比较。编辑器详情请浏览它们各自的介绍页面,本文仅供参考。.

查看 UTF-8和文件编辑器比较

文件檔案格式

文件檔案格式(Document file format)是一種使用在儲存媒體儲存-zh-tw:文件;zh-hk:文件;zh-cn:文档-的-zh-tw:文字;zh-hk:文字;zh-cn:文本-或二進制--,尤其為電腦所用。現存大量不相容的文件檔案格式。 一些人和制定標準的組織已確立出粗略共識,把XML作為未來文件檔案格式的基礎。開放XML-based標準(由XML構成的開放格式的標準)包括DocBook,較近代的包括ISO/IEC標準OpenDocument(ISO 26300:2006)、Office Open XML(ISO 29500:2008)。 1993年,ITU-T嘗試確立一個用於一眾文件檔案格式的標準,即是人們所知的(,縮寫ODA),提議取代所有相競爭的文件檔案格式。它記述在ITU-T--T.411至T.421,相等於ISO 8513。這沒有成功。 頁描述語言諸如PostScript和PDF已經變成用於一般使用者通常只能夠建立和讀取而不能編輯的文件的業界標準()。2001年,PDF格式也已變成國際ISO/IEC標準(ISO 15930-1:2001、ISO 19005-1:2005、ISO 32000-1:2008)。 HTML是已被大量使用的而且開放的國際標準,它也被用作文件檔案格式。它也已成為ISO/IEC標準(ISO 15445:2000)。 Microsoft Word的預設二進制檔案格式--已成為公務文件(Office documents)的普遍業界標準,不過它是一個,不被其他文書處理器完整支援。.

查看 UTF-8和文件檔案格式

文本文件

文本文件一般指只有字符原生编码构成的二进制计算机文件,與富文本相比,其不包含字样样式的控制元素,能够被最简单的文本编辑器直接读取。.

查看 UTF-8和文本文件

执行字符集

执行字符集(execution character set)是C/C++语言的程序编译后字符类型与字符串类型所使用的编码字符集。与源代码使用的源字符集(source character set)相对。执行宽字符集(execution wide-character set)是编译后的程序中宽字符所使用的编码字符集。 例如,源文件是Latin-1编码,执行字符集为utf-8,则char c.

查看 UTF-8和执行字符集

.nfo

.nfo(;「info」或是「information」的縮寫;也可以寫成.NFO或NFO)是相當普遍的ASCII文字檔案的副檔名,它的內容包含主要檔案的相關文字說明資訊。可以使用文字編輯器或是NFO專用的瀏覽器瀏覽NFO檔案的內容。檔案的內容還會包含精心製作的ASCII藝術圖案。 以Microsoft Windows為作業系統的電腦裡,有另一種不同的NFO二進制檔案,是微軟作業系統的軟體工具,被稱為「系統資訊」檔案。一般而言,最常被討論的「NFO檔案」通常指的是文字說明檔案,而不是以二進制為內容的微軟作業系統資訊檔案。.

查看 UTF-8和.nfo

亦称为 UTF8。

轻型目录访问协议蘋果開發工具肯·汤普逊苹果归档协议F2blogFCITXFluxBBFreedbGB 18030GeditGTK+HamlHatenaHTMLHunspellICalendarIconvID3ISO/IEC 8859-1Java本地接口JEditJulia (编程语言)LimeSurveyLRC格式M3UMediaWiki版本歷史MltermNotepad++Notepad2NTFS-3GOddMuseOpenOffice.orgPCManPCMan檔案管理程式Peppermint Linux OSPlumaPunBBQR碼Red Hat LinuxRen'PySCIMString.hTCPDFTrueTypeUliwebUnicodeUTF-1UTF-16UTF-32UTF-7Vorbis注释Win32控制台XeTeXXOOPSYAML格式化文本楚瓦什語汉字内码扩展规范汉字编码字符集我能吞下玻璃而不伤身体星號文件编辑器比较文件檔案格式文本文件执行字符集.nfo