我们正在努力恢复Google Play商店上的Unionpedia应用程序
🌟我们简化了设计以优化导航!
Instagram Facebook X LinkedIn

UTF-8和內碼

快捷方式: 差异相似杰卡德相似系数参考

UTF-8和內碼之间的区别

UTF-8 vs. 內碼

UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字元編碼,也是一种前缀码。它可以用來表示Unicode標準中的任何字元,且其編碼中的第一個位元組仍與ASCII相容,這使得原來處理ASCII字元的軟體無須或只須做少部份修改,即可繼續使用。因此,它逐漸成為電子郵件、網頁及其他儲存或傳送文字的應用中,優先採用的編碼。 UTF-8使用一至六個位元組為每個字符編碼(尽管如此,2003年11月UTF-8被RFC 3629重新规范,只能使用原来Unicode定义的区域,U+0000到U+10FFFF,也就是说最多四個字节):. 在計算機科學及相關領域當中,內碼指的是「將資訊編碼後,透過某種方式儲存在特定記憶裝置時,裝置內部的編碼形式」。在不同的系統中,會有不同的內碼。 在以往的英文系統中,內碼為ASCII。 在繁體中文系統中,目前常用的內碼為大五碼。在簡體中文系統中,內碼則為國標碼。 為了軟體開發方便,如國際化與本地化,現在許多系統會使用Unicode做為內碼,常見的作業系統Windows、Mac OS X、Linux皆如此。許多程式語言也採用Unicode為內碼,如Java、Python 3。.

之间UTF-8和內碼相似

UTF-8和內碼有(在联盟百科)11共同点: ASCII字节电子邮件通用字符集GB 18030JavaLinuxMac OS XMicrosoft WindowsUnicode汉字

ASCII

ASCII( ,American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语,而其擴展版本EASCII則可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646。 ASCII第一次以規範標準的型態發表是在1967年,最後一次更新則是在1986年,至今為止共定義了128個字元;其中33個字元無法顯示(一些终端提供了扩展,使得这些字符可顯示为諸如笑臉、撲克牌花式等8-bit符號),且這33個字元多數都已是陳廢的控制字元。控制字元的用途主要是用來操控已經處理過的文字。在33個字元之外的是95個可顯示的字元。用鍵盤敲下空白鍵所產生的空白字元也算1個可顯示字元(顯示為空白)。.

ASCII和UTF-8 · ASCII和內碼 · 查看更多 »

字节

,通常用作计算机信息计量单位,不分数据类型。 一個字节代表八個。是程序设计语言不可缺少的基本数据类型——整數。 字节是现代计算机中连续的、固定数量的比特(二進制),即八個位元為一字节。 八个二进位经常在规范中被称为Octet(八位组),例如在一些工业标准、网络及电信技术裡。 Byte(字节)可缩写成B,例如MB表示Megabyte;Bit(位元)可缩写成b(小写),例如Mb表示。.

UTF-8和字节 · 內碼和字节 · 查看更多 »

电子邮件

@符号,是所有简单邮件传输协议电邮位址的组成部分 电子邮件 (Electronic Mail),簡稱電郵 (email or e-mail),是指一種由一寄件人將數位信息傳送給一個人或多個人的信息交換方式,一般會通过網際網路或其他電腦網路进行书写、发送和接收信件,目的是达成发信人和收信人之间的信息交互。一些早期的電子郵件需要寄件人和收件人同時在線,類似即時通訊。現在的電子郵件系統以是的模型為基礎。郵件伺服器接受、轉發、送出及儲存郵件。寄信人、收信人及他們的電腦都不用同時在線。寄信人和收信人只需在寄信或收信時簡短的連線到郵件伺服器即可。 以往电子邮件會用來泛指所有電子式的文件轉送。例如在1970年代初期有幾位作家用「电子邮件」來描述文件的傳真。因此很難確定什麼時候開始用「电子邮件」來描述符合現在定義的电子邮件。 电子邮件(符合現代定義,下同)包括三個部份,訊息的「信封」、郵件標頭及郵件內容。標頭會至少包括一些傳遞郵件相關的資訊,例如寄信人的郵件地址及一至多個收信人的郵件地址,一般會包括一些敘述性的內容,例如郵件的標題以及時間等。 电子邮件最早是純文字(ASCII)的溝通媒介,但後來擴展像可以加入多媒體的附件、其他字元集的文字,其程序RFC2045到2049中,同時也產生了多用途網際網路郵件擴展(MIME)。.

UTF-8和电子邮件 · 內碼和电子邮件 · 查看更多 »

通用字符集

通用字符集(Universal Character Set, UCS)是由ISO制定的ISO 10646(或称ISO/IEC 10646)标准所定义的标准字符集。 通用字符集又称Universal Multiple-Octet Coded Character Set,中国大陆译为通用多八位编码--集,台湾译为廣用多八位--元--組編碼--集。.

UTF-8和通用字符集 · 內碼和通用字符集 · 查看更多 »

GB 18030

GB 18030,全称:“国家标准GB 18030-2005《--》”,是中华人民共和国现时最新的变长度多字节字符集。对GB 2312-1980完全向后兼容,与GBK基本向后兼容;支持GB 13000(Unicode)的所有码位;共收录汉字70,244个。 GB 18030主要有以下特点:.

GB 18030和UTF-8 · GB 18030和內碼 · 查看更多 »

Java

Java是一種廣泛使用的電腦程式設計語言,擁有跨平台、物件導向、泛型程式設計的特性,广泛应用于企业级Web应用开发和移动应用开发。 任職於昇陽電腦的詹姆斯·高斯林等人于1990年代初开发Java語言的雛形,最初被命名为Oak,目標設定在家用电器等小型系統的程式语言,應用在电视机、电话、闹钟、烤面包机等家用电器的控制和通訊。由于这些智能化家电的市场需求没有预期的高,Sun公司放弃了该项计划。随着1990年代網際網路的发展,Sun公司看見Oak在網際網路上应用的前景,于是改造了Oak,於1995年5月以Java的名称正式发布。Java伴随着互联网的迅猛发展而发展,逐渐成为重要的网络编程语言。 Java编程语言的风格十分接近C++语言。继承了C++语言面向对象技术的核心,Java舍弃了C++语言中容易引起错误的-zh-hans:指针; zh-hant:指標;-,改以-zh-hans:引用; zh-hant:參照;-取代,同時移除了C++中的--和多重继承特性,改用接口取代,增加垃圾回收器功能。在Java SE 1.5版本中引入了泛型编程、类型安全的枚举、不定长参数和自动装/拆箱特性。昇陽電腦对Java语言的解释是:「Java编程语言是个简单、面向对象、分布式、解释性、健壮、安全与系统无关、可移植、高性能、多线程和动态的语言」 Java不同於一般的编译語言或直譯語言。它首先将源代码编译成字节码,然后依赖各种不同平台上的虚拟机来解释执行字节码,从而实现了“一次编写,到处运行”的跨平台特性。在早期JVM中,这在一定程度上降低了Java程序的运行效率。但在J2SE1.4.2发布后,Java的執行速度有了大幅提升。 与传统型態不同,Sun公司在推出Java時就将其作为开放的技术。全球数以万计的Java开发公司被要求所设计的Java软件必须相互兼容。“Java语言靠群体的力量而非公司的力量”是 Sun公司的口号之一,并获得了广大软件开发商的认同。这与微软公司所倡导的注重精英和封闭式的模式完全不同,此外,微软公司後來推出了与之竞争的.NET平台以及模仿Java的C#语言。後來Sun公司被甲骨文公司併購,Java也隨之成為甲骨文公司的產品。 現時,行動作業系統Android大部分的代碼採用Java 程式設計語言編程。.

Java和UTF-8 · Java和內碼 · 查看更多 »

Linux

Linux( )是一種自由和開放源碼的類UNIX作業系統。该操作系统的内核由林纳斯·托瓦兹在1991年10月5日首次发布。,在加上使用者空間的應用程式之後,成為Linux作業系統。Linux也是自由软件和开放源代码软件发展中最著名的例子。只要遵循GNU通用公共许可证(GPL),任何个人和机构都可以自由地使用Linux的所有底层源代码,也可以自由地修改和再发布。大多數Linux系統還包括像提供GUI的X Window之類的程序。除了一部分專家之外,大多數人都是直接使用Linux發行版,而不是自己選擇每一樣組件或自行設置。 Linux嚴格來說是單指作業系統的内核,因作業系統中包含了許多用戶圖形介面和其他实用工具。如今Linux常用来指基于Linux的完整操作系统,內核則改以Linux内核稱之。由于这些支持用户空间的系统工具和库主要由理查德·斯托曼于1983年发起的GNU计划提供,自由软件基金会提议将其组合系统命名为GNU/Linux,但Linux不屬於GNU計劃,這個名稱並沒有得到社群的一致認同。 Linux最初是作为支持英特尔x86架构的个人电脑的一个自由操作系统。目前Linux已经被移植到更多的计算机硬件平台,远远超出其他任何操作系统。Linux可以运行在服务器和其他大型平台之上,如大型主机和超级计算机。世界上500个最快的超级计算机90%以上运行Linux发行版或变种,包括最快的前10名超级电脑运行的都是基于Linux内核的操作系统。Linux也广泛应用在嵌入式系统上,如手机(Mobile Phone)、平板电脑(Tablet)、路由器(Router)、电视(TV)和电子游戏机等。在移动设备上广泛使用的Android操作系统就是建立在Linux内核之上。 通常情况下,Linux被打包成供个人计算机和服务器使用的Linux发行版,一些流行的主流Linux发布版,包括Debian(及其衍生版本Ubuntu、Linux Mint)、Fedora(及其相关版本Red Hat Enterprise Linux、CentOS)和openSUSE等。Linux发行版包含Linux内核和支撑内核的实用程序和库,通常还带有大量可以满足各类需求的应用程序。个人计算机使用的Linux发行版通常包含X Window和一个相应的桌面环境,如GNOME或KDE。桌面Linux操作系统常用的应用程序,包括Firefox网页浏览器、LibreOffice办公软件、GIMP图像处理工具等。由于Linux是自由软件,任何人都可以创建一个符合自己需求的Linux发行版。.

Linux和UTF-8 · Linux和內碼 · 查看更多 »

Mac OS X

#重定向 MacOS.

Mac OS X和UTF-8 · Mac OS X和內碼 · 查看更多 »

Microsoft Windows

Microsoft Windows(中文有时譯作微軟--,通常不做翻译)是微軟公司推出的一系列操作系统。它問世於1985年,起初是MS-DOS之下的桌面環境,其後續版本逐漸發展成為主要为個人電腦和服务器用户設計的操作系統,并最终获得了世界个人电脑操作系統的垄断地位。此操作系統可以在几种不同类型的平台上运行,如个人电脑(PC)、移动裝置、服务器(Server)和嵌入式系統等等,其中在个人电脑的领域应用内最为普遍。在2004年國際數據資訊公司一次有关未来发展趋势的会议上,副董事长Avneesh Saxena宣布Windows拥有终端操作系统大约70%的市场份额 www.linuxworld.com.au。 Windows操作系統目前最新的穩定版是於2015年7月29日發佈的 Windows 10。Windows Server目前最新的穩定版是2016年9月26日發佈的Windows Server 2016。.

Microsoft Windows和UTF-8 · Microsoft Windows和內碼 · 查看更多 »

Unicode

Unicode(萬國-)是電腦科學領域裡的一項業界標準。它对世界上大部分的文字系統進行了整理、編碼,使得電腦可以用更為簡單的方式來呈現和處理文字。 Unicode伴隨著通用字符集的標準而發展,同時也以書本的形式對外發表。Unicode至今仍在不斷增修,每個新版本都加入更多新的字符。目前最新的版本為2018年6月5日公布的11.0.0,已經收錄超過13萬個字符(第十萬個字符在2005年獲採納)。Unicode涵蓋的資料除了視覺上的字形、編碼方法、標準的字符編碼外,還包含了字符特性,如大小寫字母。 Unicode發展由非營利機構統一碼聯盟負責,該機構致力於讓Unicode方案取代既有的字符編碼方案。因為既有的方案往往空間非常有限,亦不適用於多語環境。 Unicode備受认可,並廣泛地應用於電腦軟體的國際化與本地化過程。有很多新科技,如可扩展置标语言(Extensible Markup Language,簡稱:XML)、Java程式語言以及現代的作業系統,都採用Unicode編碼。.

UTF-8和Unicode · Unicode和內碼 · 查看更多 »

汉字

漢字,在中國亦称中文字、国字、唐字、方塊字,是漢字文化圈廣泛使用的一種文字,是世界上独有的一种指示会意文字--体系,也是世界上唯一仍被廣泛使用並高度發展的語素文字Defrancis (1990); 蔣為文 (2005), (2007)",為中國上古時代的汉族先民所發明創製,其字體也歷經過長久改進及演變。目前确切歷史,可追溯至約公元前1300年商朝的甲骨文、籀文、金文,再到春秋戰國與秦朝的籀文、小篆,發展至漢朝隸變,產生隶书、草书以及楷书(以及衍生的行书),至唐代楷化為今日所用的手寫字體標準——正楷,也是今日普遍使用的現代漢字。漢字在古文中只稱「字」,為與少數民族文字區別而稱「漢字」,指漢人使用的文字,後者稱法在近代才開始通用,為日文借詞。 作為華語的書寫文字,汉字是迄今为止连续使用时间最长的主要文字,也是上古时期各大文字体系中唯一传承至今的,相较而言,古埃及、古巴比伦、古印度文字都早已消亡,所以有學者認為漢字是維繫中國南北長期處於統一狀態的關鍵元素之一,亦有學者將漢字列為中國第五大發明。中國歷代皆以漢字為主要官方文字,現時在中華民國與中華人民共和國均為實務上的官方文字。漢字在古代已發展至高度完備的水準,不單中國使用,在很長時期內還充當東亞地區唯一的國際通用文字,在20世紀前都是朝鮮半島、越南、琉球和日本等國家的書面規範文字。除了漢語之外,古代東亞諸國都有一定程度地自行創製漢字。 現代漢語漢字大致分成中文字與簡體字兩個體系,前者主要用於香港、澳門以及臺灣,而後者由中国大陆制定使用,并为新加坡、馬來西亞、印度尼西亚等國家采用。非漢語体系中,日本对部分汉字进行了简化、称为新字体,韓國也製定了官方的朝鮮漢字使用規範;而歷史上曾使用過漢字的越南、北韓、蒙古等國,漢字現今已不再具有官方規範地位。 華语及簡化汉字是聯合國的六個工作語言之一。.

UTF-8和汉字 · 內碼和汉字 · 查看更多 »

上面的列表回答下列问题

UTF-8和內碼之间的比较

UTF-8有75个关系,而內碼有71个。由于它们的共同之处11,杰卡德指数为7.53% = 11 / (75 + 71)。

参考

本文介绍UTF-8和內碼之间的关系。要访问该信息提取每篇文章,请访问: