我们正在努力恢复Google Play商店上的Unionpedia应用程序
🌟我们简化了设计以优化导航!
Instagram Facebook X LinkedIn

中文信息处理和汉字

快捷方式: 差异相似杰卡德相似系数参考

中文信息处理和汉字之间的区别

中文信息处理 vs. 汉字

中文信息处理是指用计算机对中文的音、形、义等信息进行处理和加工。中文信息处理是自然语言信息处理的一个分支,是一门与计算机科学、语言学、数学、信息学、声学等多种学科相关联的综合性学科。信息处理技术在现代有广泛的应用,从1980年代开始,中文信息处理进入了快速发展阶段,并极大地提高了中文社会的信息处理效率。 中文信息处理分为汉字信息处理与汉语信息处理两部分,具体内容包括对字、词、句、篇章的输入、存储、传输、输出、识别、转换、压缩、检索、分析、理解和生成等方面的处理技术。 基於歷史、國家疆域、政治等各種問題,中文信息处理系統所需要處理的文字,有時不仅包括简体汉字、繁体汉字,也包括藏文、蒙文、壮文、维吾尔文等大量少数民族的文字,周邊國家的日語假名、諺文,还包括古汉语文字、西夏文、契丹文等各種不同的文字。 中文信息處理可以從硬體及軟體兩方面去看,以下詳述中文信息處理的發展歷史、現況及未來發展等多方面的面貌。. 漢字,在中國亦称中文字、国字、唐字、方塊字,是漢字文化圈廣泛使用的一種文字,是世界上独有的一种指示会意文字--体系,也是世界上唯一仍被廣泛使用並高度發展的語素文字Defrancis (1990); 蔣為文 (2005), (2007)",為中國上古時代的汉族先民所發明創製,其字體也歷經過長久改進及演變。目前确切歷史,可追溯至約公元前1300年商朝的甲骨文、籀文、金文,再到春秋戰國與秦朝的籀文、小篆,發展至漢朝隸變,產生隶书、草书以及楷书(以及衍生的行书),至唐代楷化為今日所用的手寫字體標準——正楷,也是今日普遍使用的現代漢字。漢字在古文中只稱「字」,為與少數民族文字區別而稱「漢字」,指漢人使用的文字,後者稱法在近代才開始通用,為日文借詞。 作為華語的書寫文字,汉字是迄今为止连续使用时间最长的主要文字,也是上古时期各大文字体系中唯一传承至今的,相较而言,古埃及、古巴比伦、古印度文字都早已消亡,所以有學者認為漢字是維繫中國南北長期處於統一狀態的關鍵元素之一,亦有學者將漢字列為中國第五大發明。中國歷代皆以漢字為主要官方文字,現時在中華民國與中華人民共和國均為實務上的官方文字。漢字在古代已發展至高度完備的水準,不單中國使用,在很長時期內還充當東亞地區唯一的國際通用文字,在20世紀前都是朝鮮半島、越南、琉球和日本等國家的書面規範文字。除了漢語之外,古代東亞諸國都有一定程度地自行創製漢字。 現代漢語漢字大致分成中文字與簡體字兩個體系,前者主要用於香港、澳門以及臺灣,而後者由中国大陆制定使用,并为新加坡、馬來西亞、印度尼西亚等國家采用。非漢語体系中,日本对部分汉字进行了简化、称为新字体,韓國也製定了官方的朝鮮漢字使用規範;而歷史上曾使用過漢字的越南、北韓、蒙古等國,漢字現今已不再具有官方規範地位。 華语及簡化汉字是聯合國的六個工作語言之一。.

之间中文信息处理和汉字相似

中文信息处理和汉字有(在联盟百科)19共同点: 台灣契丹文中国大陆中華人民共和國中文打字機东亚书法動態組字繁体字西夏文諺文電子計算機通用字符集造字GB 2312Unicode汉字朱邦復日本

台灣

#重定向 臺灣.

中文信息处理和台灣 · 台灣和汉字 · 查看更多 »

契丹文

契丹文是契丹大字和契丹小字的統稱,是書寫契丹語的兩种文字,在契丹族建立的遼國有官方文字地位。大字和小字都有表意和表音的成分,小字的表音成分比大字多。大字和小字都没有完全解读出来,小字的研究比大字更加充分。 女真族建立不久就参考契丹文创制了女真文。但是金国取代辽国之後的一段時間裏,契丹文仍然流通,直至金章宗明昌二年十二月十一日(1191年12月28日)颁发诏令废除契丹字方正式退出历史。此後耶律楚材(1190年—1244年)向西遼人學習了契丹文,可能是历史记载中会契丹文的最后一人。.

中文信息处理和契丹文 · 契丹文和汉字 · 查看更多 »

中国大陆

中國大陸,中文使用上常通稱大陸或大陸地區,中华人民共和国政府官方有时也使用祖国大陆。此詞的使用在古代即有,非現代两岸关系中具有政治含义的大陆,而是中原文化圈中相對海洋島嶼的地理用詞。如在日本也有大陸文化的說法,二戰時曾用來稱呼中國外,至今以大陸代稱的用法在學術上仍有在使用。在海外的華人移民圈也有不少使用此用法的人。 在當代的使用上,指的是中華人民共和國政府直接管轄的區域。此肇因於第二次國共內戰後,1949年中華人民共和國政府成立所導致的海峽兩岸政治分立。 地理上,該詞是指中國的大陸領土,屬於歐亞大陸的一部分的事实,與海島相對;但當代的使用上,其做為一個政治名詞的用途遠大於地理名詞,指的是中華人民共和國政府直接管轄的區域,故海南島、舟山群島等中華人民共和國之海洋及海島領土,都被視為中國大陸的一部分,香港、澳門這兩個特別行政區以及「台灣」則排除在外。使用情形類似的還有「中国内地」一詞。 另一方面,第二次國共內戰後撤退至臺灣的中華民國政府,在法律上仍然主張中國大陸為其疆域,在《中華民國憲法增修條文》、《兩岸人民關係條例》等法律中稱為「大陸地區」、並定義為「臺灣地區以外之中華民國領土」,同時否認中華人民共和國為獨立之主權國家,而僅將其視為統治中國大陸之政治實體;在陳水扁政府上台前,中華民國政府認定的「大陸地區」還包括在1946年就已獨立建國的外蒙古、以及中俄邊境的爭議領土。香港與澳門因政治地位特殊,在法律上又另外以「港澳地區」合稱。 中華民國政府對中國大陸的定義,是中國國民黨執政時期一中各表、憲法一中等兩岸政策的重要基礎。而民主進步黨執政時期,由於其政治立場偏向臺灣獨立及臺灣主體性,此主張並不活躍,尤其在陳水扁政府時期起,主要以一邊一國思維處理兩岸關係,直接將中華人民共和國(中國)視為與中華民國(台灣)分立的國家。也讓大陸這個地理代稱用法再增添更多政治含义。.

中国大陆和中文信息处理 · 中国大陆和汉字 · 查看更多 »

中華人民共和國

#重定向 中华人民共和国.

中文信息处理和中華人民共和國 · 中華人民共和國和汉字 · 查看更多 »

中文打字機

中文打字机靠鉛字敲擊色帶,將文字著印於紙上。最初的「明快中文打字機」由林語堂於1946年發明,為一個約A2大小的盤面上,排滿了鉛字。常用字的排列次序預設按照部首筆劃排列,罕用字則有另外的字盤,實際使用時可根據需求自行排列。字盤內每個鉛字均為倒置且反寫,如此打出的字才會是正的。操作時,打字員首先要在鉛字盤上找到所需鉛字,手握打字機操作桿往下壓,將一顆鉛字鉗住夾起,再按一鍵時,小鉗就會舉起鉛字,隔著色帶印在紙上。中文打字機的特色,在於打字機能夠配合當時中國人書寫習慣,允許文字打直排。當打完一行按回車鍵之後,又會自動捲回頁首,並跳往下一行。 由於中文打字機的操作並不容易,要撿字也很困難,打字速度因此端看打字員對每一顆鉛字位置的記憶力與熟悉度來決定。當時一般人還是用手抄或油印。在1960年代的香港,只有比較富裕的學校才有能力負擔一位能操作中文打字機的打字員。直到1990年代,由於電腦的普及,使中文印刷變得更容易,中文打字機亦退出歷史的舞台。由電腦文書中文輸入法所取代。.

中文信息处理和中文打字機 · 中文打字機和汉字 · 查看更多 »

东亚

东亚泛指亚洲東部,包括中國大陸、日本列島、朝鮮半島和蒙古以及臺灣等地,面积约1170万平方千米,东亚总人口超过16亿。.

东亚和中文信息处理 · 东亚和汉字 · 查看更多 »

书法

書法是一種書寫的藝術。書法縱向穿透兩個層面:「使用」與「審美」;橫向跨越文字兩個層面:「文字」、「繪畫」。書法也是一種研究書寫者心理與性格的工具。當代對實踐書法的定義有:.

中文信息处理和书法 · 书法和汉字 · 查看更多 »

動態組字

動態組字是一種汉字在電腦等領域的編碼理論及技術。 拼音文字如英文字母,一套字型只要製作26個字母和一些標點符號就足夠使用。但漢字是一種意音文字,若無數千到數萬個字型數量,便不足以應付基本的訊息交換。即便已有數萬個字型,往往在面對古籍時還有缺字的問題。這造成漢字無論是製作、儲存、使用、或交流,成本都遠高於表音文字,這對漢字的文化發展非常不利。 鑑於此,兩岸都有人在研究「動態組字」技術,這個技術的目的是解除電腦系統對漢字的束縛。作法是,只在記憶體中儲存少量(約數百至一千多)的字根部件,並用程式控制,以遞迴的方式根據部件做即時的「二維組字」,顯示到螢幕上。「字根」在此就相當於拼音文字的字母,差別只在於字母表音而字根表意。 有了動態組字,使用者便可因應各式需求自行造字,再無缺字之虞。此外,組字的過程反向操作(也就是拆字),就可以作漢字理解,也有助於人工智慧、手寫辨識及中文PDA、手機等手持式裝置開發。亦可延長儲存裝置壽命。.

中文信息处理和動態組字 · 動態組字和汉字 · 查看更多 »

繁体字

本文介绍的是与简化字对应的汉字字汇。 繁体字(unsimplified Hanzi《计算机科学技术名词》(第二版),unsimplified Chinese characters),与简化字相对,指已有简化字代替的通常笔画较多的汉字。计算机科学技术百科全书 清华大学出版社 277页在实际生活中谈到的繁体字,实际上是指繁体字和传承字的集合。 ,或作傳統中文,與簡體中文(Simplified Chinese)相對,是使用繁體字作为書寫的最基本單元的文字系统。.

中文信息处理和繁体字 · 汉字和繁体字 · 查看更多 »

西夏文

西夏文是西夏仿汉字创制的,用於書寫西夏語。汇编字书12卷,定为“国书”,上自佛经诏令,下至民间书信,均用西夏文书写。为方便人们学习西夏文,还印行了字典。西夏于1227年亡于蒙古帝国,西夏文也随之逐渐湮灭无闻。如今,这些字典以及一批佛教经卷和手书作品,在内蒙古西部地区多有发现。西夏文的创立虽然字形与汉字相仿,但避免了与汉字的雷同。西夏語属汉藏语系的羌语支,西夏人的语言已失传,跟现代的羌语和嘉绒语关系最密切。.

中文信息处理和西夏文 · 汉字和西夏文 · 查看更多 »

諺文

諺文,现在的韓國称其为韓字(한글),朝鲜称其为朝鲜字(조선글),以区别於历史上的名称「朝鲜文」()。其俗称「朝--鮮字母」、「音文」、「训民正音」等,是朝鮮语所使用的表音文字。15世纪,在朝鮮王朝(1392年-1897年)第四代君主世宗国王(1418年-1450年在位)的倡导下,其由一批学者创造完成,于1443年正式创建,1446年頒布使用。在创造这些简单的音标以前,韓國人主要借用汉字来纪录他们的语言。 諺文有10个元音和14个辅音,可能组成许多音节。它既简单又具系统性,能全面的記錄朝鮮語的語音。諺文易于学习和印刷,对于減少文盲、促進出版事业发达,贡献甚巨。它应用于电脑系统也很容易,是世上最为系統化的文字。不過也造成了大量的同音同形異義詞,如「故事」、「古寺」、「古辭」、「告辭」、「告祀」及「枯死」等都寫作「고사」。因此必須根據上下文,才能判斷文義辭彙。.

中文信息处理和諺文 · 汉字和諺文 · 查看更多 »

電子計算機

--,亦稱--,计算机是一种利用数字电子技术,根据一系列指令指示其自动执行任意算术或逻辑操作序列的设备。计算机遵循被称为“程序”的一般操作集的能力使他们能够执行极其广泛的任务。 计算机被用作各种工业和消费设备的控制系统。这包括简单的特定用途设备(如微波炉和遥控器)、工业设备(如工业机器人和计算机辅助设计),以及通用设备(如个人电脑和智能手机之类的移动设备)等。尽管计算机种类繁多,但根据图灵机理论,一部具有最基本功能的计算机,应当能够完成任何其它计算机能做的事情。因此,理论上从智能手机到超级计算机都应该可以完成同样的作业(不考虑时间和存储因素)。由于科技的飞速进步,下一代计算机总是在性能上能够显著地超过其前一代,这一现象有时被称作“摩尔定律”。通过互联网,计算机互相连接,极大地提高了信息交换速度,反过来推动了科技的发展。在21世纪的现在,计算机的应用已经涉及到方方面面,各行各业了。 自古以来,简单的手动设备——就像算盘——帮助人们进行计算。在工业革命初期,各式各样的机械的出现,其初衷都是为了自动完成冗长而乏味的任务,例如织机的编织图案。更复杂的机器在20世纪初出现,通过模拟电路进行复杂特定的计算。第一台数字电子计算机出现于二战期间。自那时以来,电脑的速度,功耗和多功能性不断增加。在现代,机械计算--机的应用已经完全被电子计算机所取代。 计算机在组成上形式不一,早期计算机的体积足有一间房屋的大小,而今天某些嵌入式计算机可能比一副扑克牌还小。当然,即使在今天依然有大量体积庞大的巨型计算机为特别的科学计算或面向大型组织的事务处理需求服务。比较小的,为个人应用而设计的称为微型计算机(Personal Computer,PC),在中國地區简称為「微机」。我們今天在日常使用“计算机”一词时通常也是指此,不过现在计算机最为普遍的应用形式却是嵌入式,嵌入式计算机通常相对简单、体积小,并被用来控制其它设备——无论是飞机、工业机器人还是数码相机。 同计算机相关的技术研究叫计算--机科学,而「计算机技术」指的是将计算--机科学的成果应用于工程实践所派生的诸多技术性和经验性成果的总合。「计算机技术」与「计算机科学」是两个相关而又不同的概念,它们的不同在于前者偏重于实践而后者偏重于理论。至於由数据为核心的研究則称為信息技术。 传统上,现代计算机包括至少一个处理单元(通常是中央处理器(CPU))和某种形式的存储器。处理元件执行算术和逻辑运算,并且排序和控制单元可以响应于存储的信息改变操作的顺序。外围设备包括输入设备(键盘,鼠标,操纵杆等)、输出设备(显示器屏幕,打印机等)以及执行两种功能(例如触摸屏)的输入/输出设备。外围设备允许从外部来源检索信息,并使操作结果得以保存和检索。.

中文信息处理和電子計算機 · 汉字和電子計算機 · 查看更多 »

通用字符集

通用字符集(Universal Character Set, UCS)是由ISO制定的ISO 10646(或称ISO/IEC 10646)标准所定义的标准字符集。 通用字符集又称Universal Multiple-Octet Coded Character Set,中国大陆译为通用多八位编码--集,台湾译为廣用多八位--元--組編碼--集。.

中文信息处理和通用字符集 · 汉字和通用字符集 · 查看更多 »

造字

造字本來是一個東亞汉字系統的一個重要組成部份。由於現存的漢字數超過十萬以上,而這些漢字都未必是我們日常會使用的字。而在有專門為東亞民族設計的系統時,就已經有“造字”的概念,以與系統內的常用字作區別。.

中文信息处理和造字 · 汉字和造字 · 查看更多 »

GB 2312

GB 2312 或 GB 2312–80 是中华人民共和国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》,通常簡稱GB,又稱GB0,由中国国家标准总局发布,1981年5月1日实施。GB 2312编码通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。.

GB 2312和中文信息处理 · GB 2312和汉字 · 查看更多 »

Unicode

Unicode(萬國-)是電腦科學領域裡的一項業界標準。它对世界上大部分的文字系統進行了整理、編碼,使得電腦可以用更為簡單的方式來呈現和處理文字。 Unicode伴隨著通用字符集的標準而發展,同時也以書本的形式對外發表。Unicode至今仍在不斷增修,每個新版本都加入更多新的字符。目前最新的版本為2018年6月5日公布的11.0.0,已經收錄超過13萬個字符(第十萬個字符在2005年獲採納)。Unicode涵蓋的資料除了視覺上的字形、編碼方法、標準的字符編碼外,還包含了字符特性,如大小寫字母。 Unicode發展由非營利機構統一碼聯盟負責,該機構致力於讓Unicode方案取代既有的字符編碼方案。因為既有的方案往往空間非常有限,亦不適用於多語環境。 Unicode備受认可,並廣泛地應用於電腦軟體的國際化與本地化過程。有很多新科技,如可扩展置标语言(Extensible Markup Language,簡稱:XML)、Java程式語言以及現代的作業系統,都採用Unicode編碼。.

Unicode和中文信息处理 · Unicode和汉字 · 查看更多 »

汉字

漢字,在中國亦称中文字、国字、唐字、方塊字,是漢字文化圈廣泛使用的一種文字,是世界上独有的一种指示会意文字--体系,也是世界上唯一仍被廣泛使用並高度發展的語素文字Defrancis (1990); 蔣為文 (2005), (2007)",為中國上古時代的汉族先民所發明創製,其字體也歷經過長久改進及演變。目前确切歷史,可追溯至約公元前1300年商朝的甲骨文、籀文、金文,再到春秋戰國與秦朝的籀文、小篆,發展至漢朝隸變,產生隶书、草书以及楷书(以及衍生的行书),至唐代楷化為今日所用的手寫字體標準——正楷,也是今日普遍使用的現代漢字。漢字在古文中只稱「字」,為與少數民族文字區別而稱「漢字」,指漢人使用的文字,後者稱法在近代才開始通用,為日文借詞。 作為華語的書寫文字,汉字是迄今为止连续使用时间最长的主要文字,也是上古时期各大文字体系中唯一传承至今的,相较而言,古埃及、古巴比伦、古印度文字都早已消亡,所以有學者認為漢字是維繫中國南北長期處於統一狀態的關鍵元素之一,亦有學者將漢字列為中國第五大發明。中國歷代皆以漢字為主要官方文字,現時在中華民國與中華人民共和國均為實務上的官方文字。漢字在古代已發展至高度完備的水準,不單中國使用,在很長時期內還充當東亞地區唯一的國際通用文字,在20世紀前都是朝鮮半島、越南、琉球和日本等國家的書面規範文字。除了漢語之外,古代東亞諸國都有一定程度地自行創製漢字。 現代漢語漢字大致分成中文字與簡體字兩個體系,前者主要用於香港、澳門以及臺灣,而後者由中国大陆制定使用,并为新加坡、馬來西亞、印度尼西亚等國家采用。非漢語体系中,日本对部分汉字进行了简化、称为新字体,韓國也製定了官方的朝鮮漢字使用規範;而歷史上曾使用過漢字的越南、北韓、蒙古等國,漢字現今已不再具有官方規範地位。 華语及簡化汉字是聯合國的六個工作語言之一。.

中文信息处理和汉字 · 汉字和汉字 · 查看更多 »

朱邦復

朱邦復(Chu Bong-Foo,),湖北省黃岡縣人。為中文終端機、倉頡輸入法、漢卡的發明人。由於其對中文電腦發展的眾多貢獻,台灣及香港地區的華人譽其為「中文電腦之父」。亦因其個性獨具、天馬行空,被人稱為「中文電腦瘋子」。 朱邦復除了從事中文電腦研究,也致力於研究中國文化哲理,著作等身,其中以漢字基因理論最為顯著。.

中文信息处理和朱邦復 · 朱邦復和汉字 · 查看更多 »

日本

日本國(),是位於東亞的島嶼國家,由日本列島、琉球群島和伊豆-小笠原群島等6,852個島嶼組成,面積約37.8万平方公里。國土全境被太平洋及其緣海環抱,西鄰朝鮮半島及俄罗斯,北面堪察加半島,西南為臺灣及中國東部。人口達1.26億,居於世界各國第11位,當中逾3,500萬以上的人口居住於東京都與周邊數縣構成的首都圈,為世界最大的都市圈。政體施行議會制君主立憲制,君主天皇為日本國家與國民的象徵,實際的政治權力則由國會(參眾兩院)、以及內閣總理大臣(首相)所領導的內閣掌理,最高法院為最高裁判所。 傳說日本於公元前660年2月11日,由天照大神之孫下凡所生之後代磐余彥尊所建,在公元4世紀出現首個統一政權,並於大化改新中確立了天皇的中央集权體制。至平安時代結束前,日本透過文字、宗教、藝術、政治制度等從漢文化引進的事物,開始衍生出今日為人所知的文化基礎。12世紀後的六百年間,日本由武家階級建立的幕府實際掌權。17世纪起江户幕府頒布锁国令,至1854年被迫開港才結束。此後,日本在西方列強進逼的時局下,首先天皇從幕府手中收回統治權,接著在19世紀中期的明治维新進行大規模政治與經濟改革,實現工業化及現代化;而自19世纪末起,日本首先兼併琉球,再拿下台灣、朝鮮、樺太等地為屬地。進入20世紀時,日本已成為當時世界的帝國主義強權之一,也是當時東方世界唯一的大國。日本後來成為第二次世界大戰的軸心國之一,對中國與南洋發動全面侵略,但最终於1945年戰敗投降。日本投降至1952年《旧金山和约》生效前,同盟国军事占领日本,並監督日本制定新憲法、建立今日所見的政治架構,日本轉型為以國會為中心的民主政體,天皇地位虛位化,並依照憲法第九條放棄維持武装以及宣戰權。而日本雖在法律上實施非武裝化,出於自我防衛上的需要,仍擁有功能等同於其他國家軍隊的自衛隊。 日本是世界第三大經濟體,亦為七大工業國組織成員,是世界先進國家之一,主要奠基於日本經濟在二戰後的巨幅增長。現時日本的科研能力、工業基礎和製造業技術均位居世界前茅,並是世界第四大出口國和進口國。2015年,日本的人均國內生產總值依國際匯率可兌換成為三萬二千,人均國民收入則在三萬七千美元左右,人類發展指數亦一直維持在極高水平。.

中文信息处理和日本 · 日本和汉字 · 查看更多 »

上面的列表回答下列问题

中文信息处理和汉字之间的比较

中文信息处理有104个关系,而汉字有337个。由于它们的共同之处19,杰卡德指数为4.31% = 19 / (104 + 337)。

参考

本文介绍中文信息处理和汉字之间的关系。要访问该信息提取每篇文章,请访问: