徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
自由
比浏览器更快的访问!
 

机器翻译

指数 机器翻译

機器翻譯(英語:Machine Translation,經常簡寫為MT,俗称机翻)屬於計算語言學的範疇,其研究藉由-zh-hant:電腦程式;zh-hans:计算机程序-將文字或演說從一種自然語言翻譯成另一種自然語言。簡單來說,機器翻譯是--將一個自然語言的字辭取代成另一個自然語言的字辭。藉由使用語料庫的技術,可達成更加複雜的自動翻譯,包含可更佳的處理不同的文法結構、辭彙辨識、慣用語的對應等。 目前的機器翻譯軟體通常可允許針對特定領域或是專業领域(例如天氣預報)來加以客製化,目的在於將辭彙的取代縮小於該特定領域的專有名詞上,以藉此改進翻譯的結果。這樣的技術适合針對一些使用較正规或是較制式化陳述方式的領域。例如政府機關公文或是法律相關文件,這類型的文句通常比一般的文句更加正式與制式化,其機器翻譯的结果通常比日常对话等非正式场合所使用语言的翻译结果更加符合语法。 目前的一些翻译机器,例如AltaVista Babelfish,有時可以得到可以理解的翻译结果,但是想要得到較有意義的翻譯結果,往往需要在輸入語句時適當地編輯,以利電腦程式分析。 但是,機器翻譯的結果好壞,往往取決於譯入及譯出語之間的詞彙、文法結構、語系甚至文化上的差異,例如英语與荷兰语同為印歐語系日耳曼語族,這兩種語言間的機器翻譯結果通常比汉语與英语間機器翻译的結果好。 因此,要改善機器翻譯的結果,人為的介入仍顯相當重要。 一般而言,大眾使用機器翻譯的目的只是為了获知原文句子或段落的要旨,而不是精確的翻譯。總的来说,機器翻譯的效果并没有达到可以取代人工翻译的程度,所以無法成為正式的翻譯。 不過現在已有越來越多的公司嘗試以機器翻譯的技術來提供其公司網站多語系支援的服務。例如微軟公司試將其 MSDN 以機器翻譯來自動翻譯成多國語言,如上文所说,知识库作为专业领域,其文法较为制式化,翻译结果亦更加符合自然语言。.

23 关系: 印欧语系世界語言微軟笛卡兒统计机器翻译翻译荷蘭語認知计算语言学计算机程序语言系属分类语法语料库自然语言英语電腦輔助翻譯MSDN技术资源库汉语成语戈特弗里德·莱布尼茨文化文法日耳曼语族

印欧语系

印欧语系(Indo-European languages),是世界上分布最广泛的语系之一。欧洲、美洲、南亚和大洋洲的大部分国家都采用印欧语系的语言作为母语或官方语言。印欧语系包括約443种(SIL統計)語言和方言,使用人數大約有20億。.

新!!: 机器翻译和印欧语系 · 查看更多 »

世界語言

世界語言指發展中國家通用的语言。不少人以此為第二語言,但並非單靠使用者(母語或第二語言使用者)人數而定的。其地理分佈,乃至在国际组织和外交上的應用亦是考慮的因素。因為殖民主义的影響,不少世界語言均來自欧洲。來自歷史上的殖民帝國的世界語言有英语、西班牙语、葡萄牙語及法语。至於阿拉伯语的國際地位,則歸功於中世纪阿拉伯征服者的伊斯蘭教傳播。 有些主要語言不橫跨大陸使用,但在國際上有重要意義。它們曾作為歷史上的帝國的通用語,譬如罗马帝国的拉丁语、中國的漢語、俄羅斯帝國的俄語、德意志帝國的德語,以及通行於印度、斯里蘭卡、馬來西亞和新加坡的坦米爾語,以及在英屬印度以後統一印度的印地語。 印度次大陸的主要語言(包括所有北印度方言和烏爾都語)及孟加拉語,因為數十年來過度的人口增長,使用人數媲美主要世界語言。同樣,日語的使用者比法語為多,分別在於法語是洲際語言,也是不少人的第二語言;而日語使用者以本國的日本人居多,以日語當作第二語言的人則主要集中在東亞,日本ACG在全球的流行也增加了學習日文的人口。 在現代,英語被最多國家作為官方語言且也是事實上的國際語言。除英文之外,法語、西班牙文和阿拉伯文也是世界上最多國家的官方語言,亦是重要的世界語言。.

新!!: 机器翻译和世界語言 · 查看更多 »

微軟

#重定向 微软.

新!!: 机器翻译和微軟 · 查看更多 »

笛卡兒

#重定向 勒内·笛卡尔.

新!!: 机器翻译和笛卡兒 · 查看更多 »

统计机器翻译

统计机器翻译(Statistical Machine Translation,简写为SMT)是机器翻译的一种,也是目前非限定领域机器翻译中性能较佳的一种方法。统计机器翻译的基本思想是通过对大量的平行语料进行统计分析,构建统计翻译模型,进而使用此模型进行翻译。从早期基于词的机器翻译已经过渡到基于短语的翻译,并正在融合句法信息,以进一步提高翻译的精确性。 2016年前Google翻译的大部分语言对采用的都是统计机器翻译的方法。而Google亦在此本领域保持领先地位,在美国国家标准局组织的机器翻译评测中遥遥领先。但Google翻译在2016年11月开始使用神經機器翻譯作为主要翻译系统,并开发了Google神經機器翻譯系統。此外,常用的基于统计法机器翻译的系统还包括Bing翻译和百度翻译等。 统计机器翻译的首要任务是为语言的产生构造某种合理的统计模型,并在此统计模型基础上,定义要估计的模型参数,并设计参数估计算法。早期的基于词的统计机器翻译采用的是噪声信道模型,采用最大似然准则进行无监督训练,而近年来常用的基于短语的统计机器翻译则采用区分性训练方法,一般来说需要参考语料进行有监督训练。.

新!!: 机器翻译和统计机器翻译 · 查看更多 »

翻译

翻译,是指在准确通顺的基础上,把一种语言信息转变成另一种语言信息的活动。 这个过程从逻辑上可以分为两个阶段:首先,必须从源语言中译码含义,然后把信息重新编码成目标语言。所有的这两步都要求对语言语义学的知识以及对语言使用者文化的了解。除了要保留原有的意思外,一个好的翻译,对于目标语言的使用者来说,應該要能像是以母語使用者说或写得那般流畅,並要符合譯入语的习惯(除非是在特殊情况下,演说者并不打算像一个本语言使用者那样说话,例如在戏剧中)。 翻譯分为口譯、筆譯和手語。口譯又稱為「傳譯」,顧名思義,是指譯員以口語的方式,將譯入語轉換為譯出語。由於語言必定早於文字出現,因此口譯的出現也必定早於筆譯。.

新!!: 机器翻译和翻译 · 查看更多 »

荷蘭語

荷兰語(Nederlands),又稱尼德蘭語,属於印欧语系日耳曼语族下的西日耳曼语支,主要通行於荷蘭,在比利時與蘇利南有六成人口使用它,這三個國家共同組成荷蘭語聯盟。是荷蘭、比利時、苏里南和荷属安的列斯群岛的官方語言。在荷兰全境和比利时北部的佛兰德斯地区通用。欧洲约有2300万人以荷兰语为第一语言,還有曾經被荷蘭統治了四個世紀的印度尼西亞也有日常的使用。 "1% of the EU population claims to speak Dutch well enough in order to have a conversation." (page 153) 荷兰语字母表由26或27個拉丁字母组成,除A至Z外,在Y后面有一个 IJ 。荷兰语有时用 IJ 代替Y。 荷兰语与英语和德语接近,同属西日耳曼语支。荷兰语是由古代低地德语诸方言演变而来,最早的荷兰语文献可追溯到12世纪的佛兰德斯。当代荷兰语是五种方言群体的集合:中西部方言(包括南、北荷兰省,乌德勒支,海尔德兰的大部和西兰的岛屿等地区使用的方言),东北方言(格罗宁根、德伦特、上埃塞尔和海尔德兰东部使用的方言),中南部方言(北博拉班特及其周边的林堡地区,比利时的安特卫普、博拉班特和东弗兰德斯),西南部方言(西弗兰德斯)和东南部方言(荷兰的林堡地区大部和比利时的同名地区)。东北方言通常被称为萨克森方言,东南方言被称为东部低地法兰科方言,其他的三个群体则被称为西部低地法兰科方言。荷兰的弗里斯兰省的语言通常单独列为一种语言:弗里斯兰语。南非荷兰语是17世紀殖民者所說的荷蘭語的變種,有相當數量的馬來、班圖諸語言的借詞和語法散佈其中,南非白人的祖先名為布爾人,其名稱的由來是來自荷蘭語中boer(農夫)這個單詞。 荷蘭語的舌後音較德語、俄語等多,除了ch發舌後音外,連g也是發舌後音的。.

新!!: 机器翻译和荷蘭語 · 查看更多 »

認知

認知或认识(cognition)在心理學中是指通过形成概念、知觉、判断或想象等心理活动来获取知识的过程,即個體思维进行信息处理(information processing)的心理功能。認知過程可以是自然的或人造的、有意識或無意識;因此,麻醉學、神經科學、心理學、哲學、系統學以及計算機科學在分析認知時,其分析的聚焦點以及脈絡是不同的。 对认知进行研究的科学称为认知科学。 Category:認知科學.

新!!: 机器翻译和認知 · 查看更多 »

计算语言学

計算語言學,亦稱電腦語言學(computational linguistics)是一門跨學科的研究領域,試圖找出自然語言的規律,建立運算模型,最終讓電腦能夠像人類般分析,理解和處理自然語言。 過去,計算語言學的研究一般由專門負責利用電腦處理自然語言的電腦學家進行。由於近年的研究顯示人類語言是超乎想像的複雜,現在的計算語言學研究多由來自不同學科的專家共同進行。一般來說,研究隊伍的成員有電腦學家、語言學家、語言專家(熟悉有關研究項目所要處理的語言的人),以至研究人工智能、認知心理學、數學、邏輯學等的專家。 計算語言學具有理論和應用的成分。理論計算語言學聚焦於理論語言學與認知科學;應用計算語言學聚焦於模擬人類使用語言的實用成果。 對於計算語言學的定義是:……從計算的觀點,以科學方法研究語言的學問。計算語言學家關注於提供各種語言學現象的計算模型。.

新!!: 机器翻译和计算语言学 · 查看更多 »

计算机程序

计算机程序(Computer Program)是指一组指示计算机或其他具有訊息处理能力装置每一步动作的指令,通常用某种程序设计语言编写,运行于某种目标体--结构上。打个比方,一个程序就像一个用汉语(程序设计语言)写下的红烧肉菜谱(程序),用于指导懂汉语(編譯器)同時也會烹饪手法的人(体--结构)来做这道菜。 通常,以英文文本為基礎的计算机程序要经过編譯和連結而成为一种人们不易看清而计算机可解讀的一連串數字的格式,然后放入运行。未经编译就可运行的程序,通常称之为脚本程序(script)。.

新!!: 机器翻译和计算机程序 · 查看更多 »

语言系属分类

语系图 语言系属分类(Language family)是指根据语言的发展和演变、直接而明显的关联,对语言进行归类的方法。 语言系属分类主要依据语言语音、词汇、语法规则之间某些对应关系,把具有相似的语言归于同一类语群,这种语群称为同族语言即“语族”;按“语族”之间的某些对应关系,又归在一起,这类同类语族称为同系语言即“语系”。 现今全世界现存的语言約6900種,根据系属分类的方法,将语言分为若干个语群,每个语群中的语言可以直接或间接反应语言分化与进化,而同类语群的语言是由一个祖语(母语言)演变而来的。语言系属分类法采取“祖语”作为前缀,其分支链接下来,图标图表类似一个系谱表。 一般只对自然语言进行系属分类,而不考虑人工语言。 在汉语的语境裡,对世界诸语言的分类,有“语系”、语系下面的“语族”,较大语族下面衍生出语言支系(或简称“语支”),最后就是具体语言,最多达到四个层次。但实际上,语言的分支比这往往更复杂,所以有时亦因利乘便的把分类再细分为“亚语族”、“亚语支”等分类。有人提出在语族和语支之间增设“语群”,在语支和语言之间增设“语组”或“语团”。而在語系之上,則有「超語系」、「大語系」,或稱為「語門」。.

新!!: 机器翻译和语言系属分类 · 查看更多 »

语法

语言学中语法(Grammar)是指任意自然语言中控制子句、词组以及单词等结构的规则,这一概念也被用来指对于这些规则进行研究的学科,例如词法学、语法学或音韵学等,并和其他学科如语音学、语义学或语用学互相补充。在很多文献中,语言学家通常不用“语法”来指正寫法。.

新!!: 机器翻译和语法 · 查看更多 »

语料库

语料库一詞在語言學上意指大量的文本,通常經過整理,具有既定格式與標記;事實上,語料庫英文 "" 的涵意即為 "body of text"。.

新!!: 机器翻译和语料库 · 查看更多 »

自然语言

自然语言(Natural language)通常是指一种自然地随文化演化的语言。英语、汉语、法語、西班牙語、日语为自然语言的例子,而世界语则为人工语言,即是一种由人特意为某些特定目的而创造的语言。 不过,有时所有人类使用的语言(包括上述自然地随文化演化的语言,以及人工语言)都会被视为“自然”语言,以相对于如编程语言等为计算机而设的“人造”语言。这一种用法可见于自然语言处理一词中。自然语言是人类交流和思维的主要工具。.

新!!: 机器翻译和自然语言 · 查看更多 »

英语

英语(English,)是一种西日耳曼语言,诞生于中世纪早期的英格兰,如今具有全球通用语的地位。“英语”一词源于迁居英格兰的日耳曼部落盎格鲁(Angles),而“盎格鲁”得名于临波罗的海的半岛盎格里亚(Anglia)。弗里西语是与英语最相近的语言。英语词汇在中世纪早期受到了其他日耳曼族语言的大量影响,后来受罗曼族语言尤其是法语的影响。英语是将近六十个国家唯一的官方语言或官方语言之一,也是全世界最多國家的官方語言。它是英国、美国、加拿大、澳大利亚、爱尔兰和新西兰最常用的语言,也在加勒比、非洲及南亚的部分地区被广泛使用。它是世界上母语人口第三多的语言,仅次于汉语和西班牙语。英语是学习者最多的第二外语跟學習者最多的第一外語,是联合国、欧盟和许多其他国际组织的官方语言。它是使用最广泛的日耳曼族语言,至少70%的日耳曼语族使用者说英语。 英语有1400多年的发展史。公元5世纪,盎格魯-撒克遜人把他们的各种盎格鲁-弗里西语方言带到了大不列顛島,它们被称为古英语。中古英语始于11世纪后期的诺曼征服,这一时期英语受到了法语的影响。15世纪末伦敦对印刷机的采用、《钦定版圣经》的出版及元音大推移标志了近代英语的开端。通过大英帝国对全球的影响,现代英语在17世纪至20世纪中叶传播到了世界各地。通过各种印刷和电子媒体,随着美国取得全球超级大国地位,英语已经成为了国际对话中居领导地位的世界語言。它还是许多地区和行业(如科学、导航、法律等)的通用语。 现代英语和很多其他语言相比屈折变化较少,更多地依靠助動詞和语序来表达复杂的时态、体和语气,以及被動語態、疑问和一些否定。英语的各种口音和方言在发音和音位方面有显著差异,有时它们的词汇、语法和拼法也有所不同,但世界各地说英语的人能基本无碍地沟通交流。.

新!!: 机器翻译和英语 · 查看更多 »

電腦輔助翻譯

電腦輔助翻譯(CAT,Computer-assisted Translation或Computer-aided Translation),亦稱電腦輔助翻譯系統,係透過人工智慧搜尋及比對技術,運用參考資料庫和翻譯記憶程式,紀錄翻譯人員所完成之譯文,當遇到相同與重複的句型、片語或專業術語時,能提供翻譯人員建議和解決方案,以節省翻譯時間及成本,同時確保翻譯品質與風格的一致性。 簡而言之,電腦輔助翻譯就是充分運用資料庫功能,將已翻譯的文本內容加以儲存。當日後遇到相似或相同的翻譯文句時,電腦會自動比對並建議翻譯人員使用資料庫中已有的譯文作為可能的翻譯,讓翻譯人員自行決定是否接受、編輯或拒絕使用。概念上與一般機器翻譯、翻譯機、翻譯軟體及線上翻譯軟體截然不同。並非僅僅是將文句詞語交給軟體處理後,軟體處理結果即為最終的翻譯結果。電腦輔助翻譯中,電腦處理的結果僅供翻譯人員參考,並非最終的翻譯結果,最終是由翻譯人員來決定最適合的翻譯結果。.

新!!: 机器翻译和電腦輔助翻譯 · 查看更多 »

MSDN技术资源库

MSDN技术资源库是微软公司为软件和网站开发人员提供的技术资源库,名字中的MSDN意味着微软开发者网络。.

新!!: 机器翻译和MSDN技术资源库 · 查看更多 »

汉语

漢語,又稱中文、華文、唐話、中國話等,是漢藏語系漢語族下之一種語文,為世界使用人数最多的语言,目前世界有六分之一人口做為母語。漢語有多種分支语言,當中現代標準漢語為現行的漢語通用語,為中华人民共和国的国家通用语言(又稱為普通話)、以及中華民國的国语。此外,漢語還是聯合國官方語言之一傳統華人社會習慣稱之為「漢語」,本文一律以漢族慣稱「漢語」來表示,國際間常稱中文。其他稱呼僅限特定人群使用,請另見相關條目。,并被上海合作组织等国际组织采用为官方语言。 汉字是汉语的文字書寫系统,又称汉文、中文、华文、唐文,在中华民国又称为国文,是一种意音文字,表意的同時也具一定的表音功能。漢語属分析语,有声调。漢語包含書面語及口語兩部分,古代書面汉语称为文言文,现代书面汉语一般指使用現代標準漢語語法、詞彙的中文通行文体(又称白话文)。 对于汉语的分支语言,学界主要有两种观点,一种观点将汉语定义为语言,并将官话、贛語、闽语、粤语、客家语、吴语、湘语七大语言定义为一级方言;另一种观点则将汉语视为语族,其下無法互相溝通的視為語言,如國際標準化組織就將漢語族分為13種語言:闽东语、晋语、官话、莆仙语、徽语、闽中语、赣语、客家语、湘语、闽北语、闽南语、吴语、粤语。.

新!!: 机器翻译和汉语 · 查看更多 »

成语

成语是東亞特有的语言形式,存在於在漢語、日本語、朝鮮語、越南語等語言中,它是一个固定短语,表达了一个固定的语意,常带有历史故事及哲学意义。成语大多数由四个汉字组成,在文言文中使用广泛,也有其他字数不等的成语,在白话文或者日常会话中也经常出现。.

新!!: 机器翻译和成语 · 查看更多 »

戈特弗里德·莱布尼茨

戈特弗里德·威廉·莱布尼茨(Gottfried Wilhelm Leibniz, 或 ;Godefroi Guillaume Leibnitz,,),德意志哲学家、数学家,歷史上少見的通才,獲誉为十七世纪的亚里士多德。他本人是律師,經常往返於各大城鎮;他許多的公式都是在顛簸的馬車上完成的,他也自稱具有男爵的貴族身份。 莱布尼茨在数学史和哲学史上都占有重要地位。在数学上,他和牛顿先后独立发明了微积分,而且他所使用的微積分的数学符号被更廣泛的使用,萊布尼茨所发明的符号被普遍认为更综合,适用范围更加广泛。莱布尼茨还对二进制的发展做出了贡献。 在哲学上,莱布尼茨的乐观主义最为著名;他认为,“我们的宇宙,在某种意义上是上帝所创造的最好的一个”。他和笛卡尔、巴鲁赫·斯宾诺莎被认为是十七世纪三位最伟大的理性主义哲学家。莱布尼茨在哲学方面的工作在预见了现代逻辑学和分析哲学诞生的同时,也显然深受经院哲学传统的影响,更多地应用第一性原理或先验定义,而不是实验证据来推导以得到结论。 莱布尼茨对物理学和技术的发展也做出了重大贡献,并且提出了一些后来涉及广泛——包括生物学、医学、地质学、概率论、心理学、语言学和信息科学——的概念。莱布尼茨在政治学、法学、伦理学、神学、哲学、历史学、语言学诸多方向都留下了著作。 莱布尼茨对如此繁多的学科方向的贡献分散在各种学术期刊、成千上万封信件、和未发表的手稿中,其中約四成為拉丁文、約三成為法文、約一成五為德文。截至2010年,莱布尼茨的所有作品还没有收集完全。 2007年,戈特弗里德·威廉·莱布尼茨图书馆暨下薩克森州州立圖書舘的莱布尼茨手稿藏品被收入联合国教科文组织编写的世界记忆项目。 由於莱布尼茨曾在汉诺威生活和工作了近四十年,并且在汉诺威去世,为了纪念他和他的学术成就,2006年7月1日,也就是萊布尼茨360周年诞辰之际,汉诺威大学正式改名为汉诺威莱布尼茨大学。.

新!!: 机器翻译和戈特弗里德·莱布尼茨 · 查看更多 »

文化

文化是由古羅馬哲學家西塞羅首次使用拉丁文“cultura animi”定义,原意是“靈魂的培養”,由此衍生為生物在其發展过程中积累起跟自身生活相关的知识或經驗,使其适应自然或周围的環境,是一群共同生活在相同自然環境及經濟生產方式所形成的一種約定俗成潛意識的外在表現。 对“文化”有各種各樣的定义,其中之一的意義是「相互通過學習人類思想與行為的精華來達到完美」;广义的文化包括文字、語言、建筑、饮食、工具、技能、知识、习俗、艺术等。大致上可以用一個民族的生活形式來指稱它的文化。 在考古学上“文化”则指同一历史时期的遗迹、遗物的综合体。同样的工具、用具、制造技术等是同一种文化的特征。文化和文明有时在用法上混淆不清。 現今中文裡文化一詞的意思,借自於日文和製漢語中"文化"之義,其所表達的概念、集合與意涵和華夏古籍的原義相差甚遠,應避免望文生義。 網際網路成熟的發展使原先相對疏離的個人或組織可以很容易經由社群網站,建立許多新的基於價值觀、理想、觀念、商業、友誼、血緣等等非常錯綜複雜的聯繫,由此發展出特定社群意識的網路文化,這種網路文化聯繫瞬間的爆發力,對特定議題及選舉所造成的影響已經是新興不可忽視的力量。.

新!!: 机器翻译和文化 · 查看更多 »

文法

文法即文章的書寫法規,一般用來指以文字、詞語、短句、句子編排而成的完整語句和文章的合理性組織。.

新!!: 机器翻译和文法 · 查看更多 »

日耳曼语族

日耳曼語族是印歐語系的一支,是居住在北部歐洲日耳曼民族的語族。這一族語言有鮮明的特徵,最著名的有關於輔音演變的格里姆定律。.

新!!: 机器翻译和日耳曼语族 · 查看更多 »

重定向到这里:

在线翻译機器翻譯機械翻譯

传出传入
嘿!我们在Facebook上吧! »