分词和统计机器翻译

分词和统计机器翻译之间的区别

分词 vs. 统计机器翻译

在语言学中，分词（participle、participium，是希腊语μετοχη(“分担”)的直译）是一种非定式动词形式，可以用于构成复合时态、语态或作为修饰语。分词常常有其他词类的特征，特别是形容词和名词的特征。有分词的语系有印欧语系、闪-含语系、乌拉尔语系、阿尔泰语系、因纽特-阿留申语系等。汉藏语系的诸语言则没有分词这一语法范畴。在多数现代欧洲语言中，分词有现在分词（present participle）和过去分词（past participle）两种。在德语中，这两种分词更习惯叫作第一分词（Partizip I）和第二分词（Partizip II）。. 统计机器翻译（Statistical Machine Translation，简写为SMT）是机器翻译的一种，也是目前非限定领域机器翻译中性能较佳的一种方法。统计机器翻译的基本思想是通过对大量的平行语料进行统计分析，构建统计翻译模型，进而使用此模型进行翻译。从早期基于词的机器翻译已经过渡到基于短语的翻译，并正在融合句法信息，以进一步提高翻译的精确性。 2016年前Google翻译的大部分语言对采用的都是统计机器翻译的方法。而Google亦在此本领域保持领先地位，在美国国家标准局组织的机器翻译评测中遥遥领先。但Google翻译在2016年11月开始使用神經機器翻譯作为主要翻译系统，并开发了Google神經機器翻譯系統。此外，常用的基于统计法机器翻译的系统还包括Bing翻译和百度翻译等。统计机器翻译的首要任务是为语言的产生构造某种合理的统计模型，并在此统计模型基础上，定义要估计的模型参数，并设计参数估计算法。早期的基于词的统计机器翻译采用的是噪声信道模型，采用最大似然准则进行无监督训练，而近年来常用的基于短语的统计机器翻译则采用区分性训练方法，一般来说需要参考语料进行有监督训练。.

之间分词和统计机器翻译相似

分词和统计机器翻译有1共同点（的联盟百科）: 印欧语系。

印欧语系

印欧语系（Indo-European languages），是世界上分布最广泛的语系之一。欧洲、美洲、南亚和大洋洲的大部分国家都采用印欧语系的语言作为母语或官方语言。印欧语系包括約443种（SIL統計）語言和方言，使用人數大約有20億。.

分词和印欧语系 · 印欧语系和统计机器翻译 · 查看更多 »

上面的列表回答下列问题

什么分词和统计机器翻译的共同点。
什么是分词和统计机器翻译之间的相似性