徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
下载
比浏览器更快的访问!
 

隐马尔可夫模型

指数 隐马尔可夫模型

尔可夫模型(Hidden Markov Model,HMM)是统计模型,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析,例如模式识别。 在正常的马尔可夫模型中,状态对于观察者来说是直接可见的。这样状态的转换概率便是全部的参数。而在隐马尔可夫模型中,状态并不是直接可见的,但受状态影响的某些变量则是可见的。每一个状态在可能输出的符号上都有一概率分布。因此输出符号的序列能够透露出状态序列的一些信息。.

19 关系: 基因組學安德雷·马尔可夫中文自动分词估计理论光学字符识别统计学维特比算法生物信息学电气电子工程师学会馬可夫過程马尔可夫链语音识别贝叶斯推断脱氧核糖核酸條件隨機域概率分布模型模式识别机器翻译

基因組學

基因组学(Genomics),或基因體學,是研究生物基因组和如何利用基因的一门学科。该学科提供基因组信息以及相关数据系统利用,试图解决生物,医学,和工业领域的重大问题。 基因组学能为一些疾病提供新的诊断、治疗方法。例如,对刚诊断为乳腺癌的女性,一个名为“Oncotype DX”的基因组测试,能用来评估病人乳腺癌复发的个体危险率以及化疗效果,这有助于医生获得更多的治疗信息并进行个性化医疗。基因组学还被用于食品与农业部门。 基因组学的主要工具和方法包括:生物信息学,遗传分析,基因表达测量和基因功能鉴定。.

新!!: 隐马尔可夫模型和基因組學 · 查看更多 »

安德雷·马尔可夫

安德雷·安德耶维齐·马尔可夫(Андрей Андреевич Марков,),生於俄羅斯帝國梁赞,数学家。 马尔可夫的父亲是一位中级官员,馬可夫出生在梁赞,后来举家迁往圣彼得堡。1874年马尔可夫入圣彼得堡大学,师从切比雪夫,毕业后留校任教。1886年当选为圣彼得堡科学院院士。马尔可夫的主要研究领域在概率和统计方面。他的研究开创了随机过程这个新的领域,以他的名字命名的马尔可夫链在现代工程、自然科学和社会科学各个领域都有很广泛的应用。 马尔可夫1922年逝世于圣彼得堡。 马尔可夫的儿子A·A·小马尔可夫也是一位著名数学家。.

新!!: 隐马尔可夫模型和安德雷·马尔可夫 · 查看更多 »

中文自动分词

中文自动分词指的是使用计算机自动对中文文本进行词语的切分,即像英文那样使得中文句子中的词之间有空格以标识。中文自动分词被认为是中文自然语言处理中的一个最基本的环节。.

新!!: 隐马尔可夫模型和中文自动分词 · 查看更多 »

估计理论

估计理论是统计学和信号处理中的一个分支,主要是通过测量或经验数据来估计概率分布参数的数值。这些参数描述了实质情况或实际对象,它们能够回答估计函数提出的问题。 例如,估计投票人总体中,给特定候选人投票的人的比例。这个比例是一个不可观测的参数,因为投票人总体很大;估计值建立在投票者的一个小的随机采样上。 又如,雷达的目的是物体(飞机、船等)的定位。这种定位是通过分析收到的回声(回波)来实现的,定位提出的问题是“飞机在哪里?”为了回答这个问题,必须估计飞机到雷达之间的距离。如果雷达的绝对位置是已知的,那么飞机的绝对位置也是可以确定的。 在估计理论中,通常假定信息隐藏在包含雜訊的信号中。噪声增加了不确定性,如果没有不确定性,那么也就没有必要估计了。.

新!!: 隐马尔可夫模型和估计理论 · 查看更多 »

光学字符识别

光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。.

新!!: 隐马尔可夫模型和光学字符识别 · 查看更多 »

统计学

统计学是在資料分析的基础上,研究测定、收集、整理、归纳和分析反映數據資料,以便给出正确訊息的科學。這一门学科自17世纪中叶产生并逐步发展起来,它廣泛地應用在各門學科,從自然科学、社會科學到人文學科,甚至被用於工商業及政府的情報決策。隨著大数据(Big Data)時代來臨,統計的面貌也逐漸改變,與資訊、計算等領域密切結合,是資料科學(Data Science)中的重要主軸之一。 譬如自一組數據中,可以摘要並且描述這份數據的集中和離散情形,這個用法稱作為描述統計學。另外,觀察者以數據的形態,建立出一個用以解釋其隨機性和不確定性的數學模型,以之來推論研究中的步驟及母體,這種用法被稱做推論統計學。這兩種用法都可以被稱作為應用統計學。數理統計學则是討論背後的理論基礎的學科。.

新!!: 隐马尔可夫模型和统计学 · 查看更多 »

维特比算法

维特比算法(Viterbi algorithm)是一种动态规划算法。它用于寻找最有可能产生观测事件序列的维特比路径——隐含状态序列,特别是在马尔可夫信息源上下文和隐马尔可夫模型中。 术语“维特比路径”和“维特比算法”也被用于寻找观察结果最有可能解释相关的动态规划算法。例如在统计句法分析中动态规划算法可以被用于发现最可能的上下文无关的派生(解析)的字符串,有时被称为“维特比分析”。 维特比算法由安德鲁·维特比(Andrew Viterbi)于1967年提出,用于在数字通信链路中解卷积以消除噪音。 此算法被广泛应用于CDMA和GSM数字蜂窝网络、拨号调制解调器、卫星、深空通信和802.11无线网络中解卷积码。现今也被常常用于语音识别、关键字识别、计算语言学和生物信息学中。例如在语音(语音识别)中,声音信号做为观察到的事件序列,而文本字符串,被看作是隐含的产生声音信号的原因,因此可对声音信号应用维特比算法寻找最有可能的文本字符串。.

新!!: 隐马尔可夫模型和维特比算法 · 查看更多 »

生物信息学

生物信息學(bioinformatics)利用应用数学、信息学、统计学和计算机科学的方法研究生物学的问题。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。目前主要的研究方向有:序列比对、序列組裝、基因识别、基因重组、蛋白质结构预测、基因表达、蛋白质反应的预测,以及建立进化模型。 生物学技术往往生成大量的嘈杂数据。与数据挖掘类似,生物信息学利用数学工具从大量数据中提取有用的生物学信息。生物信息学所要处理的典型问题包括:重新組裝在霰弹枪定序法测序过程中被打散的DNA序列,从蛋白质的氨基酸序列预测蛋白质结构,利用mRNA微阵列或质谱仪的数据检验基因调控的假说。 某些人将计算生物学作为生物信息学的同义词处理;但是另外一些人认为计算生物学和生物信息学应当被当作不同的条目处理,因为生物信息学更侧重於生物学领域中计算方法的使用和发展,而计算生物学强调应用信息学技术对生物学领域中的假说进行检验,并尝试发展新的理论。 生物信息学可以定义为对分子生物学中两类信息流的研究:.

新!!: 隐马尔可夫模型和生物信息学 · 查看更多 »

电气电子工程师学会

電機電子工程師學會(Institute of Electrical and Electronics Engineers,簡稱為IEEE,英文读作“i triple e”)是一个建立於1963年1月1日的国际性电子技术与电子工程师协会,亦是世界上最大的专业技术组织之一,擁有來自175個國家的36萬會員。 除設立於美國紐約市的總部以外,亦在全球150多個國家擁有分會,並且還有35個專業學會及2個聯合會。其每年均會發表多種雜誌、學報、書籍,亦舉辦至少300次的專業會議。 目前IEEE在工業界所定義的標準有著極大的影響。.

新!!: 隐马尔可夫模型和电气电子工程师学会 · 查看更多 »

馬可夫過程

在概率論及統計學中,馬可夫過程(Markov process)是一個具備了馬可夫性質的隨機過程,因為俄國數學家安德雷·馬可夫得名。馬可夫過程是不具備記憶特質的(memorylessness)。換言之,馬可夫過程的条件概率僅僅與系统的當前狀態相關,而與它的過去歷史或未來狀態,都是獨立、不相關的。 具備離散狀態的馬可夫過程,通常被稱為馬可夫鏈。馬可夫鏈通常使用離散的時間集合定義,又稱離散時間馬可夫鏈。有些學者雖然採用這個術語,但允許時間可以取連續的值。.

新!!: 隐马尔可夫模型和馬可夫過程 · 查看更多 »

马尔可夫链

尔可夫链(Markov chain),又稱離散時間馬可夫鏈(discrete-time Markov chain,縮寫為DTMC),因俄國數學家安德烈·马尔可夫(Андрей Андреевич Марков)得名,为狀態空間中经过从一个状态到另一个状态的转换的随机过程。该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关。这种特定类型的“无记忆性”称作馬可夫性質。马尔科夫链作为实际过程的统计模型具有许多应用。 在马尔可夫链的每一步,系统根据概率分布,可以从一个状态变到另一个状态,也可以保持当前状态。状态的改变叫做转移,与不同的状态改变相关的概率叫做转移概率。随机漫步就是马尔可夫链的例子。随机漫步中每一步的状态是在图形中的点,每一步可以移动到任何一个相邻的点,在这里移动到每一个点的概率都是相同的(无论之前漫步路径是如何的)。.

新!!: 隐马尔可夫模型和马尔可夫链 · 查看更多 »

语音识别

语音识别(speech recognition;語音辨識/言語辨別)技术,也被称为自动语音识别(Automatic Speech Recognition, ASR)、電腦語音識別(Computer Speech Recognition)或是語音轉文本識別(Speech To Text, STT),其目标是以電腦自動将人类的语音内容转换为相應的文字。与及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。 语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。 语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。.

新!!: 隐马尔可夫模型和语音识别 · 查看更多 »

贝叶斯推断

贝叶斯推断()是推論統計的一种方法。这种方法使用贝叶斯定理,在有更多證據及信息時,更新特定假设的概率。贝叶斯推断是统计学(特別是数理统计学)中很重要的技巧之一。贝叶斯更新(Bayesian updating)在序列分析中格外的重要。贝叶斯推断應用在許多的領域中,包括科學、工程學、哲學、醫學、體育運動、法律等。在决策论的哲學中,贝叶斯推断和主觀概率有密切關係,常常稱為贝叶斯概率。 贝叶斯定理是由統計學家托馬斯·貝斯(Thomas Bayes)根據許多特例推導而成,後來被許多研究者推廣為一普遍的定.

新!!: 隐马尔可夫模型和贝叶斯推断 · 查看更多 »

脱氧核糖核酸

--氧核醣核酸(deoxyribonucleic acid,縮寫:DNA)又稱--氧核醣核酸,是一種生物大分子,可組成遺傳指令,引導生物發育與生命機能運作。主要功能是資訊儲存,可比喻為「藍圖」或「配方」。其中包含的指令,是建構細胞內其他的化合物,如蛋白質與核醣核酸所需。帶有蛋白質編碼的DNA片段稱為基因。其他的DNA序列,有些直接以本身構造發揮作用,有些則參與調控遺傳訊息的表現。 DNA是一種長鏈聚合物,組成單位稱為核苷酸,而糖類與磷酸藉由酯鍵相連,組成其長鏈骨架。每個糖單位都與四種鹼基裡的其中一種相接,這些鹼基沿著DNA長鏈所排列而成的序列,可組成遺傳密碼,是蛋白質氨基酸序列合成的依據。讀取密碼的過程稱為轉錄,是根據DNA序列複製出一段稱為RNA的核酸分子。多數RNA帶有合成蛋白質的訊息,另有一些本身就擁有特殊功能,例如核糖體RNA、小核RNA與小干擾RNA。 在細胞內,DNA能組織成染色體結構,整組染色體則統稱為基因組。染色體在細胞分裂之前會先行複製,此過程稱為DNA複製。對真核生物,如動物、植物及真菌而言,染色體是存放於細胞核內;對於原核生物而言,如細菌,則是存放在細胞質中的拟核裡。染色體上的染色質蛋白,如組織蛋白,能夠將DNA組織並壓縮,以幫助DNA與其他蛋白質進行交互作用,進而調節基因的轉錄。.

新!!: 隐马尔可夫模型和脱氧核糖核酸 · 查看更多 »

條件隨機域

条件随机场(conditional random field,簡稱 CRF),是一種鑑別式機率模型,是随机场的一种,常用於標注或分析序列資料,如自然語言文字或是生物序列。 如同马尔可夫随机场,條件隨機場為無向性之圖模型,圖中的頂點代表隨機變數,頂點間的連線代表隨機變數間的相依關係,在條件隨機場當中,隨機變數 Y 的分佈為條件機率,給定的觀察值則為隨機變數 X。原則上,條件隨機場的圖模型佈局是可以任意給定的,一般常用的佈局是鏈結式的架構,鏈結式架構不論在訓練(training)、推論(inference)、或是解碼(decoding)上,都存在有效率的演算法可供演算。 條件隨機場跟隱藏式馬可夫模型常被一起提及,條件隨機場對於輸入和輸出的機率分佈,沒有如隱藏式馬可夫模型那般強烈的假設存在。 线性链条件随机场应用于标注问题是由Lafferty等人与2001年提出的。.

新!!: 隐马尔可夫模型和條件隨機域 · 查看更多 »

概率分布

概率分布(Wahrscheinlichkeitsverteilung,probability distribution)或簡稱分布,是概率論的一個概念。使用時可以有以下兩種含義:.

新!!: 隐马尔可夫模型和概率分布 · 查看更多 »

模型

模型可能是:.

新!!: 隐马尔可夫模型和模型 · 查看更多 »

模式识别

模式识别(Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。我们把环境与客体统称为“模式”。随着计算机技术的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。这是模式识别的两个重要方面。市场上可见到的代表性产品有光学字符识别、语音识别系统。 计算机识别的显著特点是速度快、准确性高、效率高,在将来完全可以取代人工录入。 识别过程与人类的学习过程相似。以光學字元識別之“汉字识别”为例:首先将汉字图像进行处理,抽取主要表达特征并将特征与汉字的代码存在计算机中。就像老师教我们「这个字叫什么、如何写」记在大脑中。这一过程叫做“训练”。识别过程就是将输入的汉字图像经处理后与计算机中的所有字进行比较,找出最相近的字就是识别结果。这一过程叫做“匹配”。.

新!!: 隐马尔可夫模型和模式识别 · 查看更多 »

机器翻译

機器翻譯(英語:Machine Translation,經常簡寫為MT,俗称机翻)屬於計算語言學的範疇,其研究藉由-zh-hant:電腦程式;zh-hans:计算机程序-將文字或演說從一種自然語言翻譯成另一種自然語言。簡單來說,機器翻譯是--將一個自然語言的字辭取代成另一個自然語言的字辭。藉由使用語料庫的技術,可達成更加複雜的自動翻譯,包含可更佳的處理不同的文法結構、辭彙辨識、慣用語的對應等。 目前的機器翻譯軟體通常可允許針對特定領域或是專業领域(例如天氣預報)來加以客製化,目的在於將辭彙的取代縮小於該特定領域的專有名詞上,以藉此改進翻譯的結果。這樣的技術适合針對一些使用較正规或是較制式化陳述方式的領域。例如政府機關公文或是法律相關文件,這類型的文句通常比一般的文句更加正式與制式化,其機器翻譯的结果通常比日常对话等非正式场合所使用语言的翻译结果更加符合语法。 目前的一些翻译机器,例如AltaVista Babelfish,有時可以得到可以理解的翻译结果,但是想要得到較有意義的翻譯結果,往往需要在輸入語句時適當地編輯,以利電腦程式分析。 但是,機器翻譯的結果好壞,往往取決於譯入及譯出語之間的詞彙、文法結構、語系甚至文化上的差異,例如英语與荷兰语同為印歐語系日耳曼語族,這兩種語言間的機器翻譯結果通常比汉语與英语間機器翻译的結果好。 因此,要改善機器翻譯的結果,人為的介入仍顯相當重要。 一般而言,大眾使用機器翻譯的目的只是為了获知原文句子或段落的要旨,而不是精確的翻譯。總的来说,機器翻譯的效果并没有达到可以取代人工翻译的程度,所以無法成為正式的翻譯。 不過現在已有越來越多的公司嘗試以機器翻譯的技術來提供其公司網站多語系支援的服務。例如微軟公司試將其 MSDN 以機器翻譯來自動翻譯成多國語言,如上文所说,知识库作为专业领域,其文法较为制式化,翻译结果亦更加符合自然语言。.

新!!: 隐马尔可夫模型和机器翻译 · 查看更多 »

重定向到这里:

Hidden Markov models隐Markov模型隐含马尔科夫模型隐蔽马尔可夫模型隐马尔科夫模型隱馬爾可夫模型

传出传入
嘿!我们在Facebook上吧! »