徽标
联盟百科
通讯
下载应用,请到 Google Play
新! 在您的Android™设备上下载联盟百科!
自由
比浏览器更快的访问!
 

狄利克雷分布

指数 狄利克雷分布

利克雷分布是一组连续多变量概率分布,是多变量普遍化的Β分布。为了纪念德国数学家約翰·彼得·古斯塔夫·勒熱納·狄利克雷(Peter Gustav Lejeune Dirichlet)而命名。狄利克雷分布常作为贝叶斯统计的先验概率。当狄利克雷分布维度趋向无限时,便成为狄利克雷过程(Dirichlet process)。 狄利克雷分布奠定了狄利克雷过程的基础,被广泛应用于自然语言处理特别是主题模型(topic model)的研究。.

12 关系: 单纯形主题模型开集先验概率勒贝格测度約翰·彼得·古斯塔夫·勒熱納·狄利克雷隐含狄利克雷分布自然语言处理Β分布Β函数Γ函数欧几里得空间

单纯形

几何学上,单纯形或者n-单纯形是和三角形类似的n维几何体。精确的讲,单纯形是某个n维以上的欧几里得空间中的(n+1)个仿射无关(也就是没有m-1维平面包含m+1个点;这样的点集被称为处于一般位置)的点的集合的凸包。 例如,0-单纯形就是点,1-单纯形就是线段,2-单纯形就是三角形,3-单纯形就是四面体,而4-单纯形是一个五胞体(每种情况都包含内部)。 正单纯形是同时也是正多胞形的单纯形。正n-单纯形可以从正(n − 1)-单纯形通过将一个新顶点用同样的边长连接到所有旧顶点构造。.

新!!: 狄利克雷分布和单纯形 · 查看更多 »

主题模型

主题模型(Topic Model)在机器学习和自然语言处理等领域是用来在一系列文档中发现抽象主题的一种统计模型。直观来讲,如果一篇文章有一个中心思想,那么一些特定词语会更频繁的出现。比方说,如果一篇文章是在讲狗的,那“狗”和“骨头”等词出现的频率会高些。如果一篇文章是在讲猫的,那“猫”和“鱼”等词出现的频率会高些。而有些词例如“这个”、“和”大概在两篇文章中出现的频率会大致相等。但真实的情况是,一篇文章通常包含多种主题,而且每个主题所占比例各不相同。因此,如果一篇文章10%和猫有关,90%和狗有关,那么和狗相关的关键字出现的次数大概会是和猫相关的关键字出现次数的9倍。一个主题模型试图用数学框架来体现文档的这种特点。主题模型自动分析每个文档,统计文档内的词语,根据统计的信息来断定当前文档含有哪些主题,以及每个主题所占的比例各为多少。 主题模型最初是运用于自然语言处理相关方向,但目前以及延伸至例如生物信息学的其它领域。.

新!!: 狄利克雷分布和主题模型 · 查看更多 »

开集

開集是指不包含任何自己邊界點的集合。或者說,開集包含的任意一點的充分小的鄰域都包含在其自身中。 例如,实数线上的由不等式2规定的集合称为开区间,是开集。这时候的边界为实数轴上的点2和5,如由不等式2\leq x \leq 5,或者2规定的区间由于包含其边界,因此不能称之为开集。 开集的概念一般与拓扑概念是紧密联系着的,通常先公理化开集,然后通过其定义边界的概念。(详细请参照拓扑空间).

新!!: 狄利克雷分布和开集 · 查看更多 »

先验概率

在贝叶斯统计中,某一不确定量p的先验概率分布是在考虑"观测数据"前,能表达p不确定性的概率分布。它旨在描述这个不确定量的不确定程度,而不是这个不确定量的随机性。这个不确定量可以是一个参数,或者是一个隐含变量(latent variable)。 在使用贝叶斯定理时,我们通过将先验概率与似然函数相乘,随后标准化,来得到后验概率分布,也就是给出某数据,该不确定量的条件分布。 先验概率通常是主观的猜测,为了使计算后验概率方便,有时候会选择共轭先验。如果后验概率和先验概率是同一族的,则认为它们是共轭分布,这个先验概率就是对应于似然函数的共轭先验。 Category:概率论.

新!!: 狄利克雷分布和先验概率 · 查看更多 »

勒贝格测度

数学上,勒贝格测度是赋予欧几里得空间的子集一个长度、面积、或者体积的标准方法。它广泛应用于实分析,特别是用于定义勒贝格积分。可以赋予一个体积的集合被称为勒贝格可测;勒贝格可测集A的体积或者说测度记作λ(A)。一个值为∞的勒贝格测度是可能的,但是即使如此,在假设选择公理成立时,Rn的所有子集也不都是勒贝格可测的。不可测集的“奇特”行为导致了巴拿赫-塔斯基悖论这样的命题,它是选择公理的一个结果。.

新!!: 狄利克雷分布和勒贝格测度 · 查看更多 »

約翰·彼得·古斯塔夫·勒熱納·狄利克雷

約翰·彼得·古斯塔夫·勒熱納·狄利克雷(Johann Peter Gustav Lejeune Dirichlet,勒熱納·狄利克雷是姓,),德國數學家,創立了現代函數的正式定義。其家庭來自比利時的小鎮利克雷(Richelet),此乃其姓氏勒熱納·狄利克雷(le jeune de Richelet.

新!!: 狄利克雷分布和約翰·彼得·古斯塔夫·勒熱納·狄利克雷 · 查看更多 »

隐含狄利克雷分布

含狄利克雷分布(Latent Dirichlet allocation,简称LDA),是一种主题模型,它可以将文档集中每篇文档的主题按照概率分布的形式给出。同时它是一种无监督学习算法,在训练时不需要手工标注的训练集,需要的仅仅是文档集以及指定主题的数量k即可。此外LDA的另一个优点则是,对于每一个主题均可找出一些词语来描述它。 LDA首先由Blei, David M.、吴恩达和Jordan, Michael I于2003年提出,目前在文本挖掘领域包括文本主题识别、文本分类以及文本相似度计算方面都有应用。.

新!!: 狄利克雷分布和隐含狄利克雷分布 · 查看更多 »

自然语言处理

自然語言處理(natural language processing,缩写作 NLP)是人工智慧和語言學領域的分支學科。此領域探討如何處理及運用自然語言;自然語言認知則是指讓電腦「懂」人類的語言。 自然語言生成系統把計算機數據轉化為自然語言。自然語言理解系統把自然語言轉化為計算機程序更易于處理的形式。.

新!!: 狄利克雷分布和自然语言处理 · 查看更多 »

Β分布

在概率论中,Β分布也称贝塔分布,是指一组定义在(0,1)区间的连续概率分布,有两个参数\alpha, \beta>0。.

新!!: 狄利克雷分布和Β分布 · 查看更多 »

Β函数

Β函数,又称为贝塔函数或第一类欧拉积分,是一个特殊函数,由下式定义: \! 其中\textrm(x), \textrm(y) > 0\,。.

新!!: 狄利克雷分布和Β函数 · 查看更多 »

Γ函数

\Gamma \,函数,也叫做伽瑪函數(Gamma函数),是階乘函數在實數與複數上的擴展。對於實數部份為正的複數z,伽瑪函數定義為: 此定義可以用解析開拓原理拓展到整個複數域上,非正整數外。 如果z為正整數,則伽瑪函數定義為: 這顯示了它與階乘函數的聯繫。可見,伽瑪函數將n!拓展到了實數與複數域上。 在概率論中常見此函數,在組合數學中也常見。.

新!!: 狄利克雷分布和Γ函数 · 查看更多 »

欧几里得空间

欧几里得几何是在约公元前300年,由古希腊数学家欧几里得建立的角和空间中距离之间联系的法则。欧几里得首先开发了处理平面上二维物体的“平面几何”,他接着分析三维物体的“立体几何”,所有欧几里得的公理被编排到幾何原本。 这些数学空间可以被扩展来应用于任何有限维度,而这种空间叫做 n维欧几里得空间(甚至简称 n 维空间)或有限维实内积空间。 这些数学空间还可被扩展到任意维的情形,称为实内积空间(不一定完备), 希尔伯特空间在高等代数教科书中也被称为欧几里得空间。 为了开发更高维的欧几里得空间,空间的性质必须非常仔细的表达并被扩展到任意维度。 尽管结果的数学非常抽象,它却捕获了我们熟悉的欧几里得空间的根本本质,根本性质是它的平面性。 另存在其他種類的空间,例如球面非欧几里得空间,相对论所描述的四维时空在重力出现的时候也不是欧几里得空间。.

新!!: 狄利克雷分布和欧几里得空间 · 查看更多 »

传出传入
嘿!我们在Facebook上吧! »