我们正在努力恢复Google Play商店上的Unionpedia应用程序
🌟我们简化了设计以优化导航!
Instagram Facebook X LinkedIn

余弦相似性和向量空間模型

快捷方式: 差异相似杰卡德相似系数参考

余弦相似性和向量空間模型之间的区别

余弦相似性 vs. 向量空間模型

余弦相似性通过测量两个向量的夹角的余弦值来度量它们之间的相似性。0度角的余弦值是1,而其他任何角度的余弦值都不大于1;并且其最小值是-1。从而两个向量之间的角度的余弦值确定两个向量是否大致指向相同的方向。两个向量有相同的指向时,余弦相似度的值为1;两个向量夹角为90°时,余弦相似度的值为0;两个向量指向完全相反的方向时,余弦相似度的值为-1。這結果是與向量的長度無關的,仅仅與向量的指向方向相關。余弦相似度通常用于正空間,因此給出的值为0到1之间。 注意這上下界對任何维度的向量空間中都適用,而且余弦相似性最常用於高维正空间。例如在信息检索中,每个词項被賦予不同的維度,而一个文档由一个向量表示,其各個維度上的值對應于該词項在文档中出现的频率。余弦相似度因此可以给出两篇文档在其主题方面的相似度。 另外,它通常用于文本挖掘中的文件比较。此外,在数据挖掘领域中,會用到它来度量集群内部的凝聚力。. 向量空间模型是一个把文本文件表示為标识符(比如索引)向量的代数模型。它应用于信息过滤、信息检索、索引以及相關排序。.

之间余弦相似性和向量空間模型相似

余弦相似性和向量空間模型有(在联盟百科)3共同点: 向量信息檢索餘弦

向量

向量(vector,物理、工程等也称作--)是数学、物理学和工程科学等多个自然科學中的基本概念,指一个同时具有大小和方向,且满足平行四边形法则的几何對象。一般地,同时满足具有大小和方向两个性质的几何对象即可认为是向量(特别地,电流属既有大小、又有正负方向的量,但由于其运算不满足平行四边形法则,公认为其不属于向量)。向量常常在以符号加箭头标示以区别于其它量。与向量相对的概念称标量或数量,即只有大小、绝大多数情况下没有方向(电流是特例)、不满足平行四边形法则的量。.

余弦相似性和向量 · 向量和向量空間模型 · 查看更多 »

信息檢索

資訊檢索(Information Retrieval)是从信息资源集合获得与信息需求相关的信息资源的活动。搜索可以基于全文或其他基于内容的索引。 自动信息检索系统用于减少所谓的“資訊超載”。许多大學和公共图书馆使用IR系统提供图书、期刊和其他文件的访问。Web搜索引擎是最可见的IR应用程序。.

余弦相似性和信息檢索 · 信息檢索和向量空間模型 · 查看更多 »

餘弦

余弦是三角函数的一种。它的定义域是整个实数集,值域是。它是周期函数,其最小正周期为2π。在自变量为2nπ(n为整数)时,该函数有极大值1;在自变量为(2n+1)π时,该函数有极小值-1。余弦函数是偶函数,其图像关于y轴对称。.

余弦相似性和餘弦 · 向量空間模型和餘弦 · 查看更多 »

上面的列表回答下列问题

余弦相似性和向量空間模型之间的比较

余弦相似性有12个关系,而向量空間模型有15个。由于它们的共同之处3,杰卡德指数为11.11% = 3 / (12 + 15)。

参考

本文介绍余弦相似性和向量空間模型之间的关系。要访问该信息提取每篇文章,请访问: