我们正在努力恢复Google Play商店上的Unionpedia应用程序
🌟我们简化了设计以优化导航!
Instagram Facebook X LinkedIn

信息檢索和停用词

快捷方式: 差异相似杰卡德相似系数参考

信息檢索和停用词之间的区别

信息檢索 vs. 停用词

資訊檢索(Information Retrieval)是从信息资源集合获得与信息需求相关的信息资源的活动。搜索可以基于全文或其他基于内容的索引。 自动信息检索系统用于减少所谓的“資訊超載”。许多大學和公共图书馆使用IR系统提供图书、期刊和其他文件的访问。Web搜索引擎是最可见的IR应用程序。. 在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词,这些字或词即被称为Stop Words(停用词)。不要把停用词与安全口令混淆。 这些停用词都是人工输入、非自动化生成的,生成后的停用词会形成一个停用词表。但是,并没有一个明确的停用词表能够适用于所有的工具。甚至有一些工具是明确地避免使用停用词来支持短语搜索的。 对于一个给定的目的,任何一类的词语都可以被选作停用词。通常意义上,停用词大致分为两类。一类是人类语言中包含的功能词,这些功能词极其普遍,与其他词相比,功能词没有什么实际含义,比如'the'、'is'、'at'、'which'、'on'等。但是对于搜索引擎来说,当所要搜索的短语包含功能词,特别是像The Who、The The或Take That等复合名词时,停用词的使用就会导致问题。另一类词包括词汇词,比如'want'等,这些词应用十分广泛,但是对这样的词搜索引擎无法保证能够给出真正相关的搜索结果,难以帮助缩小搜索范围,同时还会降低搜索的效率,所以通常会把这些词从问题中移去,从而提高搜索性能。 Hans Peter Luhn, 作为信息检索的先驱者之一,他创造了这个短语并在他的研究中应用这个概念,为信息检索工作做出了贡献。.

之间信息檢索和停用词相似

信息檢索和停用词有1共同点(的联盟百科): 搜索引擎

搜索引擎

搜索引擎(search engine)是一种信息检索系统,旨在协助搜索存储在计算机系统中的信息。搜索结果一般被称为“hits”,通常会以表单的形式列出。搜索引擎和其他信息过载管理技术类似,可缩小信息的搜索时间、搜索范围等。网络搜索引擎是最常见、公开的一种搜索引擎,其功能为搜索万维网上储存的信息。.

信息檢索和搜索引擎 · 停用词和搜索引擎 · 查看更多 »

上面的列表回答下列问题

信息檢索和停用词之间的比较

信息檢索有24个关系,而停用词有9个。由于它们的共同之处1,杰卡德指数为3.03% = 1 / (24 + 9)。

参考

本文介绍信息檢索和停用词之间的关系。要访问该信息提取每篇文章,请访问: