本体 (信息科学)和網路爬蟲

本体 (信息科学)和網路爬蟲之间的区别

本体 (信息科学) vs. 網路爬蟲

在计算机科学与信息科学领域，理论上，本体是指一种“形式化的，对于共享概念体系的明确而又详细的说明”。本体提供的是一种共享词表，也就是特定领域之中那些存在着的对象类型或概念及其属性和相互关系；或者说，本体就是一种特殊类型的术语集，具有结构化的特点，且更加适合于在计算机系统之中使用；或者说，本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达（formal representation）。本体是人们以自己兴趣领域的知识为素材，运用信息科学的本体论原理而编写出来的。本体一般可以用来针对该领域的属性进行推理，亦可用于定义该领域（也就是对该领域进行建模）。此外，有时人们也会将“本体”称为“本体论”。作为一种关于现实世界或其中某个组成部分的知识表达形式，本体目前的应用领域包括（但不仅限于）：人工智能、语义网、软件工程、生物医学信息学、图书馆学以及信息架构。. 网络爬虫（web crawler），也叫網路蜘蛛（spider），是一种用来自动浏览万维网的。其目的一般为编纂。網路搜索引擎等站点通过爬蟲軟體更新自身的或其對其他網站的索引。網路爬蟲可以將自己所訪問的頁面保存下來，以便搜索引擎事後生成供用戶搜索。爬蟲访问网站的过程会消耗目标系统资源。不少网络系统并不默许爬虫工作。因此在访问大量页面时，爬虫需要考虑到规划、负载，还需要讲“礼貌”。不愿意被爬虫访问、被爬虫主人知晓的公开站点可以使用robots.txt文件之类的方法避免访问。这个文件可以要求只对网站的一部分进行索引，或完全不作处理。互联网上的页面极多，即使是最大的爬虫系统也无法做出完整的索引。因此在公元2000年之前的万维网出现初期，搜索引擎经常找不到多少相关结果。现在的搜索引擎在这方面已经进步很多，能够即刻给出高质量结果。爬虫还可以验证超連結和HTML代码，用于（参见）。.

之间本体 (信息科学)和網路爬蟲相似

本体 (信息科学)和網路爬蟲有（在联盟百科）4共同点: 万维网，網頁，HTML，搜索引擎。

万维网

万维网（World Wide Web），亦作「WWW」、「Web」，是一个由许多互相链接的超文本组成的系统，通过互联网访问。英國科學家蒂姆·伯纳斯-李於1989年發明了萬維網。1990年他在瑞士CERN的工作期間編寫了第一個網頁瀏覽器。網頁瀏覽器於1991年在CERN向外界發表，1991年1月開始發展到其他研究機構，1991年8月在互聯網上向公眾開放。萬維網是資訊時代發展的核心，也是數十億人在網際網路上進行互動的主要工具。網頁主要是文本文件格式化和超文件標示語言（HTML）。除了格式化文字之外，網頁還可能包含圖片、影片、聲音和軟體元件，這些元件會在使用者的網頁瀏覽器中呈現為多媒體內容的連貫頁面。萬維網並不等同網際網路，萬維網只是網際網路所能提供的服務其中之一，是靠着網際網路運行的一項服務。.

万维网和本体 (信息科学) · 万维网和網路爬蟲 · 查看更多 »

網頁

网页（web page）是一个適用於全球資訊網和網頁瀏覽器的文件，它存放在世界某个角落的某一部或一組计算机中，而这部计算机必须是与互联网相连。网页经由网址（URL）来识别与存取，当我们在网页浏览器输入网址后，经过一段复杂而又快速的程序，网页文件会被传送到用户家的计算机，然后再通过浏览器解释网页的内容，再展示给用户。是網路中的一「頁」，通常是HTML格式，但現今已經有愈來愈多、各色各樣的網頁格式和標準出現。網頁通常用圖像檔來提供圖畫。網頁要透過網頁瀏覽器來閱讀。.

本体 (信息科学)和網頁 · 網路爬蟲和網頁 · 查看更多 »

HTML

超文本标记语言（HyperText Markup Language，简称：HTML）是一种用于创建网页的标准标记语言。HTML是一种基础技术，常与CSS、JavaScript一起被众多网站用于设计令人赏心悦目的网页、网页应用程序以及移动应用程序的用户界面。网页浏览器可以读取HTML文件，并将其渲染成可视化网页。HTML描述了一个网站的结构语义随着线索的呈现，使之成为一种标记语言而非编程语言。 HTML元素是构建网站的基石。HTML允许嵌入图像与对象，并且可以用于创建交互式表单，它被用来结构化信息——例如标题、段落和列表等等，也可用来在一定程度上描述文档的外观和语义。HTML的语言形式为尖括号包围的HTML元素（如），浏览器使用HTML标签和脚本来诠释网页内容，但不会将它们显示在页面上。 HTML可以嵌入如JavaScript的脚本语言，它们会影响HTML网页的行为。网页浏览器也可以引用层叠样式表（CSS）来定义文本和其它元素的外观与布局。维护HTML和CSS标准的组织万维网联盟（W3C）鼓励人们使用CSS替代一些用于表现的HTML元素。.

HTML和本体 (信息科学) · HTML和網路爬蟲 · 查看更多 »

搜索引擎

搜索引擎（search engine）是一种信息检索系统，旨在协助搜索存储在计算机系统中的信息。搜索结果一般被称为“hits”，通常会以表单的形式列出。搜索引擎和其他信息过载管理技术类似，可缩小信息的搜索时间、搜索范围等。网络搜索引擎是最常见、公开的一种搜索引擎，其功能为搜索万维网上储存的信息。.

搜索引擎和本体 (信息科学) · 搜索引擎和網路爬蟲 · 查看更多 »

上面的列表回答下列问题

什么本体 (信息科学)和網路爬蟲的共同点。
什么是本体 (信息科学)和網路爬蟲之间的相似性