内容正文:
因特网信息检索
搜索引擎是一种用于帮助因特网用户查询信息的搜索工具,它以一定的策略在因特网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航目的。
一、搜索引擎分类
1、
2、
3、
全文搜索引擎
目录索引搜索引擎
元搜索引擎
3
1、全文搜索引擎
全文搜索引擎,如Google、百度等,它们都是通过从因特网上提取各个网站中以网页文字为主的信息而建立索引数据库,当用户查询信息时,它们就在库中检索与用户查询条件相符的记录,然后按一定的排列顺序把结果返回给用户,并显示在浏览器窗口中。
2、目录索引搜索引擎
现在的搜索引擎一般都具有综合性,比如 Google 、新浪、搜孤,它们既有目录索引搜索功能,也有输入关键词的全文搜索关键词查找功能。
1.全文搜索引擎 2.目录搜索引擎
代表 百度、 google、
北大天网 新浪、雅虎、
搜狐、网易
特点
需要关键词查询 浏览主题,了解某一主题的相关资源。
信息资源多、复杂,
不易了解主题内容 网页内容丰富,
学术性较强
比较:
1.目录索引类与全文搜索引
3、元搜索引擎
元搜索引擎在接受用户查询请求时,同时在多个全文搜索引擎上搜索,并将结果返回给用户。
因特网信息检索的发展趋势
多媒体信息检索
在多媒体数据库中,除了传统的文字和数字外,还包括图形、图像、视频、音频、动画以及以上各种媒体的组合。
专业垂直搜索引擎
专业垂直搜索引擎是只面向某一特定领域,专注于自己的特长和核心技术,能够保证对该领域信息的完全收录与及时更新。
二、信息检索工具的工作原理
分类
1、
2、
3、
全文搜索引擎的工作原理
目录索引搜索引擎的工作原理
元搜索引擎的工作原理
10
1、全文搜索引擎的工作原理
搜索引擎搜索信息时,并不是真正搜索因特网上的信息,实际上,它搜索的是预先整理好的网页索引数据库信息。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被找出来。在经过复杂的算法排序后,这些结果就会按照与搜索关键词相关度的高低,依次排列出来。
搜索器在因特网上搜索网页信息
2、目录索引搜索引擎的工作原理
目录索引搜索引擎一般采用人工方式采集和存储网络信息,依靠手工方式为每个网站确定一个标题,并给出大概