内容正文:
因特网信息资源检索
搜索引擎是一种用于帮助因特网用户查询信息的搜索工具,它以一定的策略在因特网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航目的。
搜索引擎出现时间是1994年4月,典型代表是雅虎,创始人是杨致远和大卫•费罗。
用代表所需信息的主题的关键字进行信息查询
利用罗列目录的方式引导搜索者依据目录查找需要的信息。
---关键词检索
---分类检索
1.目录索引类与全文搜索引
一、检索工具的类型和特点
1.全文搜索引擎 2.目录搜索引擎
代表 百度、 google、
北大天网 新浪、雅虎、
搜狐、网易
特点
需要关键词查询 浏览主题,了解某一主题的相关资源。
信息资源多、复杂,
不易了解主题内容 网页内容丰富,
学术性较强
比较:
1.目录索引类与全文搜索引
目录搜索引擎
全文搜索引擎
2.搜索引擎
Archie是第一个自动索引因特网上匿名FTP网站文件的程序,是最早的基于文本显示的FTP搜索引擎。
代表:北大天网(http://e.pku.edu.cn)。
典型的搜索引擎
3.元搜索引擎
元搜索引擎能方便地检索多个搜索引擎,扩大检索范围,提高检索的全面性。
这类检索工具专门收集某一类的信息资源。
例:音乐文件检索工具
4.特色信息检索工具
这类检索工具专门收集某一类的信息资源。
例2:图行天下
4.特色信息检索工具
二、信息检索工具的工作原理
1.全文搜索引擎的工作原理
购 物
查找信息
描述商品特征
取货
交给顾客
结果呈现
数据库中检索
信息的关键词
二、信息检索工具的工作原理
1.全文搜索引擎的工作原理
组成部分 负责工作
搜索器 负责定期地自动到各个网站上,把网页抓下来,并顺着上面的链接,持续不断地抓取网页(如:网络机器人、爬虫、蜘蛛等)。
索引器 把搜索器抓来的网页进行分析,按照关键词句进行索引,并存入服务器的数据库中。
检索器 面向用户,接收用户提交的查询字串,在索引数据库中查询,并将结果反馈给用户。
搜索引擎组成:
二、信息检索工具的工作原理
1.全文搜索引擎