内容正文:
网络资源任我选
因特网信息资源检索
因特网中的信息检索
信息检索工具的工作原理
因特网信息资源检索
因特网信息资源检索
搜索引擎——指用于因特网信息查找的网络工具。
1.目录索引类与全文搜索引擎
(1)目录索引类搜索引擎(其搜索方式也称为分类搜索)
目录搜索引擎——将收取到的各个网站(网页)的信息按照目录分类,建
立索引数据库供人们分类查找。
代表网站: 搜狐 (www.sohu.com )
新浪 (www.sina.com.cn)
网易 (www.163.com)
雅虎 (www.yahoo.com.cn)
搜网 (www.sowang.com)
目录索引类搜索引擎的基本工作原理
目录索引类搜索引擎一般采用人工方式采集和存储网络信息,依靠手工为每个网站确定 一个标题,并给出大概的描述,建立关键字索引,将其放入相应的类目体系中。
信息检索工具的工作原理
特点:在查询信息时,不用事先确定信息检索目标(即关键词),可以通过浏览主题了解某一主题的相关资源。
优点:目录索引类搜索引擎的网页由人工精选,网页内容丰富,学术性较强。
缺点:更新速度慢。
专题目录
链接
网站
总目录
信息检索工具的工作原理
搜索的例子:
(2)全文搜索引擎(其使用方法也称为关键词查询)
全文搜索引擎—用代表所需信息主题的关键词进行信息查询。
谷歌google:(www.google.com)
百度:(www.baidu.com)
北大天网:( e.pku.edu.cn)
特点:通过从因特网上提取的各个网站的信息(以网页文字为主)而建立的索引数据库。
因特网信息资源检索
信息检索工具的工作原理
组成部分 负责工作
搜索器 负责定期地自动到各个网站上,把网页抓下来,并顺着上面的链接,持续不断地抓取网页。
索引器 把搜索器抓来的网页进行分析,按照关键词句进行索引,并存入服务器的数据库中。
检索器 面向用户,接收用户提交的查询字串,在索引数据库中查询,并将结果反馈给用户。
搜索引擎的组成
全文搜索引擎的工作原理
购物
描述商品特征
取贷
交给顾客
查找信息
输入描述信息的关键词
在数据库中检索
结果呈现
全文搜索引擎的工作原理:
信息检索工具的工作原理
查询结果
用户查询
输入查询表达式
检索器
查询结果显示
查询信息排序
索引器
搜索器
筛选
信息采集
索引
排序
索引
数据库
采集结果
上半部
下半部
目录索引类与全文搜索引擎举例
类型 举例
分类搜索(目录) www.sohu.com
全文搜索 www.baidu.com
因特网信息资源检索
区别:
1、搜索方式
(1)目录索引类搜索使用人工的采集方式,搜索相对要准确一些,使用起来也麻烦些;
(2)全文搜索引擎使用的是自动化的信息采集、检索技术,准确度差些,但是使用起来较为方便些。
2.特色信息检索工具
因特网信息资源检索
我们经常使用的一般是综合信息检索工具,而当们我们要查找图片、地图等信息时,使用综合搜索引擎会找到很多无用的信息,而且搜索的效率和有效性都不高。这时就可以使用特色搜索引擎(有时是综合检索工具中的一个功能)
一类以FTP、Telnet、Usenet(Uses Network的缩写——新闻讨论组,是全世界最大的电子布告栏系统)等资源为检索对象的检索工具,如北大天网、Archie等。
因特网信息资源检索
3.其他信息检索工具
4.元搜索引擎
因特网信息资源检索
一般的网络检索工具局限在本引擎的数据库内进行搜索,由于不同的搜索引擎各自的信息收集方式和范围、检索算法和结果排序方法都各不相同,因此检索结果也不尽相同。为了获得较好的结果,1995年出现了元搜索引擎,元搜索引擎能方便地检索多个搜索引擎,扩大检索范围,提高检索的全面性。但是由于元搜索引擎出现的时间短,一些搜索引擎强大的检索功能还不能实现。
元搜索引擎——这是一种搜索引擎之上的(强调逻辑关系、逻辑结构)搜索引擎,它可以同时检索多个成员搜索引擎的数据库。
常用元搜索引擎
1、Ithaki ( http://www.ithaki.net/dir.html)
支持包括中文在内的14种语言检索。
2、Ixquick ( http://www.ixquick.com/)
可搜索网站、MP3、新闻、图象等多种网络资源
3、qbSearch http://www.qbsearch.com/)
4、Turbo10 http://turbo10.com/)
5、Dogpile http://www.dogpile.com/)
6、Webcrawler http://www.webcrawler.com/)
7、Search.com http://www.search.com/)
因特网信息资源检索
5.因特网信息检索发展趋势
(1)多媒体信息检索
(2)专业垂直搜索引擎
因特网信息资源检索
$$