内容正文:
因特网上的信息检索
- -
学习内容:
因特网信息检索方法
搜索引擎的发展与分类
搜索引擎的工作过程
Contents Page
目录页
- -
因特网信息检索方法
1.基于超文本、超媒体的信息浏览
2.基于目录服务的信息查询
3.基于搜索引擎的信息检索
- -
1.基于超文本、超媒体的信息浏览
- -
2.基于目录服务的信息查询
- -
2.基于搜索引擎的信息检索
- -
搜索引擎是一种用于帮助因特网用户查询信息的搜索工具,它以一定的策略在因特网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航目的。
搜索引擎出现时间是1994年4月,典型代表是雅虎,创始人是杨致远和David Filo。
关于搜索引擎:
- -
搜索引擎分类
目录式搜索引擎
全文搜索引擎
元搜索引擎
利用罗列目录的方式引导搜索者依据目录查找需要的信息。
用代表所需信息的主题的关键字进行信息查询
整合多个搜索引擎的搜索结果返回给用户
- -
目录式搜索引擎
- -
全文搜索引擎
全文搜索引擎,如Google、百度、360搜索等,它们都是通过从因特网上提取各个网站中以网页文字为主的信息而建立索引数据库,当用户查询信息时,它们就在库中检索与用户查询条件相符的记录,然后按一定的排列顺序把结果返回给用户,并显示在浏览器窗口中。
- -
元搜索引擎
元搜索引擎在接受用户查询请求时,同时在多个全文搜索引擎上搜索,并将结果返回给用户。
- -
搜索引擎的工作原理
从网上抓取网页--建立索引数据库--在索引数据库中搜索排序--响应用户查询
主要技术:一个搜索引擎由搜索器、索引器、检索器和用户接口等四个部分组成。
1、搜索器:
搜索器的功能是在互联网中漫游,发现和搜集信息。它常常是一个计算机程序,日夜不停地运行。它要尽可能多、尽可能快地搜集各种类型的新信息,同时因为互联网上的信息更新很快,所以还要定期更新已经搜集过的旧信息,以避免死连接和无效连接。
- -
2.索引器
索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。
索引项有客观索引项和内容索引项两种:客观项与文档的语意内容无关,如作者名、URL、更新时间、编码、长度、链接流行度(Link Popularity)等等;内容