内容正文:
第14课 互联网搜索新发展
第三单元 便捷的互联网服务
第14课 互联网搜索新发展
问题情境
同学们,最近大家有没有用搜索引擎查过这些内容?比如最新的航天发射成果、校园周边的非遗文化活动、或是新学期学科相关的拓展资料?
大家发现了吗?不管是查时事新闻、学习资料,还是生活常识,只要在搜索引擎输入关键词,短短几秒就能跳出成百上千条结果。而整个互联网的网页数量数以亿计,搜索引擎为什么能做到这么快、这么准地找到我们需要的信息?
一、搜索引擎的工作思路
搜索引擎要从海量网页中找到匹配信息,需要做哪些准备工作?
搜索系统结构空白图表
一、搜索引擎的工作思路
合作探究,补全图表:根据对“搜索工作过程”的理解,补全图表核心环节,并用简单的语言解释每个环节的作用。
A.网页数据
B.建立索引
C.网页索引
D.获取信息
E.网页排序
搜索系统结构空白图表
一、搜索引擎的工作思路
(1)获取信息D
(2)从各类网站网页中收集海量网页数据A,形成基础数据池;
(3)建立索引B
(4)对网页数据进行整理分类,生成网页索引C,相当于给海量信息建“图书馆藏书目录”;
(5)网页排序E
用户输入关键词后,系统根据关键词出现次数、相关性等,对网页索引进行排序,优先展示匹配度高的结果。
搜索引擎提前保存信息、建立索引,是其“搜得快”的关键前提。
二、搜索系统的创新改进
最初的搜索系统,需要人工操作来扩充网页数据,大家觉得这种方式有什么问题?
如何解决这个问题,让搜索系统的工作效率更高?
烦琐、效率低、更新慢
二、搜索系统的创新改进
搜索系统的核心创新技术——网络爬虫
1、定义:用计算机程序替代人工,自动在互联网上爬取各类网站的网页数据,快速扩充、更新网页数据池。
2、网络爬虫的作用:极大提升了“获取信息”环节的效率,让搜索引擎的信息更全面、更新更及时,进一步保证了搜索的高效性。
为什么有人说网络爬虫是一种不劳而获的技术?
搜索的“魔法”原理
1、超级图书馆员
搜索引擎就像一位管理着巨大数字图书馆的超级馆员。它的第一项
工作就是派出“蜘蛛”或“机器人”,在互联网上爬行,把海量的
网页内容“抓取”回来,存放在自己的“书架”(数据库)上。
2、关键词匹配
当你输入一个词,它会在“书架”上快速查找包含这个词的所有网
页,然后把它们按照相关性(比如这个词出现的次数和位置)从高
到低排好队,展示给你。
3、超链接分析
它还会分析网页之间的“超链接”。如果一个网页被很多其他重要
网页链接到,那它自己很可能也很重要,就会在搜索结果中获得更
高的排名。
拓展:猜你喜欢什么
拓展:用“嘴”代替“手”
拓展:用“眼睛”来拍照搜
互联网搜索技术的不断创新,让我们的信息获取越来越便捷,这背后是信息技术的不断发展。希望大家不仅会用搜索引擎,更能保持对技术发展的探索兴趣,学会用科学的方法利用网络信息。
情感升华
https://ks.wjx.com/vm/h42mRD6.aspx#
完成问卷练习
$