内容正文:
万好
垂系建是弱nullnullnullnull通常由一个搜索框和按钮组成。当我们在搜索框中填写好关键词,按下搜索按钮后,我们就会得到一个结果列表。在这个结果列表中再次点击链接,就会达到我们最终想要寻找的页面。在这个过程中搜索引擎做了些什么呢?首先要明确的一点是在你按下按钮后,搜索引擎并没有真正的去互联网上实时的查找。不是他做不到这点,而是实在是太耗费时间了。目前互联网上有超过10亿个网站,而且每分钟还有上百个新网站在不断的产生,再加上和你一同搜索的还有成千上万的用户,这将是一个非常恐怖的工作量,可能十天半个月也出不来结果。那搜索引擎是去哪儿找的这些网站呢?答案是他自己的私人数据库。首先搜索引擎会24小时不间断的向互联网派出无数的爬虫程序,也叫蜘蛛程序。这些蜘蛛的任务就是扫描互联网中所有的网页,把网页的内容读取下来存入数据库,然后再顺着网页里的超级链接爬到下一个页面,重复相同的操作。这样通过一段时间的积累,搜索引擎的数据库中就会存有互联网中大部分的页面。具体的讲存的东西至少要包括页面全文。页面的链接可能代表这个页面的一些关键词。当我们点下搜索按钮时,你写的关键词就被送到了数据库里进行对比匹配。匹配成功的页面,它的简介和链接将会添加到结果列表里,最终组成你所看到的搜索结果。这就是搜索引擎真实的工作原理。当然这仅仅是一个最简化的描述,而之前我们提到的关键词匹配其实才是搜索引擎最核心的技术索引以及索引算法。但是这个话题就远远超出了今天的科普范围,所以按下不表。最后我建议大家记住两个最容易被误解的点。第一,搜索引擎从来不会真正的实时搜索,实际上它只能搜索收集好的旧数据,这也就是为什么结果列表中有些页面打不开的原因。因为当你搜它的时候,它已经不在了,但是数据库里却保存了它的旧信息。第二,蜘蛛程序所做的事情其实并不神秘,也不复杂,本质上和一个浏览网页的用户是一样的。只不过用户看到的是被浏览器渲染出来的页面,而蜘蛛程序看到的是这个页面的源代码。只要理解这两点,我可以向你保证,你对搜索引擎的认知已经超过了95%的人。
通常由一个搜索框和按钮组成。当我们在搜索框中填写好关键词,按下搜索按钮后,我们就会得到一个结果列表。在这个结果列表中再次点击链接,就会达到我们最终想要寻找的页面。在这个过程中搜索引擎做了些什么呢?首先要明确的一点是在你按下按钮后,搜索引擎并没有真正的去互联网上实时的查找。不是他做不到这点,而是实在是太耗费时间了。目前互联网上有超过10亿个网站,而且每分钟还有上百个新网站在不断的产生,再加上和你一同搜索的还有成千上万的用户,这将是一个非常恐怖的工作量,可能十天半个月也出不来结果。那搜索引擎是去哪儿找的这些网站呢?答案是他自己的私人数据库。首先搜索引擎会24小时不间断的向互联网派出无数的爬虫程序,也叫蜘蛛程序。这些蜘蛛的任务就是扫描互联网中所有的网页,把网页的内容读取下来存入数据库,然后再顺着网页里的超级链接爬到下一个页面,重复相同的操作。这样通过一段时间的积累,搜索引擎的数据库中就会存有互联网中大部分的页面。具体的讲存的东西至少要包括页面全文。页面的链接可能代表这个页面的一些关键词。当我们点下搜索按钮时,你写的关键词就被送到了数据库里进行对比匹配。匹配成功的页面,它的简介和链接将会添加到结果列表里,最终组成你所看到的搜索结果。这就是搜索引擎真实的工作原理。当然这仅仅是一个最简化的描述,而之前我们提到的关键词匹配其实才是搜索引擎最核心的技术索引以及索引算法。但是这个话题就远远超出了今天的科普范围,所以按下不表。最后我建议大家记住两个最容易被误解的点。第一,搜索引擎从来不会真正的实时搜索,实际上它只能搜索收集好的旧数据,这也就是为什么结果列表中有些页面打不开的原因。因为当你搜它的时候,它已经不在了,但是数据库里却保存了它的旧信息。第二,蜘蛛程序所做的事情其实并不神秘,也不复杂,本质上和一个浏览网页的用户是一样的。只不过用户看到的是被浏览器渲染出来的页面,而蜘蛛程序看到的是这个页面的源代码。只要理解这两点,我可以向你保证,你对搜索引擎的认知已经超过了95%的人。
第十一课 获取互联网资源
2
我国的七大古都 是哪七个?
答案:西安、洛阳、开封、杭州、南京、北京、安阳。
中国四大佛教名山分别是哪几座山?
答案:五台山(山西)、峨眉山(四川)、九华山(安徽)、普陀山(浙江)
这是哪个城市的景点?
这是哪个城市的景点?
小调查
你们平时用互联网获取哪些资讯?
课堂任务
选一个感兴趣的主题,搜索相关文字介绍、图片等信息与同学分享交流。
搜索引擎
搜索引擎来帮忙
1.什么是搜索引擎?
2.搜索引擎的工作原理是什么?
任务一 分组探究以下问题
第一二组: 什么是搜索引擎?
第三四组:
搜索引擎的工作原理是什么?
搜索引擎
搜索引擎其实也是一个网站,只不过该网站专门为人们提供信息搜索服务,它使用特有的功能把因特网上的所有信息归类以帮助人们在浩如烟海的信息海洋中搜寻到自己所需要的信息。
搜索引擎的工作原理
13
搜索引擎的工作原理
一、抓取网页:
网页抓取程序蜘蛛spider,顺着超链接,从一个网站爬到另一个网站,抓取更多网页,被抓取的网页被称为网页快照。
二、处理网页:
抓到网页后,提取信息,建立索引。
三、提供检索服务:
用户输入关键词检索,搜索引擎从索引数据库中查询并将结果返回给用户。
14
为什么大家搜索同个问题,搜索引擎反馈的结果却有所区别?
1、搜索算法不同
2、数据收集和处理存在差异
3、地域和语言不同
试一试
美食
偶像
游戏
动漫
搜集自己感兴趣的主题资料
先思考
1、如何在规定的时间内搜索到相关信息?
2、你会用哪些关键字来进行搜索,使你的效率更高?
3、保存文字、图片、视频的方法你会吗?
任务要求
同桌为一组,选一个感兴趣的主题,讨论搜索相关文字介绍、图片或视频等信息保存到指定文件夹中,并与同学分享交流。
搜索信息的途径不仅限于搜索引擎,也可以从专业网站或官方平台进行搜索,有助于获取更专业的内容和更权威的数据
如:旅游网站:携程网
购票网站:12306
视频平台:腾讯视频
购物网站:淘宝网
社交媒体:抖音、小红书
小检测
1、搜索引擎的工作原理不包括下列哪项?( )
A. 输入关键字
B. 处理网页建立索引
C. 在互联网中抓取网页
D. 在索引数据库中搜索并返回结果
2、对搜索引擎的工作原理正确排序 的是( )
①建立索引
②抓取网页
③在索引数据库中搜索并返回结果
A.①②③ B.②①③ C.②③① D.③①②
2、下列关于搜索引擎说法,正确 的是( )
A.搜索引擎能找到互联网中所有信息
B.搜索引擎只有百度、360搜索
C.使用相同的关键字在不同的搜索引擎找到的结果可能有区别
D.搜索信息的途径仅限于搜索引擎。
A
B
C
课堂小节
一、搜索引擎
二、搜索引擎工作原理
三、用互联网搜集资源
Lavf58.28.100
$null