内容正文:
第14课互联网搜索新发展学习任务单
姓名: 班级:
学习目标:
1、 了解搜索引擎的工作原理。
2、 知道搜索引擎的简单工作过程。
3、 了解网络爬虫等自动化技术给搜索带来的影响。
学习活动一:实验探究
实验一:运行《七年级_互联网_实验工具集》中的“简易搜索系统”,按实验顺序完成任务并填写实验效果和结论。
实验任务
实验效果
实验结论
打开“简易搜索系统”,将访问地址复制后粘贴在浏览器地址栏中,使用关键词”中国探月“查看检索结果?
①搜索引擎搜到的信息是(£搜索前放进去的£实时在网络中或缺的)
②本次实验网页的数据都保存在:
£桌面
£Web文件夹
£C:/programfiles/
将教师下发的web文件夹中的文件复制到”素材文件夹/第14课/web/”中,再次刷新网址,,使用关键词”中国探月“重新检索再次查看结果?
学习活动二:实验探究
实验二:Web文件夹中的pages.csv中记录网页文件的文件名和对应的网址,如果将其改名或删除是否影响搜索结果?
实验任务
实验效果
实验结论
将web文件夹中的pages.csv文件重命名为page.csv,重新运行“建议搜索系统”,输入关键词“中国探月”进行搜索
①搜索引擎工作过程中存储网页文件和实际网址的关系文件
£必须存在
£可以没有,并不影响
②若需要将存储网页文件和实际网址的关系文件存储Web文件夹中,存储的文件名是什么?
£page.csv
£pages.csv
£pages.html
£page.html
将web文件夹中的page.csv文件重命名为pages.csv,并将其删除,重新运行“建议搜索系统”,输入关键词“中国探月”进行搜索
学生活动三:实验探究
实验三:“网络爬虫测试”检验“中华人民共和国教育部2025年要闻的域名地址:http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/moe_1485/202501/t20250110_1175123.html”是否允许爬虫?并完成简易搜索系统的文件替换,运用爬虫技术后的具体变化。
实验任务
实验效果
实验结论
1、运行《网络爬虫测试》软件,输入“http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/moe_1485/202501/t20250110_1175123.html”单击“启动网络爬虫”按钮,记录实验效果和实验结论
该网址能否通过爬虫自动获取相关网页?
£能
£不能
2、把spider.pyc文件复制到搜索系统文件夹,重新运行《简易搜索系统》,界面发生了改变,输入爬虫测试网址,单击“启动网络爬虫”按钮,查看Web文件夹是否增加新的网页文件?打开page.csv文件查看是否增加记录?
①网络爬虫之后,Web文件夹中网页的数目变化情况?
£增多 £不变 £减少
②打开page.csv文件查看索引记录变化情况?
£增多 £不变 £减少
替换spider.pyc文件后简易搜索系统界面效果
学生活动四:实验探究
实验四:分词测试实验,把tokenizer.pyc文件复制到素材文件夹/第14课/web文件夹中,重新运行《简易搜索系统》,界面有无发生变化,再次运行简易搜索系统,使用关键词”中国探月“重新检索再次查看结果,完成实验请填写实验效果及结论。
实验任务
实验效果
实验结论
1、运行《分词测试》软件,输入“中国探月”进行分词,观察分词效果
2、把tokenizer.pyc文件复制到素材文件夹/第14课/web文件夹中,重新运行《简易搜索系统》,界面有无发生变化,再次运行简易搜索系统,使用关键词”中国探月“重新检索再次查看结果?
学科网(北京)股份有限公司
$$