内容正文:
第7单元 了解更多的算法
网页排名有策略
第27课
·
学习目标
01
课堂导入
02
新知探究
03
知识总结
04
智慧挑战
05
兴趣园地
06
目录
CONTENTS
2
PART 1
学习目标
初步了解网页排名算法,知道搜索引擎中存
在的网页排名算法。
学习目标
了解提升网页价值的意义,知道网页排名、
内容推荐等算法应用应遵守的规范。
PART 2
课堂导入
课堂导入
虽然我们很少直接使用网页排名算法,然而它就隐藏在互联网的背后,在我们日常使用互联网时发挥着重要作用。
例如当我们用搜索引擎搜索信息时,搜索引擎会根据网页排名算法,把内容相关度较高的网页显示在前面,帮助我们更快地找到所需信息。
网页排名算法
PART 3
新知探求
新知探究
学习活动1
活动1:找出被链接最多的网页
新知探究
学习活动1 找出被链接最多的网页
情境扮演
选出 4 位同学,每人发一张卡片,分别是 A 卡、B 卡、C 卡和 D 卡。每位同学在卡片上写上其他 3 位同学中,自己有联系方式的卡片号。为了方便对比,我们把这些卡片看成是网页。例如,A 网页上写着“C、D”,表明 A 同学有 C 同学和 D 同学的联系方式。
把联系方式看成链接,A 网页上有C和D两个链接
使用网页排名算法找出被链接次数最多的网页
假设其他 3 个网页上的链接:
B 网页上写着“A、C、D”
C 网页上写着“B”
D 网页上写着“A、B、C”
新知探究
活动过程如下:
所有网页都被检查过后,可以看出,被链接次数最多的是C网页,表示C同学被记录联系方式最多。
01
02
准备表格,用来记录网页被链接的情况
查看 A 网页,其中写着 C 和 D,在记录表中为C和D记录 1,表示C和D分别被链接一次,同时记录链接的网页为 A。
03
继续查看 B 网页、C 网页和 D 网页,在记录表中记录它们被链接的次数和链接的网页。
学习活动1 找出被链接最多的网页
2
B、D
2
C、D
3
A、B、D
2
A、B
新知探究
自然语言描述算法步骤
第 1 步:在未检查的网页中选定一个网页
第 2 步:统计选定网页中的链接次数
第 4 步:输出被链接次数最多的网页编号
第 3 步:重复以上两步,统计其余网页被链接的次数
学习活动1 找出被链接最多的网页
新知探究
学习活动2
活动2:搜索引擎中的网页排名
新知探究
实践操作
学习活动2 搜索引擎中的网页排名
第1步:打开一个搜索引擎,输入关键词,查找自己想要的内容,如“月球图片”“可爱的大熊猫”“什么是网页排名”等。
发现:搜索引擎会根据输入的关键词找到大量相关的网页,并按照相关排名算法的规则进行排序。
第2步:观察网页中显示的内容,思考其中存在的规律。
新知探究
搜索引擎后台操作过程
学习活动2 搜索引擎中的网页排名
记录网页票数
优先排列高票网页
按票数依次显示
搜索引擎会记录相关网页的“票数”,如被其他网页链接的次数。“票数”越多,表明这个网页越被关注。
搜索引擎会将其他搜索到的相关网页,按照“票数”多少依次排列并显示出来。
搜索引擎会把那些“票数”较多的网页排列在前面,让搜索信息的人先看到这些网页。
新知探究
实际应用中的网页排名算法
实际应用中,搜索引擎往往会提前搜索很多常用的词、热点事件等,并提前做好网页排名。这样,在我们进行搜索时,就能更快地提供搜索结果。
在很多社交媒体的应用软件中,也会采用类似的算法。当我们输入关键词搜索信息时,应用软件会根据网页排名算法来显示搜索结果。那些被更多人转发、点赞或评论的内容,往往会出现在首页,因为这些内容被认为更受欢迎,是多数人需要的内容。
学习活动2 搜索引擎中的网页排名
新知探究
活动3:了解网页排名算法
学习活动3
新知探究
学习活动3 了解网页排名算法
搜索引擎通常以关键词和网页内容的关联性来决定搜索结果的排列顺序,这种方法没有考虑网页是否包含更有价值的内容,因此搜索精度较低。
网页排名算法的出现,使搜索引擎的搜索性能变得更加快速、精准。 网页排名算法通过大量的计算,利用网页链接数量和结构判断网页价值。目前,决定搜索引擎搜索结果排序的已不仅仅是网页排名这一种算法,通常会用多种算法来进行计算和判定。
网页排名算法有很多,但较有名的是 PageRank 算法。
新知探究
下面通过模拟 100 个访问者的上网行为,观察他们最后停留在哪个网页上,从而确定吸引访问者最多的网页,了解 PageRank 算法。
学习活动3 了解网页排名算法
第 1 步:把 100 个访问者平均分配给 4 个网页。
PageRank算法
新知探究
学习活动3 了解网页排名算法
第 2 步:根据链接情况为每个网页重新分配访问者。
PageRank算法
例如,在 A 网页的访问者中,有 10 个访问者会访问网页 B,有 15 个访问者会访问网页 C。
新知探究
学习活动3 了解网页排名算法
PageRank算法
重新分配访问者后,网页 A 还有 23 个访问者,其中 15 个来自于网页 B,8 个来自于网页 C。
网页 B 只剩下 17 个访问者,其中 10 个来自网页 A,7 个来自网页 C。
网页 C 增加到了 50 个访问者,其中 25 个来自网页 D,15 个来自网页 A, 10 个来自网页 B。
网页 D 只剩下 10 个访问者,全部来自网页 C。
第 3 步:为了得到每个网页的排名,通过迭代计算与优化,重复上述分配过程,直到每个网页的访问者人数不再发生改变。
每个网页的最终访问者人数体现了该网页的 PageRank 排名,即访问者越多,排名就越高。
新知探究
学习活动3 了解网页排名算法
PageRank算法根据链接的数量、强度以及来源对网页中的节点进行排序,有助于找出网络中价值较高的网页。使用PageRank算法进行排名时,迭代计算是一个关键步骤。在每次迭代中,都会根据上一步计算出的数值来重新计算每个页面的数值。通过多轮的反复迭代计算,直到所有页面的数值不再发生明显变化或达到预设的迭代次数,就得到每个页面最终的排名数值。
PageRank算法中的迭代计算
通过迭代计算,PageRank算法能够量化相关内容在各个网页中的重要性或影响力,并根据这些数值对网页进行排序。
新知探究
学习活动3 了解网页排名算法
网页排名、算法推荐等应用,对社会生活产生了广泛而深远的影响,既体现在积极的正面促进方面,又包含一些潜在的负面问题。
算法应用的影响
积极的正面促进
算法的自动化性能使得许多重复性工作可以被自动完成,如机器人通过算法进行自主导航和执行任务。
算法可以优化数据分析与决策,帮助人们进行更精准、科学的决策。
算法是人工智能技术的核心要素之一,其应用推动了工业、农业、科研、教育、医疗、交通等多个领域的科技进步与创新。
潜在的负面问题
算法推荐往往基于个人偏好和历史行为,长此以往,可能导致有些人只接触到与自己观点相似的信息,从而产生认知偏见。
算法推荐需要收集和分析用户的个人信息和行为数据,增加了隐私泄露和数据安全风险。
如果算法所用的训练数据存在偏见或歧视性内容,就可能产生不公平的决策结果。
算法推荐可能通过个性化推荐和精准营销等方式,诱导用户沉迷网络、过度消费等行为。
应对的举措
为了应对这些潜在的负面问题,需要政府、企业、个人共同努力,加强监管、治理与防范。主要举措列举如下:
政府部门建立算法应用监管制度体系,明确算法应用、算法推荐等服务的法律责任和监管要求,确保其符合法律法规和伦理道德标准;
要求算法推荐服务提供者向用户披露算法的基本原理、应用场景和决策过程等信息,提高算法的透明度;
加强对个人信息的保护和管理,对数据收集、存储、处理和传输等进行监管,确保个人信息的安全和合法使用。
PART 4
知识总结
知识总结
找出被链接最多的网页
第 1 步:在未检查的网页中选定一个网页。
第 2 步:统计选定网页中的链接次数。
第 3 步:重复以上两步,统计其余网页被链接的次数。
第 4 步:输出被链接次数最多的网页编号。
了解网页排名算法
搜索引擎中的网页排名
打开一种搜索引擎,输入关键词,打开并观察网页中显示的内容。
操作后,搜索引擎会根据输入的关键词找到大量相关的网页,并按照
相关排名算法的规则进行排序。
PART 5
智慧挑战
2.当我们使用搜索引擎(如百度)查找资料时,为什么有些网页会排在前面?
A. 因为它们是最近刚创建的网页
B. 因为搜索引擎通过一种算法,根据网页的相关性和重要性等进行排序
C. 因为它们的颜色更鲜艳
D. 因为它们是免费的
1.小明想让自己关于科学小实验的网页被更多人看到,他应该怎么做?
A. 在网页上写很多次“科学小实验”这个词,即使内容不相关
B. 确保网页内容有趣、有真实的实验步骤和图片,并请老师或其他网站链接推荐
C. 把网页背景做成黑色,字也做成黑色,让用户看不清楚
D. 花钱请人点击自己的网页,制造虚假访问量
智慧挑战
智慧挑战
解析:提升网页排名正确方法是“以质取胜”。应该把科学小实验的网页做得内容充实、步骤清晰、图片真实,这样用户才会喜欢,也更容易被其他优质网站引用推荐。
答案:B
解析:“网页排名算法”会根据很多因素给网页打分,比如网页内容是否和你的搜索关键词相关、网页是否受到其他可靠网站的推荐、网页内容质量是否高等,然后按照分数从高到低排序
答案:B
PART 6
兴趣园地
兴趣园地
问题讨论:如何辩证地看待网页排名、内容推荐等算法的应用?这些算法对社会生活有什么影响?
算法应用在给社会生活带来方便的同时,也可能带来负面的影响,如损害网络资源的公共利益、泄露隐私信息、危害公共安全等。
2022年3月1日起施行的《互联网信息服务算法推荐管理规定》要求:
坚持正确导向,算法向上向善;坚持风险防控,推进算法规制;坚持规范发展,防止算法滥用。
不得利用算法推荐服务诱导未成年人沉迷网络,应当便于老年人安全使用算法推荐服务,应当建立完善平台订单分配、报酬构成及支付、工作时间、奖惩等相关算法,不得根据消费者的偏好、交易习惯等特征利用算法在交易价格等交易条件上实施不合理的差别待遇等。
讨论
谢谢
下节课见!
Thanks!
·
$