内容正文:
北师大版2024·八年级上册
6.1平均数与方差
第六章
数据的分析
02
01
能运用平均数描述数据集中趋势、用方差描述数据离散程度,解决简单实际问题。
学 习 目 标
理解算术平均数、加权平均数及方差的概念,掌握其计算方法。
情境导入
在某场女排决赛中,A队战胜B队获得冠军。下面图中反映了两队队员拦网高度情况,从中你能得到哪些信息?
情境导入
在大数据时代,人们常常需要收集、整理、表示、分析数据,进而更好地作出判断。我们已经学习了数据的收集与整理。在此基础上,还需要对收集到的数据进行分析。本章将学习如何选择一些具有“代表性”的统计量来反映数据的集中趋势与离散程度,以及根据问题的需要确定整理和分析数据的方法。在这一过程中,你将体会数据分析的重要性,发展数据观念,增强应用意识。
1.在某次射击训练中,甲、乙、丙、丁四人的成绩如图所示。
新知探究
(1)观察统计图,甲的哪个射击成绩出现次数最多?其他选手呢?
新知探究
①甲8环出现次数最多;
②乙7环出现次数最多;
③丙9环出现次数最多;
④丁6环和10环出现次数最多.
(2)不计算,请你尝试判断谁的射击成绩最好.你是怎么判断的?
初步判断丙的射击成绩最好,
通过观察高环数(9环、10环)出现的次数,丙的高环数出现次数相对更多.
总结:一组数据中出现次数最多的那个数据叫作这组数据的众数.
例如:甲射击成绩的众数是8环,丁射击成绩的众数是6环和10环.
(3) 算一算,验证你的判断是否正确.
新知探究
计算得甲平均成绩8环、乙约7.27环、丙约8.69环、丁8环,丙
平均成绩最高,判断正确.
总结:一组数据中所有数据之和除以这组数据的个数,就得到这组数据的算术平均数,简称平均数.
平均数是刻画一组数据集中趋势的一项指标,反映了一组数据的“中心”.
一般地,对于 n 个数 x₁, x₂, …, xₙ,它们的平均数是 ,记为 .
新知探究
(1) 一组数据的平均数一定在这组数据中吗?
(2) 如果甲又射击一次,意外脱靶,成绩为0环,那么这时甲的平均成绩会发生什么变化?
(3) 在某些比赛评分时,常常去掉一个最高分和一个最低分,然后计算平均成绩,你能说说这样做的好处吗?
(1) 不一定.
(2) 甲的平均成绩会变小.
(3) 这样做可以减少极端值的影响,避免因为过低或过高的分数影响平均数.
思考·交流
新知探究
某店铺一种商品10天中每天的销售量及顾客对店铺的评分如图所示.
(1) 请你计算这种商品10天的平均销售量.
操作·思考
(1) 这种商品10天的平均销售量为136.1件.
新知探究
某店铺一种商品10天中每天的销售量及顾客对店铺的评分如图所示.
(2) 顾客对店铺评分的众数是多少?顾客对店铺评分的平均数呢?
操作·思考
(2) 顾客对店铺评分的众数是5分,对店铺评分的平均数是4.732分.
新知探究
从统计图中获取众数、平均数,你有哪些经验?
回顾·反思
2.某馄饨店每碗有10个馄饨。其中蛋黄鲜肉馄饨15元/碗,虾仁鲜肉馄饨15元/碗,荠菜鲜肉馄饨12元/碗,玉米鲜肉馄饨10元/碗,香芹鲜肉馄饨10元/碗。现在计划推出一份“全家福”馄饨,其中含蛋黄鲜肉馄饨、虾仁鲜肉馄饨各1个,荠菜鲜肉馄饨2个,玉米鲜肉馄饨、香芹鲜肉馄饨各3个。你认为这种“全家福”馄饨每碗定价多少元较为合理?你是怎么想的?与同伴进行交流。
新知探究
新知探究
(1)小亮认为“全家福”馄饨每碗定价应为
你认为他的算法合理吗?为什么?
尝试·交流
合理.
因为不同馅料馄饨的个数不同.
新知探究
(2)如果“全家福”馄饨含蛋黄鲜肉馄饨3个,虾仁鲜肉馄饨3个,荠菜鲜肉馄饨2个,玉米鲜肉馄饨1个,香芹鲜肉馄饨1个,那么该如何定价呢?若每种馄饨各2个,又该如何定价呢?
尝试·交流
(3)你认为这种“全家福”馄饨的定价与什么有关?
这种“全家福”馄饨的定价和不同馅料馄饨的占比有关.
每碗定价应为
新知探究
总结:在很多实际问题中, 一组数据里各个数据的“重要程度”未必相同, 因而在计算这组数据的平均数时, 往往根据各个数据的“重要程度”赋一个“权”.
每个数据的占比就是它们的权,若 n 个数 x₁, x₂, …, xₙ的权分别是 w₁, w₂, …, wₙ,
则: x₁w₁+x₂w₂+…+xₙwₙ叫做这 n 个数的加权平均数.
例如,在一碗“全家福”馄饨中,不同馅料的馄饨个数不同,影响着这碗“全家福”馄饨的定价,
因此不同馅料馄饨的占比就是权,
我们称
为上述第一种“全家福”馄饨五种馄饨价格的加权平均数.
新知探究
新知探究
“权”的三种表现形式:
① 各个数据出现的次数;
② 比例的形式;
③ 百分比的形式.
想一想,加权平均数和算术平均数有什么区别和联系?
新知探究
区别:算术平均数对应的一组数据中的各个数据的“重要程度”相同。
加权平均数对应的一组数据中的各个数据的“重要程度”不一定相同,即各个数据的“权”不一定相同。
联系:若各个数据的“权”相同,则加权平均数就是算术平均数,因而算术平均数实际上是加权平均数的一种特例。
新知探究
某校进行广播体操比赛,评分包括以下几项(每项满分10分):服装统一、进退场有序、动作规范、动作整齐.其中三个班的成绩见下表:
例 1
如果将服装统一、进退场有序、动作规范、动作整齐这四项得分依次按10%,20%,30%,40%的比例计算各班的广播体操比赛成绩,那么哪个班的成绩最高?
班级 评分项
服装统一 进退场有序 动作规范 动作整齐
一班 9 8 9 8
二班 10 9 7 8
三班 8 9 8 9
新知探究
解:一班的成绩为9×10%+8×20%+9×30%+8×40%=8.4(分)
二班的成绩为10×10%+9×20%+7×30%+8×40%=8.1(分);
三班的成绩为8×10%+9×20%+8×30%+9×40%=8.6(分)。
所以,三班成绩最高。
班级 评分项
服装统一 进退场有序 动作规范 动作整齐
一班 9 8 9 8
二班 10 9 7 8
三班 8 9 8 9
新知探究
(1)已知A,B两家网站用户的日人均上网时间分别是2h和1h,这两家网站所有用户的日人均上网时间是 (2+1)÷2=1.5(h)吗?为什么?与同伴进行交流。
思考·交流
没有考虑A、B两家网站的用户数量,应根据用户数量用加权平均数计算.
新知探究
(2)设A,B两家网站用户的日人均上网时间分别是 a h和 b h,A,B两家网站平均每天的上网用户分别为 m 人和 n 人,你能求出这两家网站所有用户的日人均上网时间吗?
思考·交流
A,B两家网站所有用户的日人均上网时间为 ,
它不是两家网站各自用户日人均上网时间ah和bh的算术平均数,
而是ah和bh的加权平均数 ,
权 反映了两家网站用户的分布情况.
这是分布式计算的最简单形式,对于多家网站的情况也可以类似计算.
3.甲与丁每次的射击成绩如图所示,他们的平均成绩都是8环,两个人的射击表现一样吗?你对甲、丁的射击表现有什么评价?
新知探究
(1) 你觉得谁发挥得更稳定?你的理由是什么?
新知探究
甲发挥得更稳定,
理由是甲的成绩数据点分布更集中.
(2) 你能设法通过计算说明两人成绩的稳定程度吗?
新知探究
在实际生活中,除了关心数据的集中趋势外,人们往往还关注数据的离散程度,即它们相对于集中趋势的偏离情况.
在统计学里,数据的离散程度可以用离差平方和、方差或标准差等统计量来刻画.
离差平方和是各个数据与它们平均数之差的平方和,即
.
方差是各个数据与它们平均数之差的平方的平均数,即
.
其中, 是x₁,x₂,…, 的平均数.
标准差则是方差的算术平方根.
新知探究
新知探究
总结:(1) 方差、标准差是描述一组数据离散程度的量.
一般而言,一组数据的方差和标准差越小,这组数据就越稳定.
(2) 只有在两组数据的平均数相等或比较接近时,才用方差或标准差比较两组数据的离散程度.
新知探究
计算图中甲射击成绩的标准差(结果精确到0.01环).
例 2
解: (6+7×3+8×5+9×3+10)=8(环),
,
(环).
所以,甲射击成绩的标准差约为1.04环.
新知探究
(1) 计算图中丙射击成绩的方差,并对甲、丙的射击成绩进行比较.
思考·交流
甲成绩的平均数是8环,
方差约是1.08(环²).
丙成绩的平均数约是8.69环,
方差约是1.29(环²).
新知探究
(1) 计算图中丙射击成绩的方差,并对甲、丙的射击成绩进行比较.
思考·交流
甲射击成绩的方差小于丙射击成绩的方差,
但甲的射击成绩的平均数小于丙射击成绩的平均数,
故甲射击成绩较丙更稳定,丙的射击成绩更好.
新知探究
(2) 丁又进行了几次射击,这时他所有射击成绩的平均数没变,但方差变小了.你认为丁后面几次射击的成绩有什么特点?
思考·交流
丁成绩的平均数是8环,
方差是3(环²). 丁后面几次射击的成绩应集中在7,8,9环且这几次射击成绩的平均数为8环.
4.某日,A,B两地的气温如图所示.
新知探究
(1) 不进行计算,说说A,B两地这一天气温的特点.
A地的日温差较大,B地的日温差较小,但平均气温相近.
新知探究
(2) 分别计算这一天A,B两地气温的平均数和方差,与你刚才的看法一致吗?
A地24时气温(单位:℃)分别是18,17.5,17,16,16.5,18,19,20.5,22,23,23.5,24,25,25.5,24.5,23,22,20.5,20,19.5,19.5,19,18.5,18.
B地24时气温(单位:℃)分别是20,19.5,19,18,19,19.5,20.5,22,22.5,23,23,23.5,24,24,23,22.5,22.5,22,21.5,21,21.5,20.5,20.5,20.
新知探究
(℃);
(℃);
[(18-20.42)²+…+(18-20.42)²]≈7.76;
[(20-21.35)²+…+(20-21.35)²]≈2.78.
A,B两地平均气温相近,但A地日温差较大,B地日温差较小,因此与刚才看法一致.
新知探究
某校要从甲、乙两名跳远运动员中挑选一人参加一项比赛。在最近的10次选拔赛中,他们的成绩(单位:cm)如下。
甲:585 596 610 598 612 597 604 600 613 601
乙:613 618 580 574 618 593 585 590 598 624
(1)甲、乙的平均成绩分别是多少?
尝试·思考
甲的平均成绩为601.6cm,
乙的平均成绩为599.3cm.
新知探究
某校要从甲、乙两名跳远运动员中挑选一人参加一项比赛。在最近的10次选拔赛中,他们的成绩(单位:cm)如下。
甲:585 596 610 598 612 597 604 600 613 601
乙:613 618 580 574 618 593 585 590 598 624
(2) 甲、乙这10次选拔赛成绩的方差分别是多少?
尝试·思考
甲这10次比赛的方差为65.84,
乙这10次比赛的方差为284.21.
新知探究
某校要从甲、乙两名跳远运动员中挑选一人参加一项比赛。在最近的10次选拔赛中,他们的成绩(单位:cm)如下。
甲:585 596 610 598 612 597 604 600 613 601
乙:613 618 580 574 618 593 585 590 598 624
(3) 这两名运动员的选拔赛成绩各有什么特点?
尝试·思考
甲这10次的平均成绩更好, 成绩更稳定, 但没有单次超过615cm的成绩,
乙这10次成绩不稳定, 但有3次超过615cm的好成绩, 其中有1次可以达到624cm.
新知探究
某校要从甲、乙两名跳远运动员中挑选一人参加一项比赛。在最近的10次选拔赛中,他们的成绩(单位:cm)如下。
甲:585 596 610 598 612 597 604 600 613 601
乙:613 618 580 574 618 593 585 590 598 624
(4) 历届比赛成绩表明, 成绩达到5.96m就很有可能夺冠, 你认为为了夺冠应选谁参加这项比赛?如果历届比赛成绩表明, 成绩达到6.10m就能打破纪录, 那么你认为为了打破纪录应选谁参加这项比赛呢?
尝试·思考
为了夺冠应该选甲参加比赛, 甲10次中有9次成绩达到5.96m, 而乙只有5次.
为了破纪录应该选乙参加比赛, 甲10次中有3次成绩达到6.10m, 而乙有4次且乙有6.24m的成绩.
新知探究
10个苹果的直径如图所示。
思考·交流
新知探究
(1)若想把这10个苹果分成两组,使每组苹果的“个头”差不多,你想怎么分?说说你分组的理由。
思考·交流
第一组苹果编号1、3、4、7;第二组苹果编号2、5、6、8、9、10.
理由是将直径数值集中在一定范围、较为接近的苹果分为一组,使每组内苹果“个头”(直径)差不多.
新知探究
(2) 一般情况下,如果想把一组数据分成若干组,使每组组内的数据差距不大,且组与组之间的数据差别明显,那么你认为应遵循怎样的分组原则?
思考·交流
在统计学里,分组的方法有很多,其中较常用的方法是使“组内离差平方和达到最小”.
多组数据的组内离差平方和是指每组数据的离差平方和的和.
新知探究
按照“组内离差平方和达到最小”的方法,把上述的10个苹果按直径大小分成两组.
例 3
解:将10个数据由小到大排序:
65,69,70,75,76,76,78,80,80,81.
把10个数据分成两组,共有9种情况:第一组1个数据{65},第二组9个数据{69,…,81};第一组2个数据{65,69},第二组8个数据{70,…,81};……;第一组9个数据{65,…,80},第二组1个数据{81}。
以第2种分组情况为例,计算组内离差平方和。其中,第一组有2个数据{65,69},这2个数据的平均数是67,故第一组数据的组内离差平方和
新知探究
S₁²=(65-67)²+(69-67)²=8 ;第二组有8个数据{70,75,76,76,78,80,80,81},这8个数据的平均数是77,故第二组数据的组内离差平方和 S₂²=(70-77)²+(75-77)²+…+(81-77)²=90 。
因此,第2种分组情况的组内离差平方和 S₃²=S₁²+S₂²=8+90=98 。
新知探究
同理,计算其他8种分组情况的组内离差平方和,结果如下:
分组情况 组内离差平方和
第一组1个,第二组9个 146.889
第一组2个,第二组8个 98
第一组3个,第二组7个 48
第一组4个,第二组6个 74.25
第一组5个,第二组5个 98
第一组6个,第二组4个 107.583
第一组7个,第二组3个 136.095
第一组8个,第二组2个 182.375
第一组9个,第二组1个 218
计算结果表明,第3种情况的组内离差平方和最小。因此,把10个苹果按直径大小分成的两组是{65,69,70},{75,76,76,78,80,80,81}。
变式训练
1.菲尔兹奖是数学领域的一项国际大奖,每四年颁发一次。从1936年
到2022年,共有65人获奖,获奖者获奖时的年龄分布如下图,请计
算获奖者的平均获奖年龄(结果精确到0.1岁)。
变式训练
解:获奖者获奖年龄的众数是37岁和38岁,
获奖者获奖年龄的平均数为(27+29×3+31×5+32×4+33×4+34×4+35×6+36×5+37×9+38×9+39×7+40×
7+45×1)÷(1+3+5+4+4+4+6+5+9+9+7+7+1)≈35.8(岁)。
变式训练
2.某校规定学生的体育成绩由三部分组成:早锻炼及体育课外活动表现占20%,体育理论测试占30%,体育技能测试占50%。小颖的上述三项成绩依次是92分、80分、84分,则小颖的体育成绩是多少?
解: ,
即小颖这学期的体育成绩是84.4分.
变式训练
3.甲、乙两支仪仗队队员的身高(单位:cm)如下。
甲队:178 177 179 179 178 178 177 178 177 179
乙队:178 177 179 176 178 180 180 178 176 178
哪支仪仗队队员的身高更为整齐?你是怎么判断的?
解:甲队队员身高的平均数为:
乙队队员身高的平均数为:
变式训练
甲队队员身高的方差为:
乙队队员身高的方差为:
因为0.6 < 1.8,即甲队的方差小于乙队的方差,所以甲仪仗队队员的身高更为整齐。
变式训练
4.某公司欲招聘一名职员,从学历、经验和工作态度三个方面对甲、乙、丙三名应聘者进行了初步测试,测试成绩(单位:分)见下表:
如果将学历、经验和工作态度三项得分按 1:2:2 的比例确定各人的最终得分,并以此为依据确定录用者,那么谁将被录用?
变式训练
解:甲的综合成绩为 (分),
乙的综合成绩为 (分),
丙的综合成绩为 (分),
因为 7.8 > 7 > 6.4 ,
所以应录用乙.
课堂小结
平均数与方差
反映数据的
集中趋势
众数:一组数据中出现次数最多的那个数据
加权平均数
算术平均数:一组数据中所有数据之和除以这组数据的个数,就得到这组数据的算术平均数
若 n 个数 x₁,x₂,…,xₙ的权分别是 w₁,w₂,…,wₙ,则: x₁w₁+ x₂w₂+…+ xₙwₙ叫作这 n 个数的加权平均数
“权”的三种表现形式:
① 各个数据出现的次数;② 比例的形式;③ 百分比的形式
算术平均数与加权平均数的区别与联系
课堂小结
平均数与方差
反映数据的
离散程度
离差平方和:各个数据与它们平均数之差的平方和
数据的选择
方差:各个数据与平均数之差的平方的平均数
标准差:方差的算术平方根
方差越小表示这组数据越稳定,但不是方差越小就表示这组数据越好,而是对具体的情况进行具体分析才能得出正确的结论
感谢聆听!
$