内容正文:
第2课时 极差、方差与标准差
学业标准
素养目标
1.理解极差、方差和标准差的意义和作用.(难点)
2.会计算样本数据的这些数字特征,并能解答有关实际问题.(重点)
1.通过计算极差、方差与标准差,主要提升学生数学运算核心素养.
2.通过数字特征的统计含义的简单应用,重点培养学生数据分析核心素养.
导学
极差、方差与标准差
方差与标准差与原始数据的单位如何?试分析在解决实际问题中的差异.
[提示] 标准差与原始数据的单位相同,方差的单位是原始数据单位的平方,方差主要是平方后夸大了偏离的程度,虽然它们均反映了样本数据的离散程度,但在实际问题中常用标准差.
◎结论形成
1.极差
一组数的极差指的是这组数的最大值减去最小值所得的差.极差反映了一组数的变化范围,描述了这组数的离散程度.
2.方差
(1)定义
如果x1,x2,…,xn的平均数为,则方差为s2=(xi-)2.
(2)性质
若a,b为常数,则ax1+b,ax2+b,…,axn+b的方差为a2s2.
3.标准差:即方差的算术平方根.
4.方差和标准差的统计含义
方差、标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差、方差较大,数据的离散程度较大;标准差、方差较小,数据的离散程度较小.
1.判断正误(正确的打“√”,错误的打“×”)
(1)极差反映了一组数据变化的最大幅度.( )
(2)方差与原始数据单位相同.( )
(3)给定一组数据,标准差是不唯一的.( )
(4)x1,x2,x3,x4的方差为s2,则3x1-2,3x2-2,3x3-2,3x4-2的标准差为.( )
答案 (1)√ (2)× (3)× (4)×
2.下列选项中,能反映一组数据的离散程度的是( )
A.平均数 B.中位数 C.方差 D.众数
解析 由方差的定义,知方差反映了一组数据的离散程度.
答案 C
3.已知样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本方差为 .
解析 依题意得(a+0+1+2+3)=1,∴a=-1.∴样本方差s2=[(-1-1)2+(0-1)2+(1-1)2+(2-1)2-(3-1)2]=2.
答案 2
4.甲、乙两人在相同条件下练习射击,每人打5发子弹,命中环数如下:
甲
6
8
9
9
8
乙
10
7
7
7
9
则两人射击成绩的稳定程度是 .
解析 ∵甲=8,乙=8,而s=1.2,s=1.6,s<s,∴甲稳定性强.
答案 甲比乙稳定
题型一 极差、方差与标准差的计算
从甲、乙两种玉米中各抽10株,分别测得它们的株高:
甲:25,41,40,37,22,14,19,39,21,42.
乙:27,16,44,27,44,16,40,40,16,40.
试计算甲、乙两组数据的方差和标准差.
(参考数据:≈10.208,≈11.349)
[解析] 甲=×(25+41+40+37+22+14+19+39+21+42)=30,s=×[(25-30)2+(41-30)2+…+(42-30)2]=104.2,s甲=≈10.208.乙=×(27+16+44+27+44+16+40+40+16+40)=31.
同理s=128.8,s乙=≈11.349.
计算方差、标准差的步骤
(1)算出样本数据的平均数.
(2)算出每个样本数据与样本数据平均数的差:xi-(i=1,2,3,…,n).
(3)算出(2)中xi-(i=1,2,3,…,n)的平方.
(4)算出(3)中n个平方数的平均数,即为样本方差.
(5)算出(4)中方差的算术平方根,即为样本标准差.
[触类旁通]
1.一组数据1,10,5,2,x,2,且2<x<5,若该数据的众数是中位数的倍,则该数据的方差为 .
解析 根据题意知,该组数据的众数是2,则中位数是2÷=3,
把这组数据从小到大排列为1,2,2,x,5,10,
则=3,解得x=4,
所以这组数据的平均数为=×(1+2+2+4+5+10)=4,s2=[(1-4)2+(10-4)2+(5-4)2+(2-4)2+02+(2-4)2]=9.
答案 9
题型二 方差性质及其应用
设样本数据x1,x2,…,x10的平均数和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的平均数和方差分别为( )
A.1+a,4 B.1+a,4+a
C.1,4 D.1,4+a
[解析] ∵x1,x2,…,x10的平均数=1,方差s=4,且yi=xi+a(i=1,2,…,10),∴y1,y2,…,y10的平均数=·(y1+y2+…+y10)=·(x1+x2+…+x10+10a)=·(x1+x2+…+x10)+a=+a=1+a,
其方差s=·[(y1-)2+(y2-)2+…+(y10-)2]=[(x1-1)2+(x2-1)2+…+(x10-1)2]=s=4.故选A.
[答案] A
若样本数据x1,x2,…,xn的平均数为,方差为s2,则yi=axi+b,i=1,2,…,n的平均数为a+b,方差为a2s2.
[触类旁通]
2.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )
A.8 B.15
C.16 D.32
解析 样本数据x1,x2,…,x10的标准差s=8,则样本数据2x1-1,2x2-1,…,2x10-1的标准差s′=2×8=16.
答案 C
题型三 数字特征的实际应用
甲、乙两名跳高运动员进行了8次比赛,他们的成绩(单位:m)如下:
甲:1.70 1.65 1.68 1.69 1.72 1.73 1.68 1.67;
乙:1.60 1.73 1.72 1.61 1.62 1.71 1.70 1.75.
(1)甲、乙两名运动员的平均跳高成绩分别是多少?
(2)哪位运动员的成绩更为稳定?
(3)教练根据这8次成绩,从甲、乙两名运动员中挑选一个参加省大学生运动会,若预测跳过1.65 m就很可能获得冠军,该校为了获得冠军,可能选哪名运动员参赛?若预测跳过1.70 m才能获得冠军呢?
[解析] (1)甲的平均成绩为
=1.69(m);
乙的平均成绩为
=1.68(m).
(2)s=×[(1.70-1.69)2+(1.65-1.69)2+…+(1.67-1.69)2]=0.000 6.
s=×[(1.60-1.68)2+(1.73-1.68)2+…+(1.75-1.68)2]=0.003 15.
显然,甲的平均成绩好于乙的平均成绩,而且甲的方差小于乙的方差,说明甲的成绩比乙稳定.
(3)由于甲的平均成绩高于乙,且成绩稳定,且甲1.65 m及以上的成绩有8次,乙1.65 m以上的成绩有5次,所以若跳过1.65 m就很可能获得冠军,应派甲参赛.
由于甲1.70 m及以上的成绩有3次,乙1.70 m及以上的成绩有5次,所以若跳过1.70 m才能获得冠军,应派乙参赛.
[素养聚焦] 通过数字特征的应用,重点提升数据分析核心素养.
平均数、方差、标准差在决策中的应用
(1)在实际应用中,常常把平均数与方差(标准差)结合起来进行决策.在平均数相等的情况下,比较方差(标准差)以确定稳定性.当平均数差异较大时,不必考虑方差.
(2)平均数和标准差是工业生产中监测产品质量的重要指标,当样本的平均数或标准差超过规定界限时,说明这批产品的质量可能离生产要求有较大的偏差,应该进行检查,找出原因,从而及时解决问题.
[触类旁通]
3.某教育集团为了办好人民满意的教育,每年底都随机邀请8名学生家长代表对集团内甲、乙两所学校进行人民满意度的民主测评(满意度最高120分,最低0分,分数越高说明人民满意度越高,分数越低说明人民满意度越低).去年测评的结果(单位:分)如下:
甲校:96,112,97,108,100,103,86,98;
乙校:108,101,94,105,96,93,97,106;
(1)分别计算甲、乙两所学校去年人民满意度测评数据的平均数及方差;
(2)根据以上数据,你认为这两所学校中哪所学校的人民满意度比较好.
解析 (1)甲=(96+112+97+108+100+103+86+98)=100,
乙=(108+101+94+105+96+93+97+106)=100,
s=[(96-100)2+(112-100)2+(97-100)2+(108-100)2+(100-100)2+(103-100)2+(86-100)2+(98-100)2]=55.25,
s=[(108-100)2+(101-100)2+(94-100)2+(105-100)2+(96-100)2+(93-100)2+(97-100)2+(106-100)2]=29.5.
(2)甲、乙的平均数相同,但是甲的方差大,数据波动就大,乙的方差小,数据相对集中,所以乙的人民满意度比较好.
知识落实
技法强化
1.极差、方差与标准差的计算公式.
2.极差、方差与标准差的统计含义.
在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差).标准差越大,说明数据的离散性越大;标准差越小,说明数据的离散性越小或数据越集中、稳定.
[必备知识·基础巩固]
1.(多选题)下列四个选项中,正确的是( )
A.极差与方差都反映了数据的集中程度
B.方差是没有单位的统计量
C.标准差比较小时,数据比较分散
D.只有两个数据时,极差是标准差的2倍
解析 设两个数据分别为x1,x2,则极差等于|x2-x1|,标准差等于|x2-x1|,故D正确.由定义可知A正确,B,C错误.
答案 AD
2.在某知识竞赛中,共设有10道题目,每题1分,经统计,10位选手的得分情况如下表:
得分(X)
6
7
8
9
10
人数
1
2
4
2
1
则这10位选手得分的方差为( )
A.12 B.8
C.0.8 D.1.2
解析 依题意=(6+7×2+8×4+9×2+10)=8,
所以方差s2=[(6-8)2+2×(7-8)2+4×(8-8)2+2×(9-8)2+(10-8)2]=1.2.
答案 D
3.(2024·四川攀枝花高一期末)已知一组数据x1,x2,x3,x4,x5的方差是,那么另一组数据3x1-1,3x2-1,3x3-1,3x4-1,3x5-1的方差是( )
A. B.
C.1 D.3
解析 由题意可得3x1-1,3x2-1,3x3-1,3x4-1,3x5-1的方差是9×=3.
答案 D
4.某单位共有A、B两个部门,1月份进行服务满意度问卷调查,得到两部门服务满意度得分的频率分布条形图如下.设A、B两部门的服务满意度得分的第75百分位数分别为n1,n2,方差分别为s,s,则( )
A.n1>n2,s>s
B.n1>n2,s<s
C.n1<n2,s<s
D.n1<n2,s>s
解析 根据频率分布条形图可知n1=4,n2=5,即n1<n2;
显然A部门得分数据较B部门更为集中,其方差更小,即s<s;故选C.
答案 C
5.已知某位同学五次数学考试成绩分别为121,127,123,a,125.若其平均成绩是124,则这组数据的方差为 .
解析 由平均成绩是124,可以求得a=124,然后由方差公式得方差为×[(121-124)2+(127-124)2+(123-124)2+(124-124)2+(125-124)2]=4.
答案 4
6.已知一组数据x1,x2,…,x10的方差是2,且(x1-3)2+(x2-3)2+…+(x10-3)2=380,则这组数据的平均数= .
解析 ∵数据x1,x2,…,x10的方差为2,
∴[(x1-)2+(x2-)2+…+(x10-)2]=2,
即(x1-)2+(x2-)2+…+(x10-)2=20,
又(x1-3)2+(x2-3)2+…+(x10-3)2=380,
∴90-10 2+(2 -6)×10 =360,∴2-6 -27=0,解得=-3或=9.
答案 -3或9
7.已知方差s2=(x+x+…+x)-2,用这个公式计算:若10个数的平均数是3,标准差是2,则方差是 ,这10个数据的平方和是 .
解析 由方差的算术平方根是标准差知s2=22=4,故4=×(x+x+…+x)-9,
所以x+x+…+x=130.
答案 4 130
8.某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果:(a,b),(a,),(a,b),(,b),(,),(a,b),(a,b),(a,),(,b),(a,),(,),(a,b),(a,),(,b),(a,b).其中,a,分别表示甲组研发成功和失败;b,分别表示乙组研发成功和失败.
若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平.
解析 甲组研发新产品的成绩分别为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1.其平均数为甲==,
方差s==.
乙组研发新产品的成绩分别为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,
其平均数乙==,方差s==.
因为甲>乙,s<s,
所以甲组的研发水平优于乙组.
[关键能力·综合提升]
9.(多选题)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,这5天中14时的气温数据(单位:℃)分别为甲:26,28,29,31,31;乙:28,29,30,31,32.考虑以下结论,其中能得到的正确的统计结论的编号为( )
A.甲地该月14时的平均气温低于乙地该月14时的平均气温
B.甲地该月14时的平均气温高于乙地该月14时的平均气温
C.甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差
D.甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差
解析 解法一 因为甲==29,
乙==30,
所以甲<乙,
又s==,
s==2,
所以s甲>s乙.
故可判断结论A、D正确.
解法二 甲地该月14时的气温数据分布在26 ℃和31 ℃之间,且数据波动较大,而乙地该月14时的气温数据分布在28 ℃和32 ℃之间,且数据波动较小,可以判断结论A、D正确.
答案 AD
10.(多选题)在某地区某高传染性病毒流行期间,为了建立指标来显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各选项中,一定符合上述指标的是( )
A.平均数≤3
B.平均数≤3且标准差s≤2
C.平均数≤3且极差小于或等于2
D.众数等于1且极差小于或等于4
解析 A错误,举反例:0,0,0,0,2,6,6;其平均数=2≤3,不符合指标.
B错误,举反例:0,3,3,3,3,3,6;其平均数=3,且标准差s=≤2,不符合指标.
C正确,若极差等于0或1,在≤3的条件下,显然符合指标;若极差等于2且≤3,则每天新增感染人数的最小值与最大值有下列可能:(1)0,2,(2)1,3,(3)2,4,符合指标.
D正确,若众数等于1且极差小于或等于4,则最大值不超过5,符合指标.故选CD.
答案 CD
11.下列两组数是甲、乙两组各5名学生的数学竞赛成绩(70分~99分),若甲、乙两组学生的平均成绩一样,则a= ;甲、乙两组学生的成绩相对整齐的是 .
甲组:75 88 89 98 9a
乙组:76 85 89 98 97
解析 由题意可知==89,解得a=5.
因为s=×[(-14)2+(-1)2+0+92+62]=,
s=×[(-13)2+(-4)2+0+92+82]=,所以s<s,故成绩相对整齐的是甲组.
答案 5 甲组
12.某科研机构研究发现,某品种中成药的药物成分A的含量x(单位:g)与药物功效y(单位:药物单位)之间具有关系:y=x(20-x).检测这种药品一个批次的一个容量为5的样本,得到成分A含量的平均值为8 g,标准差为2 g,估计这批中成药的药物功效的平均值为 药物单位.
解析 5个数据x1,x2,x3,x4,x5的平均值为8 g,s标准差为2 g,
所以x1+x2+x3+x4+x5=40,
(x1-)2+(x2-)2+…+(x5-)=20,
即x+x+…+x-2(x1+x2+…+x5)+52=20,
解得x+x+…x=340.
因为y=x(20-x)=20x-x2,
所以y1+y2+…+y5=20(x1+x2+…+x5)-(x+x+…+x)=460,
所以这批中成药的药物功效的平均值==92(药物单位).
答案 92
13.某工厂36名工人的年龄数据如下表:
工人编号
年龄
工人编号
年龄
工人编号
年龄
工人编号
年龄
1
40
10
36
19
27
28
34
2
44
11
31
20
43
29
39
3
40
12
38
21
41
30
43
4
41
13
39
22
37
31
38
5
33
14
43
23
34
32
42
6
40
15
45
24
42
33
53
7
45
16
39
25
37
34
37
8
42
17
38
26
44
35
49
9
43
18
36
27
42
36
39
用简单随机抽样法抽得样本为:44,40,36,43,36,37,44,43,37.
(1)计算样本的平均值和方差s2;
(2)36名工人中年龄在-s与+s之间的有多少人?所占的百分比是多少(精确到0.01%)?
解析 (1)样本的平均值为
==40,方差为
s2=[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=[42+02+(-4)2+32+(-4)2+(-3)2+42+32+(-3)2]=.
(2)由(1)知s=,所以-s=,+s=,
所以年龄在-s与+s之间的共有23人,
所占的百分比为×100%≈63.89%.
[核心价值·探索创新]
14.(多选题)在某年的足球甲A联赛上,一队每场比赛平均失球数是1.6,全年比赛失球个数的标准差为1.2;二队每场比赛平均失球数是2.2,全年比赛失球个数的标准差是0.5.下列说法正确的有( )
A.平均来说一队比二队防守技术好
B.二队比一队技术水平更稳定
C.一队有时表现很差,有时表现又非常好
D.二队很少失球
解析 对于A,一队每场比赛平均失球数是1.6,二队每场比赛平均失球数是2.2,所以平均来说一队比二队防守技术好,故A正确;对于B,二队全年比赛失球个数的标准差是0.5<1.2,所以二队比一队技术水平更稳定,故B正确;对于C,一队全年比赛失球个数的标准差为1.2,二队全年比赛失球个数的标准差是0.5,所以一队有时表现很差,有时表现又非常好,故C正确;对于D,二队每场比赛平均失球数是2.2,全年比赛失球个数的标准差是0.5,所以二队很少不失球,故D错误.故选ABC.
答案 ABC
15.(多选题)在发生公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.以下为过去10日,甲、乙、丙、丁四地新增疑似病例数据信息.
甲地:中位数为2,极差为5;
乙地:平均数为2,众数为2;
丙地:平均数为1,方差大于0;
丁地:平均数为2,方差为3.
则四地中,一定没有发生大规模群体感染的是( )
A.甲地 B.乙地
C.丙地 D.丁地
解析 对于A选项,因为甲地中位数为2,极差为5,所以甲地过去10天每天新增疑似病例不超过2+5=7(人),故甲地符合要求.对于B选项,若乙地过去10天每天新增疑似病例人数分别为0,0,0,2,2,2,2,2,2,8,满足平均数为2,众数为2,但不满足每天新增疑似病例不超过7人,故乙地不符合要求.对于C选项,若丙地过去10天每天新增疑似病例人数分别为0,0,0,0,0,0,0,0,1,9,满足平均数为1,方差大于0,但不满足每天新增疑似病例不超过7人,故丙地不符合要求.对于D选项,若丁地过去10天每天新增疑似病例数满足平均数为2,且至少有一天新增疑似病例超过7人,则必有方差s2>×(8-2)2=3.6>3,与方差为3矛盾,故丁地符合要求.故选AD.
答案 AD
学科网(北京)股份有限公司
$