内容正文:
极差、方差与标准差
(教学方式:深化学习课—梯度进阶式教学)
第2课时
课时目标
1.本节的重点是理解极差、方差和标准差的意义和作用.
2.本节的难点是会计算样本数据的这些数字特征,并能解答有关实际问题.
CONTENTS
目录
1
2
3
课前预知教材·自主落实基础
课堂题点研究·迁移应用融通
课时跟踪检测
课前预知教材·自主落实基础
1.极差
一组数的极差指的是这组数的最大值减去最小值所得的差.
2.方差
(1)定义:如果x1,x2,…,xn的平均数为,则方差可用求和符号表示为s2=_______________.
(2)性质:如果a,b为常数,则ax1+b,ax2+b,…,axn+b的方差为______.
a2s2
3.标准差
方差的算术平方根称为标准差.标准差描述了数据相对于平均数的离散程度,一般用s表示.
s=________________________________________.
|微|点|助|解|
(1)数据的离散程度可以通过极差、方差或标准差来描述,极差反映了一组数据变化的最大幅度,它对一组数据中的极端值极为敏感,一般情况下,极差大,则数据波动性大;极差小,则数据波动性小.极差只需考虑两个极端值,便于计算,但没有考虑中间的数据,可靠性较差.
(2)标准差和方差则反映了一组数据围绕平均数波动的大小,方差、标准差的运算量较大.因为方差与原始数据单位不同,且平方后可能夸大了偏差程度,所以虽然标准差与方差在体现数据离散程度上是一样的,但解决问题时一般用标准差.
基础落实训练
1.请你运用数学学习中所学的统计知识加以分析,下列关于个人收入的统计量中,最能体现共同富裕要求的是 ( )
A.平均数小,方差大 B.平均数小,方差小
C.平均数大,方差大 D.平均数大,方差小
解析:方差反映的是一组数据的波动情况,方差越大说明数据偏离平均水平的程度越大,平均数是整体的平均水平,是一组数据的集中程度的刻画,所以最能体现共同富裕要求的是平均数大,方差小.
√
2.下列说法正确的是 ( )
A.在两组数据中,平均数较大的一组方差较大
B.平均数反映数据的集中趋势,方差则反映数据离平均数的波动大小
C.方差的求法是求出各个数据与平均数的差的平方后再求和
D.在记录两个人射击环数的两组数据中,方差大的表示射击水平高
解析:在两组数据中,平均数与方差所表示的意义不同,由此不能根据平均数的大小来衡量其方差的大小,所以A的说法错误;易知C、D的说法错误,只有B正确,故选B.
√
3.已知样本x1,x2,x3,…,xn的方差s2=2,则样本2x1+1,2x2+1,2x3+1,…,
2xn+1的方差为 .
解析:由方差的性质知,所求方差为4s2=8.
4.已知样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本方差为 .
解析:∵样本的平均数为1,∴(a+0+1+2+3)=1,∴a=-1.∴样本方差为s2=[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.
8
2
课堂题点研究·迁移应用融通
题型(一) 极差、方差、标准差的计算
[例1] (1)已知某9个数据的平均数为6,方差为5,现又加入一个新数据6,此时这10个数的平均数和方差分别为 ( )
A.6, B.6,
C.5, D.5,5
√
解析:设原9个数据分别为a1,a2,a3,a4,a5,a6,a7,a8,a9,
现又加入一个新数据6,此时这10个数为a1,a2,a3,a4,a5,a6,a7,a8,a9,6,
则这10个数的平均数为
(a1+a2+a3+a4+a5+a6+a7+a8+a9+6)=6,这10个数的方差
s2=[(a1-6)2+(a2-6)2+(a3-6)2+(a4-6)2+(a5-6)2+(a6-6)2+(a7-6)2+(a8-6)2+
(a9-6)2+(6-6)2]==.
(2)一组数据按从小到大的顺序排列为1,2,2,x,5,10,其中x≠5,已知该组数据的中位数是众数的倍,则该组数据的标准差为 .
3
解析:由题意,可得该组数据的众数为2,所以=×2=3,解得x=4,故该组数据的平均数为
×(1+2+2+4+5+10)=4.
所以该组数据的方差为×[(1-4)2+(2-4)2+(2-4)2+(4-4)2+(5-4)2+
(10-4)2]=9,即标准差为3.
|思|维|建|模|
求方差的基本方法
针对训练
1.一组数据按从小到大的顺序排列为56,59,60,62,a,若这组数据的极差为7,则这组数据的方差为 ( )
A.30 B.6 C.25 D.5
解析:由题意得a=56+7=63,所以这组数据的平均数为=60,方差为=6,故选B.
√
2.若40个数据的平方和是56,平均数是,则这组数据的标准差是 .
题型(二) 方差的性质
[例2] (1)已知一组数据x1,x2,…,xn的平均数为2,方差为3,则数据2x1+1,2x2+1,…,2xn+1的平均数与方差s2分别为( )
A.=4,s2=12 B.=2,s2=12
C.=5,s2=12 D.=5,s2=7
√
解析:根据题意,数据x1,x2,…,xn的平均数为2,方差为3,则数据2x1+1,2x2+1,…,2xn+1的平均数=2×2+1=5,其方差s2=22×3=12.
(2)已知一组数据x1,x2,…,xn的平均数为,方差为s2.若2x1+4,2x2+4,…,
2xn+4的平均数与方差相等,则2s2-的最大值为 .
解析:由题意可得2+4=4s2,
因为s2≥0,所以2+4≥0,解得≥-2.
令y=2s2-=-++2=-+(≥-2),当=时,y取得最大值.
|思|维|建|模|
若样本数据x1,x2,…,xn的平均数为,方差为s2,则yi=axi+b,i=1,
2,…,n,a,b∈R的平均数为a+b,方差为a2s2,标准差为|a|s.
针对训练
3.有一组样本数据x1,x2,…,x6如下表:
x1 x2 x3 x4 x5 x6
5 6 7 5 7 6
由这组数据得到新样本数据y1,y2,…,y6,其中yi=xi+c(i=1,2,…,6),
c为常数,则数据y1,y2,…,y6的方差为 .
解析:因为样本数据x1,x2,…,x6的平均数为=6,方差为=.所以数据y1,y2,…,y6的方差为×=.
4.已知数据x1,x2,x3,x4的方差为3,若数据ax1+b,ax2+b,ax3+b,
ax4+b(a,b∈R)的方差为12,则a= .
解析:由题意3a2=12,解得a=±2.
±2
题型(三) 方差、标准差的应用
[例3] 如图是甲、乙两人在一次射击比赛中中靶的情况(击中靶中心的圆面为10环,靶中各数字表示该数字所在圆环被击中时所得的环数),每人射击了6次.
(1)请用列表法将甲、乙两人的射击成绩统计出来;
解:甲、乙两人的射击成绩统计如下表:
环数 6 7 8 9 10
甲命中次数 0 0 2 2 2
乙命中次数 0 1 0 3 2
(2)请用学过的统计知识对甲、乙两人这次的射击情况进行比较.
解:=×(8×2+9×2+10×2)=9(环),
=×(7×1+9×3+10×2)=9(环),
=×[(8-9)2×2+(9-9)2×2+(10-9)2×2]=,=×[(7-9)2+(9-9)2
×3+(10-9)2×2]=1,
因为=,<,
所以甲与乙的平均成绩相同,但甲的发挥比乙稳定.
|思|维|建|模|
在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差).标准差越大,说明数据的离散性越大;标准差越小,说明数据的离散性越小或数据越集中、稳定.
针对训练
5.甲、乙两名跳高运动员进行了8次比赛,他们的成绩(单位:m)如下:
甲:1.70 1.65 1.68 1.69 1.72 1.73 1.68 1.67
乙:1.60 1.73 1.72 1.61 1.62 1.71 1.70 1.75
(1)甲、乙两名运动员的平均跳高成绩分别是多少?
解:甲的平均成绩为(1.70+1.65+1.68+1.69+1.72+1.73+1.68+1.67)=
1.69(m).
乙的平均成绩为(1.60+1.73+1.72+1.61+1.62+1.71+1.70+1.75)=
1.68(m).
(2)哪位运动员的成绩更为稳定?
解:=×[(1.70-1.69)2+(1.65-1.69)2+…+(1.67-1.69)2]=0.000 6.
=×[(1.60-1.68)2+(1.73-1.68)2+…+(1.75-1.68)2]=0.003 15.
显然,甲的平均成绩高于乙的平均成绩,而且甲的方差小于乙的方差,说明甲的成绩比乙稳定.
(3)教练根据这8次成绩,从甲、乙两名运动员中挑选一人参加省大学生运动会,若预测跳过1.65 m就很可能获得冠军,该校为了获得冠军,可能选哪名运动员参赛?若预测跳过1.70 m才能得冠军呢?
解:由于甲的平均成绩高于乙,成绩稳定,且甲1.65 m 以上的成绩有8次,乙1.65 m以上的成绩有5次,所以若跳过1.65 m就很可能获得冠军,应派甲参赛.
由于甲1.70 m以上的成绩有3次,乙1.70 m以上的成绩有5次,所以若跳过1.70 m才能获得冠军,应派乙参赛.
课时跟踪检测
1
3
4
5
6
7
8
9
10
11
12
13
14
2
A级——达标评价
1.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )
A.8 B.15 C.16 D.32
解析:样本数据x1,x2,…,x10的标准差s=8,则样本数据2x1-1,2x2-1,…,
2x10-1的标准差s'=2×8=16.
√
1
5
6
7
8
9
10
11
12
13
14
2
3
4
2.若一组数据a,3,5,7的平均数是b,且a,b是方程x2-5x+4=0的两根,
则这组数据的方差是 ( )
A.3 B.4 C.5 D.6
解析:x2-5x+4=0的两根是1,4.当a=1时,a,3,5,7的平均数是4;当a=4时,
a,3,5,7的平均数不是1.所以a=1,b=4,则方差为s2=×[(1-4)2+(3-4)2+
(5-4)2+(7-4)2]=5.
√
1
5
6
7
8
9
10
11
12
13
14
3
4
2
3.(多选)幸福指数是某个人主观地评价他对自己目前生活状态的满意程度指标,常用[0, 10]内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取8位小区居民,他们的幸福指数分别是3,4,5,6,6,7,8,9,则 ( )
A.这组数据的极差是6
B.这组数据的平均数是5
C.这组数据的70%分位数是7
D.这组数据的方差是3.5
√
√
√
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解析:极差为9-3=6,故A正确;
平均数为×(3+4+5+6+6+7+8+9)=6,故B错误;
因为8×70%=5.6,所以这组数据的70%分位数为7,故C正确;
方差为s2=×[(3-6)2+(4-6)2+(5-6)2+(6-6)2+(6-6)2+(7-6)2+(8-6)2+(9-6)2]=
×(9+4+1+1+4+9)==3.5,故D正确.故选ACD.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
4.某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,
随机采访了9位代表,得到的数据分别为36,36,37,37,40,43,43,44,44,若用样本估计总体,年龄在(-s,+s)内的人数占公司人数的百分比是(其中是平均数,s为标准差,结果精确到1%)( )
A.14% B.25%
C.56% D.67%
√
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解析:因为=×(36+36+37+37+40+43+43+44+44)=40,s2=×(16+16+
9+9+0+9+9+16+16)=,即s=.年龄在(-s,+s)内,即内的人数有5人,所以百分比为≈56%.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
5.(多选)甲、乙两班举行电脑汉字录入比赛,参加学生每分钟录入汉字的个数经统计计算后填入下表:
√
班级 参加人数 中位数 方差 平均数
甲 55 149 191 135
乙 55 151 110 135
下列结论中,正确的是 ( )
A.甲、乙两班学生成绩的平均水平相同
B.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)
C.甲班的成绩比乙班的成绩波动大
D.甲班成绩的众数小于乙班成绩的众数
√
√
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解析:甲、乙两班成绩的平均数都是135,故两班成绩的平均水平相同,所以A正确;
=191>110=,所以甲班成绩不如乙班成绩稳定,即甲班成绩波动较大,所以C正确;
甲、乙两班人数相同,但甲班成绩的中位数为149,乙班成绩的中位数为151,从而易知乙班每分钟输入汉字数≥150个的人数要多于甲班,所以B正确;
由题表看不出两班学生成绩的众数,D错误.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
6.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9(x,y∈N),
已知这组数据的平均数为10,方差为2,则|x-y|的值为 ( )
A.4 B.3 C.2 D.1
解析:由这组数据的平均数为10,方差为2可得x+y=20,(x-10)2+(y-10)2=8.设x=10+t,y=10-t,由(x-10)2+(y-10)2=8得t2=4,所以|x-y|=2|t|=4.
√
7.(2023·新课标Ⅰ卷)(多选)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则 ( )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
1
5
6
7
8
9
10
11
12
13
14
3
4
2
√
√
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解析:取x1=1,x2=x3=x4=x5=2,x6=9,则x2,x3,x4,x5的平均数等于2,标准差为0,x1,x2,…,x6的平均数等于3,标准差为,故A、C均不正确;
根据中位数的定义,将x1,x2,…,x6按从小到大的顺序进行排列,中位数是中间两个数的算术平均数,由于x1是最小值,x6是最大值,故x2,x3,x4,
x5的中位数是将x2,x3,x4,x5按从小到大的顺序排列后中间两个数的算术平均数,与x1,x2,…,x6的中位数相等,故B正确;
根据极差的定义,知x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差,故D正确.故选BD.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
8.国家射击队要从甲、乙、丙、丁四名队员中选出一名选手去参加射击比赛,四人的平均成绩和方差如下表:
甲 乙 丙 丁
平均成绩 8.5 8.8 8.8 8
方差s2 3.5 3.5 2.1 8.7
则应派 参赛最为合适.
解析:由题表可知,丙的平均成绩较高,且发挥比较稳定,应派丙去参赛最合适.
丙
1
5
6
7
8
9
10
11
12
13
14
3
4
2
9.某班有48名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名同学的成绩有误,甲实得80分却记为50分,乙实得70分却记为100分,则更正后平均分和方差分别是 , .
解析:甲少记30分,乙多记30分,则总分不变,由此平均分不发生变化;原方差s2=(++…++502+1002-48×702)=75,更正后方差s'2=(++…++802+702-48×702)=(++…++502+
1002-48×702-1 200)=s2-×1 200=50.
70
50
1
5
6
7
8
9
10
11
12
13
14
3
4
2
10.(10分)已知一组样本数据共有9个数,其平均数为8,方差为12.将这组样本数据增加一个数据后,所得新的样本数据的平均数为9,求新的样本数据的方差.
解:设增加的数为k,原来的9个数分别为a1,a2,…,a9,则a1+a2+…+
a9=72,a1+a2+…+a9+k=90,所以k=18,
1
5
6
7
8
9
10
11
12
13
14
3
4
2
1
5
6
7
8
9
10
11
12
13
14
3
4
2
B级——重点培优
11.一组数据的平均数是4.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( )
A.55.2,3.6 B.55.2,56.4
C.64.8,63.6 D.64.8,3.6
√
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解析:设这组数据分别为x1,x2,…,xn,
由其平均数是4.8,方差是3.6,得
=(x1+x2+…+xn)=4.8,
方差=[(x1-)2+(x2-)2+…+(xn-)2]=3.6.
若将这组数据中每一个数据都加上60,则数据为x1+60,x2+60,…,xn+60,
则其平均数为=[(x1+60)+(x2+60)+…+(xn+60)]=64.8,
方差为=[(x1+60-64.8)2+(x2+60-64.8)2+…+(xn+60-64.8)2]=3.6.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
12.(多选)在某地区某高传染性病毒流行期间,为了建立指标来显示疫情已受控制,以便向该地区居民显示可以过正常生活,有公共卫生专家建议的指标是“连续7天每天新增感染人数不超过5人”,根据连续7天的新增病例数计算,下列各选项中,一定符合上述指标的是 ( )
A.平均数≤3
B.平均数≤3且标准差s≤2
C.平均数≤3且极差小于或等于2
D.众数等于1且极差小于或等于4
√
√
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解析: A错,举反例:0,0,0,0,2,6,6,其平均数=2≤3,不符合指标.
B错,举反例:0,3,3,3,3,3,6,其平均数=3,且标准差s=≤2,不符合指标.
C正确,若极差等于0或1,在≤3的条件下,显然符合指标;若极差等于2且≤3,则每天新增感染人数的最小值与最大值有下列可能:①0,2,②1,3,③2,4,符合指标.
D正确,若众数等于1且极差小于或等于4,则最大值不超过5,符合指标.故选CD.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
13.(15分)有两位射击运动员在一次射击测试中各射靶7次,每次命中的环数如下:
甲 6 9 7 8 8 5 6
乙 a 3 9 8 9 6 4
经计算可得甲、乙两名射击运动员的平均成绩是一样的.
(1)求实数a的值;
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解:由题意知,甲的平均成绩为=×(6+9+7+8+8+5+6)=7,
乙的平均成绩为=×(a+3+9+8+9+6+4)=(a+39).
又甲、乙两名射击运动员的平均成绩是一样的,所以有(a+39)=7,解得a=10.故实数a的值为10.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
(2)请通过计算,判断甲、乙两名射击运动员哪一位的成绩更稳定?
解:甲的方差为=×[(6-7)2+(9-7)2+(7-7)2+(8-7)2+(8-7)2+(5-7)2+
(6-7)2]=,
乙的方差为=×[(10-7)2+(3-7)2+(9-7)2+(8-7)2+(9-7)2+(6-7)2+
(4-7)2]=.由<知,甲的成绩比乙更稳定.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
14.(18分)(2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率xi 545 533 551 522 575 544 541 568 596 548
伸缩率yi 536 527 543 530 560 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为,样本方差为s2.
(1)求,s2.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解:由题意,求出zi的值如表所示,
试验序号i 1 2 3 4 5 6 7 8 9 10
zi 9 6 8 -8 15 11 19 18 20 12
则=×(9+6+8-8+15+11+19+18+20+12)=11,
s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+
(18-11)2+(20-11)2+(12-11)2]=61.
1
5
6
7
8
9
10
11
12
13
14
3
4
2
1
5
6
7
8
9
10
11
12
13
14
3
4
2
解:因为2=2=,=11=>,
所以可认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
(xi-)2
(1)先求平均值,再代入公式s2=(xi-)2,或s2=-.
(2)当一组数据重复数据较多时,可先整理出频数表,再计算s2.
解析:设这40个数据为xi(i=1,2,…,40),平均数为.由题意可知=56,
这40个数据的平均数=,
所以这40个数据的方差
s2=(xi-)2=(-2xi+)
=-=-=-=,
所以这40个数据的标准差s===.
又因为=12,即=108,
所以=
[2
$$