内容正文:
课时夯基过关练了
9.2.4总体离散程度的估计
素养目标
1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;
2.会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评
价的意识;
3.培养学生逻辑推理和数学建模的核心素养。
核心素养达标夯实基础
一、选择题
3.为了解本市居民的生活成本,甲、乙、丙三名
1.在样本方差子=一209+6一20+十
同学利用假期分别对三个社区进行了“家庭
每月日常消费额”的调查.他们将调查所得
(x0一20)2]中,数字10和20分别表示样本的
到的数据分别绘制成频率分布直方图(如图
所示),记甲、乙、丙所调查数据的标准差分
A.容量、方差
B.平均数、容量
别为s1,52,53,则它们的大小关系为()
C.容量、平均数
D.标准差、平均数
个频率组距
2.为了解某地农村经济情况,对该地农户家庭
0.0008
年收入进行抽样调查,将农户家庭年收入的
0.0006
调查数据整理得到如图所示的频率分布直
0.0004
0.0002
方图.
0100015002000250030003500元
↑频率组距
甲
0.20
◆频率/组距
0.14
0.10
0.0008
0.0006
8
02.53.5455.56.57.58.59.510.511.512.513.5145收入万元
0.0004
0.0002
根据此频率分布直方图,下面结论中,不正
0100015002000250030003500元
确的是()
A.该地农户家庭年收入低于4.5万元的农
个频率组距
户比率估计为6%
0.0008
0.0006
B.该地农户家庭年收入低于10.5万元的农
0.0004
户比率估计为10%
0.0002
C.估计该地农户家庭年收入的平均值不超
0100015002000250030003500元
过6.5万元
丙
D.估计该地有一半以上的农户,其家庭年收
A.s3>S2>S1
B.s2>S1>S3
人介于4.5万元至8.5万元之间
C.s1>52>53
D.52>53>51
·数学·
95
、第九章统计
4.一组数据中的每一个数据都减去80,得一组
A.该地区2023年5月有严重污染天气
新数据,若求得新数据的平均数是1.2,方差
B.该地区2023年6月的AQI值比5月的
是4.4,则原来数据的平均数和方差分别是
AQI值集中
C.该地区2023年5月的AQI值比6月的
A.81.2,4.4
B.78.8,4.4
AQI值集中
C.81.2,84.4
D.78.8,75.6
D.从整体上看,该地区2023年5月的空气
5.已知在R软件的控制台中,输入“sample(1:
质量略好于6月
20,4,replace=F)”,按回车键,得到的4个
二、填空题
1~20范围内的不重复的整数随机数为12,
7.某老师从星期一到星期五收到的信件数分
6,10,4,则这4个整数的标准差为()
别为10,6,8,5,6,则该组数据的方差
A.2√10
B.√10
s2=
C.40
D.10
8.从一堆苹果中任取5只,称得它们的质量如
6.(多选)箱线图是用来表示一组或多组数据
下(单位:克):125,124,121,123,127.则该
分布情况的统计图,因形似箱子而得名.在
样本的标准差s=
(用数字
箱线图中(如图1),箱体中部的粗实线表示
作答)克
中位数;中间箱体的上、下底,分别是数据的
9.某工厂新旧两条生产线的产量比为7:3,为
上四分位数(75%分位数)和下四分位数
了解该工厂生产的一批产品的质量情况,采
(25%分位数);整个箱体的高度为四分位
用样本量比例分配的分层抽样方法从两条
距;位于最下面和最上面的实横线分别表示
生产线抽取样本,并观测样本的质量指标
最小值和最大值(有时候箱子外部会有一些
值,计算得新生产线质量指标的均值为10,
点,它们是数据中的异常值).图2为某地区
方差为1,旧生产线质量指标的均值为9,方
2023年5月和6月的空气质量指数(AQI)
差为2,由此估计,该批产品的质量指标的均
箱线图.AQI值越小,空气质量越好;AQI
值为
,方差为
值超过200,说明污染严重.则(
10.某田径队6位运动员的体测成绩如下:甲
异常值
上边缘
78,乙86,丙64,丁77,戊83,己93.现从中
上四分位数
平均值
挑选3位运动员参加集体赛,挑选条件为:
中位数
下四分位数
①丁一定要参加;
下边缘
②3人的体测成绩总分要超过240(不含240);
异常值
图1
③3人的体测成绩方差要小
某地区空气质量指数(AQI)的箱线图
那么参加集体赛3人名单应为
300
三、解答题
250
200
11.某校高三(1)班全体女生的一次数学测试
150
100
成绩的茎叶图和频率分布直方图都受到不
50
0
同程度的破坏,但可见部分如下,据此解答
5月6月
图2
如下问题:
96
·数学·
课时夯基过关练了
◆频率/组距
12.为了了解甲、乙两个工厂生产的轮胎的宽
茎叶
0.04
568
度是否达标,从两厂各随机选取了10个轮
62335689
0.028
1223456789
0.016
胎,将每个轮胎的宽度(单位:mm)记录下
0.008
58
5060708090100分数
来并绘制出如下的折线图:
图1
图2
甲厂轮胎宽度
198
(1)求高三(1)班全体女生的人数;
197
196
195
(2)求分数在[80,90)之间的女生人数;并
194
193
计算频率分布直方图中[80,90)间的矩形
192
191
45678910
的高;
乙厂轮胎宽度
197
(3)求该班女生数学测试成绩的众数、中位
数和平均数的估计值.(同一组中的数据用
194
该组区间的终点值代表)
191
190
2
3
456
7
8910
(1)分别计算甲、乙两厂提供的10个轮胎
宽度的平均数;
(2)若轮胎的宽度在[194,196]内,则称这
个轮胎是标准轮胎.试比较甲、乙两厂分别
提供的10个轮胎中所有标准轮胎宽度的
方差的大小,根据两厂的标准轮胎宽度的
平均水平及其波动情况,判断这两个工厂
哪个的轮胎相对更好,
·数学·
97
、第九章统计
核心素养培优
拓展提升
1.若一组样本数据x1,x2,…,xn的平均数为10,
A.f(1)=1
另一组样本数据21+4,2x2十4,…,2xn十4的
B.对任意∈N*,f(k)≥0恒成立
方差为8,则两组样本数据合并为一组样本数
C.当k为奇数时,f(k)不可能为负数
据后的平均数和方差分别为()
D.若|x:-x≤1(i=1,2,…,n),则f(k)≤f(2)
A.17,54
B.17,48
6.从某企业生产的某种产品中抽取100件,测
C.15,54
D.15,48
量这些产品的质量指标值,由测量结果得如
2.四名同学各掷骰子五次,分别记录每次骰子
下频数分布表:
出现的点数.根据四名同学的统计结果,可
质量指标
[75,85)
[85,95)
[95,105)[105,115)[115,125
以判断出一定没有出现点数6的是()
值分组
A.平均数为3,中位数为2
频数
6
26
38
22
8
B.中位数为3,众数为2
(1)作出这些数据的频率分布直方图;
C.平均数为2,方差为2.4
(2)估计这种产品质量指标值的平均数及方
D.中位数为3,方差为2.8
差(同一组中的数据用该组区间的中点值作
3.已知数据x1,x2,x3,…,xn是上海市n(n≥
代表);
3,n∈N*)个人的年收人.设这n个数据的
(3)根据以上抽样调查数据,能否认为该企
中位数为x,平均数为y,方差为之.如果再加
业生产的这种产品符合“质量指标值不低于
上世界首富的年收入xn+1,针对这(n十1)个
95的产品至少要占全部产品的80%”的
数据,下列说法正确的是()
规定?
A.y大大增大,x一定变大,之可能不变
B.y大大增大,x可能不变,之变大
C.y大大增大,x可能不变,之也不变
D.y可能不变,x可能不变,之可能不变
4.(多选)已知某样本的容量为50,平均数为
70,方差为75.现发现在收集这些数据时,其
中的两个数据记录有误,一个错将80记录
为60,另一个错将70记录为90.在对错误
的数据进行更正后,重新求得样本的平均数
为x,方差为s2,则(
)
A.x=70B.x>70C.s2<75D.s2>75
5.(多选)已知样本x1,x2,…,xn的平均数为
c,设f(k)=12(c,-(k∈N)为该样
n
本的“飞阶方差”,则以下错误的有()
98
·数学。12.解:(1)众数大致的值就是样本数据的
核心素养培优·拓展提升
频率分布直方图中最高小长方形的中1.A2.1n43.229.5
点的横坐标.由直方图可估计出学生身
4.解:(1)由10(a+0.02+0.03+0.04+
高众数应为174.5cm.
a)=1,可得a=0.005,
(2)在样本中,有50%的个体小于或等
故此次化学考试成绩的平均值为55×
于中位数,也有50%的个体大于或等
0.05+65×0.4+75×0.3+85×0.2+
于中位数,因此,在频率分布直方图中,
95×0.05=73分
中位数使得在它左边和右边的直方图的
(2)由频率分布直方图知,原始分成绩位
面积相等,由此可以估计中位数的值,如
于区间[90,100]的占比为5%,位于区
图,学生身高中位数约为171.55cm.
间[80,90)的占比为20%,
频率/组距
因为成绩A等级占比为15%,所以等级
0.08
0.07
0.06
A的原始分区间的最低分位于区间[80,
0.05
0.04
36
0.03
90),
0.02
0.220.22
0.01h
0.08
0.12
57162167172177182身高/cm
估计等级A的原始分区间的最低分为
(3)平均数是频率分布直方图的“重
90-15%5%×10=85,
20%
心”,是频率分布直方图的平衡点,因
已知最高分为98,所以估计此次考试化学
此,每个小长方形的面积与小长方形底
成绩A等级的原始分区间为[85,98]!
边中,点的横坐标的乘积之和为平均数
(3)由98-88=100-T
的估计值.由直方图可估计学生身高的
88-85=-86,解得T=1160≈
13
平均数为170.6cm.
89,该学生的等级分为89分
(4)因为样本数据的频率分布直方图只
9.2.4总体离散程度的估计
是直观地表明分布的形状,从直方图本
身得不出原始的数据内容,也就是说频
核心素养达标·夯实基础
率分布直方图损失了一些样本数据,得
1.C2.C3.C4.A5.B6.ACD
到的是一个估计值,且所得估计值与数
7.3.28.29.9.71.5110.乙、丁、戊
据分组有关,所以估计的值有一定的
11.解:(1)根据茎叶图,分数在[50,60)之
偏差.
间的女生人数为2,根据频率分布直方
图可得它所占的比率为0.008×10=
1.众数的估计值是频率分布直方图中最
0.08,故高三(1)班全体女生的人数为
高小长方形的中点的横坐标;
2
2.中位数左、右两侧直方图的面积相等;
0.08≈25.
规
3.平均数的估计值等于频率分布直方图
(2)茎叶图中可见部分共有21人,所以
律
中每个小长方形的面积乘小长方形底边
总
分数在[80,90)之间的女生人数为25
中点的横坐标之和,
结
利用频率分布直方图求得的众数、中位
21=4,所以数在[80,90)之间的频率为
数、平均数均为估计值,往往与实际数据
25
=0.16,故频率分布直方图中[80,
得出的不一致,但它们能粗略估计其众
数、中位数和平均数
90之间的矩形的高为006-0.016,
187
(3)由(2)及茎叶图知,众数所在区间为
核心素养培优·拓展提升
[70,80),所以估计该班的测试成绩的1.A2.C3.B4.AC5.ABC
众数为75.把这25个数从小到大排列,6.解:(1)频率分布直方图如图所示:
中位数为第13个数,结合茎叶图可得
频率组距
中位数是73.估计高三(1)班全体女生
的一次数学测试成绩的平均数为55×
元+65×3+75×9+85×号+95×
号=8.8
0002
12.解:(1)甲厂10个轮胎宽度的平均数:
01
758595105115125质量指标值
元,=0×(195+194+196+193+
(2)质量指标值的样本平均数为
x=80×0.06+90×0.26+100×0.38十
194+197+196+195+193+197)=
110×0.22+120×0.08=100.
195,乙厂10个轮胎宽度的平均数:
质量指标值的样本方差为
z。=0×(195+196+193+192+195+
s2=(80-100)2×0.06+(90-100)2×
194+195+192+195+193)=194.
0.26+(100-100)2×0.38+(110
(2)甲厂10个轮胎中宽度在[194,196]
100)2×0.22+(120-100)2×0.08=104.
内的数据为195,194,196,194,196,195,
所以这种产品质量指标值的平均数的估
平均数:五=日×(195十194+196十
计值为100,方差的估计值为104.
(3)质量指标值不低于95的产品所占比
194+196+195)=195,
例的估计值为0.38+0.22+0.08=
方差:号=日×[(195-195)2+(194-
0.68.由于该估计值小于0.8,故不能认
195)2+(196-195)2+(194-195)2+
为该企业生产的这种产品符合“质量指
标值不低于95的产品至少要占全部产
(196-195)+(195-195)2门=号,
品的80%”的规定。
乙厂10个轮胎中宽度在[194,196]内
专题集训突破练
的数据为195,196,195,194,195,195,
平均数:=合×(195+196十195十
专题1抽样方法
例1③
194+195+195)=195,
抽样调查是获取数据的重要途径,而样本
方差:号=日×[(195-1952+(196
名师点晴
具有随机性,其好坏直接影响统计分析结
论的可靠性,所以要根据实际情况合理选
195)2+(195-195)2+(194-195)2+
择抽样方法.
(195-195)2+(195-195)]=3,
跟踪训练1C解析:因为小学、初中、
,两厂标准轮胎宽度的平均数相等,但
高中三个学段学生的肺活量有较大差
乙厂的方差更小,.乙厂的轮胎相对
异,所以学段对统计结果影响较大.因
更好.
为同一学段男、女生肺活量差异不大,
188
所以性别对统计结果无明显影响,所
以最合理的抽样方法是按学段分层随
机抽样」
例2B解析:根据随机数表的读数规则,
依次从随机数表中读出的有效编号为
32,12,31,02,01,04,15,20,得到选出来
的第8个个体的编号为20.故选B.
跟踪训练2AC解析:A选项,男生抽取
600
100×600+400=60,女生抽取100-
60=40人,A选项正确.C选项,样本平
均复为0×170+0×160=16,可以
用样本平均数估计总体的平均数,C选
项正确:B选项,样本方差为0[15十
a70-16)]+0[30+160-16)]-
93+132=45,所以B选项错误.
55
D选项,男生甲被抽到的概率为品
立D递项错误,故选AC
专题2用样本估计总体
例3(1)0
1
2
(2)甲
名
平均数、众数、中位数都是反映数据的集中
趋势,极差、方差(或标准差)反映的是数据
的离散程度,各有特点和侧重.
跟踪训练3A解析:对于A,去掉最高
分、最低分后,中位数仍旧是处于中间位
置(从小到大排列)的那个数,不发生改
变;对于B,去掉最高分、最低分后,平均
数是否发生改变与去掉的分数有关,不
能确定是否变化;对于C,去掉最高分、
最低分后,方差的确定和平均数、数据个
数有关,因此方差也不确定;对于D,去
掉最高分、最低分后,极差可能发生改
变,也可能不改变