内容正文:
参 考 答 案
*
14.
解: (
1
) 由频率分布直方图得, 一刀宣纸有正
牌
100×0.1×4=40
(张), 有副牌
100×0.05×4×2=40
(张),
有废品
100×0.025×4×2=20
(张),
∴
该公司一刀宣纸的
利润的估计值为
40×15+40×8-20×20=520
(元),
∴
估计
该公司的年利润为
520
万元
.
(
2
) 由频率分布直方图得,
x=42×0.025×4+46×0.05×4+50×0.1×4+54×0.05×4+58×
0.025×4=50.
根据表中数据, 这种机器生产的一刀宣纸中有正牌
的张数估计为
100×0.682 7=68.27
(张),
废品的张数估计为
100×
(
1-0.954 5
)
=4.55
(张),
副牌的张数为
100×
(
0.954 5-0.682 7
)
=27.18
(张),
∴
一刀宣纸的利润为
68.27×12+27.18×5-4.55×20=
864.14
(元),
∴
改进后该公司的年利润为
864.14-100=
764.14
(万元),
∵764.14>520
,
∴
建议该公司购买这种
机器
.
5.1.4
用样本估计总体
学习手册
变式训练
1
解: (
1
) 根据频率分布直方图得 (
0.004+0.006+a+
0.030+0.024+0.016
)
×10=1
, 解得
a=0.020.
(
2
) 由众数的概念可知, 众数是出现次数最多的数,
∴
众数为
70+80
2
=75. ∵0.004×10+0.006×10+0.020×10=0.3
,
∴
前三个小矩形的面积的和为
0.3
, 而第四个小矩形的
面积为
0.030×10=0.3
,
0.3+0.3=0.6>0.5
,
∴
中位数应位于
[
70
,
80
) 内, 中位数
=70+
0.5-0.3
0.3
×10=
230
3
≈76.7.
平均数为
45×
(
0.004×10
)
+55×
(
0.006×10
)
+65×
(
0.020×
10
)
+75 ×
(
0.030 ×10
)
+85 ×
(
0.024 ×10
)
+95 ×
(
0.016 ×10
)
=
76.2.
(
3
) 前
5
个小组的频率之和是 (
0.004+0.006+0.020+
0.030+0.024
)
×10=0.84
,
∴
第
90
百分位数在第五小组
[
90
,
100
] 内, 为
90+
0.90-0.84
1-0.84
×10=
375
4
=93.75.
变式训练
2
解: 把专业人士打分样本记为
x
1
,
x
2
, …,
x
8
, 其平
均数记为
x
, 方差记为
s
2
x
; 把观众代表打分样本记为
y
1
,
y
2
, …,
y
12
, 其平均数为
y
, 方差记为
s
2
y
; 把总体数据的
平均数记为
z
, 方差记为
s
2
.
则总样本平均数为:
z=
8
20
×47.4+
12
20
×56.2=52.68
(分),
总样本方差为:
s
2
=
1
20
8
i=1
移
(
x
i
-z
)
2
+
12
j=1
移
(
y
j
-z
)
) $
2
=
1
20
{8
[
s
2
x
+
(
x-z
)
2
]
+12
[
s
2
y
+
(
y-z
)
2
]
}
=
1
20
×{8×
[
3.7
2
+
(
47.4-52.68
)
2
]
+12×
[
11.8
2
+
(
56.2-52.68
)
2
]
}
=107.6
, 总样本标准差
s≈10.37.
∴
这名选手得分的平均数为
52.68
分, 标准差约为
10.37.
变式训练
3
解: (
1
) 由题中数据可得, 频率分布表如下:
(
2
) 频率分布直方图如图:
(
3
) 该月水电费用在 [
440
,
560
] 内的家庭所占的
百分比为
0.13+0.07=0.2=20%.
随堂练习
1. B
【解析 】 根据频率分布直方图中每组的高为
频率
组距
, 可知
m
|a-b|
=h
,
∴|a-b|=
m
h
.
故选
B.
2. A
【解析】 根据题中统计图, 可知有
4
人成绩在
[
0
,
20
) 之间, 其考试分数之和为
4×10=40
; 有
8
人成
绩在 [
20
,
40
) 之间, 其考试分数之和为
8×30=240
; 有
10
人成绩在 [
40
,
60
) 之间 , 其考试分数之和为
10×
50=500
; 有
6
人成绩在 [
60
,
80
) 之间, 其考试分数之
和为
6×70=420
; 有
2
人成绩在 [
80
,
100
) 之间, 其考
试分数之和为
2×90=180.
由此可知, 考生总人数为
4+8+
10+6+2=30
, 考试总成绩为
40+240+500+420+180=1 380
,
平均数为
1 380
30
=46.
故选
A.
3. B
【解析】 在频率分布直方图中, 长方形的面积
表示其频率
.
根据所给数据, 估计该校高一年级期末数
分组 频数 频率
[
320
,
380
)
6 0.20
[
380
,
440
)
18 0.60
[
440
,
500
)
4 0.13
[
500
,
560
]
2 0.07
合计
30 1.00
频率
组距
月水电费用
/
元
320 380 440 500 560
0.01
0.003 3
0.002 2
0.001 2
变式训练
3
答图
57
高 中 数 学 必 修 第二册 (人教 B 版) 精编版
学成绩不少于
60
分的频率为
1-
(
0.005+0.015
)
×10=0.8
,
∴
对应的学生人数为
600×0.8=480.
故选
B.
4. AD
【解析】
∵x
甲
=
26+28+29+31+31
5
=29
,
x
乙
=
28+29+30+31+32
5
=30
,
∴x
甲
<x
乙
.
又
s
2
甲
=
9+1+0+4+4
5
=
18
5
,
s
2
乙
=
4+1+0+1+4
5
=2
,
∴s
甲
>
s
乙
.
故由样本估计总体可知
A
,
D
正确
.
故选
AD.
5. B
【解析】 众数是指样本中出现频率最高的数 ,
在频率分布直方图中通常取该组区间的中点,
∴
众数为
2+2.5
2
=2.25.
中位数是频率为
0.5
的分界点, 由频率分布
直方图, 可知前
4
组的频率和为 (
0.08+0.16+0.30+0.44
)
×0.5=0.49
, 因此中位数出现在第
5
组 , 设中位数为
x
,
则 (
x-2
)
×0.5=0. 01
, 解得
x=2.02
, 故选
B.
练习手册
效果评价
1. B
【解析】 这
3 000
个 数 据 的 平 均 数 为
78.1×800+85×1 300+91.9×900
3 000
=85.23.
用样本平均数估计
总体平均数, 可知这
4
万个数据的平均数约为
85.23.
故
选
B.
2. C
【解析 】 由频率分布直方图得 , 自学时间在
[
0.5
,
2
) 的频率为 (
0.16+0.2+0.34
)
×0.5=0.35
, 自学时
间在 [
2
,
2.5
) 的频率为
0.52×0.5=0.26
,
∴
自学时间的
中位数为
2+
0.5-0.35
0.26
×0.5≈2.29
, 众数为
2+2.5
2
=2.25.
故
选
C.
3. C
【解析 】 由频率分布直方图得 (
0.005+0.010+
0.010+0.015+a+0.025+0.005
)
×10=1
, 解得
a=0.030
, 故
A
错误; 样本数据低于
130
分的频率为
1-
(
0.025+0.005
)
×
10=0.7
, 故
B
错误; [
80
,
120
)的频率为 (
0.005+0.010+
0.010+0.015
)
×10=0.4
, [
120
,
130
) 的频率为
0.030×10=
0.3
,
∴
总体的中位数 (保留
1
位小数 ) 估计为
120+
0.5-0.4
0.3
×10≈123.3
(分 ) , 故
C
正 确 ; 样 本 分 布 在
[
90
,
100
)的频数一定与样本分布在 [
100
,
110
)的频数
相等, 总体分布在 [
90
,
100
)的频数不一定与总体分布
在[
100
,
110
)的频数相等, 故
D
错误
.
故选
C.
4. A
【解析】 利用特殊法解决
.
假设
n=2
, 这
2
名学
生的得分分别为
150
,
150
, 则这
2
名学生中得分至少为
1
分的人数为
b
1
=2
, 这
2
名学生中得分至少为
2
分的人
数为
b
2
=2
, 这
2
名学生中得分至少为
3
分的人数为
b
3
=
2
, …, 这
2
名学生中得分至少为
150
分的人数为
b
150
=
2
, 即这
2
名学生中得分至少为
k
(
1≤k≤150
) 分的人
数
b
k
分别为
2
,
2
, …,
2
,
2.
一共有
150
个 “
2
”, 从而
得
k
分的同学会被记
k
次, 所有
b
k
的和恰好是所有人得
分的总和, 即
b
1
+b
2
+
…
+b
k-1
+b
k
=a
1
+a
2
, 从而
b
1
+b
2
+
…
+b
150
n
=
2+2+2+
…
+2
2
=
2×150
2
=150.
b
1
+b
2
+
…
+b
150
150
=
2+2+2+
…
+2
150
=
2×150
150
=2.
故选
A.
5. D
【解析】 由茎叶图得乙运动员得分的中位数是
17
, 平均值为
9+14+15+17+18+19+20
7
=16.
根据甲得分的
折 线 图 确 定 被 墨 迹 污 损 的 两 个 数 字 取 值 范 围 为
[
13
,
15
],
∴
甲运动员得分的极差是
28-9=19
, 甲运动
员得分有
4
8
=
1
2
的叶集中在茎
1
上, 甲运动员得分数据
比乙分散,
∴
甲发挥的稳定性比乙运动员发挥的稳定性
差, 甲运动员得分平均值
x
甲
>
9+12+13+13+13+20+26+28
8
>16
,
∴D
错误
.
故选
D.
6. B
【解析】 根据茎叶图中数据的分布可得,
A
班
学生的分数多集中在 [
70
,
90
] 之间,
B
班学生的分数
集中在 [
50
,
80
] 之间,
∴x
A
>x
B
.
相对两个班级的成绩分
布来说,
A
班学生的分数更加集中,
B
班学生的分数更
加离散,
∴s
2
A
<s
2
B
.
故选
B.
7. 3 t
【解析 】 [
0
,
0.5
) 的频数为
0.08×0.5×100
=4
, [
0.5
,
1
) 的频数为
0.16×0.5×100=8
, [
1
,
1.5
) 的
频数为
0.3×0.5×100=15,
[
1.5
,
2
) 的频数为
0.44×0.5×
100 =22
, [
2
,
2.5
) 的 频 数 为
0.5 ×0.5 ×100 =25
,
[
2.5
,
3
) 的频数为
0.28×0.5×100=14
, [
3
,
3.5
) 的频数
为
0.12×0.5×100=6
, [
3.5
,
4
) 的频数为
0.08×0.5×100=
4
, [
4
,
4.5
) 的频数为
0.04×0.5×100=2
,
4+8+15+22+
25+14=88
,
∴
前
6
组占
88%
,
a
为
3 t.
8. 0.982 5
【解析】 总车次:
10+20+10=40
, 则所有
车次的平均正点率为
10×0.97+20×0.99+10×0.98
40
=0.982 5.
9.
解: (
1
) 由样本数据可知, 在昼批次的
20
个样
本中有
2
个不合格品, 有
18
个合格品, 合格品的比率
为
18
20
=0.9
, 因此昼批次合格品概率估计值为
0.9.
在夜批
次的
20
个样本中有
4
个不合格品, 有
16
个合格品, 合
格品的比率为
16
20
=0.8
, 因此夜批次合格品概率估计值为
0.8.
(
2
) 昼批次合格品的概率为
0.9
, 不合格品的概率
为
0.1
,
∴1 000
件产品中合格品的均值为
900
件, 不合
格品的均值为
100
件 ,
∴
利润为
900×10-100×5=8 500
(元); 夜批次合格品的概率为
0.8
, 不合格品的概率为
0.2
,
∴1 000
件产品中合格品的均值为
800
件, 不合格
品的均值为
200
件 ,
∴
利润为
800×10-200×5=7 000
58
参 考 答 案
(元)
. ∴
这台车床一天的总利润的平均值为
8 500+7 000=
15 500
(元)
.
10.
解: (
1
) 根据频率和为
1
, 得
2×
(
0.02+0.095+
0.11+0.125+x+0.05+0.025
)
=1
, 解得
x=0.075
; 由图可知,
最高矩形的数据组为 [
6
,
8
),
∴
众数为
1
2
×
(
6+8
)
=7.
(
2
) [
0
,
6
) 内的频率之和为 (
0.02+0.095+0.11
)
×2=0.45
; 设中位数为
y
, 则
0.45+
(
y-6
)
×0.125=0.5
, 解
得
y=6.4
,
∴
中位数为
6.4
; 平均数为
2×
(
1×0.02+3×
0.095+5×0.11+7×0.125+9×0.075+11×0.05+13×0.025
)
=6.56.
(
3
) 月平均用电量为 [
10
,
12
) 的用户在四组用户
中所占的比例为
0.05
0.125+0.075+0.05+0.025
=
2
11
,
∴
月平均
用电量在 [
10
,
12
) 的用户中应抽取
11×
2
11
=2
(户)
.
(
4
) 月平均用电量在 [
12
,
14
) 的用户中应抽取
11×
1
11
=1
(户), 月平均用电量在 [
10
,
12
) 的用户设为
A
,
B
, 月平均用电量在 [
12
,
14
) 的用户设为
C
, 从
[
10
,
12
), [
12
,
14
) 这两组中随机抽取
2
户共有
AB
,
AC
,
BC
三种情况, 其中, 抽取的
2
户不是来自同一个
组的有
AC
,
BC
两种情况,
∴
抽取的
2
户不是来自同一
个组的概率为
2
3
.
提升练习
11. ABC
【解析】 由柱形图可知,
2010
—
2018
年的
CPI
均大于
100
, 说明其中每一年的居民消费价格都大
于前一年的居民消费价格,
∴2010
—
2018
年居民消费价
格总体呈增长趋势是正确的, 故
A
正确;
由柱形图可知,
2010
年的居民消费价格的增长率为
3.02%
,
2011
年的居民消费价格的增长率为
5.62%
, 都
超过了
3%
, 故
B
正确;
2009
年的
CPI
的值小于
100
, 说明当年的居民消费
价格低于
2008
年的居民消费价格,
∴2009
年的居民消
费价格出现负增长是正确的, 故
C
正确;
由柱形图可知,
2011
年的居民消费价格的增长率最
高 , 从
2010
—
2018
年每年的居民消费价格都在增长 ,
∴2018
年的居民消费价格才是最高的, 故
D
错误
.
故选
ABC.
12. BC
【解析 】 车速在 [
70
,
75
) 的频率为
1-
(
0.01+0.02+0.06+0.05+0.02
)
×5=0.2
, 故
A
错误;
∵
(
0.01+0.02
)
×5×n=45
,
∴n=300
,
∴
车速超过
80 km/h
的车辆数为 (
0.05+0.02
)
×5×300=105
, 故
B
正确;
∵
[
75
,
80
) 这一组数据的频率最大,
∴
估计众数
为
77.5
, 故
C
正确;
∵
(
0.01+0.02+0.04
)
×5=0.35<0.5
, (
0.01+0.02+0.04+
0.06
)
×5=0.65>0.5
,
∴
中位数在区间 [
75
,
80
) 内,
∴
该
样本的中位数为
75+
0.15
0.3
×5=77.5
, 故
D
错误
.
故选
BC.
13. 4
【解析】
1
n
n
i=1
移
(
x
i
-x
)
2
=
(
x
1
-x
)
2
+
(
x
2
-x
)
2
+
…
+
(
x
n
-x
)
2
n
=
(x
2
1
-2x
1
x+x
2
)
+
(x
2
2
-2x
2
x+x
2
)
+
…
+
(x
2
n
-2x
n
x+x
2
)
n
=
(x
2
1
+x
2
2
+
…
+x
2
n
)
-2x
(x
1
+x
1
+
…
+x
n
)
+nx
2
n
=
1
n
n
i=1
移
x
2
i
-
2x
·
nx
n
+x
2
=
1
n
n
i=1
移
x
2
i
-x
2
=
1
n
n
i=1
移
x
2
i
-1.6
2
=1.44
,
∴
1
n
n
i=1
移
x
2
i
=1.6
2
+1.44=4.
14. ②③
【解析】 不能确定甲、 乙两校的男女比例,
故
①
错误;
因为甲、 乙两校男生成绩的优秀率均大于女生成绩
的优秀率, 故甲、 乙两校所有男生成绩的优秀率大于甲、
乙两校所有女生成绩的优秀率, 故
②
正确;
因为不能确定甲、 乙两校的男女比例, 故不能确定
甲校学生成绩的优秀率与甲、 乙两校所有学生成绩的优
秀率的大小关系, 故
③
正确
.
15.
解: (
1
) 由题意得 (
a+0.04+0.085+0.11+0.125+
b+a+0.01+0.01
)
×2=1
, 即
b+2a=0.12.
又
∵b=2a
,
∴a=0.03
,
b=0.06.
(
2
)
∵
前三组的频率之和为
0.31
, 前四组的频率之
和为
0.53
,
∴
中位数
x∈
[
6
,
8
),
∴
(
x-6
)
×0.11+0.31=0.5
,
即
x=
0.19
0.11
+6≈7.7
, 即中位数的估计值为
7.7.
(
3
) 这周课外阅读时间为 [
0
,
6
) , [
6
,
10
) ,
[
10
,
14
), [
14
,
18
] 的频率分别为
0.31
,
0.47
,
0.18
,
0.04. ∴
各组的人数分别为
31
,
47
,
18
,
4.
一共奖励这
100
名学生笔记本的数量为
47+18×2+4×
3=95.
5.2 概 率
5.2.1
样本空间与事件
学习手册
变式训练
1
解: 由题意知
①
中事件可能发生, 也可能不发生,
所以是随机事件;
②
中事件一定会发生, 是必然事件;
由于骰子朝上面的数字最小是
1
, 两次朝上面的数字之
和最小是
2
, 不可能小于
2
, 所以
③
中事件不可能发生,
是不可能事件
.
59
第五章 统计与概率
学
学 习 目 标
1.
会利用样本的众数、 中位数、 平均
数、 方差估计总体的众数、 中位数、 平均
数、 方差
.
2.
能通过样本的频率分布表或频率分布
直方图对数据作出总体估计
.
3.
通过样本和总体的关系, 体会部分和
整体的辩证统一的关系, 体会统计在生产和
生活中的应用
.
要 点 精 析
要点
1
用样本的数字特征估计总体的
数字特征
众数、 中位数、 平均数与频率分布表、
频率分布直方图的关系:
(
1
) 众数: 众数一般用频率分布表中频
率最高的一小组的组中值来表示, 即在样本
数据的频率分布直方图中, 最高矩形的底边
中点的横坐标
.
(
2
) 中位数: 在频率分布表中, 中位数
是累计频率 (样本数据小于某一数值的频率
称为该数值点的累计频率) 为
0.5
时所对应
的样本数据的值, 而在样本中有
50%
的个体
小于或等于中位数, 也有
50%
的个体大于或
等于中位数
.
因此在频率分布直方图中, 中
位数左边和右边的直方图的面积应该相等
.
(
3
) 平均数: 平均数在频率分布直方图
中等于每个小矩形底边中点的横坐标与小矩
形的面积的乘积之和
.
思考 如何根据频率分布直方图求样
本中位数?
例
1
某校从参加高二年级学业水平测
试的学生中抽出
80
名学生, 其数学成绩 (均
为整数) 的频率分布直方图如图
5-1-8
所示
.
(
1
) 求这次测试数学成绩的众数;
(
2
) 求这次测试数学成绩的中位数;
(
3
) 求这次测试数学成绩的平均分;
(
4
) 试估计
80
分以上的学生人数
.
分析 本题利用频率分布直方图估计
总体的数字特征
.
解: (
1
) 由图知众数为
70+80
2
=75.
(
2
) 由图知, 设中位数为
x
, 由于前三
个矩形面积之和为
0.4
, 第四个矩形面积为
0.3
,
0.3+0.4>0.5
, 因此中位数位于第四个矩
形内, 得
0.1=0.03
(
x-70
),
∴x≈73.3.
(
3
) 由图知这次数学成绩的平均分为
40+50
2
×0.005×10+
50+60
2
×0.015×10+
60+70
2
×
0.02×10+
70+80
2
×0.03×10+
80+90
2
×0.025×10+
90+100
2
×0.005×10=72.
(
4
) [
80
,
90
) 分的频率为
0.025×10=
0.25
, 频数为
0.25×80=20.
[
90
,
100
] 分的
5.1.4 用样本估计总体
分数
频率
组距
40 50 60 70 80 90 100
0.030
0.025
0.020
0.015
0.005
0
图
5-1-8
45
学
高 中 数 学 必 修 第二册 (人教 B 版) 精编版
频率为
0.005×10=0.05
, 频数为
0.05×80=4.
∴
估计
80
分以上的学生人数为
20+4=24.
变式训练
1
为增进全体党员干部职工对党史的了
解, 某单位组织开展党史知识竞赛活动, 以
支部为单位参加比赛
.
现把
50
名党员的成绩
绘制了频率分布直方图如图
5-1-9
, 根据图
中数据回答下列问题:
(
1
) 求
a
的值;
(
2
) 求这
50
名党员成绩的众数、 中位
数及平均数;
(
3
) 试估计此样本数据的第
90
百分位数
.
要点
2
用样本的分布估计总体的分布
(
1
) 用分层抽样下样本的数字特征估计
总体的数字特征:
以分两层抽样的情况为例
.
假设第一层
有
m
个数, 分别为
x
1
,
x
2
, …,
x
m
, 平均数
为
x
, 方差为
s
2
; 第二层有
n
个数, 分别为
y
1
,
y
2
, …,
y
n
, 平均数为
y
, 方差为
t
2
.
如果
记样本均值为
a
, 样本方差为
b
2
, 则可以计
算出:
a=
1
m+n
m
i=1
移
x
i
+
n
i=1
移
y
i
i #
=
mx+ny
m+n
,
b
2
=
m
[
s
2
+
(
x-a
)
2
]
+n
[
t
2
+
(
y-a
)
2
]
m+n
=
1
m+n
(
ms
2
+nt
2
)
+
mn
m+n
(
x-y
)
) %
2
.
(
2
) 样本分布与总体分布的关系:
①
在简单随机抽样中, 我们常用样本分
布特征去估计总体分布特征
.
②
一般情况下, 如果样本的容量恰当,
抽样方法又合理的话, 样本的特征能够反映
总体的特征
.
特别地, 样本平均数 (也称为
样本均值)、 方差 (也称为样本方差) 与总
体对应的值相差不会太大
.
思考 能否举出一个生活中 “用样本
估计总体” 的具体事例?
例
2
考查某中学的学生身高时, 采用
分层抽样的方法, 得到了男生身高的平均数
为
170
, 方差为
16
; 女生身高的平均数为
165
, 方差为
25.
如果知道抽取的样本中 ,
男生有
20
人, 女生有
15
人, 估计总体的平
均数与方差
.
分析 本题利用分层抽样下样本的数
字特征估计总体的数字特征公式即可计算
.
解: 代入公式可以算出, 总体的平均数
可以估计为
167.86
, 总体的方差可以估计为
25.98.
变式训练
2
在一次文艺比赛中,
8
名专业人士和
12
名观众代表各组成一个评判小组, 给参赛选
手打分
.
在给某选手的打分中, 专业人士打
40 50 60 70 80 90 100
成绩
/
分
频率
组距
0.030
0.024
0.016
0.006
0.004
a
0
图
5-1-9
46
第五章 统计与概率
学
分的平均数和标准差分别为
47.4
和
3.7
, 观
众代表打分的平均数和标准差分别为
56.2
和
11.8
, 试根据这些数据计算这名选手得分
的平均数和标准差
.
例
3
某市
2020
年
4
月
1
日至
30
日对
空气污染指数的监测数据如下 (主要污染物
为可吸入颗粒物)
:
61 76 70 56 81 91 92 91 75
81 88 67 101 103 95 91 77 86
81 83 82 82 64 79 86 85 75 71
49 45
(
1
) 完成频率分布表;
(
2
) 作出频率分布直方图;
(
3
) 根据国家标准, 污染指数在
0~50
之间时, 空气质量为优; 在
51~100
之间时,
空气质量为良; 在
101~150
之间时, 空气质
量为轻微污染; 在
151~200
之间时, 空气质
量为轻度污染
.
请你依据所给数据和上述标
准, 对该市的空气质量给出一个简短评价
.
分析 列出频率分布表, 进而画出频
率分布直方图, 通过直方图对本月污染天
数进行估计
.
解: (
1
) 频率分布表
(
2
) 频率分布直方图
(
3
) 答对下述两条中的一条即可:
①
该
市一个月中空气污染指数有
2
天处于优的水
平, 占当月天数的
1
15
; 有
26
天处于良的水
平, 占当月天数的
13
15
; 处于优或良的天数共
有
28
天, 占当月天数的
14
15
.
说明该市空气
质量基本良好
. ②
轻微污染有
2
天, 占当
月天数的
1
15
.
污染指数在
80
以上的接近轻
微污染的天数有
15
天, 加上处于轻微污染
的天数, 共有
17
天, 占当月天数的
17
30
, 超
过
50%.
说明该市空气质量有待进一步改善
.
变式训练
3
抽样调查
30
个家庭某月的水电费用 ,
得到如下数据 (单位: 元):
404 444 556 430 380 420 500
430 420 384 420 404 424 340
424 412 388 472 358 476 376
396 428 444 366 436 364 438
330 426
(
1
) 取组距为
60
, 起点为
320
, 列出样
本的频率分布表;
(
2
) 画出频率分布直方图;
分组 频数 频率 分组 频数 频率
[
41
,
51
)
2
2
30
[
81
,
91
)
10
10
30
[
51
,
61
)
1
1
30
[
91
,
101
)
5
5
30
[
61
,
71
)
4
4
30
[
101
,
111
)
2
2
30
[
71
,
81
)
6
6
30
图
5-1-10
频率
组距
1
30
41 51 61 71 81 91 101 111
空气污染指数
1
60
0
47
学
高 中 数 学 必 修 第二册 (人教 B 版) 精编版
(
3
) 根据频率分布直方图估计该月水电
费用在 [
440
,
560
] 内的家庭所占的百分比
.
反思感悟
1.
样本平均数与总体平均数的关系:
(
1
) 在简单随机抽样中, 我们常用样
本平均数
y
去估计总体平均数
Y.
(
2
) 一般地, 大部分样本平均数离总
体平均数不远, 在总体平均数附近波动
.
样
本量越大, 波动幅度越小
.
2.
计算样本平均数、 样本方差直接利
用公式, 在按比例分配分层随机抽样中,
我们可以用样本平均数和样本方差估计总
体平均数和总体方差
.
3.
众数、 中位数分别是频率分布直方
图中最高的小矩形的中间值、 累计频率为
0.5
时所对应的样本数据的值, 平均数为每
个小矩形底边中点的横坐标与小矩形的面
积的乘积之和
.
数 学 文 化
例 解放战争中, 国民党军队拥有过多
辆各型坦克, 编成了
1
个装甲兵团 (师级编
制)
.
我军为了知道这个装甲兵团的各型坦克
的数量, 采用了两种方法: 一种是传统的情
报收集, 一种是用统计学的方法进行估计
.
统计学的方法最后被证实比传统的情报收集
更精确
.
这个装甲兵团对各型坦克从
1
开始
进行了连续编号, 在解放战争期间我军把缴
获的这些坦克的编号进行记录并计算出这些
编号的平均值为
112.5
, 假设缴获的坦克代
表了所有坦克的一个随机样本, 则利用你所
学过的统计知识估计这个装甲兵团的各型坦
克的数量有
.
分析 本题考查用样本估计总体
.
解 : 由题意 , 得
1+2+
…
+n
n
=112.5
, 解
得
n=224.
48