内容正文:
N
高中数学必修第二册人教B版
5.1.4用样
学习目标
1.会利用样本的众数、中位数、平均
数、方差估计总体的众数、中位数、平均
数、方差
2.能通过样本的频率分布表或频率分布
直方图对数据作出总体估计.
3.通过样本和总体的关系,体会部分和
整体的辩证统一的关系,体会统计在生产和
生活中的应用.
要点精析
要点1用样本的数字特征估计总体的
数字特征
众数、中位数、平均数与频率分布表、
频率分布直方图的关系:
(1)众数:众数一般用频率分布表中频
率最高的一小组的组中值来表示,即在样本
数据的频率分布直方图中,最高矩形的底边
中点的横坐标。
(2)中位数:在频率分布表中,中位数
是累计频率(样本数据小于某一数值的频率
称为该数值点的累计频率)为0.5时所对应
的样本数据的值,而在样本中有50%的个体
小于或等于中位数,也有50%的个体大于或
等于中位数.因此在频率分布直方图中,中
位数左边和右边的直方图的面积应该相等.
(3)平均数:平均数在频率分布直方图
中等于每个小矩形底边中点的横坐标与小矩
形的面积的乘积之和,
44)学
本估计总体
思考如何根据频率分布直方图求样
本中位数?
例1某校从参加高二年级学业水平测
试的学生中抽出80名学生,其数学成绩(均
为整数)的频率分布直方图如图5-1-7所示.
频率
组距
0.030上
0.025
0.020
0.015
0.005
405060708090100分数
图5-1-7
(1)求这次测试数学成绩的众数;
(2)求这次测试数学成绩的中位数;
(3)求这次测试数学成绩的平均分;
(4)试估计80分以上的学生人数.
分析本题利用频率分布直方图估计
总体的数字特征
B变式训练①
为增进全体党员干部职工对党史的了
解,某单位组织开展党史知识竞赛活动,以
支部为单位参加比赛.现将50名党员的成绩
绘制成频率分布直方图如图5-1-8,根据图
中数据回答下列问题:
频率
组距
0.030F
0.024
0.016
889:1
405060708090100成绩/分
图5-1-8
(1)求a的值:
(2)求这50名党员成绩的众数、中位
数及平均数;
(3)试估计此样本数据的第90百分位数.
川要点2用样本的分布估计总体的分布!
(1)用分层抽样下样本的数字特征估计
总体的数字特征:
以分两层抽样的情况为例.假设第一层
抽取m个数,分别为x1,x2,…,xm,平均
数为x,方差为s2;第二层抽取n个数,分
别为y1,2,…,y,平均数为y,方差为只
第五章统计与概率。
如果记样本均值为a,样本方差为b2,则可
以计算出:
a1/
2+∑
mx+ny
mtn i
mtn
b2=ms2+(x-a)2]+n[+(y-a)21]
m+n
=1(ms2+nt2)+m(x-y))2.
mtn l
m+n
(2)样本分布与总体分布的关系:
①在简单随机抽样中,我们常用样本分
布特征去估计总体分布特征.
②一般情况下,如果样本的容量恰当,
抽样方法又合理的话,样本的特征能够反映
总体的特征.特别地,样本平均数(也称为
样本均值)、方差(也称为样本方差)与总
体对应的值相差不会太大
思考能否举出一个生活中“用样本
估计总体”的具体事例?
例2考查某中学的学生身高时,采用
分层抽样的方法,得到了男生身高的平均数
为170,方差为16:女生身高的平均数为
165,方差为25.如果知道抽取的样本中,
男生有20人,女生有15人,估计总体的平
均数与方差
分析本题利用分层抽样下样本的数
字特征估计总体的数字特征公式即可计算.
学(45
N
高中数学必修第二册人教B版
仔变式训练2
在一次文艺比赛中,8名专业人士和12
名观众代表各组成一个评判小组,给参赛选
手打分.在给某选手的打分中,专业人士打
分的平均数和标准差分别为47.4和3.7,观
众代表打分的平均数和标准差分别为56.2
和11.8,试根据这些数据计算这名选手得分
的平均数和标准差.
例3某市2025年4月1日至30日对
空气污染指数的监测数据如下(主要污染物
为可吸入颗粒物):
617670568191929175
81886710110395917786
81838282647986857571
4945
(46)学
N
(1)完成频率分布表。
(2)作出频率分布直方图.
(3)根据国家标准,污染指数在0~50
之间时,空气质量为优;在51~100之间时,
空气质量为良;在101~150之间时,空气质
量为轻微污染;在151~200之间时,空气质
量为轻度污染.请你依据所给数据和上述标
准,对该市的空气质量作出一个简短评价,
分析列出频率分布表,进而画出频
率分布直方图,通过直方图对本月污染天
数进行估计
变式训练3
抽样调查30个家庭某月的水电费用,
得到如下数据(单位:元):
404444556430380420500
430420384420
404424340
424412388472358476376
396428444366436364438
330426
(1)取组距为60,起点为320,列出样
本的频率分布表;
(2)画出频率分布直方图:
(3)估计该月水电费用在[440,560]
内的家庭所占的百分比,
第五章统计与概率。
反思感悟
1.样本平均数与总体平均数的关系:
(1)在简单随机抽样中,我们常用样
本平均数y去估计总体平均数Y
(2)一般地,大部分样本平均数离总
体平均数不远,在总体平均数附近波动.样
本量越大,波动幅度越小
2.计算样本平均数、样本方差直接利
用公式,在按比例分配分层随机抽样中,
我们可以用样本平均数和样本方差估计总
体平均数和总体方差
3.众数、中位数分别是频率分布直方
图中最高的小矩形的中间值、累计频率为
0.5时所对应的样本数据的值,平均数为每
个小矩形底边中点的横坐标与小矩形的面
积的乘积之和
数学文化
例解放战争中,国民党军队拥有过多
辆各型坦克,编成了1个装甲兵团(师级编
制).我军为了知道这个装甲兵团的各型坦克
的数量,采用了两种方法:一种是传统的情
报收集,一种是用统计学的方法进行估计.
统计学的方法最后被证实比传统的情报收集
更精确.这个装甲兵团对各型坦克从1开始
进行了连续编号,在解放战争期间,我军把
缴获的这些坦克的编号进行记录,并计算出
这些编号的平均值为112.5,假设缴获的坦
克代表了所有坦克的一个随机样本,则利用
你所学过的统计知识估计这个装甲兵团的各
型坦克的数量为
分析本题考查用样本估计总体.
学(3)这20名工人年龄的平均数x=(19+28x3+29x3+
30x5+31×4+32x3+40)÷20=30.
s20×[(30-19P+3x(30-2843x30-29245x(30-
30)2+4×(30-31)2+3×(30-32)24(30-40)2]=12.6.
例4D【解析】在频率分布直方图中,中位数是频率
为0.5的分界点的横坐标,由频率分布直方图可知前2
组的频率和为(0.02+0.06)×5=0.4,因此中位数出现在第
3组.设中位数为x,则(x-25)×0.08=0.1,=26.25,∴A
正确;众数是指样本中出现频率最高的数,在频率分布
直方图中通常取纵坐标最高的一组区间的中点,.众数
为25+30-27.5,B正确;仰卧起坐次数超过30次的频
率为0.04×5-0.2,.频数为1600×0.2=320(人),.C正
确;仰卧起坐的次数少于20次的人数约有0.02x5x1600=
160(人),.D错误.故选D
变式训练3
解:(1)样本容量是10÷0.1=100.
(2)①50②0.10所补频率分布直方图如图中阴
影部分所示.
频率
组距
0.1
0.06
0.02-
510152025购票用时/min
变式训练3答图
100×(0x04
(3)设旅客平均购票用时为tmin,则有,
5×10+10×10+15×50+20×30)≤t<
100×(5x0+10x10+15×
10+20×50+25×30),即15≤t<20,.旅客购票用时的平
均数可能落在第四组
数学文化
解:(1)该市一天的空气质量等级为1,2,3,4
的概率估计值如下表:
空气质量等级
1
2
3
概率的估计值
0.43
0.27
0.21
0.09
(2)一天中到该公园锻炼的平均人次的估计值为
参考答案。
0×10x20430x35+50x45)=350.
5.1.4用样本估计总体
要点精析
例1解:(1)由图知众数为70+80=75.
2
(2)设中位数为x,由图知,前三个矩形面积之和
为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位
数位于第四个矩形内,.0.1=0.03(x-70),x≈73.3.
(3)由图知,这次数学成绩的平均分为40+50×
2
0.005x10+50+60x0.015×10+60+70×0.02×10+70+80×
2
2
2
0.03×10+80490x0.025x10490+100x0.005×10=72.
2
2
(4)[80,90)分的频率为0.025×10=0.25,频数为
0.25×80=20;[90,100]分的频率为0.005×10=0.05,
频数为0.05×80=4..估计80分以上的学生人数为20+4=
24.
变式训练1
解:(1)根据频率分布直方图得(0.004+0.006+a+
0.030+0.024+0.016)×10=1,解得a=0.020.
(2)由众数的概念可知,众数是出现次数最多的数,
.众数为70+80=75.0.004×10+0.006x10+0.020x10=0.3,
2
∴.前三个小矩形的面积的和为0.3,而第四个小矩形的
面积为0.030x10=0.3,0.3+0.3=0.6>0.5,..中位数应位于
[70,80)内,中位数=70+0.503x10-=230≈76.7
0.3
3
平均数为45×(0.004×10)+55×(0.006x10)+65×(0.020×
10)+75×(0.030x10)+85×(0.024×10)+95×(0.016x10)=76.2
(3)前5个小组的频率之和是(0.004+0.006+0.020+
0.030+0.024)×10=0.84,.第90百分位数在第六小组
[0,10]内,为009284x10-5-9875
4
例2解:代入公式可以算出,总体的平均数可以估计
为167.86,总体的方差可以估计为25.98.
变式训练2
解:把专业人士打分样本记为x,x2,…,x8,其平
均数记为元,方差记为;把观众代表打分样本记为,
y2,…,y,其平均数为y,方差记为s;把总体数据的
平均数记为云,方差记为s2
39
高中数学必修第二册人教B版
则总休的平均数为员x474+号562-5268(分)。
20
总体的方差为2=1
20
(x-z)2]+12[s+y-z)2]}
20×8x[3.74(474-5268]+12x
[11.82+(56.2-52.68)2]}=107.6,总体的标准差s≈10.37.
.这名选手得分的平均数为52.68分,标准差约为
10.37.
例3解:(1)频率分布表
分组
频数
频率
分组
频数
频率
[41,51)
2
30
[81,91)
10
10
30
[51,61)
1
0
[91,101)
5
[61,71)
4
「101,1111
2
2
30
30
[71,81)
6
6
(2)频率分布直方图
4频率
1
30
组距
60
0
A
415161718191101111空气污染指数
例3答图
(3)答对下述两条中的一条即可:①该市一个月中
空气污染指数有2天处于优的水平,占当月天数的5:
有26天处于良的水平,占当月天数的号:处于优或良
的天数共有28天,占当月天数的普说明该市空气质量
基本良好.②该市一个月中空气质量为轻微污染的有2
天,占当月天数的5污染指数在80以上的接近轻微污
染的天数有15天,加上处于轻微污染的天数,共有17
天,占当月天数的只,超过50%.说明该市空气质量有
30”
待进一步改善
变式训练3
解:(1)由题中数据可得,频率分布表如下:
40
分组
频数
频率
[320,380)
6
0.20
[380,440)
18
0.60
[440,500)
4
0.13
[500,560]
0.07
合计
30
1.00
(2)频率分布直方图如图:
频率
组距
0.01
0.0033
88▣
0.0022F
320380440500560月水电费用/元
变式训练3答图
(3)该月水电费用在[440,560]内的家庭所占的
百分比为0.13+0.07=0.2=20%.
数学文化
24【解析】由题意,得1+24机1125,解得m=224
n
>m5.2概
率
5.2.1样本空间与事件
要点精析
例1解:(1)掷一个质地均匀的骰子,其点数有可能
出现16,点数是不能确定的,因此是随机现象
(2)抽出的2个产品中有可能全部是正品,也有可
能是1个正品1个次品,还有可能是2个次品,故是随
机现象
变式训练1
解:由题意知①中事件可能发生,也可能不发生,
所以是随机事件;②中事件一定会发生,是必然事件;
由于骰子朝上面的数字最小是1,两次朝上面的数字之
和最小是2,不可能小于2,所以③中事件不可能发生,
是不可能事件
例2D【解析】三个球分为两组,有两种情况,1+2和
3+0,.①是正确的命题:任意实数x都有x≥0,②是
正确的命题;“明天全天要下雨”是随机事件,.③是