内容正文:
第五章 统计与概率
5.1 统计
5.1.4 用样本估计总体
知识对点练
目录
40分钟综合练
知识对点练
知识点一 用样本的数字特征估计总体的数字特征
1.某中学高一(1)班共有50名学生,其中男生30名,女生20名,采用分层随机抽样的方法,从全班学生中抽取20人测量其身高(单位:cm).已知在抽取的样本中,男生的平均身高为a cm,女生的平均身高为b cm,由此估计该班全体学生的平均身高约为( )
答案
知识对点练
1
2
3
4
5
6
4
解析
知识对点练
1
2
3
4
5
6
5
2.对甲厂、乙厂、丙厂所生产的袋装食品各抽检了20袋,称得质量如柱形图所示.
据此估计甲厂、乙厂、丙厂质量的标准差,分别用s1,s2,s3表示,则有( )
A.s2>s1>s3 B.s1>s3>s2
C.s3>s1>s2 D.s3>s2>s1
答案
知识对点练
1
2
3
4
5
6
6
解析
知识对点练
1
2
3
4
5
6
7
3.李大伯承包了一个果园,种植了100棵樱桃树,今年已进入收获期,收获时,从中任选并采摘了10棵树的樱桃,分别称得每棵树所产樱桃的质量如下表:
据调查,市场上今年樱桃的批发价格为每千克15元,用所学的统计知识估计今年此果园樱桃的总产量与按批发价格销售樱桃所得的总收入分别约为________,________.
答案
序号 1 2 3 4 5 6 7 8 9 10
质量/千克 14 21 27 17 18 20 19 23 19 22
2000
30000
解析:样本平均数为(14+21+27+17+18+20+19+23+19+22)÷10=20.由此可估计每棵樱桃树所产樱桃质量平均约为20千克,所以这100棵樱桃树所产樱桃的质量约为20×100=2000(千克).根据樱桃批发价格为每千克15元,可得总收入约为15×2000=30000(元).
解析
知识对点练
1
2
3
4
5
6
8
4.某医院急救中心随机抽取20位病人等待急诊的时间(单位:min)记录如下表:
答案
解析
等待时间 [0,5) [5,10) [10,15) [15,20) [20,25]
频数 4 8 5 2 1
9.5
28.5
知识对点练
1
2
3
4
5
6
9
知识点二 用样本的分布来估计总体的分布
5.[多选]某学校为普及安全知识,对本校1500名
高一学生开展了一次校园安全知识竞赛答题活动(满分
为100分).现从中随机抽取100名学生的得分进行统计
分析,整理得到如图所示的频率分布直方图,则根据
该直方图,下列结论正确的是( )
A.图中x的值为0.016
B.估计该校高一大约有77%的学生竞赛得分介于60至90之间
C.该校高一学生竞赛得分不小于90的人数估计为195
D.该校高一学生竞赛得分的75%分位数估计大于80
答案
知识对点练
1
2
3
4
5
6
10
解析:由频率分布直方图的性质可得,(0.010+0.013+x+0.028+0.032)×10=1,解得x=0.017,故A错误;得分介于60至90之间的频率为(0.028+0.032+0.017)×10=0.77,故B正确;得分不小于90的人数估计为1500×0.013×10=195,故C正确;得分介于50至80之间的频率为(0.01+0.028+0.032)×10=0.7<0.75,故D正确.故选BCD.
解析
知识对点练
1
2
3
4
5
6
11
解析:由题意可知,丙成绩的平均数最大且方差最小,所以丙的总成绩最好且发挥最稳定,故最合适的人是丙.
答案
解析
丙
知识对点练
1
2
3
4
5
6
12
40分钟综合练
一、单项选择题
1.样本的频率分布与相应的总体分布的关系是( )
A.样本的频率分布与相应的总体分布是同样的分布
B.样本的频率分布与相应的总体分布是互不相关的两种分布
C.样本的频率分布将随着样本容量的增大更加接近相应的总体分布
D.样本容量增大到某一定值时样本的频率分布就变成了相应的总体分布
解析:样本容量越大,样本的频率分布越接近相应的总体分布.
答案
解析
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
14
2.为了解某地区1500名高三男生的身体
发育情况,抽查了该地区100名年龄为17~18岁
的高三男生体重(单位:kg),得到频率分布直方
图如图.根据图示,估计该地区高三男生中体重
在[56.5,64.5) kg的人数是( )
A.390 B.510
C.600 D.660
解析:由题意,得体重在[56.5,64.5) kg的学生频率为(0.03+0.05+0.05+0.07)×2=0.4,故该地区高三男生中体重在[56.5,64.5) kg的频率是0.4,人数为1500×0.4=600.
答案
解析
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
3.某校从参加高二年级学业水平测试的
学生中抽出80名学生,其数学成绩(均为整数)
的频率分布直方图如图所示.估计这次测试
数学成绩的众数为( )
A.50 B.60
C.75 D.80
答案
解析
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
16
4.(2024·甘肃兰州期末)某校为了提高学生的安全意识,组织高一年级全体学生进行安全知识竞赛答题活动,随机抽取8人的得分作为样本,分数从低到高依次为84,85,87,87,90,a,b,99,若这组数据的75%分位数为94,则利用样本估计此次竞赛得分的平均数为( )
A.85 B.86
C.90 D.95
答案
解析
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
17
5.从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如图所示(单位:cm).根据数据估计( )
A.甲种玉米比乙种玉米不仅长得高而且长得整齐
B.乙种玉米比甲种玉米不仅长得高而且长得整齐
C.甲种玉米比乙种玉米长得高但长势没有乙整齐
D.乙种玉米比甲种玉米长得高但长势没有甲整齐
解析:由题中的茎叶图可知,甲种玉米的株高主要集中在20~30 cm,乙种玉米的株高主要集中在30~40 cm,则甲种玉米的平均株高小于乙种玉米的平均株高,但乙种玉米的株高较分散.故选D.
答案
解析
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
18
二、多项选择题
6.某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1120名学生中随机抽取了100名学生的数学成绩,发现都在[80,150]内.现将这100名学生的成绩按照[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150]分组,得到的频率分布直方图如图所示.则下列说法正确的是( )
A.频率分布直方图中a的值为0.040
B.样本数据低于130分的频率为0.7
C.总体的中位数(精确到0.1)估计为123.3分
D.总体分布在[90,100)的频数一定与总体分布在[100,110)的频数相等
答案
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
19
解
析
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
20
7.某地教师招聘考试,有3200人参加笔试,满分为100分,笔试成绩前20%(含20%)的考生有资格参加面试,所有考生的笔试成绩和年龄分别如频率分布直方图和扇形统计图所示,则( )
A.90后考生比00后考生多150人
B.笔试成绩的60%分位数为80
C.参加面试的考生的成绩最低为86分
D.笔试成绩的平均分为76分
答案
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
21
解
析
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
22
三、填空题
8.为了鼓励市民节约用电,某市实行“阶梯式”电价,
将每户居民的月用电量分为两档,月用电量不超过200度
的部分按0.5元/度收费,超过200度的部分按0.8元/度收费.
某小区共有居民1000户,为了解居民的用电情况,通过抽
样,获得了2023年5月份100户居民的用电量,统计分析后
得到如图所示的频率分布直方图,则估计该小区1000户居民2023年5月份用电费用不超过260元的户数为________.
900
答案
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
23
解
析
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
24
9.甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从甲、乙生产的零件中分别抽取40件、60件,甲的平均尺寸为10,方差为20,乙的平均尺寸为12,方差为40.则从甲、乙生产的零件中抽取的这100件产品的平均尺寸为________,方差为________.
答案
解析
11.2
32.96
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
25
10.(2024·河南驻马店期末)某校高三年级的
一次模拟考试中,经统计,重点班30名学生的数学
成绩均在[100,150](单位:分)内,根据统计的数据
制作出频率分布直方图如图所示,则图中的实数a=
________,若以各组数据的中间数值代表这组数据的
平均水平,估算该班数学成绩的平均值为________分.
解析:由频率分布直方图,得(2a+3a+7a+6a+2a)×10=1,∴a=0.005.该班数学成绩的平均值为105×0.1+115×0.15+125×0.35+135×0.3+145×0.1=126.5(分).
答案
解析
0.005
126.5
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
26
四、解答题
11.为了了解甲、乙两个工厂生产的轮胎的宽度是
否达标,从两厂各随机选取了10个轮胎,将每个轮胎的
宽度(单位:mm)记录下来并绘制出如下的折线图:
(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均数;
(2)若轮胎的宽度在[194,196]内,则称这个轮胎是标准
轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好.
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
27
解
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
28
解
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
29
12.(2024·辽宁辽阳期末)“天宫课堂”是为发挥中国
空间站的综合效益,推出的首个太空科普教育品牌.“天
宫课堂”是结合载人飞行任务,贯穿中国空间站建造和
在轨运营系列化推出的,将由中国航天员担任“太空教
师”,以青少年为主要对象,采取天地协同互动方式开展.
2023年9月21日15时45分,“天宫课堂”第四课在中国空间
站开讲.学校针对这次直播课,举办了“天宫课堂”知识竞赛,有100名学生代表参加了竞赛,竞赛后对这100名学生的成绩(满分100分)进行统计,将数据分为[60,70),[70,80),[80,90),[90,100]四组,画出如图所示的频率分布直方图.
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
30
(1)求频率分布直方图中m的值;
(2)估计这100名学生竞赛成绩的平均数(同一组中的数据用该组区间的中点值作代表);
(3)若该校准备对本次知识竞赛成绩较好的40%的学生进行嘉奖,试问被嘉奖的学生的分数不低于多少?
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
31
解
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
32
答案
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
33
解
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
34
14.(2024·北京海淀高一上期末)农科院作物所为了解某种农作物的幼苗质量,分别从该农作物在甲、乙两个不同环境下培育的幼苗中各随机抽取了15株幼苗进行检测,量出它们的高度如图(单位:cm):
记该样本中甲、乙两种环境下幼苗高度的中位数分别为a,b,则|a-b|=________;
若以样本估计总体,记甲、乙两种环境下幼苗高度的标准差分别为s1,s2,则s1________s2(用“<”“>”或“=”连接).
3
>
答案
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
35
解析:由题意得甲环境的幼苗高度为31,32,33,33,35,43,44,45,49,55,57,58,59,63,65,其中位数a=45,乙环境的幼苗高度为37,43,44,45,45,47,48,48,49,52,54,54,55,58,60,其中位数b=48,所以|a-b|=|45-48|=3.由题中茎叶图知乙种环境下幼苗高度更加集中,所以s1>s2.
解
40分钟综合练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
36
R
A.eq \f(a+b,2) cm
B.eq \f(3a+2b,2) cm
C.eq \f(2a+3b,5) cm
D.eq \f(3a+2b,5) cm
解析:因为抽样比为eq \f(2,5),则样本中男生有30×eq \f(2,5)=12人,女生有20×eq \f(2,5)=8人,所以样本的平均身高为eq \f(12a+8b,20)=eq \f(3a+2b,5),由此估计该班全体学生的平均身高约为eq \f(3a+2b,5) cm.故选D.
解析:根据题意,甲厂袋装食品质量的平均数eq \o(x,\s\up17(-))1=eq \f(1,20)×(5×7+5×8+5×9+5×10)=8.5,方差seq \o\al(2,1)=eq \f(1,20)×[5×(7-8.5)2+5×(8-8.5)2+5×(9-8.5)2+5×(10-8.5)2]=1.25,标准差s1=eq \r(1.25);乙厂袋装食品质量的平均数eq \o(x,\s\up17(-))2=eq \f(1,20)×(4×7+6×8+6×9+4×10)=8.5,方差seq \o\al(2,2)=eq \f(1,20)×[4×(7-8.5)2+6×(8-8.5)2+6×(9-8.5)2+4×(10-8.5)2]=1.05,标准差s2=eq \r(1.05);丙厂袋装食品质量的平均数eq \o(x,\s\up17(-))3=eq \f(1,20)×(6×7+4×8+4×9+6×10)=8.5,方差seq \o\al(2,3)=eq \f(1,20)×[6×(7-8.5)2+4×(8-8.5)2+4×(9-8.5)2+6×(10-8.5)2]=1.45,标准差s3=eq \r(1.45).所以s3>s1>s2.故选C.
用上述分组资料计算出病人平均等待时间的估计值eq \o(x,\s\up17(-))=________,病人等待时间的方差的估计值s2=________.
解析:eq \o(x,\s\up17(-))=eq \f(1,20)×(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5,s2=eq \f(1,20)×[(2.5-9.5)2×4+(7.5-9.5)2×8+(12.5-9.5)2×5+(17.5-9.5)2×2+(22.5-9.5)2×1]=28.5.
6.甲、乙、丙、丁四名运动员参加射击项目选拔赛,每人10次射击成绩的平均数eq \o(x,\s\up17(-))(单位:环)和方差s2如下表所示:
甲
乙
丙
丁
eq \o(x,\s\up17(-))
8.2
9.5
9.9
7.7
s2
0.16
0.65
0.09
0.41
根据表中数据,若从中选择一名成绩好且发挥稳定的运动员参加比赛,最合适的人是________.
解析:估计这次测试数学成绩的众数为eq \f(70+80,2)=75.
解析:由于8×75%=6,所以这组数据的75%分位数为第6个数和第7个数的平均数,故eq \f(a+b,2)=94,故a+b=188,故平均数为eq \f(84+85+87+87+90+188+99,8)=90.故选C.
解析:由频率分布直方图,得(0.005+0.010+
0.010+0.015+a+0.025+0.005)×10=1,解得a=
0.030,故A错误;样本数据低于130分的频率为
1-(0.025+0.005)×10=0.7,故B正确;[80,120)的频率为(0.005+0.010+0.010+0.015)×10=0.4<0.5,[80,130)的频率为0.4+0.030×10=0.7>0.5,∴总体的中位数估计为120+eq \f(0.5-0.4,0.3)×10≈123.3分,故C正确;样本分布在[90,100)的频数一定与样本分布在[100,110)的频数相等,总体分布在[90,100)的频数不一定与总体分布在[100,110)的频数相等,故D错误.故选BC.
解析:对于A,由年龄的扇形统计图,可得90后的考生有3200×45%=1440(人),00后的考生有3200×40%=1280(人),1440-1280=160(人),A不正确;对于B,由频率分布直方图性质,可得(0.01+0.02+a+a+0.01)×10=1,解得a=0.03,则前三个矩形的面积和为(0.01+0.02+0.03)×10=0.6,所以笔试成绩的60%分位数为80,B正确;对于C,设面试成绩的最低分为x,由前三个矩形的面积和为0.6,第四个矩形的面积为0.3,则80+eq \f(0.02,0.03)×10≈86.6≈87(分),C不正确;对于D,根据频率分布直方图的平均数的计算公式,可得笔试成绩的平均分为eq \o(x,\s\up17(-))=55×0.1+65×0.2+75×0.3+85×0.3+95×0.1=76(分),D正确.故选BD.
解析:当用电量为400度时,用电费用为200×0.5+200×0.8=260(元),所以此100户居民中用电费用超过260元的户数为0.001×100×100=10,所以此100户居民中用电费用不超过260元的户数为90,所以估计该小区1000户居民2023年5月份用电费用不超过260元的户数为eq \f(90,100)×1000=900.
解析:由题知甲机床的平均尺寸和方差分别为eq \o(x,\s\up17(-))甲=10,seq \o\al(2,甲)=20,乙机床的平均尺寸和方差分别为eq \o(x,\s\up17(-))乙=12,seq \o\al(2,乙)=40,所以从甲、乙生产的零件中抽出的这100件产品的平均尺寸eq \o(x,\s\up17(-))=eq \f(40×10+60×12,40+60)=11.2,所以方差s2=eq \f(1,40+60)×eq \b\lc\[\rc\](\a\vs4\al\co1((40×20+60×40)+\f(40×60,40+60)×(10-12)2))=32.96.
解:(1)甲厂10个轮胎宽度的平均数为eq \o(x,\s\up17(-))甲=eq \f(1,10)×(195+194+196+193+194+197+196+195+193+197)=195,乙厂10个轮胎宽度的平均数为eq \o(x,\s\up17(-))乙=eq \f(1,10)×(195+196+193+192+195+194+195+192+195+193)=194.
(2)甲厂10个轮胎中宽度在[194,196]内的数据为195,194,196,194,196,195,
平均数eq \o(x,\s\up17(-))1=eq \f(1,6)×(195+194+196+194+196+195)=195,
方差seq \o\al(2,1)=eq \f(1,6)×[(195-195)2+(194-195)2+(196-195)2+(194-195)2+(196-195)2+(195-195)2]=eq \f(2,3),
乙厂10个轮胎中宽度在[194,196]内的数据为195,196,195,194,195,195,
平均数eq \o(x,\s\up17(-))2=eq \f(1,6)×(195+196+195+194+195+195)=195,
方差seq \o\al(2,2)=eq \f(1,6)×[(195-195)2+(196-195)2+(195-195)2+(194-195)2+(195-195)2+(195-195)2]=eq \f(1,3),
∵两厂标准轮胎宽度的平均数相等,但乙厂的方差更小,
∴乙厂的轮胎相对更好.
解:(1)由图可得(m+5m+0.030+0.040)×10=1,
解得m=0.005.
(2)估计这100名学生竞赛成绩的平均数
eq \o(x,\s\up17(-))=65×0.005×10+75×0.025×10+
85×0.040×10+95×0.030×10=84.5.
(3)设被嘉奖的学生的分数不低于x,
因为第四组的频率为0.030×10=0.3,第三组的频率为0.040×10=0.4,
所以x∈[80,90),所以0.040×(90-x)+0.3=0.4,解得x=87.5.
13.已知总体划分为3层,通过分层随机抽样,各层抽取的样本容量分别为n1,n2,n3,样本平均数分别为eq \o(x,\s\up17(-))1,eq \o(x,\s\up17(-))2,eq \o(x,\s\up17(-))3,样本方差分别为seq \o\al(2,1),seq \o\al(2,2),seq \o\al(2,3),若n1∶n2∶n3=1∶2∶3,则( )
A.eq \o(x,\s\up17(-))1∶eq \o(x,\s\up17(-))2∶eq \o(x,\s\up17(-))3=1∶2∶3
B.seq \o\al(2,1)∶seq \o\al(2,2)∶seq \o\al(2,3)=1∶4∶9
C.总样本平均数eq \o(x,\s\up17(-))=x1+2eq \o(x,\s\up17(-))2+3eq \o(x,\s\up17(-))3
D.当eq \o(x,\s\up17(-))1=eq \o(x,\s\up17(-))2=eq \o(x,\s\up17(-))3时,总样本方差s2=eq \f(1,6)seq \o\al(2,1)+eq \f(1,3)seq \o\al(2,2)+eq \f(1,2)seq \o\al(2,3)
解:由于样本容量与样本平均数、样本方差之间并不成某种比例关系,所以A,B错误;设n1=k,n2=2k,n3=3k,k∈N+,则总样本平均数eq \o(x,\s\up17(-))=eq \f(n1·\o(x,\s\up17(-))1+n2·\o(x,\s\up17(-))2+n3·\o(x,\s\up17(-))3,n1+n2+n3)=eq \f(k·\o(x,\s\up17(-))1+2k·\o(x,\s\up17(-))2+3k·\o(x,\s\up17(-))3,6k)=eq \f(1,6)
eq \o(x,\s\up17(-))1+eq \f(1,3)
eq \o(x,\s\up17(-))2+eq \f(1,2)
eq \o(x,\s\up17(-))3,所以C错误;当eq \o(x,\s\up17(-))1=eq \o(x,\s\up17(-))2=eq \o(x,\s\up17(-))3时,总样本平均数eq \o(x,\s\up17(-))=eq \o(x,\s\up17(-))1=eq \o(x,\s\up17(-))2=eq \o(x,\s\up17(-))3,所以总样本方差s2=eq \f(1,n1+n2+n3){n12,1)eq \b\lc\[\rc\](\a\vs4\al\co1(s+(\o(x,\s\up17(-))1-\o(x,\s\up17(-)))2))
+n2[seq \o\al(2,2)+(eq \o(x,\s\up17(-))2-eq \o(x,\s\up17(-)))2]+n32,3)eq \b\lc\[\rc\](\a\vs4\al\co1(s+(\o(x,\s\up17(-))3-\o(x,\s\up17(-)))2))
}=2,1)eq \f(k·s+2k·seq \o\al(2,2)+3k·seq \o\al(2,3),6k)
=eq \f(1,6)seq \o\al(2,1)+eq \f(1,3)seq \o\al(2,2)+eq \f(1,2)seq \o\al(2,3),所以D正确.故选D.
$$