内容正文:
第六章 统计
§3 用样本估计总体的分布
3.1 从频数到频率
3.2 频率分布直方图
15分钟对点练
30分钟综合练
目录
15分钟对点练
1.已知样本7,8,10,14,9,7,12,11,10,8,13,10,8,11,10,9,12,9,13,11.那么这组样本数据落在8.5~11.5内的频率是( )
A.0.4 B.0.5
C.0.6 D.0.65
知识点一 频率的概念
1
2
3
4
5
15分钟对点练
6
7
2.[多选]对于频率分布直方图,下列说法正确的是( )
A.小矩形的面积表示相应各组的频率
B.小矩形的面积表示该组个体在样本中出现的频数
C.小矩形的高表示该组个体在样本中出现的频率与组距的比
D.小矩形的高表示该组个体在样本中出现的频数与组距的比
解析 由于在频率分布直方图中各小矩形的面积表示相应各组的频率,因此,小矩形的高表示该组个体在样本中出现的频率与组距的比.
知识点二 频率分布直方图的概念
1
2
3
4
5
15分钟对点练
6
7
3.样本的频率分布与相应的总体分布的关系是( )
A.样本的频率分布与相应的总体分布是同样的分布
B.样本的频率分布与相应的总体分布是互不相关的两种分布
C.样本的频率分布将随着样本容量的增大更加接近相应的总体分布
D.样本容量增大到某一定值时,样本的频率分布就变成了相应的总体分布
解析 样本容量越大,样本的频率分布越接近相应的总体分布.
1
2
3
4
5
15分钟对点练
6
7
4.某市2022年4月1日到4月30日对空气污染指数的监测数据如下:
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)作出频率分布表;
(2)画出频率分布直方图及频率折线图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻度污染;在151~200之间时,为中度污染.请你依据所给数据和上述标准,对该市的空气质量作出一个简短评价.
知识点三 频率分布直方图、频率折线图的绘制
1
2
3
4
5
15分钟对点练
6
7
1
2
3
4
5
15分钟对点练
6
7
1
2
3
4
5
15分钟对点练
6
7
1
2
3
4
5
15分钟对点练
6
7
A.90 B.75
C.60 D.45
5.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分
知识点四 频率分布直方图的计算
组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )
1
2
3
4
5
15分钟对点练
6
7
1
2
3
4
5
15分钟对点练
6
7
6.下表给出了在某校500名10岁学生中,用随机抽样得出的120人的身高(单位:cm).
知识点五 用频率分布表及频率分布直方图估计总体分布
身高分组 [122,126) [126,130) [130,134) [134,138) [138,142)
人数 5 8 10 22 33
身高分组 [142,146) [146,150) [150,154) [154,158]
人数 20 11 6 5
(1)列出样本频率分布表(频率精确到0.01);
(2)画出频率分布直方图;
(3)估计身高小于134 cm的人数占总人数的百分比.
1
2
3
4
5
15分钟对点练
6
7
解 (1)样本频率分布表如下:
身高分组 频数 频率
[122,126) 5 0.04
[126,130) 8 0.07
[130,134) 10 0.08
[134,138) 22 0.18
[138,142) 33 0.28
[142,146) 20 0.17
[146,150) 11 0.09
[150,154) 6 0.05
[154,158] 5 0.04
合计 120 1
1
2
3
4
5
15分钟对点练
6
7
(2)频率分布直方图如下:
(3)由样本频率分布表可知,身高小于134 cm的学生出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.
1
2
3
4
5
15分钟对点练
6
7
7.中小学生的视力状况受到社会的广泛关注.某市有关部门从全市6万名高一学生中随机抽取400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示,从左至右第一组与第五组的频率之比为5∶6,则该市6万名高一学生中视力在[3.95,4.25)范围内的学生约有多少人?
易错点 误将频率分布直方图的纵坐标当作频率
1
2
3
4
5
15分钟对点练
6
7
[易错分析] 由于将频率分布直方图的纵坐标误认为是频率而致误.
1
2
3
4
5
15分钟对点练
6
7
30分钟综合练
一、选择题
1.已知样本:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,12.那么频率为0.3的范围是( )
A.5.5~7.5 B.7.5~9.5
C.9.5~11.5 D.11.5~13.5
解析 样本容量为20.样本数据在5.5~7.5范围内的有2个,频率为0.1;在7.5~9.5范围内的有6个,频率为0.3;在9.5~11.5范围内的有7个,频率为0.35;在11.5~13.5范围内的有5个,频率为0.25.
1
2
3
4
5
6
7
8
9
10
30分钟综合练
2.某班学生在一次数学考试中各分数段以及人数的成绩分布为:[0,80),2人;[80,90),6人;[90,100),4人;[100,110),8人;[110,120),12人;[120,130),5人;[130,140),6人;[140,150],2人.那么分数在[100,130)中的频数以及频率分别为( )
A.25,0.56 B.20,0.56
C.25,0.50 D.13,0.29
1
2
3
4
5
6
7
8
9
10
30分钟综合练
3.从某小区抽取100户居民进行月用电量调查,为制定阶梯电价提供数据,发现其月用电量都在50到350度之间,制作频率分布直方图(如图所示)的工作人员粗心大意,位置t处未标明数据,则t=( )
A.0.0041
B.0.0042
C.0.0043
D.0.0044
解析 由题意得50×(0.006+t+0.0036+0.0024×2+0.0012)=1,故t=0.0044.故选D.
1
2
3
4
5
6
7
8
9
10
30分钟综合练
1
2
3
4
5
6
7
8
9
10
30分钟综合练
A.样本数据分布在[6,10)内的频率为0.32
B.样本数据分布在[10,14)内的频数为40
C.样本数据分布在[2,10)内的频数为40
D.估计总体数据大约有10%分布在[10,14)内
5.[多选]容量为100的样本,其数据分布在[2,18]内,将样本数据分为4组:[2,6),[6,10),[10,14),[14,18],得到频率分布直方图如图所示,则下列说法中正确的是( )
1
2
3
4
5
6
7
8
9
10
30分钟综合练
解析 样本数据分布在[6,10)内的频率为0.08×4=0.32,样本数据分布在[10,14)内的频数为100×0.1×4=40,样本数据分布在[2,10)内的频数为100×(0.02+0.08)×4=40,估计总体数据分布在[10,14)内的比例为0.1×4=0.4=40%.故选ABC.
1
2
3
4
5
6
7
8
9
10
30分钟综合练
二、填空题
6.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.
9
1
2
3
4
5
6
7
8
9
10
30分钟综合练
1
2
3
4
5
6
7
8
9
10
30分钟综合练
7.为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱,他们的捐款数(单位:元)如下:19,20,25,30,24,23,25,29,27, 27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心,制图时先计算最大值与最小值的差是________,若取组距为2,则应分成________组;若第一组的起点定为18.5,则在[26.5,28.5)内的频数为________.
11
6
5
1
2
3
4
5
6
7
8
9
10
30分钟综合练
8.某市共有5000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如图频率分布表:
根据右面的频率分布表,可知①处的数值为________,②处的数值为________.
成绩分组 频数 频率
[80,90) ① ②
[90,100) 0.050
[100,110) 0.200
[110,120) 36 0.300
[120,130) 0.275
[130,140) 12 ③
[140,150] 0.050
合计 ④
3
0.025
1
2
3
4
5
6
7
8
9
10
30分钟综合练
成绩分组 频数 频率
[80,90) ① ②
[90,100) 0.050
[100,110) 0.200
[110,120) 36 0.300
[120,130) 0.275
[130,140) 12 ③
[140,150] 0.050
合计 ④
1
2
3
4
5
6
7
8
9
10
30分钟综合练
三、解答题
9.某校100名学生期中考试语文成绩的频率分布
直方图如图所示,其中成绩分组区间是[50,60),[60,
70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)若这100名学生的语文成绩在某些分数段的人
数x与数学成绩在相应分数段的人数y之比如下表所示,求数学成绩在[50,90)之外的人数.
成绩分组 [50,60) [60,70) [70,80) [80,90)
x∶y 1∶1 2∶1 3∶4 4∶5
1
2
3
4
5
6
7
8
9
10
30分钟综合练
1
2
3
4
5
6
7
8
9
10
30分钟综合练
10.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月
均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水
量不超过标准x(吨),估计x的值,并说明理由.
1
2
3
4
5
6
7
8
9
10
30分钟综合练
解 (1)由频率分布直方图知,月均用水量
在[0,0.5)中的频率为0.08×0.5=0.04,同理,在
[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)
中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由
0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+
0.04+0.02=1,解得a=0.30.
(2)由(1)可知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.
1
2
3
4
5
6
7
8
9
10
30分钟综合练
(3)因为前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,所以2.5≤x<3.由0.3×(x-2.5)=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
1
2
3
4
5
6
7
8
9
10
30分钟综合练
R
解析 频率表示频数与总数的比值,在本题中数据落在8.5~11.5内的频数为10,样本数据总数为20,所以这组样本数据落在8.5~11.5内的频率是eq \f(10,20)=0.5.故选B.
解 (1)频率分布表如下:
污染指数分组
频数
频率
[41,51)
2
eq \f(2,30)
[51,61)
1
eq \f(1,30)
[61,71)
4
eq \f(4,30)
[71,81)
6
eq \f(6,30)
[81,91)
10
eq \f(10,30)
[91,101)
5
eq \f(5,30)
[101,111]
2
eq \f(2,30)
(2)频率分布直方图及频率折线图如图所示.
(3)答对下述两条中的一条即可:
①该市一个月中空气污染指数有2天处于优的水平,占当月天数的eq \f(1,15);有26天处于良的水平,占当月天数的eq \f(13,15).所以处于优或良的天数为28,占当月天数的eq \f(14,15).说明该市空气质量基本良好.
②轻度污染有2天,占当月天数的eq \f(1,15);污染指数在80以上100以下的接近轻度污染的天数为15,加上处于轻度污染的天数2,占当月天数的eq \f(17,30),超过50%.说明该市空气质量有待进一步改善.
解析 产品净重小于100克的频率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n,则eq \f(36,n)=0.300,所以n=120,净重大于或等于98克并且小于104克的产品的个数是120×(0.100+0.150+0.125)×2=90.
正解 由题图可知,第五组的频率为
0.5×0.3=0.15,
所以第一组的频率为0.15×eq \f(5,6)=0.125.
所以该市6万名高一学生中视力在
[3.95,4.25)范围内的学生约有
60000×0.125=7500(人).
解析 由[100,130)中的人数为8+12+5=25,得频数为25,频率为eq \f(25,45)≈0.56.
4.在样本的频率分布直方图中,一共有n(n∈Z,n≥4)个小矩形,第4个小矩形的面积等于其余(n-1)个小矩形面积和的eq \f(3,7),且样本容量为100,则第4组的频数是( )
A.30
B.25
C.20
D.15
解析 设第4个小矩形对应的频率为x,则其余(n-1)个小矩形对应的频率和为1-x,∴x=eq \f(3,7)(1-x),解得x=0.3,∴第4组的频数是100×0.3=30.故选A.
解析 由频率分布直方图可知,平均气温低于22.5 ℃的频率为1×(0.12+0.10)=0.22,不低于25.5 ℃的频率为1×0.18=0.18,故样本中平均气温不低于25.5 ℃的城市个数为eq \f(11,0.22)×0.18=9.
解析 由题意知,极差为30-19=11.由于组距为2,eq \f(11,2)=5.5不是整数,所以取6组.捐款数落在[26.5,28.5)内的有27,27,28,28,27,共5个,因此频数为5.
解析 设样本容量为n,由位于[110,120)的频数为36,频率为0.300,得eq \f(36,n)=0.300,解得n=120,所以[130,140)的频率为eq \f(12,120)=0.1,②处的数值为1-0.050-0.200-0.300-0.275-0.1-0.050=0.025;①处的数值为0.025×120=3.
解 (1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得a=0.005.
(2)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×1 00=30,0.02×10× 100=20.
成绩分组
[50,60)
[60,70)
[70,80)
[80,90)
x∶y
1∶1
2∶1
3∶4
4∶5
由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×eq \f(1,2)=20,30×eq \f(4,3)=40,20×eq \f(5,4)=25.
故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.
$$