内容正文:
专题11 统计
【清单01】分层随机抽样
1、分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
2、分层随机抽样的平均数计算
在分层随机抽样中,以层数是2为例,如果第1层和第2层包含的个体数分别为和,抽取的样本量分别为和,第1层和第2层的样本平均数分别为,,样本平均数位,则.我们可以采用样本平均数估计总体平均数
【清单02】样本的数字特征
1、众数、中位数、平均数
(1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
(2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
(3)平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:.
2、标准差和方差
(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.
(2)方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
(3)数据特征
标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
【清单03】频率分布直方图
1、频率、频数、样本容量的计算方法
①×组距=频率.
②=频率,=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于 .
2、频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.
【清单04】百分位数
1、定义
一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
2、计算一组个数据的的第百分位数的步骤
(1)按从小到大排列原始数据.
(2)计算.
(3)若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
3、四分位数
我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
【考点题型一】获取数据的途径
【例1】.从某市参加升学考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是( )
A.该市参加升学考试的全体学生是总体
B.1000名学生的数学成绩是样本
C.1000名学生是样本容量
D.1000名学生中的每一名学生是个体
【答案】B
【详解】该市参加升学考试的全体学生的数学成绩是总体,故A不正确;
1000名学生的数学成绩是样本是正确;
1000是样本容量,故C不正确;
1000名学生中的每一名学生的数学成绩是个体,故D不正确.
故选:B
【变式1-1】.在以下调查中,适合用普查的是( )
A.调查一批小包装饼干的卫生是否达标
B.调查一批袋装牛奶的质量
C.调查一个班级的学生每天完成家庭作业所需要的时间
D.调查一批绳索的抗拉强度是否达到要求
【答案】C
【详解】普查适用总体数量较少以及破坏性不大的情况,显然A、B、D的调查对象不适用,
对于C,一个班级的学生人数相对较少,适用普查方式.
故选:C
【变式1-2】.为了了解参加中考的50000名学生的视力情况,抽查了1000名学生的视力进行统计分析.下列四个判断中正确的是( ).
A.50000名学生是总体
B.1000名学生的视力是总体的一个样本
C.每名学生是总体的一个个体
D.上述调查是普查
【答案】B
【详解】选项A:50000名学生的视力值是总体.判断错误;
选项B:1000名学生的视力是总体的一个样本.判断正确;
选项C:每名学生的视力值是总体的一个个体.判断错误;
选项D:普查是对全体对象逐一进行调查了解,上述调查不是普查,是抽查.判断错误.
故选:B
【变式1-3】.下列调查适合作普查的是( ).
A.了解大学生的主要工作方向
B.了解市民对废电池的处理情况
C.日光灯管厂要检测一批灯管的使用寿命
D.对与新冠检测阳性者同一车厢的乘客进行医学检查
【答案】D
【详解】了解在校大学生的主要娱乐方式,调查范围广,适合抽样调查,故A不符合题意;
了解某市居民对废电池的处理情况,普查的意义不大,故B不符合题意;
日光灯管厂要检测一批灯管的使用寿命,具有破坏性,适合抽样调查,故C不符合题意;
对与新冠检测阳性者同一车厢的乘客进行医学检查,要求精确度高,适合普查,故D符合题意;
故选:D.
【变式1-4】.(多选)下列调查中,适宜采用抽样调查的是( )
A.调查某市小学生每天的运动时间
B.某公司初步发现一位职员患有甲肝,对此公司职员进行检查
C.农业科技人员调查某块地今年麦穗的单穗平均质量
D.调查某快餐店中全部8位店员的生活质量情况
【答案】AC
【详解】A.调查某市小学生每天的运动时间的工作量很大,抽样调查;
B.某公司初步发现一位职员患有甲肝,甲肝具有传染性,危害大,对此公司职员进行检查适合普查的方式;
C.农业科技人员调查某块地今年麦穗的单穗平均质量适合采用抽样调查;
D.调查某快餐店中全部8位店员的生活质量情况适合普查的方式;
故选:AC.
【考点题型二】随机简单抽样
【例2】.(1)随着老龄化时代的到来,某社区为了探讨社区养老模式,在社区内对2400名老年人、2400名中年人、2100名青年人用分层抽样方法随机发放了调查问卷345份,则在老年人中发放的调查问卷份数是( )
A.110 B.115 C.120 D.125
【答案】C
【详解】设在老年人中发放的调查问卷份数为x,
则,
解得.
所以在老年人中发放的调查问卷份数是.
故选:C.
(2).高一某班有30位同学,他们依次编号为01,02,…,29,30,现利用下面的随机数表选取6位同学组建“文明校园督查组”.选取方法是从随机数表第1行第5列的数字开始,由左到右依次选取两个数字,则选出来的第6位同学的编号为( )
41792 71635 86089 32157 95620 92109 29145
74955 82835 98378 83513 47870 20799 32122
A.29 B.21 C.14 D.09
【答案】A
【详解】从随机数表第1行第5列的数字开始,由左到右依次选取两个数字分别为
27,16,35(舍去),86(舍去),08,93(舍去),21,57(舍去),
95(舍去),62(舍去),09,21(舍去),09(舍去),29.
故最终取得的第6个数字为29.
故选:A
【变式2-1】.①某班数学期中考试有14人在120分以上,35人在90~119分,7人不及格,现从中抽出8人研讨进一步改进教与学;②高一某班级春节聚会,要产生两位“幸运者”.上述两件事,合适的抽样方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,分层抽样
C.简单随机抽样,简单随机抽样 D.分层抽样,分层抽样
【答案】A
【详解】①由于学生的成绩是差异比较大的几部分,应用分层抽样.②由于总体与样本容量较小,应用简单随机抽样.
故选:A
【变式2-2】.为了解学生们的视力状况,某学校决定采用分层抽样的方法,从高一、高二、高三三个年级共抽取100人进行调查. 已知高三年级有200人,高二年级有240人,高一年级有360人,则高三年级抽取的人数为( )
A.20 B.25 C.30 D.45
【答案】B
【详解】依题意,高三年级抽取的人数为.
故选:B
【变式2-3】.某校高三年级有810名学生,其中男生有450名,女生有360名,按比例分层随机抽样的方法抽取一个容量为72的样本,则抽取男生和女生的人数分别为( )
A.40,32 B.42,30 C.44,28 D.46,26
【答案】A
【详解】根据分层抽样原理知,,,
所以抽取男生40人,女生32人.
故选:A.
【变式2-4】.某实验室的笼子中有40只小白鼠,将其进行编号,分别为00,01,02,…,39,现从中抽取一个容量为10的样本进行试验,选取方法是从下面的随机数表的第1行第15列和第16列数字开始由左向右依次选取2个数字,直到取足样本,则抽取样本的第6个号码为( )
90 84 60 79 80 24 36 59 87 38 82 07 53 89 35 96 35 23 79 18 05 98 90
07 35 46 40 62 98 80 54 97 20 56 95 15 74 80 08 32 16 46 70 50 80 67
A.05 B.40 C.35 D.23
【答案】A
【详解】重复的号码只能算作一个,抽取样本的号码是38,07,35,23,18,05,20,15,08,32,
所以抽取样本的第6个号码为05.
故选:A.
【考点题型三】不用样本估计总体分布
【例3】.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:,并整理得到如下频率分布直方图.
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
【答案】(1)0.4 (2)20 (3)
【详解】(1)根据频率分布直方图可知,样本中分数不小于70的频率为,
所以样本中分数小于70的频率为,所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.
(2)根据题意,样本中分数不小于50的频率为,
分数在区间内的人数为,
所以总体中分数在区间内的人数估计为.
(3)由题意可知,样本中分数不小于70的学生人数为,
所以样本中分数不小于70的男生人数为,
所以样本中的男生人数为,女生人数为,
所以样本中男生和女生人数的比例为,所以根据分层抽样原理,估计总体中男生和女生人数的比例为.
【变式3-1】.小王为了了解现在人们的网购途径,随机对1000名市民进行走访调查,统计结果如图所示,下列表述错误的是( )
A.
B.这1000名市民中,不在淘宝网购物的人数为545人
C.这1000名市民中,通过其他方式购物的人数超过100人
D.这1000名市民中,在京东商城购物的人数比在唯品会购物的人数多165人
【答案】C
【详解】对于A选项:,,A正确;
B选项中,由扇形统计图可得不在淘宝网购物的市民的频率为1
所以这1000名市民中,不在淘宝网购物的人数为(人),B正确;
C选项中,∵,∴通过其他方式购物的市民的频率为,
∴通过其他方式购物的市民的人数为(人),
∵,所以C错误;
D选项中,这1000名市民中,在京东商城购物的人数为(人),
这1000名市民中,在唯品会购物的人数为(人)
所以这1000名市民中,在京东商城购物的人数比在唯品会购物的人数多, D正确.
故选:C.
【变式3-2】.年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前名学生分布的饼状图(如图)和前名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩前名的人中,高一人数比高二人数多30人
B.成绩第1-名的人中,高一人数不超过一半
C.成绩第1-50名的50人中,高三最多有32人
D.成绩第51-名的50人中,高二人数比高一的多
【答案】D
【详解】由饼状图,成绩前名的人中,高一人数比高二人数多
(人).故选项A判断正确;
由条形图知,成绩第1-100名的人中,前和后人数相等,
因此高一人数为,故选项B判断正确;
成绩第1-50名的50人中,高一人数为,
因此高三最多有32人. 故选项C判断正确;
成绩第51-名的50人中,高二人数无法确定,故选项D判断错误.
故选:D
【变式3-3】.某校高三共有200人参加体育测试,根据规则,82分以上的考生成绩等级为,则估计获得的考生人数约为( )
A.100 B.75 C.50 D.25
【答案】C
【详解】由频率分布直方图可得82分以上的考生的频率约为,
所以获得的考生人数约为人,
故选:C.
【变式3-4】.某校名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是: ,,,,.
(1).求图中的值;
(2).根据频率分布直方图,估计这名学生语文成绩的平均分;
(3).若这名学生语文成绩某些分数段的人数()与数学成绩相应分数段的人数()之比如下表所示,求数学成绩在之外的人数.
分数段
【答案】(1)
(2)分
(3)
【详解】(1)依题意得:,解得:.
(2)用每组中间的数据作为该组的平均数估计这100名学生语文成绩的平均分为:
(分)
(3)数学成绩在的人数为:,
数学成绩在的人数为:,
数学成绩在的人数为:,
数学成绩在的人数为:
数学成绩在的人数为:.
【考点题型四】用样本估计总体数字特征
【例4】.在学校举办的教师优质课评比比赛中,八位评委打出八个完全不同的分数后,去掉一个最高分,去掉一个最低分,再用剩余的六个分数计算平均数,作为讲课教师的最后得分.那么剩余的六个分数与最初的八个分数相比较,一定不变的数字特征是( )
A.平均数 B.方差 C.极差 D.中位数
【答案】D
【详解】一共8个数据,从小到大排列后分别为,
则为中位数,
去掉最高分和最低分后为一共有6个数据,
则中位数仍然为,故中位数一定不变;
其余数据可能改变,不妨设8个分数为,
平均数为,
极差为,
方差为,
去掉最高分10和最低分3后,
平均数为,
极差为,
方差为,
所以平均值,极差和方差均发生变化.
故选:D.
【变式4-1】.2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是( )
A.该组数据的第60百分位数为7.5 B.该组数据的极差为5
C.该组数据的平均数为7.5 D.该组数据的中位数为7
【答案】C
【详解】A选项:,因此该组数据的第60百分位数为,故A正确;
B选项:该组数据最大为9,最小为4,因此极差为,故B正确;
C选项:该组数据的平均数为,故C错误;
D选项:该组数据的中位数为第五个和第六个数据的平均值7,故D正确,
故选:C.
【变式4-2】.2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是( )
A.该组数据的第60百分位数为7.5 B.该组数据的极差为5
C.该组数据的平均数为7.5 D.该组数据的中位数为7
【答案】C
【详解】A选项:,因此该组数据的第60百分位数为,故A正确;
B选项:该组数据最大为9,最小为4,因此极差为,故B正确;
C选项:该组数据的平均数为,故C错误;
D选项:该组数据的中位数为第五个和第六个数据的平均值7,故D正确,
故选:C.
【变式4-3】.已知样本数据为:,,,,,,,,,. 去掉一个最大值和一个最小值后的数据与原来的数据相比,下列数字特征的值一定不变的是( )
A.平均数 B.众数 C.极差 D.中位数
【答案】D
【详解】样本数据为,,,,,,,,,,
去掉一个最大值和一个最小值后的数据与原来的数据相比,假设从小到大就是从到,极差和众数可能变化,故BC错;
平均数为,可能变,故A错;
中位数还是按从小到大排序中间两个数的平均数,即,故D正确;
故选:D.
【变式4-4】.若样本的平均数为10,方差为20,则样本的平均数和方差分别为( )
A.20,35 B.20,40 C.15,75 D.15,80
【答案】D
【详解】由题得样本,的平均数为,方差为.
故选:D
【变式4-5】.下表是某地区2024年3月1日至10日每天中午12时的气温统计表,则下列关于这10天中气温的说法错误的是( )
日期
1
2
3
4
5
6
7
8
9
10
气温(℃)
2
10
18
20
16
12
6
2
6
12
A.众数为2和6和12 B.70%分位数为16
C.平均数小于中位数 D.极差为18
【答案】B
【详解】对于A:由气温统计表可得众数为2和6和12,故A正确;
对于B:把气温由小到大排为2,2,6,6,10,12,12,16,18,20,
由,故70%分位数为,故B错误;
对于C:平均数为,
中位数为,所以平均数小于中位数,故C正确;
对于D:极差为,故D正确.
故选:B.
【变式4-6】.数据1,2,3,4,5,6,7,8,9,10的第75百分位数为( )
A.7 B.7.5 C.8 D.8.5
【答案】C
【详解】易知,则该组数据的第八个数8为第75百分位数.
故选:C
【考点题型五】频率分布直方图数字特征
【例5】.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),,[90,100]得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第75百分位数;
(2)求样本成绩的众数,中位数和平均数;
(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
【答案】(1),第75百分位数为84;
(2)众数为75,中位数为75,平均数为74;
(3)平均数为62,方差为37.
【详解】(1)由每组小矩形的面积之和为1,得,解得,
成绩在内的频率为,在内的频率为,
显然第75百分位数,由,解得,
所以第75百分位数为84.
(2)由,得样本成绩的众数为75,
成绩落在[40,70)内的频率为,
成绩落在内的频率为,
故中位数在[70,80)内,由,得样本成绩的中位数为75,
由.
得样本成绩的平均数为74.
(3)由频率分布直方图知,成绩在的市民人数为,成绩在的市民人数为,
所以,
总方差为.
【变式5-1】.某校组织50名学生参加庆祝中华人民共和国成立75周年知识竞赛,经统计这50名学生的成绩都在区间内,按分数分成5组:,得到如图所示的频率分布直方图(不完整),根据图中数据,下列结论错误的是( )
A.成绩在上的人数最少
B.成绩不低于80分的学生所占比例为
C.50名学生成绩的极差为50
D.50名学生成绩的平均分小于中位数
【答案】C
【详解】设这一组的频率为,则由各组频率之和为1,
得,解得,
各组频率依次为:,
对于A,这一组频率最小,即成绩在上的人数最少,A正确;
对于B,成绩不低于80分的学生频率为,成绩不低于80分的学生所占比例为,B正确;
对于C,极差为数据中最大值与最小值的差,而50名学生的成绩都在区间内,
但成绩的最大值不一定是100,最小值也不一定是,则极差小于等于,但不一定等于50,C错误;
对于D,根据频率分布直方图,得50名学生成绩的平均数是
,而50名学生成绩的中位数为80,
因此50名学生成绩的平均分小于中位数,D正确.
故选:C
【变式5-2】.为了了解某小区2000户居民月用水量使用情况,通过随机抽样获得了100户居民的月用水量.下图是调查结果的频率分布直方图.
(1)根据频率直方图估计某小区2000户居民月用水量使用大于3的户数;
(2)利用频率分布直方图估计该样本的众数和中位数(保留到0.01).
【答案】(1)200 (2)2.25;2.02
【详解】(1)某小区2000户居民月用水量使用大于3的户数为.
(2)由题可知,众数,
因为,
中位数.
【变式5-3】.从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生的平均成绩.
【答案】(1)众数75,中位数. (2)76.2
【详解】(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,
所以众数应为.
由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,
即频率也相等,从而就是小矩形的面积和相等.
因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.
因为,
所以前三个小矩形面积的和为0.3.而第四个小矩形面积为,,
所以中位数应位于第四个小矩形内.
设中位数为x,,
解得,
故中位数应约为.
(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,
取每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.
所以平均成绩为
.
【变式5-4】.2024年10月13日,成都市将举办马拉松比赛,其中志愿者的服务工作是马拉松成功举办的重要保障.成都市文体广电旅游局承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.
(1)求a的值;
(2)估计这100名候选者面试成绩的平均数和第百分位数;
(3)现从以上各组中用分层随机抽样的方法选取人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为和,第四组面试者的面试成绩的平均数和方差分别为和,请据此估计这次第二组和第四组所有面试者的面试成绩的方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:,记两组数据总体的样本平均数为,则总体样本方差)
【答案】(1)
(2),
(3)
【详解】(1)由图得,
解之可得;
(2)根据题意知,
,,
设第百分位数为,所以,
,解之可得,
故这名候选者面试成绩的平均数为,第80百分位数为.
(3)设第二组、第四组所有面试者的面试成绩的平均数、方差分别为,
且两组的频率之比为,
则第二组和第四组所有面试者的面试成绩的平均数为,
第二组和第四组所有面试者的面试成绩的方差为
,
则第二组和第四组所有面试者的面试成绩的方差为.
【变式5-5】.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)求样本成绩的第75百分位数;
(3)已知落在的平均成绩是56,方差是7,落在的平均成绩为65,方差是4,求两组成绩的总平均数和总方差
【答案】(1)0.030
(2)84
(3)总平均数是62,总方差是23.
【详解】(1)每组小矩形的面积之和为1,
,
;
(2)成绩落在内的频率为,
落在内的频率为,
设第75百分位数为m,
由,
得,故第75百分位数为84;
(3)由频率分布直方图知,成绩在的市民人数为,
成绩在的市民人数为,所以;
由样本方差计算总体方差公式,得总方差为
1.已知甲组数据由这个数据构成,记这组数据的平均数为,方差为;乙组数据由,这数据构成,记这组数据的平均数为,方差为,则( )
A., B.,
C., D.,
【答案】D
【详解】由已知可得,
,
,
,
所以ABC错误,D正确.
故选:D.
2.(多选)下列抽样实验中,不适宜用抽签法的是( )
A.从某场生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检测
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检测
【答案】ACD
【详解】A、D中个体的总数较大,不适合用抽签法;
C中甲、乙两厂生产的两箱产品质量可能差别较大,不适合用抽签法;
B中个体的总数和样本容量均较小,且是同厂生产的两箱产品,质量差别不大,适宜用抽签法.
故选:ACD.
3.(多选)某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如图所示的统计图,以下四个选项中,说法正确的有( )
A.54周岁以上客户人数最多 B.18-29周岁客户参保总费用最少
C.丁险种更受客户青睐 D.30周岁以上的客户约占参保客户的80%
【答案】CD
【详解】对于A,由参保人数的扇形统计图可知,54周岁以上客户占8%,人数最少,所以A错误,
对于B,由于统计图显示的人均参保费用,人数未知,所以不能确定总费用,所以B错误,
对于C,从参保险种比例图可知,丁险种参保比例最高,所以丁险种更受客户青睐,所以C正确,
对于D,因为18-29周岁客户约占20%,所以30周岁以上的客户约占参保客户的80%,所以D正确,
故选:CD
4.(多选)某班有50名学生,某次数学考试的成绩经计算得到的平均分数为80分,标准差为s,后来发现记录有误,甲同学得90分误记为60分,乙同学得70分误记为100分,更正后重新计算得到的平均分数为,标准差为,则下列说法正确的是( )
A. B. C. D.
【答案】AD
【详解】设更正前甲,乙,的成绩依次为,则,
即,可得,
则更正后的平均分为,
可得,所以更改前后的平均数不变,所以A正确,B错误;
由更改前的方差为,
即,
可得,
更改后的数据方差为,
可知,所以,故C错误,D正确;
故选:AD.
5.(多选)若数据的平均数为2,方差为3,则( )
A.数据,,,的平均数为20 B.
C.数据,,,的标准差为 D.
【答案】BCD
【详解】对于A,由平均数公式,得数据,,…,的平均数为,A错误;
对于B,,B正确;
对于C,由方差公式,得数据,,…,的方差为,标准差为,C正确;
对于D,由,
得,即,
所以,D正确.
故选:BCD
6.,两班共100人,现采取分层随机抽样的方法抽取10人的样本进行问卷调查,若样本中有4人来自班,则班的人数为 .
【答案】人
【详解】由分层抽样的概念及计算方法,可得(人).
故答案为:
7.福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为 .
【答案】05
【详解】解:由题意,选取方法是从随机数表第1行的第6列和第7列数字开始,由左到右依次选取两个数字中小于34的编号为:21,32,05,16,
故第3个个体的编号为05.
故答案为:05.
8.数据:7.2,8.3,8.5,8.5,8.7,8.8,9.0,9.2的第40百分位数是 .
【答案】8.5
【详解】因为,故这组数据的第百分位数是.
故答案为:.
9.一组数据:12,8,6,15,12,10,8,17,20,12的分位数是 .
【答案】
【详解】将这组数据从小到大排列:6,8,8,10,12,12,12,15,17,20,共10个数据,
可得,所以这组数据的80%分位数是.
故答案为:.
10.某企业共有3200名职工,其中,中年、青年、老年职工的比例为5:3:2,从所有职工中抽取一个样本容量为400的样本.
(1)应采用哪种抽样方法更合理?
(2)中年、青年、老年职工应分别抽取多少人?
【答案】(1)分层抽样,理由见解析;
(2)抽取的中年、青年、老年职工分别为200人,120人,80人.
【详解】(1)因为中、青、老年职工有明显的差异,故采用分层抽样更合理;
(2)按照比例抽取中、青、老年职工的人数分别为,
,,
因此应抽取的中年、青年、老年职工分别为200人,120人,80人.
11.“疫苗犹豫”,即尽管疫苗可及,却迟迟未接种或拒绝接种疫苗的现象.成人接种新冠疫苗的犹豫,主要原因是对感染新冠肺炎的风险缺乏了解,心存侥幸,认为即使不接种也未必会感染,对感染的后果也认识不足.现从某小区未接种的人群中随机选出100人,并将这100人按年龄分组:第1组,第2组,第3组,第4组,第5组,得到的频率分布直方图如图所示.
(1)求出样本的平均数(同一组数据用该区间的中点值作代表)和中位数(精确到小数点后一位);
(2)现先从第1,2组中用分层抽样的方法抽取5人,再从这5人中随机抽取3人进行问卷调查,求第2组中抽到2人的概率.
【答案】(1)平均数为44.5;中位数为45.1 (2)
【详解】(1)由,得.
平均数为:,
设中位数为,则,
得.
(2)第1,2组的人数分别为人,人,
从第1,2组中用分层抽样的方法抽取5人,则第1,2组抽取的人数分别为2人,3人,分别记为
设从5人中随机抽取3人,为:
,,,,,,,,,,
共10个基本事件,
第2组中抽到2人的情况有,,,,,,共6种情况,从而第2组中抽到2人的概率.
12.为了了解某工厂生产的产品情况,从该工厂生产的产品随机抽取了一个容量为20的样本,测量它们的尺寸(单位:),数据分为,,,,,,七组,其频率分布直方图如图所示.
(1)求上图中的值;
(2)根据频率分布直方图,求200件样本尺寸在内的样本数;
(3)记产品尺寸在内为等品,每件可获利5元;产品尺寸在内为不合格品,每件亏损2元;其余的为合格品,每件可获利3元.若该机器一个月共生产3000件产品.以样本的频率代替总体在各组的频率,若单月利润未能达到11000元,则需要对该工厂设备实施升级改造.试判断是否需要对该工厂设备实施升级改造.
【答案】(1);
(2)(件);
(3)需要对该工厂设备实施升级改造.
【详解】(1)因为,
解得;
(2)200件样本中尺寸在内的样本数为(件)
(3)由题意可得,这批产品中优等品有(件),
这批产品中不合格品有件,
这批产品中合格品有(件),
元.
所以该工厂生产的产品一个月所获得的利润为10680元,
因为,
所以需要对该工厂设备实施升级改造.
13.山西运城王过酥梨是国家农产品地理标志保护产品,王过酥梨含有多种对人体有益的钙、铁、磷等微量营养元素,食后清火润肺,止咳化痰,能起到祛病养生之效,一致被人们作为逢年过节走亲访友,馈赠待客及日常生活的必备佳品.某水果批发商小李从事酥梨批发多年,他把去年年底客户采购酥梨在内的数量x(单位:箱)绘制成下表:
采购数x(单位:箱)
客户数
5
10
15
15
5
(1)根据表中的数据,补充完整这些数据的频率分布直方图,并估计采购数在168箱以上(含168箱)的客户数;
(2)若去年年底采购在内的酥梨数量约占小李去年年底酥梨总销售量的,估算小李去年年底总销售量(同一组中的数据用该组区间的中点值作代表);
(3)在(2)的条件下,由于酥梨受到人们的青睐,小李做了一份市场调查以决定今年年底是否在网上出售酥梨,若没有在网上出售酥梨,则按去年的价格出售,每箱利润为14元,预计销售量与去年持平;若计划在网上出售酥梨,则需把每箱售价下调1至5元(网上、网下均下调),且每下调m元销售量可增加箱,试预计小李在今年年底销售酥梨总利润Y(单位:元)的最大值.
【答案】(1)见解析
(2)(箱)
(3)(元)
【详解】(1)对应的频率分别为,则对应的频率/组距为,故这些数据的频率分布直方图如下图所示:
由直方图可知,采购数在168箱以上(含168箱)的客户数为(人)
(2)由题意可知,去年年底客户采购酥梨在内的数量为(箱)
则小李去年年底总销售量为(箱)
(3)由题意可得
当时,(元)
14.某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h),可以把这批电子元件分成第一组,第二组,第三组,第四组,第五组,第六组.由于工作中不慎将部分数据丢失,现有以下部分图表:
使用
寿命
频数
30
20
频率
0.2
0.4
(1)求图2中A的值;
(2)补全图2频率分布直方图,并求图2中阴影部分的面积;
(3)为了某次展销会,用分层抽样的方法在寿命位于内的产品中抽取5个作为样本,那么在内应抽取多少个?
【答案】(1)
(2)频率分布直方图答案见解析,阴影部分的面积为
(3)
【详解】(1)由题意可知,所以.
(2)
使用
寿命
频数
20
30
40
80
20
10
频率
0.1
0.15
0.2
0.4
0.1
0.05
补全后的频率分布直方图如图所示,
阴影部分的面积为.
(3)由分层抽样的性质,知在内应抽取.
15.东风家具店为了解顾客购买额度(单位:元)情况,调查了10000名顾客,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示购买额度在内.
(1)为了分析顾客购买额度与年龄的关系,按购买额度从这10000人中用分层随机抽样的方法抽出100人作进一步分析,则购买额度在内的应抽取多少名?
(2)根据频率分布直方图估计样本数据的平均数(同一组中的数据用该组区间的中点值作代表).
【答案】(1)25
(2)3900
【详解】(1)因为,所以.
又0.25,所以购买额度在内的频率为0.25,所以100人中购买额度在内的人数为0..
(2)样本平均数为
.
16.对某校高一学生参加志愿服务次数进行统计,随机抽取名学生作为样本,得到这名学生参加志愿服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图.
分组
频数
频率
15
0.3
25
4
0.08
合计
1
(1)请补全表格,并求出图中的值;
(2)若该校高一年级学生有400人,试估计该校高一年级学生参加志愿服务的次数在区间上的人数;
(3)试估计该校高一年级学生参加志愿服务次数的中位数和平均数(每组次数用中间值代替).
【答案】(1)表格见解析,
(2)
(3)中位数是,平均数为;
【详解】(1),,
则,,表格如下:
分组
频数
频率
15
25
0.5
6
0.12
4
合计
50
1
故.
(2)因为该校高一年级学生有人,在上的频率是,
所以估计该校高一年级学生参加志愿服务的次数在此区间上的人数为人.
(3)因为且,
所以中位数在区间上,
因为中位数及前面的数的频率之和为,设样本中位数为,
则,解得,
估计该校高一年级学生参加志愿服务次数的中位数是.
平均数,
估计该校高一年级学生参加志愿服务次数的平均数是.
17.某地红心猕猴桃因富含维生素C及K,等多种矿物质和18种氨基酸,被誉为“维C之王”,某收购商为了了解某种植基地的红心猕猴桃品质,从该基地随机摘下100个猕猴桃进行测重,其重量分布在区间内(单位:克),根据样本数据作出频率分布直方图如图所示.
(1)根据频率分布直方图,分别求出样本数据的平均数和分位数;
(2)已知该基地大约还有8000个猕猴桃,该收购商准备收购这批猕猴桃,提出了以下两种收购方案:方案一:所有猕猴桃均以20元每千克收购;方案二:小于90克的猕猴桃以10元每千克收购,不小于90克的猕猴桃以30元每千克收购;请你就这两种方案,通过计算为该猕猴桃基地选择最佳的出售方案.(同一组中的数据用该组区间的中点值代表,视频率为概率)
【答案】(1)平均数为,分位数为
(2)方案二
【详解】(1)依题意可得样本数据的平均数为
;
因为,,
所以分位数位于,设为,则,
解得,
所以平均数为,分位数为;
(2)选择方案一获得收入为(元),
选择方案二获得收入为
(元),
因为,所以选择方案二.
18.某中学名学生参加全市高中数学竞赛,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了名学生,记录他们的分数,将数据分成组:,并整理得到如下频率分布直方图:
(1)根据频率分布直方图求出分数大于的频率与频数;
(2)根据频率分布直方图求样本中分位数;
(3)已知样本中男生与女生的比例是,男生样本的均值为,方差为,女生样本的均值为,方差为,请计算样本的均值与方差.
【答案】(1)0.6;60
(2)
(3)72.5,
【详解】(1)根据频率分布直方图知分数大于70的频率为,
故
(2)落在的频率为,落在的频率为,
故根据频率分布直方图知分位数,在区间上,设其为,
则,解得,
所以样本中分位数是:.
(3)解法一:总样本的均值为,
设男生个体依次为,女生个体依次为,
则,,
,
,
总体样本方差为,
其中
同理,
所以总样本的方差为,
解法二:总样本的均值为,
由可得
故总样本的方差为.
19.2024年5月22日至5月28日是第二届全国城市生活垃圾分类宣传周,本次宣传周的主题为“践行新时尚分类志愿行”.阜阳三中高一年级举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩x(单位:分,得分取正整数,满分为100分)作为样本进行统计将成绩进行整理后,分为五组(,,,,),其中第1组频数的平方等于第2组、第4组频数之积,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题:
(1)求a,b的值;
(2)若根据这次成绩,学校准备淘汰80%的同学,仅留20%的同学进入下一轮竞赛请问晋级分数线划为多少合理?
(3)某老师在此次竞赛成绩中抽取了10名学生的分数:,,,…,,已知这10个分数的平均数,标准差,若剔除其中的95和85这两个分数,求剩余8个分数的平均数与方差.
【答案】(1),
(2)晋级分数线划为78分合理
(3)90;38.75
【详解】(1)由题意知,所以,解得,
又,解得.
所以,,
(2)成绩落在内的频率为:,
落在内的频率为:,
设第80百分位数为m,则,
解得,所以晋级分数线划为78分合理.
(3),故:.
又,,
剔除其中的95和85两个分数,设剩余8个数为,,,…,,
平均数与标准差分别为,,
则剩余8个分数的平均数:;
方差:.
20.为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记为事件:“乙离子残留在体内的百分比不高于”,根据直方图得到的估计值为.
(1)求乙离子残留百分比直方图中的值;
(2)求甲离子残留百分比的第百分位数;
(3)估计乙离子残留百分比的均值.(同一组数据用该组区间的中点值为代表)
【答案】(1),,
(2)
(3)
【详解】(1)由已知得,解得,
所以.
(2)根据直方图,易知甲离子残留百分比的第百分位数在区间,设为,
则,解得,
所以甲离子残留百分比的第百分位数为.
(3)乙离子残留百分比的平均值的估计值为.
原创精品资源学科网独家享有版权,侵权必究!学科网(北京)股份有限公司3
学科网(北京)股份有限公司
$$
专题11 统计
【清单01】分层随机抽样
1、分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
2、分层随机抽样的平均数计算
在分层随机抽样中,以层数是2为例,如果第1层和第2层包含的个体数分别为和,抽取的样本量分别为和,第1层和第2层的样本平均数分别为,,样本平均数位,则.我们可以采用样本平均数估计总体平均数
【清单02】样本的数字特征
1、众数、中位数、平均数
(1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
(2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
(3)平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:.
2、标准差和方差
(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.
(2)方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
(3)数据特征
标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
【清单03】频率分布直方图
1、频率、频数、样本容量的计算方法
①×组距=频率.
②=频率,=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于 .
2、频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.
【清单04】百分位数
1、定义
一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
2、计算一组个数据的的第百分位数的步骤
(1)按从小到大排列原始数据.
(2)计算.
(3)若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
3、四分位数
我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
【考点题型一】获取数据的途径
【例1】.从某市参加升学考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是( )
A.该市参加升学考试的全体学生是总体
B.1000名学生的数学成绩是样本
C.1000名学生是样本容量
D.1000名学生中的每一名学生是个体
【变式1-1】.在以下调查中,适合用普查的是( )
A.调查一批小包装饼干的卫生是否达标
B.调查一批袋装牛奶的质量
C.调查一个班级的学生每天完成家庭作业所需要的时间
D.调查一批绳索的抗拉强度是否达到要求
【变式1-2】.为了了解参加中考的50000名学生的视力情况,抽查了1000名学生的视力进行统计分析.下列四个判断中正确的是( ).
A.50000名学生是总体
B.1000名学生的视力是总体的一个样本
C.每名学生是总体的一个个体
D.上述调查是普查
【变式1-3】.下列调查适合作普查的是( ).
A.了解大学生的主要工作方向
B.了解市民对废电池的处理情况
C.日光灯管厂要检测一批灯管的使用寿命
D.对与新冠检测阳性者同一车厢的乘客进行医学检查
【变式1-4】.(多选)下列调查中,适宜采用抽样调查的是( )
A.调查某市小学生每天的运动时间
B.某公司初步发现一位职员患有甲肝,对此公司职员进行检查
C.农业科技人员调查某块地今年麦穗的单穗平均质量
D.调查某快餐店中全部8位店员的生活质量情况
【考点题型二】随机简单抽样
【例2】.(1)随着老龄化时代的到来,某社区为了探讨社区养老模式,在社区内对2400名老年人、2400名中年人、2100名青年人用分层抽样方法随机发放了调查问卷345份,则在老年人中发放的调查问卷份数是( )
A.110 B.115 C.120 D.125
(2).高一某班有30位同学,他们依次编号为01,02,…,29,30,现利用下面的随机数表选取6位同学组建“文明校园督查组”.选取方法是从随机数表第1行第5列的数字开始,由左到右依次选取两个数字,则选出来的第6位同学的编号为( )
41792 71635 86089 32157 95620 92109 29145
74955 82835 98378 83513 47870 20799 32122
A.29 B.21 C.14 D.09
【变式2-1】.①某班数学期中考试有14人在120分以上,35人在90~119分,7人不及格,现从中抽出8人研讨进一步改进教与学;②高一某班级春节聚会,要产生两位“幸运者”.上述两件事,合适的抽样方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,分层抽样
C.简单随机抽样,简单随机抽样 D.分层抽样,分层抽样
【变式2-2】.为了解学生们的视力状况,某学校决定采用分层抽样的方法,从高一、高二、高三三个年级共抽取100人进行调查. 已知高三年级有200人,高二年级有240人,高一年级有360人,则高三年级抽取的人数为( )
A.20 B.25 C.30 D.45
【变式2-3】.某校高三年级有810名学生,其中男生有450名,女生有360名,按比例分层随机抽样的方法抽取一个容量为72的样本,则抽取男生和女生的人数分别为( )
A.40,32 B.42,30 C.44,28 D.46,26
【变式2-4】.某实验室的笼子中有40只小白鼠,将其进行编号,分别为00,01,02,…,39,现从中抽取一个容量为10的样本进行试验,选取方法是从下面的随机数表的第1行第15列和第16列数字开始由左向右依次选取2个数字,直到取足样本,则抽取样本的第6个号码为( )
90 84 60 79 80 24 36 59 87 38 82 07 53 89 35 96 35 23 79 18 05 98 90
07 35 46 40 62 98 80 54 97 20 56 95 15 74 80 08 32 16 46 70 50 80 67
A.05 B.40 C.35 D.23
【考点题型三】用样本估计总体分布
【例3】.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:,并整理得到如下频率分布直方图.
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
【变式3-1】.小王为了了解现在人们的网购途径,随机对1000名市民进行走访调查,统计结果如图所示,下列表述错误的是( )
A.
B.这1000名市民中,不在淘宝网购物的人数为545人
C.这1000名市民中,通过其他方式购物的人数超过100人
D.这1000名市民中,在京东商城购物的人数比在唯品会购物的人数多165人
【变式3-2】.年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前名学生分布的饼状图(如图)和前名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩前名的人中,高一人数比高二人数多30人
B.成绩第1-名的人中,高一人数不超过一半
C.成绩第1-50名的50人中,高三最多有32人
D.成绩第51-名的50人中,高二人数比高一的多
【变式3-3】.某校高三共有200人参加体育测试,根据规则,82分以上的考生成绩等级为,则估计获得的考生人数约为( )
A.100 B.75 C.50 D.25
【变式3-4】.某校名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是: ,,,,.
(1).求图中的值;
(2).根据频率分布直方图,估计这名学生语文成绩的平均分;
(3).若这名学生语文成绩某些分数段的人数()与数学成绩相应分数段的人数()之比如下表所示,求数学成绩在之外的人数.
分数段
【考点题型四】用样本估计总体数字特征
【例4】.在学校举办的教师优质课评比比赛中,八位评委打出八个完全不同的分数后,去掉一个最高分,去掉一个最低分,再用剩余的六个分数计算平均数,作为讲课教师的最后得分.那么剩余的六个分数与最初的八个分数相比较,一定不变的数字特征是( )
A.平均数 B.方差 C.极差 D.中位数
【变式4-1】.2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是( )
A.该组数据的第60百分位数为7.5 B.该组数据的极差为5
C.该组数据的平均数为7.5 D.该组数据的中位数为7
【变式4-2】.2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是( )
A.该组数据的第60百分位数为7.5 B.该组数据的极差为5
C.该组数据的平均数为7.5 D.该组数据的中位数为7
【变式4-3】.已知样本数据为:,,,,,,,,,. 去掉一个最大值和一个最小值后的数据与原来的数据相比,下列数字特征的值一定不变的是( )
A.平均数 B.众数 C.极差 D.中位数
【变式4-4】.若样本的平均数为10,方差为20,则样本的平均数和方差分别为( )
A.20,35 B.20,40 C.15,75 D.15,80
【变式4-5】.下表是某地区2024年3月1日至10日每天中午12时的气温统计表,则下列关于这10天中气温的说法错误的是( )
日期
1
2
3
4
5
6
7
8
9
10
气温(℃)
2
10
18
20
16
12
6
2
6
12
A.众数为2和6和12 B.70%分位数为16
C.平均数小于中位数 D.极差为18
【变式4-6】.数据1,2,3,4,5,6,7,8,9,10的第75百分位数为( )
A.7 B.7.5 C.8 D.8.5
【考点题型五】频率分布直方图数字特征
【例5】.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),,[90,100]得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第75百分位数;
(2)求样本成绩的众数,中位数和平均数;
(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
【变式5-1】.某校组织50名学生参加庆祝中华人民共和国成立75周年知识竞赛,经统计这50名学生的成绩都在区间内,按分数分成5组:,得到如图所示的频率分布直方图(不完整),根据图中数据,下列结论错误的是( )
A.成绩在上的人数最少
B.成绩不低于80分的学生所占比例为
C.50名学生成绩的极差为50
D.50名学生成绩的平均分小于中位数
【变式5-2】.为了了解某小区2000户居民月用水量使用情况,通过随机抽样获得了100户居民的月用水量.下图是调查结果的频率分布直方图.
(1)根据频率直方图估计某小区2000户居民月用水量使用大于3的户数;
(2)利用频率分布直方图估计该样本的众数和中位数(保留到0.01).
【变式5-3】.从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图.由于一些数据丢失,试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生的平均成绩..
【变式5-4】.2024年10月13日,成都市将举办马拉松比赛,其中志愿者的服务工作是马拉松成功举办的重要保障.成都市文体广电旅游局承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.
(1)求a的值;
(2)估计这100名候选者面试成绩的平均数和第百分位数;
(3)现从以上各组中用分层随机抽样的方法选取人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为和,第四组面试者的面试成绩的平均数和方差分别为和,请据此估计这次第二组和第四组所有面试者的面试成绩的方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:,记两组数据总体的样本平均数为,则总体样本方差)
【变式5-5】.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)求样本成绩的第75百分位数;
(3)已知落在的平均成绩是56,方差是7,落在的平均成绩为65,方差是4,求两组成绩的总平均数和总方差
1.已知甲组数据由这个数据构成,记这组数据的平均数为,方差为;乙组数据由,这数据构成,记这组数据的平均数为,方差为,则( )
A., B.,
C., D.,
2.(多选)下列抽样实验中,不适宜用抽签法的是( )
A.从某场生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检测
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检测
3.(多选)某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如图所示的统计图,以下四个选项中,说法正确的有( )
A.54周岁以上客户人数最多 B.18-29周岁客户参保总费用最少
C.丁险种更受客户青睐 D.30周岁以上的客户约占参保客户的80%
4.(多选)某班有50名学生,某次数学考试的成绩经计算得到的平均分数为80分,标准差为s,后来发现记录有误,甲同学得90分误记为60分,乙同学得70分误记为100分,更正后重新计算得到的平均分数为,标准差为,则下列说法正确的是( )
A. B. C. D.
5.(多选)若数据的平均数为2,方差为3,则( )
A.数据,,,的平均数为20 B.
C.数据,,,的标准差为 D.
6.,两班共100人,现采取分层随机抽样的方法抽取10人的样本进行问卷调查,若样本中有4人来自班,则班的人数为 .
7.福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为 .
8.数据:7.2,8.3,8.5,8.5,8.7,8.8,9.0,9.2的第40百分位数是 .
9.一组数据:12,8,6,15,12,10,8,17,20,12的分位数是 .
10.某企业共有3200名职工,其中,中年、青年、老年职工的比例为5:3:2,从所有职工中抽取一个样本容量为400的样本.
(1)应采用哪种抽样方法更合理?
(2)中年、青年、老年职工应分别抽取多少人?
11.“疫苗犹豫”,即尽管疫苗可及,却迟迟未接种或拒绝接种疫苗的现象.成人接种新冠疫苗的犹豫,主要原因是对感染新冠肺炎的风险缺乏了解,心存侥幸,认为即使不接种也未必会感染,对感染的后果也认识不足.现从某小区未接种的人群中随机选出100人,并将这100人按年龄分组:第1组,第2组,第3组,第4组,第5组,得到的频率分布直方图如图所示.
(1)求出样本的平均数(同一组数据用该区间的中点值作代表)和中位数(精确到小数点后一位);
(2)现先从第1,2组中用分层抽样的方法抽取5人,再从这5人中随机抽取3人进行问卷调查,求第2组中抽到2人的概率.
12.为了了解某工厂生产的产品情况,从该工厂生产的产品随机抽取了一个容量为20的样本,测量它们的尺寸(单位:),数据分为,,,,,,七组,其频率分布直方图如图所示.
(1)求上图中的值;
(2)根据频率分布直方图,求200件样本尺寸在内的样本数;
(3)记产品尺寸在内为等品,每件可获利5元;产品尺寸在内为不合格品,每件亏损2元;其余的为合格品,每件可获利3元.若该机器一个月共生产3000件产品.以样本的频率代替总体在各组的频率,若单月利润未能达到11000元,则需要对该工厂设备实施升级改造.试判断是否需要对该工厂设备实施升级改造.
13.山西运城王过酥梨是国家农产品地理标志保护产品,王过酥梨含有多种对人体有益的钙、铁、磷等微量营养元素,食后清火润肺,止咳化痰,能起到祛病养生之效,一致被人们作为逢年过节走亲访友,馈赠待客及日常生活的必备佳品.某水果批发商小李从事酥梨批发多年,他把去年年底客户采购酥梨在内的数量x(单位:箱)绘制成下表:
采购数x(单位:箱)
客户数
5
10
15
15
5
(1)根据表中的数据,补充完整这些数据的频率分布直方图,并估计采购数在168箱以上(含168箱)的客户数;
(2)若去年年底采购在内的酥梨数量约占小李去年年底酥梨总销售量的,估算小李去年年底总销售量(同一组中的数据用该组区间的中点值作代表);
(3)在(2)的条件下,由于酥梨受到人们的青睐,小李做了一份市场调查以决定今年年底是否在网上出售酥梨,若没有在网上出售酥梨,则按去年的价格出售,每箱利润为14元,预计销售量与去年持平;若计划在网上出售酥梨,则需把每箱售价下调1至5元(网上、网下均下调),且每下调m元销售量可增加箱,试预计小李在今年年底销售酥梨总利润Y(单位:元)的最大值.
14.某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h),可以把这批电子元件分成第一组,第二组,第三组,第四组,第五组,第六组.由于工作中不慎将部分数据丢失,现有以下部分图表:
使用
寿命
频数
30
20
频率
0.2
0.4
(1)求图2中A的值;
(2)补全图2频率分布直方图,并求图2中阴影部分的面积;
(3)为了某次展销会,用分层抽样的方法在寿命位于内的产品中抽取5个作为样本,那么在内应抽取多少个?
15.东风家具店为了解顾客购买额度(单位:元)情况,调查了10000名顾客,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示购买额度在内.
(1)为了分析顾客购买额度与年龄的关系,按购买额度从这10000人中用分层随机抽样的方法抽出100人作进一步分析,则购买额度在内的应抽取多少名?
(2)根据频率分布直方图估计样本数据的平均数(同一组中的数据用该组区间的中点值作代表).
16.对某校高一学生参加志愿服务次数进行统计,随机抽取名学生作为样本,得到这名学生参加志愿服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图.
分组
频数
频率
15
0.3
25
4
0.08
合计
1
(1)请补全表格,并求出图中的值;
(2)若该校高一年级学生有400人,试估计该校高一年级学生参加志愿服务的次数在区间上的人数;
(3)试估计该校高一年级学生参加志愿服务次数的中位数和平均数(每组次数用中间值代替).
17.某地红心猕猴桃因富含维生素C及K,等多种矿物质和18种氨基酸,被誉为“维C之王”,某收购商为了了解某种植基地的红心猕猴桃品质,从该基地随机摘下100个猕猴桃进行测重,其重量分布在区间内(单位:克),根据样本数据作出频率分布直方图如图所示.
(1)根据频率分布直方图,分别求出样本数据的平均数和分位数;
(2)已知该基地大约还有8000个猕猴桃,该收购商准备收购这批猕猴桃,提出了以下两种收购方案:方案一:所有猕猴桃均以20元每千克收购;方案二:小于90克的猕猴桃以10元每千克收购,不小于90克的猕猴桃以30元每千克收购;请你就这两种方案,通过计算为该猕猴桃基地选择最佳的出售方案.(同一组中的数据用该组区间的中点值代表,视频率为概率)
18.某中学名学生参加全市高中数学竞赛,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了名学生,记录他们的分数,将数据分成组:,并整理得到如下频率分布直方图:
(1)根据频率分布直方图求出分数大于的频率与频数;
(2)根据频率分布直方图求样本中分位数;
(3)已知样本中男生与女生的比例是,男生样本的均值为,方差为,女生样本的均值为,方差为,请计算样本的均值与方差.
19.2024年5月22日至5月28日是第二届全国城市生活垃圾分类宣传周,本次宣传周的主题为“践行新时尚分类志愿行”.阜阳三中高一年级举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩x(单位:分,得分取正整数,满分为100分)作为样本进行统计将成绩进行整理后,分为五组(,,,,),其中第1组频数的平方等于第2组、第4组频数之积,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题:
(1)求a,b的值;
(2)若根据这次成绩,学校准备淘汰80%的同学,仅留20%的同学进入下一轮竞赛请问晋级分数线划为多少合理?
(3)某老师在此次竞赛成绩中抽取了10名学生的分数:,,,…,,已知这10个分数的平均数,标准差,若剔除其中的95和85这两个分数,求剩余8个分数的平均数与方差.
20.为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记为事件:“乙离子残留在体内的百分比不高于”,根据直方图得到的估计值为.
(1)求乙离子残留百分比直方图中的值;
(2)求甲离子残留百分比的第百分位数;
(3)估计乙离子残留百分比的均值.(同一组数据用该组区间的中点值为代表)
原创精品资源学科网独家享有版权,侵权必究!学科网(北京)股份有限公司3
学科网(北京)股份有限公司
$$