内容正文:
专题05 统计
【人教A版(2019)】
【知识清单1 简单随机抽样】
1.抽样调查的必要性
(1)相关概念
名称
定义
全面调查(普查)
对每一个调查对象都进行调查的方法.
抽样调查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法.
总体
调查对象的全体.
个体
从总体中抽取的那部分个体.
样本
从总体中抽取的那部分个体.
样本量
样本中包含的个体数.
(2)抽样的必要性
普查往往需要花费大量的财力、物力,而抽样调查具有花费少、效率高的特点.另外,在有些调查中,抽样调查则具有不可替代的作用,比如:
①一些个体具有破坏性.如不可能对所有的炮弹都进行试射检验其是否合格.
②一些检测具有毁损性.如不可能把地里所有的种子都挖出来检验其是否发芽.
2.简单随机抽样
(1)简单随机抽样的概念
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
(2)(不放回)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取样本的总体中所含个体的个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单随机抽样中各个个体被抽到的可能性(机会)都相等(与第几次抽取无关),从而保证了抽样的公平性.
3.两种常见的简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也
可以是卡片、小球等)上作为号签,并将这些号签放在一个不透明的盒,充分搅拌,最后从盒中不放回
地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的数量.
(2)随机数法
先把总体中的N个个体编号,用随机数工具产生1~N范围内的整数随机数,把产生的随机数作为抽中
的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的数量.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的数量.
(3)两种抽样方法的优缺点
抽样方法
优点
缺点
适用范围
抽签法
简单易行.
总体量较大时,操作起来比较麻烦.
适用于总体中个体数不多的情形.
随机数法
简单易行,它很好地解决了总体量较大时用抽签法制签困难的问题.
总体量很大,样本量也很大时,利用随机数法抽取样本仍不方便.
总体量较大,样本量较小的情形.
【题型1 抽签法及其应用】
【例1】(24-25高一·全国·课后作业)下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【变式1-1】(24-25高二上·新疆巴音郭楞·期中)在对101个人进行一次抽样时,先采用抽签法从中剔除一个人,再在剩余的100中随机抽取10人,那么下列说法正确的是( )
A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
B.每个人在整个抽样过程中被抽到的机会均等,因为每个人被剔除的可能性相等,那么,不被剔除的机会也是均等的
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
【变式1-2】(24-25高一上·全国·课后作业)奥委会现从报名的某高校20名志愿者中选取5人组成奥运志愿小组,请用抽签法设计抽样方案.
【变式1-3】(2025高一下·全国·专题练习)某校举办晚会,共邀请20名同学演出,其中从30名高一学生中随机挑选10人,从18名高二学生中随机挑选6人,从10名高三学生中随机挑选4人.试用抽签法确定选中的同学,并确定他们的表演顺序.
【题型2 随机数法及其应用】
【例2】(24-25高一下·甘肃兰州·阶段练习)某高校对中文系新生进行体测,利用随机数表对400名学生进行抽样,先将400名学生进行编号,001,002,……,399,400.从中抽取40个样本,如图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第4个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77
A.328 B.253 C.007 D.860
【变式2-1】(24-25高一上·江西·阶段练习)某班级共有52位同学,现随机抽取8位同学参加学校组织的“校园读书节”活动,老师将班级同学进行编号:01,02,03,……,52,若从随机数表的第3行第27列开始,依次往右读数,直到取足样本为止,则第6位被抽到的同学对应的编号为( )
95 33 95 22 00 18 74 72 00 18 38 79 58 69 32 81 76 80 26 92 82 80 84 25 39
90 84 60 79 80 24 36 59 87 38 82 07 53 89 35 56 35 23 79 18 05 98 90 07 35
46 40 62 98 80 54 97 20 56 95 15 74 80 08 32 16 46 70 50 80 67 72 16 42 79
20 31 89 03 43 38 46 82 68 72 32 14 82 99 70 80 60 47 18 97 63 49 30 21 30
71 59 73 05 50 08 22 23 71 77 91 01 93 20 49 82 96 59 26 94 66 39 67 98 60
A.16 B.42 C.50 D.80
【变式2-2】(2024高一下·全国·专题练习)高一某班有30位同学,他们依次编号为01,02,…,29,30,现利用下面的随机数表选取6位同学组建“文明校园督查组”.选取方法是从随机数表第1行第5列的数字开始,由左到右依次选取两个数字,则选出来的第6位同学的编号为( )
41792 71635 86089 32157 95620 92109 29145
74955 82835 98378 83513 47870 20799 32122
A.29 B.21 C.14 D.09
【变式2-3】(24-25高一上·江西南昌·期末)某工厂利用随机数表对生产的40个零件进行抽样测试,先将40个零件进行编号,编号分别为,从中抽取8个样本,下面提供随机数表的第1行到第3行:
0347,4373,8636,9647,3661,4698,6371,6202
9774,2467,6242,8114,5720,4253,3237,3214
1676,0227,6656,5026,7107,3290,7978,5336
若从表中第2行第7列开始向右依次读取数据,则得到的第5个样本编号是( )
A.37 B.32 C.14 D.16
【知识清单2 分层随机抽样】
1.分层随机抽样
(1)分层随机抽样的必要性
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比
较“极端”的样本,从而使得估计出现较大的误差,这时候我们可以考虑采取一种新的抽样方法——分层随机抽样.
(2)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个
子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(3)比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.即
①=;
②=.
(4)分层随机抽样的步骤
①分层:根据已经掌握的信息,将总体分成互不重叠的层.
②求比:根据总体中的个体数N和样本容量n计算抽样比.
③定数:确定第i层应该抽取的个体数为ni=Ni·k(Ni为总体中第i层所包含的个体数),使得各ni之和
为n.
④抽样:按“定数”步骤中确定的个体数在各层中随机地抽取个体,合在一起便得到容量为n的样本.
(5)分层随机抽样的特点
①适用于由差异明显的几部分(即层)组成的总体;
②分成的各层互不重叠;
③各层抽取的比例都等于样本容量在总体中的比例,即,其中n为样本容量,N为总体容量;
④分层随机抽样使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的随机抽样方法.
2.分层随机抽样的平均数计算
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量
分别为m和n,第1层、第2层的总体平均数分别为,第1层、第2层的样本平均数分别为,总体平均数为,样本平均数为,则.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用估计总体平均数.
又==,
所以.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
【题型3 抽样方法的选取】
【例3】(23-24高二上·上海长宁·期末)①植物根据植株的高度及分枝部位等可以分为乔木、灌木和草木三大类,某植物园需要对其园中的不同植物的干重(烘干后测定的质量)进行测量;②检测员拟对一批新生产的1000箱牛奶抽取10箱进行质量检测;上述两项调查应采用的抽样方法是( )
A.①用简单随机抽样,②用分层随机抽样 B.①用简单随机抽样,②用简单随机抽样
C.①用分层随机抽样,②用简单随机抽样 D.①用分层随机抽样,②用分层随机抽样
【变式3-1】(23-24高一下·陕西西安·期末)现要完成下列3项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查;②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈;③某中学有高中生3500人,初中生1500人,为了解学生的学习情况,拟抽取一个容量为200的样本.较为合理的抽样方法分别是( )
A.①简单随机抽样,②分层抽样,③系统抽样
B.①简单随机抽样,②系统抽样,③分层抽样
C.①系统抽样,②简单随机抽样,③分层抽样
D.①分层抽样,②系统抽样,③简单随机抽样
【变式3-2】(24-25高二上·四川绵阳·期末)①在一次满分为100分的测试中,有12人的成绩在90分以上,30人的成绩在60~80分,12人的成绩低于60分,现从中抽取9人了解有关考试题目难度的情况;②一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.针对这两件事,恰当的抽样方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层抽样 D.分层抽样,分层抽样
【变式3-3】(24-25高一上·广西桂林·期末)要完成下列两项调查:(1)某社区有100户高收入家庭,210户中等收入家庭,90户低收入家庭,从中抽取100户调查有关消费购买力的某项指标;(2)从某中学高一年级的10名体育特长生中抽取3人调查学习情况;应采用的抽样方法分别是( )
A.(1)用简单随机抽样,(2)用分层随机抽样 B.(1)(2)都用简单随机抽样
C.(1)用分层随机抽样,(2)用简单随机抽样 D.(1)(2)都用分层随机抽样
【题型4 分层抽样的计算】
【例4】(24-25高一下·江西赣州·开学考试)为庆祝中国共产党成立周年,赣州市举办“红歌大传唱”主题活动,以传承红色革命精神,某高中学校分别有高一、高二、高三学生人、人、人,现欲采用分层随机抽样法组建一个人的高一、高二、高三学生红歌传唱队,则应抽取高一学生( )
A.人 B.人 C.人 D.人
【变式4-1】(24-25高三上·广西·阶段练习)北京时间2023年10月31日8时11分,神舟十六号载人飞船返回舱在东风着陆场成功着陆,载人飞行任务取得圆满成功.某高中学校在有120名同学的“航天”社团中随机抽取24名参加一个交流会,若按社团中高一、高二、高三年级的成员人数比例分层随机抽样,则高一年级抽取6人,若按性别比例分层随机抽样,则女生抽取15人,则下列结论错误的是( )
A.24是样本容量
B.120名社团成员中男生有50人
C.高二与高三年级的社团成员共有90人
D.高一年级的社团成员中女生最多有30人
【变式4-2】(23-24高一下·江苏常州·期末)某学校高一年级选择“物化生”、“物化地”、“物化政”和“史政地”组合的同学人数分别为240、120、90和150.现采用分层抽样的方法选出20位同学进行一项调查研究,则“史政地”组合中选出的同学人数为( )
A.8 B.4 C.3 D.5
【变式4-3】(2024高一下·全国·专题练习)中国农历的“二十四节气”是凝结着中华民族的智慧与传统文化的结晶.某小学一年级随机抽查100名学生并提问“二十四节气歌”,只能说出两句的有32人,能说出三句或三句以上的有45人,据此估计该校一年级的400名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数为( )
A.23 B.92
C.128 D.180
【知识清单3 获取数据的途径】
1.获取数据的途径
(1)通过调查获取数据
我们一般通过抽样调查或普查的方法获取数据.
(2)通过试验获取数据
没有现存的数据可以查询时,就需要通过对比试验的方法去获取样本观测数据.
(3)通过观察获取数据
自然现象只能通过长久的持续观察获取数据.
(4)通过查询获得数据
通过收集前人的劳动成果并加以利用,从而减少收集数据的成本.
【题型5 普查与抽样】
【例5】(23-24高一下·内蒙古通辽·阶段练习)下列调查,比较适用普查而不适用抽样调查方式的是( )
A.为了了解中央电视台春节联欢晚会的收视率
B.为了了解高一某班的每个学生星期六晚上的睡眠时间
C.为了了解夏季冷饮市场上冰淇淋的质量情况
D.为了考查一片实验田某种水稻的穗长情况
【变式5-1】(23-24高一下·青海海南·期末)下列调查中,调查方式选择合理的是( )
A.了解某一品牌空调的使用寿命,选择普查
B.了解神舟飞船的设备零件的质量情况,选择抽样调查
C.了解一批袋装食品是否含有防腐剂,选择普查
D.了解某公园全年的游客流量,选择抽样调查
【变式5-2】(2025高一·全国·专题练习)下列调查方式,你认为最合适的是( )
A.了解北京每天的流动人口数,采用抽样调查
B.旅客上飞机前的安检,采用抽样调查
C.了解北京居民“建党百年庆祝大会”期间的出行方式,采用全面调查
D.日光灯管厂要检测一批灯管的使用寿命,采用全面调查
【变式5-3】(23-24高二上·重庆北碚·阶段练习)在以下调查中,适合用全面调查的个数是( )
①调查一个班级学生的吃早餐情况
②调查某种饮料质量合格情况
③调查某批飞行员的身体健康指标
④调查某个水库中草鱼的所占比例
A.1 B.2 C.3 D.4
【知识清单4 总体取值规律的估计】
1.频率分布直方图
(1)频率分布表与频率分布直方图的意义
为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初
中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.
(2)频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中最大值与最小值的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取左闭右开区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,作出频率分布表.
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
2.其他几类常用统计图——条形图、折线图、扇形图
条形图
折线图
扇形图
特
点
一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的.
用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化.
用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
作用及选用情景
能清楚地表示每个项目的具体数量,便于相互比较大小.
能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中.
可以形象地表示出各部分数据在全部数据中所占的比例情况.
图例
【题型6 频率分布直方图的相关计算问题】
【例6】(23-24高一下·河北·期末)某校为了了解学生的体能情况,于6月中旬在全校进行体能测试,统计得到所有学生的体能测试成绩均在内.现将所有学生的体能测试成绩按分成三组,绘制成如图所示的频率分布直方图.若根据体能测试成绩采用按比例分层随机抽样的方法抽取20名学生作为某项活动的志愿者,则体能测试成绩在内的被抽取的学生人数为( )
A.4 B.6 C.8 D.10
【变式6-1】(2025高三上·河南·专题练习)为了调查某工厂生产的一批口罩的质量情况,随机抽取了一批口罩,所得数据如下图所示,为了进一步了解情况,研究人员在被抽取的口罩中按照质量的指标值再次进行分层抽样,共抽取个,若质量的指标值在中的抽取个,则下列说法正确的是( )
A.质量的指标值在中的抽取个
B.质量的指标值在中的抽取个
C.质量的指标值在中的抽取个
D.
【变式6-2】(23-24高一下·吉林·期末)随着卡塔尔世界杯的举办,全民对足球的热爱程度有所提高,组委会在某场比赛结束后,随机抽取了若干名球迷对足球“喜爱度”进行调查评分,把喜爱程度较高的按年龄分成5组,其中第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第四组与第五组共有150人,第二组中女性球迷有75人,则第二组中男性球迷的人数为( )
A.140 B.120 C.100 D.80
【变式6-3】(23-24高二上·北京·期中)某校组织全体学生参加了主题为“建党百年,薪火相传”的知识竞赛,随机抽取了200名学生进行成绩统计、发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,在被抽取的学生中,成绩在区间的学生数是( )
A.30 B.45 C.60 D.100
【题型7 根据统计图解决实际问题】
【例7】(24-25高一下·吉林通化·阶段练习)2024年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩在前200名的学生中,高一人数比高二人数多30
B.成绩在第1~50名的学生中,高三最多有32人
C.高一学生成绩在第101~150名的人数一定比高三学生成绩在第1~50名的人数多
D.成绩在第51~100名的学生中,高二人数比高一人数多
【变式7-1】(24-25高一下·湖南·阶段练习)如图为近一年我国商品零售总额和餐饮收入总额同比增速情况折线图,根据该图,下列结论正确的是( )
(注:同比,指当前的数据与上一年同期进行比对;环比,指当前数据与上个月的数据进行比对.)
A.2024年月份,商品零售总额同比增长
B.2023年月份,餐饮收入总额同比都降低
C.2023年月份,商品零售总额同比都增加
D.2023年12月,餐饮收入总额环比增速为
【变式7-2】(23-24高一下·贵州黔东南·期末)小波一星期的总开支(单位:元)分布如图1所示,一星期的食品开支(单位:元)分布如图2所示,则小波一星期的肉类开支占总开支的百分比为( )
A. B. C. D.
【变式7-3】(2024高一下·全国·专题练习)已知全国农产品批发价格200指数月度变化情况如图所示,下列选项正确的是( )
A.全国农产品夏季价格比冬季低
B.全国农产品批发价格200指数2023年每个月逐渐增加
C.2023年“菜篮子”产品批发价格指数与农产品批发价格200指数的变化趋势基本保持一致
D.2023年6月农产品批发价格200指数大于116
【知识清单5 总体百分位数的估计】
1.总体百分位数的估计
(1)概念
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个
值,且至少有(100-p)%的数据大于或等于这个值.
(2)求解步骤
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p
百分位数为第i项与第(i+1)项数据的平均数.
【题型8 百分位数的求解】
【例8】(24-25高一下·甘肃兰州·阶段练习)已知一组数据3,4,5,6,7,8,9,10,则这组数据的第20百分位数是( )
A. B.4 C. D.5
【变式8-1】(2025高二下·河北·学业考试)某校为了解高一年级学生的体育健康标准测试(简称“体测”)成绩的分布情况,从该年级学生的体测成绩(规定满分为100分)中,随机抽取了80名学生的成绩,并进行分组:,,,,,绘制成如下频率分布直方图,该校高一年级学生体测成绩的第80百分位数的估计值是( )
A.87 B.88 C.89 D.90
【变式8-2】(23-24高一下·江苏苏州·期末)某科研单位对ChatGPT的使用情况进行满意度调查,在一批用户的有效问卷(用户打分在50分到100分之间的问卷)中随机抽取了100份,按分数进行分组(每组为左闭右开的区间),得到如图所示的频率分布直方图,估计这批用户问卷的得分的第百分位数为( )
A.78.5 B.82.5 C.85 D.87.5
【变式8-3】(23-24高一下·江苏常州·期末)在2021年东京奥运会女子10米气步枪项目中,杨倩凭借出色的表现获得冠军.她前10枪的成绩(单位:环)分别为:10.2,10.9,10.5,10.0,10.3,10.5,10.8,10.5,10.1,10.9.基于这些数据,我们可以计算出前10枪成绩的第75百分位数为( )
A.10.2 B.10.5 C.10.65 D.10.8
【知识清单6 总体集中趋势与离散程度的估计】
1.总体集中趋势的估计
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度
刻画了一组数据的集中趋势.具体概念回顾如下:
名称
概念
平
均
数
如果有n个数x1,x2,…,xn,那么就是这组数据的平均数,用表示,即.
中
位
数
将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
众
数
一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.
2.总体离散程度的估计
(1)方差和标准差
假设一组数据是,,,,用表示这组数据的平均数,则我们称为这组数据的
方差.有时为了计算方差的方便,我们还把方差写成的形式.
我们对方差开平方,取它的算数平方根,称为这组数据的标准差.
(2)总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,总体平均数为,则总体方差
.
②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为,其中出
现的频数为,则总体方差为.
总体标准差:S=.
(3)标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+∞).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则
标准差为0.反之,标准差为0的样本,其中的数据都相等.
3.频率分布直方图中的统计参数
(1)频率分布直方图中的“众数”
根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用
中点近似代替.
(2)频率分布直方图中的“中位数”
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.
因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)频率分布直方图中的“平均数”
平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分
布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
【题型9 众数、中位数、平均数的求解及应用】
【例9】(23-24高一下·海南省直辖县级单位·期中)下表是某地区2024年3月1日至10日每天中午12时的气温统计表,则下列关于这10天中气温的说法错误的是( )
日期
1
2
3
4
5
6
7
8
9
10
气温(℃)
2
10
18
20
16
12
6
2
6
12
A.众数为2和6和12 B.70%分位数为16
C.平均数小于中位数 D.极差为18
【变式9-1】(23-24高一下·云南曲靖·期末)已知一组数据丢失了其中一个大于3的数据,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的2倍,则丢失的数据可能是( )
A.5 B.12 C.18 D.20
【变式9-2】(23-24高一下·浙江宁波·期末)在如图所示的两种分布形态中( )
A.(1)中的中位数大于平均数
B.(1)中的众数大于平均数
C.(2)中的众数小于中位数
D.(2)中的平均数小于中位数
【变式9-3】(23-24高一下·新疆·期末)已知在高考前最后一次模拟考试中,高三某班8名同学的物理成绩分别为84,79,84,86,95,84,87,93,则该组数据的平均数和众数分别是( )
A.86,84 B.84.5,85 C.85,84 D.86.5,84
【题型10 方差、标准差的求解及应用】
【例10】(24-25高一下·内蒙古通辽·阶段练习)已知某次期中考试中,甲、乙两组学生的数学成绩如下:
甲:88 100 95 86 95 91 84 74 92 83
乙:93 89 81 77 96 78 77 85 89 86
则下列结论正确的是( )
A.甲>乙,s甲>s乙 B.甲>乙,s甲<s乙
C.甲<乙,s甲>s乙 D.甲<乙,s甲<s乙
【变式10-1】(23-24高一下·海南省直辖县级单位·期末)从两个班级各随机抽取5名学生测量身高(单位:),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高,及方差,的关系为( )
A., B.,
C., D.,
【变式10-2】(23-24高一下·山西太原·期末)甲、乙两名射箭运动员在10次射箭训练中,射中的环数分别为:
甲 9 10 8 9 9 7 8 9 10 8
乙 9 9 8 8 10 9 9 8 8 9
(1)计算这10次训练中甲、乙射中环数的平均数和方差;
(2)从计算结果看,哪位运动员的射箭技术更好?
【变式10-3】(24-25高一下·甘肃·阶段练习)为了迎接某项活动,某市积极开展网上竞赛,先采取甲、乙两套方案进行培训,并对分别采取两套方案培训的单位的7次线上测试成绩进行统计如图所示:
(1)求甲和乙的测试成绩的平均数和方差;
(2)从下列两个不同的角度对这次方案选择的结果进行分析:
①从平均数和方差相结合看(分析哪种方案的成绩更好);
②从折线图上两种方案的走势看(分析哪种方案更有潜力).
【题型11 统计图中集中趋势参数的计算】
【例11】(2024·广东韶关·一模)众数、平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据的分布形态有关.根据某小区1000户居民的月均用水量数据(单位:),得到如图所示的频率分布直方图,记该组数据的众数为,中位数为,平均数为,则( )
A. B.
C. D.
【变式11-1】(24-25高二上·黑龙江齐齐哈尔·期中)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.则下列说法错误的是( )
A.估计该年级学生成绩的众数约为75
B.
C.估计该年级学生成绩的75百分位数约为85
D.估计该年级成绩在80分及以上的学生成绩的平均数约为87.50
【变式11-2】(多选)(23-24高一下·山东临沂·期末)某学校为了调查高一年级学生每天体育活动时间的情况,随机选取了100名学生,绘制了如图所示频率分布直方图,则( )
A.
B.平均数的估计值为30
C.众数的估计值为35
D.这100名学生中有25名学生每天体育活动时间不低于40分钟
【变式11-3】(24-25高一下·甘肃平凉·开学考试)为进一步弘扬中华优秀传统文化,提升诗词爱好者的素养和创作水平,形成浓厚的国学和诗词学习氛围,2024年9月19日,首届“中华诗韵·风雅平凉”彦军杯诗词大赛决赛在剧院成功举行.为了解参赛者对此次活动的满意度,某研究性学习小组用问卷调查的方式随机调查了名参赛者,该小组将收集到的参赛者满意度分值数据(满分100分)统计如下表所示:
分数
频数
5
10
20
35
频率
0.05
0.20
0.30
0.35
(1)分别求,,的值,并在图中画出频率分布直方图;
(2)估计名参赛者满意度分值的众数、平均数和第75百分位数(结果保留整数).
【题型12 统计图中方差的计算】
【例12】(2025高二下·湖南·学业考试)2023年袁隆平“超级稻”突破亩产,再次刷新了杂交水稻单季亩产世界纪录.已知甲、乙两种杂交水稻在面积相等的两块试验田中连续6年的产量如图所示,则( )
A.甲的平均产量高于乙的平均产量 B.甲的最高产量高于乙的最高产量
C.甲的产量更稳定 D.乙的产量更稳定
【变式12-1】(23-24高一下·云南楚雄·期末)某商品3〜5月份在甲、乙、丙、丁四个地区的销量如下图所示,则在这四个地区中该商品3〜5月份销量方差最小的为( )
A.甲地区 B.乙地区 C.丙地区 D.丁地区
【变式12-2】(多选)(23-24高一下·黑龙江·期末)为普及疫情知识,某校不定期地共组织了10次全员性的防控知识问答竞赛,下面是甲、乙两个班级10次成绩(单位:分)的折线图:根据折线图( )
A.甲班的成绩分数呈上升趋势
B.甲班乙班的成绩分数平均值均为7
C.甲班成绩分数的方差小于乙班成绩分数的方差
D.从第8次到第10次甲班成绩分数增量大于乙班成绩分数增量
【变式12-3】(23-24高一下·云南昆明·期末)某中学举行了一次“环保知识竞赛”,全校学生参加了这次竞赛. 为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)作为样本进行统计. 请根据下面尚未完成并有局部污损的频率分布表(如图所示)和频率分布直方图(如图所示)解决下列问题:频率分布表:
组别
分组
频数
频率
第1组
8
0.16
第2组
第3组
20
0.40
第4组
0.08
第5组
2
合计
频率分布直方图:
(1)写出 的值;
(2)若根据这次成绩,学校准备淘汰 同学,仅留 的同学进入下一轮竞赛,请问晋级分数线划为多少合理?
(3)某老师在此次考试成绩中抽取10名学生的分数:,已知这10个分数的平均数,标准差 ,若剔除其中的100和80这两个分数,求剩余8个分数的平均数与标准差.
【题型13 总体集中趋势与方差的综合应用】
【例13】(23-24高二下·湖南·期末)某学校开展“国学知识竞赛”,共有“诗经组”,“论语组”,“春秋组”,“礼记组”4个小组参赛,每组10位选手,若该组每位选手的失分不超过6分,该组获得“优秀”称号,则根据每组选手的失分情况,下列小组一定获得“优秀”称号的是( )
A.诗经组中位数为3,众数为2
B.论语组平均数为3,方差为1
C.春秋组平均数为3,众数为2
D.礼记组中位数为3,极差为4
【变式13-1】(23-24高一下·黑龙江大庆·期末)一个同学投掷10次骰子,记录出现的点数,根据统计结果,在下列情况中一定不能出现点数6的是( )
A.平均数为3,中位数为4
B.中位数为4,众数为3
C.平均数为2,方差为2.1
D.中位数为3,方差为0.85
【变式13-2】(多选)(23-24高一下·黑龙江绥化·期末)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标准为“连续10天,每天新增疑似病例不超过7人”,过去10天,甲、乙、丙、丁四地新增疑似病例数据信息如下:甲地:平均数为2,众数为2;乙地:中位数为3,极差为4;丙地:平均数为2,中位数为3;丁地:平均数为2,标准差为,甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是( )
A.甲地 B.乙地 C.丙地 D.丁地
【变式13-3】(23-24高一下·北京通州·期中)甲、乙、丙三人进行5轮的投篮比赛,每轮各投10次,其成绩(命中次数)如下:
甲投中次数
6
6
8
7
8
乙投中次数
6
5
4
6
丙投中次数
(1)若乙比甲平均少投中2次,求的值,甲和乙投中次数的方差分别为和,试比较和大小(结论不要求证明);
(2)若投中一球计三分,丙平均得分为21分,方差为27,且每轮得分互不相同,求丙在比赛中的最高得分,并说明理由.
【题型14 统计综合】
【例14】(23-24高一下·湖南长沙·期末)有一组互不相等的样本数据,平均数为.若随机剔除其中一个数据,得到一组新数据,记为,平均数为,则下列说法错误的是( )
A.新数据的极差可能等于原数据的极差
B.新数据的中位数不可能等于原数据的中位数
C.若,则新数据的方差一定大于原数据方差
D.若,则新数据的分位数一定大于原数据的分位数
【变式14-1】(23-24高二下·安徽·阶段练习)在一组数3,3,8,11,28中插入两个整数,,使得新的一组数极差为原来极差的两倍,且众数和中位数保持不变,则的最大值为( )
A.57 B.58 C.60 D.61
【变式14-2】(23-24高一下·宁夏·期末)某公司为了提高职工的健身意识,鼓励大家加入健步运动,要求200名职工每天晚上9:30上传手机计步截图,对于步数超过10000的予以奖励.图1为甲乙两名职工在某一星期内的运动步数统计图,图2为根据这星期内某一天全体职工的运动步数做出的频率分布直方图.
(1)请根据频率分布直方图,求m的值,并求出该天运动步数不少于15000步的人数;
(2)估计全体职工在该天运动步数的众数、平均数和中位数;
(3)如果当天甲的排名为第130名,乙的排名为第40名,试判断做出的是星期几的频率分布直方图.
【变式14-3】(23-24高一下·河南鹤壁·期末)某电视台有一档益智答题类综艺节目,每期节目从现场编号为01~80的80名观众中随机抽取10人答题.答题选手要从“科技”和“文艺”两类题目中选一类作答,一共回答10个问题,答对1题得1分.
(1)若采用随机数表法抽取答题选手,按照以下随机数表,从下方带点的数字2开始向右读,每次读取两位数,一行用完接下一行左端,求抽取的第6个观众的编号.
1622779439 4954435482 1737932378 873509643 8426349164
8442175331 5724550688 7704744767 2176335025 8392120676
(2)若采用等距系统抽样法抽取答题选手,且抽取的最小编号为06,求抽取的最大编号.
(3)某期节目的10名答题选手中6人选科技类题目,4人选文艺类题目.其中选择科技类的6人得分的平均数为7,方差为;选择文艺类的4人得分的平均数为8,方差为.求这期节目的10名答题选手得分的平均数和方差.
一、单选题
1.(23-24高一下·吉林四平·期末)下列调查方式中,不适合的是( )
A.调查一批灯泡的使用寿命,采用普查的方式
B.调查某班学生的体重,采用普查的方式
C.调查一条河流的水质,采用抽查的方式
D.调查某鱼塘中草鱼的平均重量,采用抽查的方式
2.(23-24高一下·江西景德镇·期中)在新冠肺炎疫情期间,大多数学生都在家进行网上上课,某校高一,高二,高三共有学生6000名,为了了解同学们对某授课软件的意见,计划采用分层抽样的方法从这6000名学生中抽取一个容量60的样本,若从高一,高二,高三抽取的人数恰好是从小到大排列的连续偶数,则该校高二年级的人数为( )
A.1000 B.1500 C.2000 D.3000
3.(23-24高一下·云南丽江·阶段练习)下列两项调查适宜采用的抽样方法依次是( )
①一项对“中兴事件”(2018年4月16日,美国对中兴通讯施行惩罚措施,引起国内关于国产芯片的讨论)影响的调查中有10000人认为这是美国贸易保护主义,对世界经济会产生比较负面的影响:有9000人认为这只是一个孤立事件,对世界经济大格局不会产生太大影响:有1000人没有发表自己的看法.现要从这20000人中随机抽取200人做进一步调查.
②从某中学高二年级的15名艺术特长生中选出3名调查学习负担情况.
A.①简单随机抽样,②分层抽样
B.①分层抽样,②简单随机抽样
C.①②都用简单随机抽样
D.①②都用分层抽样
4.(23-24高一下·贵州毕节·期末)某研究小组为了解某市高中生自主阅读情况,随机调查了2000名学生的每周自主阅读时间,按照时长(单位:小时)分成五组:,得到如图所示的频率分布直方图,其中每周自主阅读时间不低于8小时的频率为0.3.则以下说法中错误的是( )
A.
B.估计样本数据的第60百分位数值是7.5小时
C.样本的极差介于6小时至10小时之间
D.估计这2000名学生每周自主阅读时间的平均值是6.5小时
5.(23-24高一下·青海·期末)某篮球运动员进行投篮训练,共进行了10组,每组投篮55次,每组投篮命中的个数分别为m,n,48,47,48,50,45,47,49,50.已知这组数据的平均数为48,方差为7,则( )
A.10 B. C. D.5
6.(23-24高一下·湖南长沙·期末)有一组互不相等的样本数据,平均数为.若随机剔除其中一个数据,得到一组新数据,记为,平均数为,则下列说法错误的是( )
A.新数据的极差可能等于原数据的极差
B.新数据的中位数不可能等于原数据的中位数
C.若,则新数据的方差一定大于原数据方差
D.若,则新数据的分位数一定大于原数据的分位数
7.(23-24高二下·陕西安康·期末)某校为了了解学生的身体素质,对2022届初三年级所有学生仰卧起坐一分钟的个数情况进行了数据统计,结果如下图所示.该校2023届初三学生人数较2022届初三学生人数上升了10%,则下列说法错误的是( )
A.该校2022届初三年级学生仰卧起坐一分钟的个数在内的学生人数占70%
B.该校2023届初三学生仰卧起坐一分钟的个数在内的学生人数比2022届初三学生仰卧起坐一分钟个数同个数段的学生人数的2倍还多
C.该校2023届初三学生仰卧起坐一分钟的个数和2022届初三学生仰卧起坐一分钟个数的中位数均在内
D.相比2022届初三学生仰卧起坐一分钟个数不小于50的人数,2023届初三学生仰卧起坐一分钟个数不小于50的人数占比增加
8.(23-24高二下·湖南·期末)某学校开展“国学知识竞赛”,共有“诗经组”,“论语组”,“春秋组”,“礼记组”4个小组参赛,每组10位选手,若该组每位选手的失分不超过6分,该组获得“优秀”称号,则根据每组选手的失分情况,下列小组一定获得“优秀”称号的是( )
A.诗经组中位数为3,众数为2
B.论语组平均数为3,方差为1
C.春秋组平均数为3,众数为2
D.礼记组中位数为3,极差为4
二、多选题
9.(23-24高一下·江苏淮安·期末)某学校为了解学校学生视力健康状况,降低学生近视率,增强学生爱眼护眼意识,对三个年级的学生视力健康状况进行调研,已知高一、高二、高三的学生人数之比为4:3:3,现用分层抽样方法抽取一个容量为 n的样本,样本中高一年级学生人数为200人,则( )
A.该校三个年级总的学生数为5000人 B.样本容量n为500
C.该校高二年级总的学生数有1500人 D.样本中高二年级学生数为150人
10.(2025高一·江苏·专题练习)2019年,全国各地区坚持稳中求进工作总基调,经济运行总体平稳,发展水平迈上新台阶,发展质量稳步上升,人民生活福祉持续增进,全年最终消费支出对国内生产总值增长的贡献率为,2019年居民消费价格月度涨跌幅度如下图所示.(同比=,环比=)
下列结论中正确的有( )
A.2019年第三季度的居民消费价格一直都在增长
B.2018年7月份的居民消费价格比同年8月份要低一些
C.2019年全年的居民消费价格比2018年涨了以上
D.2019年3月份的居民消费价格全年最低
11.(23-24高一下·黑龙江绥化·期末)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标准为“连续10天,每天新增疑似病例不超过7人”,过去10天,甲、乙、丙、丁四地新增疑似病例数据信息如下:甲地:平均数为2,众数为2;乙地:中位数为3,极差为4;丙地:平均数为2,中位数为3;丁地:平均数为2,标准差为,甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是( )
A.甲地 B.乙地 C.丙地 D.丁地
三、填空题
12.(23-24高一下·河北邢台·阶段练习)要考查某种品牌的850颗种子的发芽率,从中抽取50颗种子进行实验,利用随机数表法抽取种子,先将850颗种子按001,002,…,850进行编号,如果从随机数表第2行第2列的数开始并向右读,下列选项中属于最先检验的4颗种子依次是 .
(下面抽取了随机数表第1行至第3行)
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95
97 74 94 67 74 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73
16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10
13.(24-25高一下·宁夏·阶段练习)为了解某企业员工对习近平新时代中国特色社会主义思想的学习情况,对该企业员工进行问卷调查,已如他们的得分都处在A,B,C,D四个区间内,根据调查结果得到下面的统计图.已知该企业男员工占,则下列结论中,错误的结论是 .(填序号)
①男、女员工得分在A区间的占比相同;
②在各得分区间男员工的人数都多于女员工的人数;
③得分在区间的员工最多;
④得分在区间的员工占总人数的20%.
14.(23-24高一下·福建厦门·阶段练习)厦门一中为提升学校食堂的服务水平,组织全校师生对学校食堂满意度进行评分,按照分层抽样方法,抽取200位师生的评分(满分100分)作为样本,在这200个样本中,所有学生评分样本的平均数为,方差为,所有教师评分样本的半均数为,方差为,总样本的平均数为,方差为,若,抽取的学生样本多于教师样本,则总样本中学生样本的个数至少为
.
四、解答题
15.(23-24高一上·全国·课后作业)为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民.
(1)这项调查的总体是什么?
(2)你认为这样的调查结果会怎样?
16.(24-25高一·全国·随堂练习)为了评估某校的教学水平,将抽取这个学校高三年级部分学生本学年的考试成绩进行考察.为了全面反映实际情况,采取以下两种抽样方式(已知该校高三年级共有10个教学班400名学生,并且每个班的学生都已经按随机方式编好了学号,假定每班人数都相同):
方式1:从全年级10个班中任意抽取一个班,考察他们的成绩;
方式2:把该校高三年级的学生按成绩分成优秀、良好、普通三个级别(若按成绩分,该校高三学生中优秀学生有60名,良好学生有180名,普通学生有160名),从中按比例抽取40名学生进行考察.
根据上面的叙述,试回答下列问题:
(1)上面两种抽样方式各自采用何种抽取样本的方法?
(2)分别写出上面两种抽样方式各自抽取样本的步骤.
17.(23-24高一下·广东梅州·期末)某中学新建了学校食堂,每天有近2000名学生在学校食堂用午餐,午餐开放时间约40分钟,食堂制作了三类餐食,第一类是选餐,学生凭喜好在做好的大约6种菜和主食米饭中任意选购;第二类是套餐,已按配套好菜色盛装好,可直接取餐;第三类是面食,如煮面、炒粉等,为了更合理地设置窗口布局,增加学生的用餐满意度,学校学生会在用餐的学生中对就餐选择、各类餐食的平均每份取餐时长以及可接受等待时间进行问卷调查,并得到以下的统计图表.
类别
选餐
套餐
面食
选择人数
50
30
20
平均每份取餐时长(单位:分钟)
2
0.5
1
已知饭堂的售饭窗口一共有20个,就餐高峰期时有200名学生在等待就餐.
(1)根据以上的调查统计,如果设置12个选餐窗口,4个套餐窗口,4个面食窗口,就餐高峰期时,假设大家在排队时自动选择较短的队伍等待(即各类餐食的窗口前队伍长度各自相同),问:选择选餐的同学最长等待时间是多少?这能否让80%的同学感到满意(即在接受等待时长内取到餐)?
(2)根据以上的调查统计,从等待时长和公平的角度上考虑,如何设置各类售饭窗口数更优化,并给出你的求解过程.
18.(24-25高一·全国·单元测试)某赛季甲、乙两名运动员在若干场比赛中的得分情况如下:
甲:18,20,21,22,23,25,28,29,30,30,32,34;
乙:8,13,14,16,23,26,28,33,38,39,48.求:
(1)分别计算甲、乙两人每场得分的平均数;
(2)计算甲、乙两人每场得分的中位数;
(3)计算甲、乙两人得分的标准差,并回答谁的成绩比较稳定.
19.(23-24高一下·云南昆明·期末)某中学举行了一次“环保知识竞赛”,全校学生参加了这次竞赛. 为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)作为样本进行统计. 请根据下面尚未完成并有局部污损的频率分布表(如图所示)和频率分布直方图(如图所示)解决下列问题:频率分布表:
组别
分组
频数
频率
第1组
8
0.16
第2组
第3组
20
0.40
第4组
0.08
第5组
2
合计
频率分布直方图:
(1)写出 的值;
(2)若根据这次成绩,学校准备淘汰 同学,仅留 的同学进入下一轮竞赛,请问晋级分数线划为多少合理?
(3)某老师在此次考试成绩中抽取10名学生的分数:,已知这10个分数的平均数,标准差 ,若剔除其中的100和80这两个分数,求剩余8个分数的平均数与标准差.
第 1 页 共 49 页
学科网(北京)股份有限公司
$$
专题05 统计
【人教A版(2019)】
【知识清单1 简单随机抽样】
1.抽样调查的必要性
(1)相关概念
名称
定义
全面调查(普查)
对每一个调查对象都进行调查的方法.
抽样调查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法.
总体
调查对象的全体.
个体
从总体中抽取的那部分个体.
样本
从总体中抽取的那部分个体.
样本量
样本中包含的个体数.
(2)抽样的必要性
普查往往需要花费大量的财力、物力,而抽样调查具有花费少、效率高的特点.另外,在有些调查中,抽样调查则具有不可替代的作用,比如:
①一些个体具有破坏性.如不可能对所有的炮弹都进行试射检验其是否合格.
②一些检测具有毁损性.如不可能把地里所有的种子都挖出来检验其是否发芽.
2.简单随机抽样
(1)简单随机抽样的概念
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
(2)(不放回)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取样本的总体中所含个体的个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单随机抽样中各个个体被抽到的可能性(机会)都相等(与第几次抽取无关),从而保证了抽样的公平性.
3.两种常见的简单随机抽样方法
(1)抽签法
一般地,抽签法就是把总体中的N个个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也
可以是卡片、小球等)上作为号签,并将这些号签放在一个不透明的盒,充分搅拌,最后从盒中不放回
地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的数量.
(2)随机数法
先把总体中的N个个体编号,用随机数工具产生1~N范围内的整数随机数,把产生的随机数作为抽中
的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的数量.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的数量.
(3)两种抽样方法的优缺点
抽样方法
优点
缺点
适用范围
抽签法
简单易行.
总体量较大时,操作起来比较麻烦.
适用于总体中个体数不多的情形.
随机数法
简单易行,它很好地解决了总体量较大时用抽签法制签困难的问题.
总体量很大,样本量也很大时,利用随机数法抽取样本仍不方便.
总体量较大,样本量较小的情形.
【题型1 抽签法及其应用】
【例1】(24-25高一·全国·课后作业)下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【解题思路】根据抽签法的适用条件,结合选项依次判断即可.
【解答过程】选项A,总体中的个体数较大,样本容量也较大,不适合用抽签法,故A不符合题意;
选项B,总体中的个体数较小,样本容量也较小,
且同厂生产的两箱产品可视为搅拌均匀了,可用抽签法,故B符合题意;
选项C,甲、乙两厂生产的两箱产品质量可能差别较大,
不能满足搅拌均匀的条件,不能用抽签法,故C不符合题意;
选项D,总体中的个体数较大,不适合用抽签法,故D不符合题意.
故选:B.
【变式1-1】(24-25高二上·新疆巴音郭楞·期中)在对101个人进行一次抽样时,先采用抽签法从中剔除一个人,再在剩余的100中随机抽取10人,那么下列说法正确的是( )
A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
B.每个人在整个抽样过程中被抽到的机会均等,因为每个人被剔除的可能性相等,那么,不被剔除的机会也是均等的
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
【解题思路】根据随机抽样的特征,即可判断出结果.
【解答过程】由于第一次剔除时采用抽签法,对每个人来说可能性相等,然后随机抽取10人对每个人的机会也是均等的,所以总的来说每个人的机会都是均等的,被抽到的可能性都是相等的.
故选:B.
【变式1-2】(24-25高一上·全国·课后作业)奥委会现从报名的某高校20名志愿者中选取5人组成奥运志愿小组,请用抽签法设计抽样方案.
【解题思路】利用抽签法的步骤求解即可.
【解答过程】(1)将20名志愿者编号,号码分别是01,02,…,20;
(2)将号码分别写在20张大小、形状都相同的纸条上,揉成团儿,制成号签;
(3)将所得号签放在一个不透明的袋子中,并搅拌均匀;
(4)从袋子中依次不放回地抽取5个号签,并记录下上面的编号;
(5)所得号码对应的志愿者就是志愿小组的成员.
【变式1-3】(2025高一下·全国·专题练习)某校举办晚会,共邀请20名同学演出,其中从30名高一学生中随机挑选10人,从18名高二学生中随机挑选6人,从10名高三学生中随机挑选4人.试用抽签法确定选中的同学,并确定他们的表演顺序.
【解题思路】第一步,确定参演学生,做号签,抽签,第二步,确定演出顺序,做号签,抽签.
【解答过程】第一步,确定参演学生.
(1)将30名高一学生从01到30编号,然后用相同的纸条做成30个号签,在每个号签上分别写上编号,然后放入一个暗箱中搅匀,从中顺次不放回地抽出10个号签,相应编号的学生参加演出;
(2)运用相同的办法分别从18名高二学生中抽取6人,从10名高三学生中抽取4人.
第二步,确定演出顺序.
确定了演出人员后,再用相同的纸条做成20个号签,上面分别写上1~20这20个数字,代表演出顺序,不放回地让每名学生抽一张,各人抽到的号签上的数就是这位学生表演的顺序.
【题型2 随机数法及其应用】
【例2】(24-25高一下·甘肃兰州·阶段练习)某高校对中文系新生进行体测,利用随机数表对400名学生进行抽样,先将400名学生进行编号,001,002,……,399,400.从中抽取40个样本,如图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第4个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77
A.328 B.253 C.007 D.860
【解题思路】按照随机数表提供的数据,三位一组的读数,并取001到400内的数,重复的只取一次,读取到第4个即可.
【解答过程】从第5行第6列开始向右读取数据,分别为:253(第1个),313(第2个),457(不在范围内,不符合要求),860(不在范围内,不符合要求),736(不在范围内,不符合要求),253(重复,不符合要求),007(第3个),328(第4个),
故选:A.
【变式2-1】(24-25高一上·江西·阶段练习)某班级共有52位同学,现随机抽取8位同学参加学校组织的“校园读书节”活动,老师将班级同学进行编号:01,02,03,……,52,若从随机数表的第3行第27列开始,依次往右读数,直到取足样本为止,则第6位被抽到的同学对应的编号为( )
95 33 95 22 00 18 74 72 00 18 38 79 58 69 32 81 76 80 26 92 82 80 84 25 39
90 84 60 79 80 24 36 59 87 38 82 07 53 89 35 56 35 23 79 18 05 98 90 07 35
46 40 62 98 80 54 97 20 56 95 15 74 80 08 32 16 46 70 50 80 67 72 16 42 79
20 31 89 03 43 38 46 82 68 72 32 14 82 99 70 80 60 47 18 97 63 49 30 21 30
71 59 73 05 50 08 22 23 71 77 91 01 93 20 49 82 96 59 26 94 66 39 67 98 60
A.16 B.42 C.50 D.80
【解题思路】利用随机数表法即可得解.
【解答过程】由随机数法,抽取的同学对应的编号为08,32,16,46,50,42,…,
故第6位同学的编号为42.
故选:B.
【变式2-2】(2024高一下·全国·专题练习)高一某班有30位同学,他们依次编号为01,02,…,29,30,现利用下面的随机数表选取6位同学组建“文明校园督查组”.选取方法是从随机数表第1行第5列的数字开始,由左到右依次选取两个数字,则选出来的第6位同学的编号为( )
41792 71635 86089 32157 95620 92109 29145
74955 82835 98378 83513 47870 20799 32122
A.29 B.21 C.14 D.09
【解题思路】根据随机数表法分析求解.
【解答过程】从随机数表第1行第5列的数字开始,由左到右依次选取两个数字分别为
27,16,35(舍去),86(舍去),08,93(舍去),21,57(舍去),
95(舍去),62(舍去),09,21(舍去),09(舍去),29.
故最终取得的第6个数字为29.
故选:A.
【变式2-3】(24-25高一上·江西南昌·期末)某工厂利用随机数表对生产的40个零件进行抽样测试,先将40个零件进行编号,编号分别为,从中抽取8个样本,下面提供随机数表的第1行到第3行:
0347,4373,8636,9647,3661,4698,6371,6202
9774,2467,6242,8114,5720,4253,3237,3214
1676,0227,6656,5026,7107,3290,7978,5336
若从表中第2行第7列开始向右依次读取数据,则得到的第5个样本编号是( )
A.37 B.32 C.14 D.16
【解题思路】根据随机数表法的应用,按照已知的要求选出五个三个数字组成编号即可.
【解答过程】依题意从第2行第7列开始的数为67(舍去),62(舍去),42(舍去),81(舍去),14,
57(舍去),20,42(舍去),53(舍去),32,37,32(舍去),14(舍去),16,
则满足条件的5个样本编号为14,20,32,37,16,则第5个编号为16.
故选:D.
【知识清单2 分层随机抽样】
1.分层随机抽样
(1)分层随机抽样的必要性
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比
较“极端”的样本,从而使得估计出现较大的误差,这时候我们可以考虑采取一种新的抽样方法——分层随机抽样.
(2)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个
子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(3)比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.即
①=;
②=.
(4)分层随机抽样的步骤
①分层:根据已经掌握的信息,将总体分成互不重叠的层.
②求比:根据总体中的个体数N和样本容量n计算抽样比.
③定数:确定第i层应该抽取的个体数为ni=Ni·k(Ni为总体中第i层所包含的个体数),使得各ni之和
为n.
④抽样:按“定数”步骤中确定的个体数在各层中随机地抽取个体,合在一起便得到容量为n的样本.
(5)分层随机抽样的特点
①适用于由差异明显的几部分(即层)组成的总体;
②分成的各层互不重叠;
③各层抽取的比例都等于样本容量在总体中的比例,即,其中n为样本容量,N为总体容量;
④分层随机抽样使样本具有较强的代表性,而且在各层抽样时,又可灵活地选用不同的随机抽样方法.
2.分层随机抽样的平均数计算
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量
分别为m和n,第1层、第2层的总体平均数分别为,第1层、第2层的样本平均数分别为,总体平均数为,样本平均数为,则.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用估计总体平均数.
又==,
所以.
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数.
【题型3 抽样方法的选取】
【例3】(23-24高二上·上海长宁·期末)①植物根据植株的高度及分枝部位等可以分为乔木、灌木和草木三大类,某植物园需要对其园中的不同植物的干重(烘干后测定的质量)进行测量;②检测员拟对一批新生产的1000箱牛奶抽取10箱进行质量检测;上述两项调查应采用的抽样方法是( )
A.①用简单随机抽样,②用分层随机抽样 B.①用简单随机抽样,②用简单随机抽样
C.①用分层随机抽样,②用简单随机抽样 D.①用分层随机抽样,②用分层随机抽样
【解题思路】根据简单随机抽样和分层随机抽样的特点进行判断即可.
【解答过程】①乔木、灌木、草木,分类明显,可以采用分层随机抽样;
②并未有明显分层特点,且样本容量较小,可以采用简单随机抽样;
故选:C.
【变式3-1】(23-24高一下·陕西西安·期末)现要完成下列3项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查;②科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈;③某中学有高中生3500人,初中生1500人,为了解学生的学习情况,拟抽取一个容量为200的样本.较为合理的抽样方法分别是( )
A.①简单随机抽样,②分层抽样,③系统抽样
B.①简单随机抽样,②系统抽样,③分层抽样
C.①系统抽样,②简单随机抽样,③分层抽样
D.①分层抽样,②系统抽样,③简单随机抽样
【解题思路】根据简单随机抽样、系统抽样、分层抽样的定义和特点,以及适用范围,判断即可.
【解答过程】对于①,总体中的个体数较少,宜用简单随机抽样;
对于②,总体中的个体数较多,而且容易分成均衡的若干部分,
要选32名听众而刚好有32排,每排选一人,宜用系统抽样;
对于③,总体中的个体数较多,又是由差异明显的两部分组成,宜用分层抽样.
故选:B.
【变式3-2】(24-25高二上·四川绵阳·期末)①在一次满分为100分的测试中,有12人的成绩在90分以上,30人的成绩在60~80分,12人的成绩低于60分,现从中抽取9人了解有关考试题目难度的情况;②一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.针对这两件事,恰当的抽样方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层抽样 D.分层抽样,分层抽样
【解题思路】根据分层抽样和简单随机抽样的特点判断即可.
【解答过程】对于①:考试成绩在不同分数段之间的同学有明显的差异,用分层随机抽样比较恰当;
对于②:总体包含的个体较少,用简单随机抽样比较恰当.
故选:A.
【变式3-3】(24-25高一上·广西桂林·期末)要完成下列两项调查:(1)某社区有100户高收入家庭,210户中等收入家庭,90户低收入家庭,从中抽取100户调查有关消费购买力的某项指标;(2)从某中学高一年级的10名体育特长生中抽取3人调查学习情况;应采用的抽样方法分别是( )
A.(1)用简单随机抽样,(2)用分层随机抽样 B.(1)(2)都用简单随机抽样
C.(1)用分层随机抽样,(2)用简单随机抽样 D.(1)(2)都用分层随机抽样
【解题思路】根据简单随机抽样、分层抽样的适用条件进行分析判断.
【解答过程】因为有关消费购买力的某项指标受家庭收入的影响,而社区家庭收入差距明显,所以①用分层抽样;
从10名体育特长生中抽取3人调查学习情况,个体之间差别不大,且总体和样本容量较小,所以②用简单随机抽样.
故选:C.
【题型4 分层抽样的计算】
【例4】(24-25高一下·江西赣州·开学考试)为庆祝中国共产党成立周年,赣州市举办“红歌大传唱”主题活动,以传承红色革命精神,某高中学校分别有高一、高二、高三学生人、人、人,现欲采用分层随机抽样法组建一个人的高一、高二、高三学生红歌传唱队,则应抽取高一学生( )
A.人 B.人 C.人 D.人
【解题思路】借助分层抽样的性质计算即可得.
【解答过程】,故应抽取高一学生人.
故选:D.
【变式4-1】(24-25高三上·广西·阶段练习)北京时间2023年10月31日8时11分,神舟十六号载人飞船返回舱在东风着陆场成功着陆,载人飞行任务取得圆满成功.某高中学校在有120名同学的“航天”社团中随机抽取24名参加一个交流会,若按社团中高一、高二、高三年级的成员人数比例分层随机抽样,则高一年级抽取6人,若按性别比例分层随机抽样,则女生抽取15人,则下列结论错误的是( )
A.24是样本容量
B.120名社团成员中男生有50人
C.高二与高三年级的社团成员共有90人
D.高一年级的社团成员中女生最多有30人
【解题思路】利用样本容量的定义结合分层抽样知识解答即可.
【解答过程】对于A,由样本容量定义知:样本容量为,A正确;
对于B,女生共有人,男生有人,B错误;
对于C,高一年级的社团成员有人,高二高三年级的社团成员共有人,C正确;
对于D,由C知:高一年级的社团成员共人,高一年级的社团成员中女生最多有人,正确.
故选:B.
【变式4-2】(23-24高一下·江苏常州·期末)某学校高一年级选择“物化生”、“物化地”、“物化政”和“史政地”组合的同学人数分别为240、120、90和150.现采用分层抽样的方法选出20位同学进行一项调查研究,则“史政地”组合中选出的同学人数为( )
A.8 B.4 C.3 D.5
【解题思路】根据分层抽样计算规则计算可得.
【解答过程】依题意“史政地”组合中选出的同学人数为人.
故选:D.
【变式4-3】(2024高一下·全国·专题练习)中国农历的“二十四节气”是凝结着中华民族的智慧与传统文化的结晶.某小学一年级随机抽查100名学生并提问“二十四节气歌”,只能说出两句的有32人,能说出三句或三句以上的有45人,据此估计该校一年级的400名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数为( )
A.23 B.92
C.128 D.180
【解题思路】本题属于分层抽样,根据样本来估计总体,先计算样本中只能说出一句或一句也说不出的人的抽样比例,再乘以总体即可得出结果.
【解答过程】由题意,100名学生中只能说出一句或一句也说不出的人数为100-32-45=23,
在样本中的频率为,
故该校一年级的400名学生中对“二十四节气歌”只能说出一句或一句也说不出的人数约为×400=92.
故选:B.
【知识清单3 获取数据的途径】
1.获取数据的途径
(1)通过调查获取数据
我们一般通过抽样调查或普查的方法获取数据.
(2)通过试验获取数据
没有现存的数据可以查询时,就需要通过对比试验的方法去获取样本观测数据.
(3)通过观察获取数据
自然现象只能通过长久的持续观察获取数据.
(4)通过查询获得数据
通过收集前人的劳动成果并加以利用,从而减少收集数据的成本.
【题型5 普查与抽样】
【例5】(23-24高一下·内蒙古通辽·阶段练习)下列调查,比较适用普查而不适用抽样调查方式的是( )
A.为了了解中央电视台春节联欢晚会的收视率
B.为了了解高一某班的每个学生星期六晚上的睡眠时间
C.为了了解夏季冷饮市场上冰淇淋的质量情况
D.为了考查一片实验田某种水稻的穗长情况
【解题思路】根据普查和抽样调查的适用特征即可结合选项逐一求解.
【解答过程】A选项中做普查时数量太大,且该调查对调查结果准确性的要求不高,适合采用抽样调查的方式;
B选项中班级人数有限,比较容易调查,因而适合普查;
C选项中数量大并且时间长,不适合普查;
D选项中普查时数量太大,要费太大的人力物力,得不偿失,不适合普查.
故选:B.
【变式5-1】(23-24高一下·青海海南·期末)下列调查中,调查方式选择合理的是( )
A.了解某一品牌空调的使用寿命,选择普查
B.了解神舟飞船的设备零件的质量情况,选择抽样调查
C.了解一批袋装食品是否含有防腐剂,选择普查
D.了解某公园全年的游客流量,选择抽样调查
【解题思路】根据抽样调查和普查的定义,逐个选项判断调查方式是否合理即可.
【解答过程】对于A,了解某一品牌空调的使用寿命,选择抽样调查更符合经济效益,故A错误;
对于B,了解神舟飞船的设备零件的质量情况,
安全是最重要的,应该采取普查,故B错误;
对于C,了解一批袋装食品是否含有防腐剂,选择抽样调查更符合经济效益,故C错误;
对于D,了解某公园全年的游客流量,选择抽样调查比较符合经济效益,故D正确.
故选:D.
【变式5-2】(2025高一·全国·专题练习)下列调查方式,你认为最合适的是( )
A.了解北京每天的流动人口数,采用抽样调查
B.旅客上飞机前的安检,采用抽样调查
C.了解北京居民“建党百年庆祝大会”期间的出行方式,采用全面调查
D.日光灯管厂要检测一批灯管的使用寿命,采用全面调查
【解题思路】根据普查与抽样调查的适用范围以及特点即可结合选项逐一判断.
【解答过程】A选项,了解北京每天的流动人口数,调查范围广,应采用抽样调查,故A正确;
B选项,旅客上飞机前的安检,涉及到安全,事关重大,应采用全面调查,故B错误;
C选项,了解北京居民“建党百年庆祝大会”期间的出行方式,调查范围广,应采用抽样调查,故C错误;
D选项,日光灯管厂要检测一批灯管的使用寿命,由于调查具有破坏性,应采用抽样调查,故D错误.
故选:A.
【变式5-3】(23-24高二上·重庆北碚·阶段练习)在以下调查中,适合用全面调查的个数是( )
①调查一个班级学生的吃早餐情况
②调查某种饮料质量合格情况
③调查某批飞行员的身体健康指标
④调查某个水库中草鱼的所占比例
A.1 B.2 C.3 D.4
【解题思路】结合全面调查和抽样调查的特点进行判断.
【解答过程】①因为一个班级学生的人数不太多,吃早餐情况的全面调查也容易操作,所以适合全面调查;
②某种饮料数量太多,质量合格情况适合抽样调查;
③飞行员职业特点决定了身体健康指标必须全面调查;
④某个水库中鱼的种类和数量一般都较多,不适合全面调查.
故选:B.
【知识清单4 总体取值规律的估计】
1.频率分布直方图
(1)频率分布表与频率分布直方图的意义
为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初
中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.
(2)频率分布表与频率分布直方图的制作步骤
与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
第一步,求极差
极差为一组数据中最大值与最小值的差.
第二步,决定组距与组数
第三步,将数据分组
通常对组内数据取左闭右开区间,最后一组数据取闭区间.
第四步,列频率分布表
计算各小组的频率,作出频率分布表.
第五步,画频率分布直方图
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
2.其他几类常用统计图——条形图、折线图、扇形图
条形图
折线图
扇形图
特
点
一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的.
用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化.
用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
作用及选用情景
能清楚地表示每个项目的具体数量,便于相互比较大小.
能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中.
可以形象地表示出各部分数据在全部数据中所占的比例情况.
图例
【题型6 频率分布直方图的相关计算问题】
【例6】(23-24高一下·河北·期末)某校为了了解学生的体能情况,于6月中旬在全校进行体能测试,统计得到所有学生的体能测试成绩均在内.现将所有学生的体能测试成绩按分成三组,绘制成如图所示的频率分布直方图.若根据体能测试成绩采用按比例分层随机抽样的方法抽取20名学生作为某项活动的志愿者,则体能测试成绩在内的被抽取的学生人数为( )
A.4 B.6 C.8 D.10
【解题思路】由频率分布直方图可知体能测试成绩在内的频率为,由此采用按比例分层随机抽样的方法求解即可
【解答过程】根据题意可得体能测试成绩在内的被抽取的学生人数为.
故选:B.
【变式6-1】(2025高三上·河南·专题练习)为了调查某工厂生产的一批口罩的质量情况,随机抽取了一批口罩,所得数据如下图所示,为了进一步了解情况,研究人员在被抽取的口罩中按照质量的指标值再次进行分层抽样,共抽取个,若质量的指标值在中的抽取个,则下列说法正确的是( )
A.质量的指标值在中的抽取个
B.质量的指标值在中的抽取个
C.质量的指标值在中的抽取个
D.
【解题思路】计算出质量的指标值在内的频率,由频率、频数以及总容量三者之间的关系额可求得的值,可判断D选项;然后将的值乘以对应组的频率,可判断ABC选项.
【解答过程】质量的指标值在内的频率为,所以,,
所以,质量的指标值在中的抽取的数量为个,
质量的指标值在中的抽取的数量为个,
质量的指标值在的抽取的数量为个,ABC错,D对.
故选:D.
【变式6-2】(23-24高一下·吉林·期末)随着卡塔尔世界杯的举办,全民对足球的热爱程度有所提高,组委会在某场比赛结束后,随机抽取了若干名球迷对足球“喜爱度”进行调查评分,把喜爱程度较高的按年龄分成5组,其中第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第四组与第五组共有150人,第二组中女性球迷有75人,则第二组中男性球迷的人数为( )
A.140 B.120 C.100 D.80
【解题思路】由频率分布直方图求出第四组与第五组的频率之和,即可求出样本容量,再求出第二组的人数,即可得解.
【解答过程】由题意结合频率分布直方图可得,第四组与第五组的频率之和为,
第二组频率为.
因为第四组与第五组共有150人,所以样本容量,
所以第二组人数为,所以第二组中男性球迷人数为.
故选:C.
【变式6-3】(23-24高二上·北京·期中)某校组织全体学生参加了主题为“建党百年,薪火相传”的知识竞赛,随机抽取了200名学生进行成绩统计、发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,在被抽取的学生中,成绩在区间的学生数是( )
A.30 B.45 C.60 D.100
【解题思路】由频率之和为先求出,再由成绩在的频率可求成绩在该区间的学生数.
【解答过程】由题意得,,
解得,则学生成绩在区间的频率为,
由共抽取200名学生,则成绩在区间的学生数为.
故选:C.
【题型7 根据统计图解决实际问题】
【例7】(24-25高一下·吉林通化·阶段练习)2024年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩在前200名的学生中,高一人数比高二人数多30
B.成绩在第1~50名的学生中,高三最多有32人
C.高一学生成绩在第101~150名的人数一定比高三学生成绩在第1~50名的人数多
D.成绩在第51~100名的学生中,高二人数比高一人数多
【解题思路】由饼状图可计算出高一年级共90人,高二年级共60人,高三年级共50人,再由高一学生排名分布的频率条形图可计算出各排名段中高一年级学生的人数,由此即可判断出答案.
【解答过程】由饼状图可知,成绩在前200名的学生中,高一人数比高二人数多,A正确;
成绩在第名的学生中,高一人数为,因此高三最多有32人,B正确;
由条形图知高一学生的成绩在第名的人数为,
而高三的学生成绩在第名的人数最多为人,
故高一学生的成绩在第名的人数一定比高三的学生成绩在第名的人数多,C正确;
成绩在第名的学生中,高一人数为,
高二成绩在第名的人数最多为,
即成绩在第51~100名的学生中,高一的人数一定比高二的人数多,D错误.
故选:D.
【变式7-1】(24-25高一下·湖南·阶段练习)如图为近一年我国商品零售总额和餐饮收入总额同比增速情况折线图,根据该图,下列结论正确的是( )
(注:同比,指当前的数据与上一年同期进行比对;环比,指当前数据与上个月的数据进行比对.)
A.2024年月份,商品零售总额同比增长
B.2023年月份,餐饮收入总额同比都降低
C.2023年月份,商品零售总额同比都增加
D.2023年12月,餐饮收入总额环比增速为
【解题思路】根据折线统计图一一分析即可.
【解答过程】对于A,2024年月份,商品零售总额同比增长,故A错误;
对于B,2023年8月份,餐饮收入总额同比增加,故B错误;
对于C,2023年月份,商品零售总额同比都增加,故C正确;
对于D,2023年12月,餐饮收入总额环比增速并未告知,故D错误.
故选:C.
【变式7-2】(23-24高一下·贵州黔东南·期末)小波一星期的总开支(单位:元)分布如图1所示,一星期的食品开支(单位:元)分布如图2所示,则小波一星期的肉类开支占总开支的百分比为( )
A. B. C. D.
【解题思路】首先根据频数分布直方图可知食品开支为300元,其中肉类开支为元,运用百分比公式计算出肉类占食品开支的百分比; 然后根据扇形统计图得出食品在所有开支中所占的百分比,两者相乘,即可求得一星期的肉类开支占总开支的百分比.
【解答过程】由图2知,小波一星期的食品开支为300元,其中肉类开支为元,占食品开支的,
而食品开支占总开支的,所以小波一星期的肉类开支占总开支的百分比为,
故选:C.
【变式7-3】(2024高一下·全国·专题练习)已知全国农产品批发价格200指数月度变化情况如图所示,下列选项正确的是( )
A.全国农产品夏季价格比冬季低
B.全国农产品批发价格200指数2023年每个月逐渐增加
C.2023年“菜篮子”产品批发价格指数与农产品批发价格200指数的变化趋势基本保持一致
D.2023年6月农产品批发价格200指数大于116
【解题思路】由图表直接观察一一分析选项即可.
【解答过程】对于A,图中给的是批发价格200指数,所以并不能确定农产品的价格变化,故A错误;
对于B,全国农产品批发价格200指数2023年4-6月呈下降趋势,并未增加,故B错误;
对于C,根据图中曲线的变化趋势可发现2023年“菜篮子”产品批发价格指数与农产品批发价格200指数的变化趋势基本保持一致,故C正确;
对于D,2023年6月农产品批发价格200指数在115附近,故D错误.
故选:C.
【知识清单5 总体百分位数的估计】
1.总体百分位数的估计
(1)概念
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个
值,且至少有(100-p)%的数据大于或等于这个值.
(2)求解步骤
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p
百分位数为第i项与第(i+1)项数据的平均数.
【题型8 百分位数的求解】
【例8】(24-25高一下·甘肃兰州·阶段练习)已知一组数据3,4,5,6,7,8,9,10,则这组数据的第20百分位数是( )
A. B.4 C. D.5
【解题思路】根据百分位数的定义求解即可.
【解答过程】这组数据从小到大的顺序为3,4,5,6,7,8,9,10,
因为,所以第20百分位数是这组数据的第二个数,
所以这组数据的第20百分位数为.
故选:.
【变式8-1】(2025高二下·河北·学业考试)某校为了解高一年级学生的体育健康标准测试(简称“体测”)成绩的分布情况,从该年级学生的体测成绩(规定满分为100分)中,随机抽取了80名学生的成绩,并进行分组:,,,,,绘制成如下频率分布直方图,该校高一年级学生体测成绩的第80百分位数的估计值是( )
A.87 B.88 C.89 D.90
【解题思路】先根据频率之和为1得到方程,求出,求出第80百分位数落在第四组数据内,设第80百分位数为,得到方程,求出答案.
【解答过程】,解得,
前三组数据的频率之和为,
前四组数据的频率之和为,
故该校高一年级学生体测成绩的第80百分位数落在第四组数据内,
设第80百分位数为,
则,解得,
该校高一年级学生体测成绩的第80百分位数的估计值是88.
故选:B.
【变式8-2】(23-24高一下·江苏苏州·期末)某科研单位对ChatGPT的使用情况进行满意度调查,在一批用户的有效问卷(用户打分在50分到100分之间的问卷)中随机抽取了100份,按分数进行分组(每组为左闭右开的区间),得到如图所示的频率分布直方图,估计这批用户问卷的得分的第百分位数为( )
A.78.5 B.82.5 C.85 D.87.5
【解题思路】根据百分位数计算规则计算可得.
【解答过程】因为,
,
所以第百分位数位于,设为,
则,解得.
故选:B.
【变式8-3】(23-24高一下·江苏常州·期末)在2021年东京奥运会女子10米气步枪项目中,杨倩凭借出色的表现获得冠军.她前10枪的成绩(单位:环)分别为:10.2,10.9,10.5,10.0,10.3,10.5,10.8,10.5,10.1,10.9.基于这些数据,我们可以计算出前10枪成绩的第75百分位数为( )
A.10.2 B.10.5 C.10.65 D.10.8
【解题思路】将数据从小到大排序,再结合百分位数的定义与计算方法,即可求解.
【解答过程】根据题意,数据从小到大排序为:,
可得,所以前10枪成绩的第75百分位数为第8个数据,即为.
故选:D.
【知识清单6 总体集中趋势与离散程度的估计】
1.总体集中趋势的估计
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度
刻画了一组数据的集中趋势.具体概念回顾如下:
名称
概念
平
均
数
如果有n个数x1,x2,…,xn,那么就是这组数据的平均数,用表示,即.
中
位
数
将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
众
数
一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.
2.总体离散程度的估计
(1)方差和标准差
假设一组数据是,,,,用表示这组数据的平均数,则我们称为这组数据的
方差.有时为了计算方差的方便,我们还把方差写成的形式.
我们对方差开平方,取它的算数平方根,称为这组数据的标准差.
(2)总体(样本)方差和总体标准差
①一般式:如果总体中所有个体的变量值分别为,总体平均数为,则总体方差
.
②加权式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为,其中出
现的频数为,则总体方差为.
总体标准差:S=.
(3)标准差与方差的统计意义
①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.
③标准差(方差)的取值范围为[0,+∞).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则
标准差为0.反之,标准差为0的样本,其中的数据都相等.
3.频率分布直方图中的统计参数
(1)频率分布直方图中的“众数”
根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用
中点近似代替.
(2)频率分布直方图中的“中位数”
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.
因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.
(3)频率分布直方图中的“平均数”
平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分
布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
【题型9 众数、中位数、平均数的求解及应用】
【例9】(23-24高一下·海南省直辖县级单位·期中)下表是某地区2024年3月1日至10日每天中午12时的气温统计表,则下列关于这10天中气温的说法错误的是( )
日期
1
2
3
4
5
6
7
8
9
10
气温(℃)
2
10
18
20
16
12
6
2
6
12
A.众数为2和6和12 B.70%分位数为16
C.平均数小于中位数 D.极差为18
【解题思路】由众数,平均数,中位数,百分位数,极差的概念求解可得结论.
【解答过程】对于A:由气温统计表可得众数为2和6和12,故A正确;
对于B:把气温由小到大排为2,2,6,6,10,12,12,16,18,20,
由,故70%分位数为,故B错误;
对于C:平均数为,
中位数为,所以平均数小于中位数,故C正确;
对于D:极差为,故D正确.
故选:B.
【变式9-1】(23-24高一下·云南曲靖·期末)已知一组数据丢失了其中一个大于3的数据,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的2倍,则丢失的数据可能是( )
A.5 B.12 C.18 D.20
【解题思路】设丢失的数据为,即可求出平均数与众数,再对分和两种情况讨论,得到中位数,即可得到方程,解得即可;
【解答过程】设丢失的数据为,则这七个数据的平均数为,众数是3,
若,则中位数为,此时,解得;
若,则中位数为5,此时,解得.
综上所述,丢失的数据可能是4,18.
故选:C.
【变式9-2】(23-24高一下·浙江宁波·期末)在如图所示的两种分布形态中( )
A.(1)中的中位数大于平均数
B.(1)中的众数大于平均数
C.(2)中的众数小于中位数
D.(2)中的平均数小于中位数
【解题思路】根据直方图矩形高低以及数据的分布趋势,判断即可得出结论
【解答过程】众数是最高的矩形的中点横坐标,因此(1)中的众数在第二列矩形的中点处,
(1)中的数据第二、三列较多,且右侧拖尾,
所以平均数大于中位数,即在(1)中,众数<中位数<平均数;
同理在(2)中,平均数<中位数<众数.
故选:D.
【变式9-3】(23-24高一下·新疆·期末)已知在高考前最后一次模拟考试中,高三某班8名同学的物理成绩分别为84,79,84,86,95,84,87,93,则该组数据的平均数和众数分别是( )
A.86,84 B.84.5,85 C.85,84 D.86.5,84
【解题思路】根据平均数和众数的概念求解.
【解答过程】将样本数据按升序排列为79,84,84,84,86,87,93,95,可得平均数,
因为84出现了三次,且次数最多,所以众数为84.
故选:D.
【题型10 方差、标准差的求解及应用】
【例10】(24-25高一下·内蒙古通辽·阶段练习)已知某次期中考试中,甲、乙两组学生的数学成绩如下:
甲:88 100 95 86 95 91 84 74 92 83
乙:93 89 81 77 96 78 77 85 89 86
则下列结论正确的是( )
A.甲>乙,s甲>s乙 B.甲>乙,s甲<s乙
C.甲<乙,s甲>s乙 D.甲<乙,s甲<s乙
【解题思路】先求解两组数据的平均数,再利用标准差公式计算标准差,由此可得答案;
【解答过程】∵,,
s甲==≈7.08,
s乙==≈6.41,
∴甲>乙,s甲>s乙.
故选:A.
【变式10-1】(23-24高一下·海南省直辖县级单位·期末)从两个班级各随机抽取5名学生测量身高(单位:),甲班的数据为169,162,150,160,159,乙班的数据为180,160,150,150,165.据此估计甲、乙两班学生的平均身高,及方差,的关系为( )
A., B.,
C., D.,
【解题思路】由题意,根据平均数和方差的计算公式分别计算出、、、,即可下结论.
【解答过程】,,
,
,
所以,.
故选:D.
【变式10-2】(23-24高一下·山西太原·期末)甲、乙两名射箭运动员在10次射箭训练中,射中的环数分别为:
甲 9 10 8 9 9 7 8 9 10 8
乙 9 9 8 8 10 9 9 8 8 9
(1)计算这10次训练中甲、乙射中环数的平均数和方差;
(2)从计算结果看,哪位运动员的射箭技术更好?
【解题思路】(1)由平均数和方差的计算公式计算即可得到答案;
(2)由,可知乙运动员的射箭技术更好.
【解答过程】(1)根据题中所给数据,甲的平均数为,
乙的平均数为,
甲的方差为,
乙的方差为,
故甲的平均数为8.7,标准差为0.81,乙的平均数为8.7,标准差为0.41.
(2)由(1)可知,,因为平均数相同,方差越小的技术越稳定,
所以乙的技术较为稳定,故乙运动员的射箭技术更好.
【变式10-3】(24-25高一下·甘肃·阶段练习)为了迎接某项活动,某市积极开展网上竞赛,先采取甲、乙两套方案进行培训,并对分别采取两套方案培训的单位的7次线上测试成绩进行统计如图所示:
(1)求甲和乙的测试成绩的平均数和方差;
(2)从下列两个不同的角度对这次方案选择的结果进行分析:
①从平均数和方差相结合看(分析哪种方案的成绩更好);
②从折线图上两种方案的走势看(分析哪种方案更有潜力).
【解题思路】(1)利用平均数和方差的公式进行求解;
(2)①比较平均数,两者相等,比较方差,,得到结论;
②数形结合得到甲成绩在稳步提高,得到结论
【解答过程】(1)由表格中的数据可得
甲的平均数为,
乙的平均数为,
甲的方差为,
乙的方差为,
(2)①甲,乙两种方案的平均数相等,且,乙方案更稳定,更好;
②从折线图的走势上看甲更有潜力,使用甲方案成绩稳步提高,
而使用乙方案成绩不稳定,忽上忽下.
【题型11 统计图中集中趋势参数的计算】
【例11】(2024·广东韶关·一模)众数、平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据的分布形态有关.根据某小区1000户居民的月均用水量数据(单位:),得到如图所示的频率分布直方图,记该组数据的众数为,中位数为,平均数为,则( )
A. B.
C. D.
【解题思路】由频率分布直方图结合中位数以及众数的计算即可比较大小.
【解答过程】观察频率分布直方图,发现是属于右边“拖尾”,所以平均数大于中位数为,
由于第一个小矩形面积为,
前2个小矩形面积之和为,
所以中位数位于之间,故可得,解得,
由频率分布直方图可知众数,
故,
故选:D.
【变式11-1】(24-25高二上·黑龙江齐齐哈尔·期中)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.则下列说法错误的是( )
A.估计该年级学生成绩的众数约为75
B.
C.估计该年级学生成绩的75百分位数约为85
D.估计该年级成绩在80分及以上的学生成绩的平均数约为87.50
【解题思路】根据频率分布直方图中众数的估计方法可判断A;利用各组频率之和为1可判断B;根据百分位数的估计方法可判断C;根据平均数的估计方法可判断D.
【解答过程】由图易知成绩在分之间的人数最多,
故可估计该年级学生成绩的众数为75,A正确;
由频率分布直方图可知,解得,B错误;
由于前三组的频率之和为,前四组的频率之和为,
故估计该年级学生成绩的75百分位数约为,C正确;
由频率分布直方图可知成绩在分之间和分之间的频率之比为,
故估计该年级成绩在80分及以上的学生成绩的平均数为,D正确.
故选:B.
【变式11-2】(多选)(23-24高一下·山东临沂·期末)某学校为了调查高一年级学生每天体育活动时间的情况,随机选取了100名学生,绘制了如图所示频率分布直方图,则( )
A.
B.平均数的估计值为30
C.众数的估计值为35
D.这100名学生中有25名学生每天体育活动时间不低于40分钟
【解题思路】根据频率分布直方图中所有小矩形面积之和为求出,再根据平均数、众数及频率分布直方图一一判断即可.
【解答过程】依题意可得,解得,故A正确;
平均数的估计值为,故B错误;
由频率分布直方图可知的频率最大,因此众数的估计值为,故C正确;
随机选取这100名学生中体育活动时间不低于40分钟的人数为,故D正确;
故选:ACD.
【变式11-3】(24-25高一下·甘肃平凉·开学考试)为进一步弘扬中华优秀传统文化,提升诗词爱好者的素养和创作水平,形成浓厚的国学和诗词学习氛围,2024年9月19日,首届“中华诗韵·风雅平凉”彦军杯诗词大赛决赛在剧院成功举行.为了解参赛者对此次活动的满意度,某研究性学习小组用问卷调查的方式随机调查了名参赛者,该小组将收集到的参赛者满意度分值数据(满分100分)统计如下表所示:
分数
频数
5
10
20
35
频率
0.05
0.20
0.30
0.35
(1)分别求,,的值,并在图中画出频率分布直方图;
(2)估计名参赛者满意度分值的众数、平均数和第75百分位数(结果保留整数).
【解题思路】(1)根据频率分布直方图中各组频率之和为1即可求得a的值;结合频数、频率的关系即可求得,的值,并作图;
(2)结合众数、中位数和第p百分位数的含义即可求得它们的值.
【解答过程】(1)由,解得,
,.
而每组的频率/组距分别为0.005、0.010、0.020、0.030、0.035,
所以频率分布直方图如下所示:
(2)由题意,众数为频率分布直方图中最高矩形所在区间的中点,
即众数为95分;
平均值为每个小矩形底边中点的横坐标与小矩形的面积的乘积之和,
即,
所以估计平均值为83分;
前四组频率和为,
所以第75百分位数在内,设第百分位数为,
则,解得,所以估计第75百分位数是93分.
【题型12 统计图中方差的计算】
【例12】(2025高二下·湖南·学业考试)2023年袁隆平“超级稻”突破亩产,再次刷新了杂交水稻单季亩产世界纪录.已知甲、乙两种杂交水稻在面积相等的两块试验田中连续6年的产量如图所示,则( )
A.甲的平均产量高于乙的平均产量 B.甲的最高产量高于乙的最高产量
C.甲的产量更稳定 D.乙的产量更稳定
【解题思路】A选项,分别求出甲、乙的平均产量进行判断;B选项,从图中分别求出甲、乙的最高产量进行判断;C、D选项,由折线图的波动情况可确定产量的稳定性,波动越小产量越稳定.
【解答过程】A选项,甲的平均产量为kg,
乙的平均产量为,A错误;
B选项,甲的最高产量为1200kg,乙的最高产量为1251kg,B错误;
C、D选项,由折线图可知甲的波动更大,所以乙的产量更稳定,D正确.
故选:D.
【变式12-1】(23-24高一下·云南楚雄·期末)某商品3〜5月份在甲、乙、丙、丁四个地区的销量如下图所示,则在这四个地区中该商品3〜5月份销量方差最小的为( )
A.甲地区 B.乙地区 C.丙地区 D.丁地区
【解题思路】根据题意,由方差的计算公式代入计算,即可得到结果.
【解答过程】由图可得,丁地区销量最稳定,所以丁地区销量的方差最小.
故选:D.
【变式12-2】(多选)(23-24高一下·黑龙江·期末)为普及疫情知识,某校不定期地共组织了10次全员性的防控知识问答竞赛,下面是甲、乙两个班级10次成绩(单位:分)的折线图:根据折线图( )
A.甲班的成绩分数呈上升趋势
B.甲班乙班的成绩分数平均值均为7
C.甲班成绩分数的方差小于乙班成绩分数的方差
D.从第8次到第10次甲班成绩分数增量大于乙班成绩分数增量
【解题思路】由折线图易知A正确;经计算可知两班成绩平均值相等,即B正确;由甲乙两班成绩波动程度可得C错误;从第8次到第10次两班成绩分数增量相等,即D错误.
【解答过程】对于A,由折线图可知,甲班的成绩分数呈上升趋势,即A正确;
对于B,计算甲班成绩平均值为,
乙班成绩平均值为,即B正确;
对于C,根据甲班成绩分数的波动性大于乙班成绩分数的波动性,可得甲班成绩分数的方差大于乙班成绩分数的方差,即C错误;
对于D,从第8次到第10次甲班成绩分数增量等于乙班成绩分数增量,即D错误;
故选:AB.
【变式12-3】(23-24高一下·云南昆明·期末)某中学举行了一次“环保知识竞赛”,全校学生参加了这次竞赛. 为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)作为样本进行统计. 请根据下面尚未完成并有局部污损的频率分布表(如图所示)和频率分布直方图(如图所示)解决下列问题:频率分布表:
组别
分组
频数
频率
第1组
8
0.16
第2组
第3组
20
0.40
第4组
0.08
第5组
2
合计
频率分布直方图:
(1)写出 的值;
(2)若根据这次成绩,学校准备淘汰 同学,仅留 的同学进入下一轮竞赛,请问晋级分数线划为多少合理?
(3)某老师在此次考试成绩中抽取10名学生的分数:,已知这10个分数的平均数,标准差 ,若剔除其中的100和80这两个分数,求剩余8个分数的平均数与标准差.
【解题思路】(1)根据频率和频数的关系以及直方图中小矩形的面积代表频率,进行计算即可;
(2)利用频率分布直方图计算第90百分位数即可;
(3)根据平均数和方差的计算公式求解即可.
【解答过程】(1)由题意可知抽取的学生人数为:,
则第四组人数为:,
所以,
,,.
(2)成绩落在内的频率为:,
落在内的频率为:,
设第90百分位数为,
则,解得,
故晋级分数线划为82.5合理.
(3)因为,所以.
标准差,所以,
则,
剔除其中的100和80两个分数,设剩余8个数为,
设平均数与标准差分别为,
则剩余8个分数的平均数为,
方差为,
故标准差为.
【题型13 总体集中趋势与方差的综合应用】
【例13】(23-24高二下·湖南·期末)某学校开展“国学知识竞赛”,共有“诗经组”,“论语组”,“春秋组”,“礼记组”4个小组参赛,每组10位选手,若该组每位选手的失分不超过6分,该组获得“优秀”称号,则根据每组选手的失分情况,下列小组一定获得“优秀”称号的是( )
A.诗经组中位数为3,众数为2
B.论语组平均数为3,方差为1
C.春秋组平均数为3,众数为2
D.礼记组中位数为3,极差为4
【解题思路】举出相应反例计算可得A、C、D错误,借助反证法及方差计算公式可得B.
【解答过程】对于A,数据为:时,满足中位数为3,众数为2,
但不满足每位选手的失分不超过6分,故A错误;
对于B,假设有一位同学失7分,则方差,与方差为1矛盾,
假设不成立,故B正确;
对于C,数据为:1,2,2,2,2,时,满足平均数为3,众数为2,
但是不满足每位选手失分不超过6分,故C错误;
对于D,数据为:,满足中位数为3,极差为4,
但最大值超过6分,故D错误.
故选:B.
【变式13-1】(23-24高一下·黑龙江大庆·期末)一个同学投掷10次骰子,记录出现的点数,根据统计结果,在下列情况中一定不能出现点数6的是( )
A.平均数为3,中位数为4
B.中位数为4,众数为3
C.平均数为2,方差为2.1
D.中位数为3,方差为0.85
【解题思路】举例判断ABD,C用反证法证明不能出现6.
【解答过程】对于A,10次点数为符合题意,故A错误;
对于B,10次点数为符合题意,故B错误;
对于C,设10次点数为,且,平均数为,
假设有一次点数为6,不妨设,
由方差公式,
代入,,,
则,则最大取4,
不妨设,则,方程无解,故,
当,,最大取3,
不妨设,则,则,
则这10次点数为,但平均数为,不合题意,故;
当时,,方程无解,故;
当时,,方程无解,
综上所述,假设有一次点数为6不成立,故C正确;
对于D,10次点数为符合题意,故D错误;
故选:C.
【变式13-2】(多选)(23-24高一下·黑龙江绥化·期末)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标准为“连续10天,每天新增疑似病例不超过7人”,过去10天,甲、乙、丙、丁四地新增疑似病例数据信息如下:甲地:平均数为2,众数为2;乙地:中位数为3,极差为4;丙地:平均数为2,中位数为3;丁地:平均数为2,标准差为,甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是( )
A.甲地 B.乙地 C.丙地 D.丁地
【解题思路】对于A,举例判断,对于B,计算出每天新增疑似病例人数的最大值判断,对于CD,利用反证法判断.
【解答过程】对于A,若甲地过去10天每天新增疑似病例人数分别为0,0,0,2,2,2,2,2,2,8,
则满足平均数2,众数为2,但不满足每天新增疑似病例不超过7人,所以A错误,
对于B,因为乙地:中位数为3,极差为4,则最大值不大于,
所以乙地满足每天新增疑似病例不超过7人,所以B正确,
对于C,假设丙地至少有一天新增疑似病例人数超过7人,
由中位数为3可得平均数的最小值为,
与题意矛盾,所以C正确,
对于D,假设丁地至少有一天新增疑似病例人数超过7人,
则方差的最小值为,与题意矛盾,所以D正确,
故选:BCD.
【变式13-3】(23-24高一下·北京通州·期中)甲、乙、丙三人进行5轮的投篮比赛,每轮各投10次,其成绩(命中次数)如下:
甲投中次数
6
6
8
7
8
乙投中次数
6
5
4
6
丙投中次数
(1)若乙比甲平均少投中2次,求的值,甲和乙投中次数的方差分别为和,试比较和大小(结论不要求证明);
(2)若投中一球计三分,丙平均得分为21分,方差为27,且每轮得分互不相同,求丙在比赛中的最高得分,并说明理由.
【解题思路】(1)利用平均数求得值,再利用方差的定义计算即得.
(2)根据给定条件,转化为投中次数的平均数和方差,列式换元,构造函数并利用二次函数的性质推理计算得解.
【解答过程】(1)由乙比甲平均少投中2次,得,所以,
甲投中次数的平均数为7,乙投中次数的平均数为5,
则,,
所以.
(2)因投中一球计三分,丙的平均得分为21,方差为27,
等价于丙平均投中7次,方差为3,不妨设,
则,,
设分别为,
于是,设
,
由恒成立,得判别式,即,
解得,且,因此的最大值为3,
则最大为3+7=10,所以丙在一轮比赛中的最高得分为30.
【题型14 统计综合】
【例14】(23-24高一下·湖南长沙·期末)有一组互不相等的样本数据,平均数为.若随机剔除其中一个数据,得到一组新数据,记为,平均数为,则下列说法错误的是( )
A.新数据的极差可能等于原数据的极差
B.新数据的中位数不可能等于原数据的中位数
C.若,则新数据的方差一定大于原数据方差
D.若,则新数据的分位数一定大于原数据的分位数
【解题思路】根据题意,由数据极差、中位数、方差和百分位数的计算公式逐项分析即可.
【解答过程】不妨设原数据,新数据..,
A:例如原数据为,新数据为,此时极差均为,故A正确;
B:原数据中位数为,新数据中位数为,可知或,
若,可得;若,可得;
综上所述:新数据的中位数不可能等于原数据的中位数,故B正确;
C:若,可知去掉的数据为,则,
可得,所以新数据的方差一定大于原数据方差,故C正确;
D:若,可知去掉的数据为,因为,可知原数据的分位数为第3位数,,可知新数据的分位数为第2位数与第3位数的平均数,
例如原数据为,新数据为,此时新数据的分位数、原数据的分位数均为3,故D错误,
故选:D.
【变式14-1】(23-24高二下·安徽·阶段练习)在一组数3,3,8,11,28中插入两个整数,,使得新的一组数极差为原来极差的两倍,且众数和中位数保持不变,则的最大值为( )
A.57 B.58 C.60 D.61
【解题思路】由题意可得插入的两个数不可能都是;可得一个为,另一个数不小于8,由极差加倍,则另一个数为,若插入的两个数是不等的且不是,,,,且极差为,进而可得,进而可求的最大值.
【解答过程】若插入两个整数后众数不变,则插入的数可以是“两个都是”,或是“一个为,另一个不是”,
或是“两个不等的且不是,,”.
①因为新的一组数极差加倍,所以插入的两个数不可能都是;
②因为中位数保持不变,若插入的数“一个为,另一个不是”,则一个为,另一个数不小于,
又因为极差加倍,则另一个数为,此时;
③若插入的两个数是不等的且不是,,,,且极差为,中位数保持不变,
则两个数可以为
,,,,,,,
所以,的最大值为.
故选:C.
【变式14-2】(23-24高一下·宁夏·期末)某公司为了提高职工的健身意识,鼓励大家加入健步运动,要求200名职工每天晚上9:30上传手机计步截图,对于步数超过10000的予以奖励.图1为甲乙两名职工在某一星期内的运动步数统计图,图2为根据这星期内某一天全体职工的运动步数做出的频率分布直方图.
(1)请根据频率分布直方图,求m的值,并求出该天运动步数不少于15000步的人数;
(2)估计全体职工在该天运动步数的众数、平均数和中位数;
(3)如果当天甲的排名为第130名,乙的排名为第40名,试判断做出的是星期几的频率分布直方图.
【解题思路】(1)根据频率分布直方图中各组频率之和为1,即可求得m的值;结合频率、频数之间的关系即可求得该天运动步数不少于15000步的人数;
(2)根据频率分布直方图,依据众数、平均数和中位数的估计方法即可求得答案;
(3)计算甲乙排名的占比,结合频率分布直方图计算出甲乙两人的步数,与已知的甲乙两名职工在某一星期内的运动步数统计图比较,即得答案.
【解答过程】(1)由图可知,解得;
所以该天运动步数不少于15000的人数为(人);
(2)众数是(千步);
全体职工在该天的平均步数为:
(千步)
由于前两组频率之和为,前三组频率之和为,
故设中位数为x,则,
即中位数是:(千步)
(3)因为,,
假设甲的步数为千步,乙的步数为千步,
由频率分布直方图可得:
,解得(千步),
,解得(千步),
所以可得出是星期二的频率分布直方图.
【变式14-3】(23-24高一下·河南鹤壁·期末)某电视台有一档益智答题类综艺节目,每期节目从现场编号为01~80的80名观众中随机抽取10人答题.答题选手要从“科技”和“文艺”两类题目中选一类作答,一共回答10个问题,答对1题得1分.
(1)若采用随机数表法抽取答题选手,按照以下随机数表,从下方带点的数字2开始向右读,每次读取两位数,一行用完接下一行左端,求抽取的第6个观众的编号.
1622779439 4954435482 1737932378 873509643 8426349164
8442175331 5724550688 7704744767 2176335025 8392120676
(2)若采用等距系统抽样法抽取答题选手,且抽取的最小编号为06,求抽取的最大编号.
(3)某期节目的10名答题选手中6人选科技类题目,4人选文艺类题目.其中选择科技类的6人得分的平均数为7,方差为;选择文艺类的4人得分的平均数为8,方差为.求这期节目的10名答题选手得分的平均数和方差.
【解题思路】(1)根据随机数表依次读取数据即可,取01~80之间的数据;
(2)根据系统抽样,确定组矩,计算可得;
(3)根据平均数和方差得出数据的整体关系,整体代入求解10名选手的平均数和方差.
【解答过程】(1)根据题意读取的编号依次是:20,96(超界),43,84(超界),26,34,91(超界),64,84(超界),42,17,
所以抽取的第6个观众的编号为42;
(2)若采用系统抽样,组矩为8,最小编号为06,则最大编号为6+9×8=78;
(3)记选择科技类的6人成绩分别为:,
选择文艺类的4人成绩分别为:,
由题:,,
,,
所以这10名选手的平均数为
方差为
.
一、单选题
1.(23-24高一下·吉林四平·期末)下列调查方式中,不适合的是( )
A.调查一批灯泡的使用寿命,采用普查的方式
B.调查某班学生的体重,采用普查的方式
C.调查一条河流的水质,采用抽查的方式
D.调查某鱼塘中草鱼的平均重量,采用抽查的方式
【解题思路】用普查与抽查的定义逐一判断即可
【解答过程】对于A:调查一批灯泡的使用寿命,破坏性较强,应采用抽查的方式;
对于B:调查某班学生的体重,要求结果精确,故因采用普查的方式;
对于C:调查一条河流的水质,因为所调查的对象范围广,应采用抽查的方式;
对于D:调查某鱼塘中草鱼的平均重量,因为所调查的对象范围广,且捕捉不易,应采用抽查的方式;
故选:A.
2.(23-24高一下·江西景德镇·期中)在新冠肺炎疫情期间,大多数学生都在家进行网上上课,某校高一,高二,高三共有学生6000名,为了了解同学们对某授课软件的意见,计划采用分层抽样的方法从这6000名学生中抽取一个容量60的样本,若从高一,高二,高三抽取的人数恰好是从小到大排列的连续偶数,则该校高二年级的人数为( )
A.1000 B.1500 C.2000 D.3000
【解题思路】根据分层抽样的性质,结合样本容量进行求解即可.
【解答过程】因为从高一、高二、高三抽取的人数恰好是从小到大排列的连续偶数,
所以设高三抽取的人数为,则高二抽取的人数为,高一抽取的人数为,
因为样本容量为60,所以,
设我校高二年级的人数为,
根据分层抽样得:,
故选:C.
3.(23-24高一下·云南丽江·阶段练习)下列两项调查适宜采用的抽样方法依次是( )
①一项对“中兴事件”(2018年4月16日,美国对中兴通讯施行惩罚措施,引起国内关于国产芯片的讨论)影响的调查中有10000人认为这是美国贸易保护主义,对世界经济会产生比较负面的影响:有9000人认为这只是一个孤立事件,对世界经济大格局不会产生太大影响:有1000人没有发表自己的看法.现要从这20000人中随机抽取200人做进一步调查.
②从某中学高二年级的15名艺术特长生中选出3名调查学习负担情况.
A.①简单随机抽样,②分层抽样
B.①分层抽样,②简单随机抽样
C.①②都用简单随机抽样
D.①②都用分层抽样
【解题思路】由随机抽样的定义进行判断.
【解答过程】解:对于①,总体中明显存在差异,则用分层随机抽样;
对于②,总体个数较少,则用简单随机抽样,
故选:B.
4.(23-24高一下·贵州毕节·期末)某研究小组为了解某市高中生自主阅读情况,随机调查了2000名学生的每周自主阅读时间,按照时长(单位:小时)分成五组:,得到如图所示的频率分布直方图,其中每周自主阅读时间不低于8小时的频率为0.3.则以下说法中错误的是( )
A.
B.估计样本数据的第60百分位数值是7.5小时
C.样本的极差介于6小时至10小时之间
D.估计这2000名学生每周自主阅读时间的平均值是6.5小时
【解题思路】A项,由已知频率可得关系;B项,由各组频率之和为与A项所得频率关系求解,由,估计第60百分位数值所在区间,再利用矩形面积计算估值即可;C项,由最大值与最小值的取值区间,再由不等式的性质可得极差范围;D项,样本平均数由每个小矩形底边中点的横坐标与小矩形的面积(频率)的乘积之和近似代替,计算可得.
【解答过程】选项A,由每周自主阅读时间不低于8小时的频率为0.3,
则,解得,故A正确;
选项B,由各组频率之和为得,,
联立解得,
故五组的频率分别为,
因为前两组的频率之和为,前三组的频率之和为,
且,
设样本数据的第60百分位数值为,则,
由,解得,
故估计样本数据的第60百分位数值是7.5小时,故B正确;
选项C,设样本数据中的最小值为,最大值为,
由频率分布直方图可知,最小值,最大值,
所以,则由不等式的性质可得极差,
即样本的极差介于6小时至10小时之间,故C正确;
选项D,由频率分布直方图样本平均数的近似值为,
估计这2000名学生每周自主阅读时间的平均值是小时,故D错误.
故选:D.
5.(23-24高一下·青海·期末)某篮球运动员进行投篮训练,共进行了10组,每组投篮55次,每组投篮命中的个数分别为m,n,48,47,48,50,45,47,49,50.已知这组数据的平均数为48,方差为7,则( )
A.10 B. C. D.5
【解题思路】根据平均数与方差的公式列方程可得解.
【解答过程】因为这组数据的平均数为48,方差为7,
所以
整理得
设,则,
因为50,所以,即,
则.
故选:A.
6.(23-24高一下·湖南长沙·期末)有一组互不相等的样本数据,平均数为.若随机剔除其中一个数据,得到一组新数据,记为,平均数为,则下列说法错误的是( )
A.新数据的极差可能等于原数据的极差
B.新数据的中位数不可能等于原数据的中位数
C.若,则新数据的方差一定大于原数据方差
D.若,则新数据的分位数一定大于原数据的分位数
【解题思路】根据题意,由数据极差、中位数、方差和百分位数的计算公式逐项分析即可.
【解答过程】不妨设原数据,新数据..,
A:例如原数据为,新数据为,此时极差均为,故A正确;
B:原数据中位数为,新数据中位数为,可知或,
若,可得;若,可得;
综上所述:新数据的中位数不可能等于原数据的中位数,故B正确;
C:若,可知去掉的数据为,则,
可得,所以新数据的方差一定大于原数据方差,故C正确;
D:若,可知去掉的数据为,因为,可知原数据的分位数为第3位数,,可知新数据的分位数为第2位数与第3位数的平均数,
例如原数据为,新数据为,此时新数据的分位数、原数据的分位数均为3,故D错误,
故选:D.
7.(23-24高二下·陕西安康·期末)某校为了了解学生的身体素质,对2022届初三年级所有学生仰卧起坐一分钟的个数情况进行了数据统计,结果如下图所示.该校2023届初三学生人数较2022届初三学生人数上升了10%,则下列说法错误的是( )
A.该校2022届初三年级学生仰卧起坐一分钟的个数在内的学生人数占70%
B.该校2023届初三学生仰卧起坐一分钟的个数在内的学生人数比2022届初三学生仰卧起坐一分钟个数同个数段的学生人数的2倍还多
C.该校2023届初三学生仰卧起坐一分钟的个数和2022届初三学生仰卧起坐一分钟个数的中位数均在内
D.相比2022届初三学生仰卧起坐一分钟个数不小于50的人数,2023届初三学生仰卧起坐一分钟个数不小于50的人数占比增加
【解题思路】根据扇形统计图和条形图对四个选项逐个判断可得答案.
【解答过程】2022届初三年级学生仰卧起坐一分钟的个数在内的学生人数占比为
,A正确.
由于2023届初三学生人数较2022届上升了,
假设2022届初三学生人数为(),
则仰卧起坐一分钟的个数在内的学生人数为,
2023届初三学生仰卧起坐一分钟的个数在内的学生人数为
,,B正确.
2022届初三学生仰卧起坐一分钟个数的中位数在内,
2023届初三学生仰卧起坐一分钟个数的中位数在内,C错误.
2022届初三学生仰卧起坐一分钟个数不小于50的人数占,
2023届初三学生仰卧起坐一分钟个数不小于50的人数占,D正确.
故选:C.
8.(23-24高二下·湖南·期末)某学校开展“国学知识竞赛”,共有“诗经组”,“论语组”,“春秋组”,“礼记组”4个小组参赛,每组10位选手,若该组每位选手的失分不超过6分,该组获得“优秀”称号,则根据每组选手的失分情况,下列小组一定获得“优秀”称号的是( )
A.诗经组中位数为3,众数为2
B.论语组平均数为3,方差为1
C.春秋组平均数为3,众数为2
D.礼记组中位数为3,极差为4
【解题思路】举出相应反例计算可得A、C、D错误,借助反证法及方差计算公式可得B.
【解答过程】对于A,数据为:时,满足中位数为3,众数为2,
但不满足每位选手的失分不超过6分,故A错误;
对于B,假设有一位同学失7分,则方差,与方差为1矛盾,
假设不成立,故B正确;
对于C,数据为:1,2,2,2,2,时,满足平均数为3,众数为2,
但是不满足每位选手失分不超过6分,故C错误;
对于D,数据为:,满足中位数为3,极差为4,
但最大值超过6分,故D错误.
故选:B.
二、多选题
9.(23-24高一下·江苏淮安·期末)某学校为了解学校学生视力健康状况,降低学生近视率,增强学生爱眼护眼意识,对三个年级的学生视力健康状况进行调研,已知高一、高二、高三的学生人数之比为4:3:3,现用分层抽样方法抽取一个容量为 n的样本,样本中高一年级学生人数为200人,则( )
A.该校三个年级总的学生数为5000人 B.样本容量n为500
C.该校高二年级总的学生数有1500人 D.样本中高二年级学生数为150人
【解题思路】利用分层抽样性质确定抽样比即可求解.
【解答过程】设样本中高二、高三的学生人数分别为a,b,
则,
则,故D正确,
故样本容量,故B正确;
无法确定该校三个年级总的学生数和该校高二年级总的学生数,故AC错误;
故选:BD.
10.(2025高一·江苏·专题练习)2019年,全国各地区坚持稳中求进工作总基调,经济运行总体平稳,发展水平迈上新台阶,发展质量稳步上升,人民生活福祉持续增进,全年最终消费支出对国内生产总值增长的贡献率为,2019年居民消费价格月度涨跌幅度如下图所示.(同比=,环比=)
下列结论中正确的有( )
A.2019年第三季度的居民消费价格一直都在增长
B.2018年7月份的居民消费价格比同年8月份要低一些
C.2019年全年的居民消费价格比2018年涨了以上
D.2019年3月份的居民消费价格全年最低
【解题思路】根据图象中的环比增长率即可判断A,根据图象中的同比增长率即可判断B,计算2019年同比增长率的均值即可判断C,设1月份的居民消费价格为,分别计算下面每个月的消费价格即可判断.
【解答过程】对A,由折线图知,从2019年每月的环比增长率看,2019年第三季度的居民消费价格一直都在增长,故A正确;
对B,从2019年每月的同比增长率看,2018年7月份的居民消费价格比同年8月份要低一些,故B正确;
对C,从2019年每月的同比增长率看,
,
则2019年1~12月的同比数据均值超过,进而估计出2019年全年的居民消费价格比2018年涨了以上,故C正确;
对D,不妨设1月份的居民消费价格为,
故可得2月份的居民消费价格为,
同理可得3月份的居民消费价格,
而4月份的居民消费价格为,
5月份的居民消费价格和4月份的居民消费价格相同,
6月份的居民消费价格为,
而后面每个月都是增长的,即1月份的居民消费价格是最低的,故D错误.
故选:ABC.
11.(23-24高一下·黑龙江绥化·期末)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标准为“连续10天,每天新增疑似病例不超过7人”,过去10天,甲、乙、丙、丁四地新增疑似病例数据信息如下:甲地:平均数为2,众数为2;乙地:中位数为3,极差为4;丙地:平均数为2,中位数为3;丁地:平均数为2,标准差为,甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是( )
A.甲地 B.乙地 C.丙地 D.丁地
【解题思路】对于A,举例判断,对于B,计算出每天新增疑似病例人数的最大值判断,对于CD,利用反证法判断.
【解答过程】对于A,若甲地过去10天每天新增疑似病例人数分别为0,0,0,2,2,2,2,2,2,8,
则满足平均数2,众数为2,但不满足每天新增疑似病例不超过7人,所以A错误,
对于B,因为乙地:中位数为3,极差为4,则最大值不大于,
所以乙地满足每天新增疑似病例不超过7人,所以B正确,
对于C,假设丙地至少有一天新增疑似病例人数超过7人,
由中位数为3可得平均数的最小值为,
与题意矛盾,所以C正确,
对于D,假设丁地至少有一天新增疑似病例人数超过7人,
则方差的最小值为,与题意矛盾,所以D正确,
故选:BCD.
三、填空题
12.(23-24高一下·河北邢台·阶段练习)要考查某种品牌的850颗种子的发芽率,从中抽取50颗种子进行实验,利用随机数表法抽取种子,先将850颗种子按001,002,…,850进行编号,如果从随机数表第2行第2列的数开始并向右读,下列选项中属于最先检验的4颗种子依次是 774,428,114,572 .
(下面抽取了随机数表第1行至第3行)
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95
97 74 94 67 74 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73
16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10
【解题思路】依据题意结合随机数表法直接读数并满足号码不大于850即可.
【解答过程】依据题意可知:向右读数依次为:774,946,774,428,114,572,042,533,,
所以最先检验的4颗种子符合条件的为:774,428,114,572.
故答案为:774,428,114,572.
13.(24-25高一下·宁夏·阶段练习)为了解某企业员工对习近平新时代中国特色社会主义思想的学习情况,对该企业员工进行问卷调查,已如他们的得分都处在A,B,C,D四个区间内,根据调查结果得到下面的统计图.已知该企业男员工占,则下列结论中,错误的结论是 ②③④ .(填序号)
①男、女员工得分在A区间的占比相同;
②在各得分区间男员工的人数都多于女员工的人数;
③得分在区间的员工最多;
④得分在区间的员工占总人数的20%.
【解题思路】先求出员工总数和男员工人数,再求出男女员工再各区间的人数,进而可以判断①正确,②③④错误.
【解答过程】根据题意,设员工总人数为个,
因为女员工人数为,
所以,解得,
所以男员工人数为,
对于①,女员工得分在A区间的占比为,
男员工得分在A区间的占比为,
故①正确;
对于②,女员工在A区间有20人,区间有60人,
区间有70人,区间有50人;
男员工在A区间有人,
区间有人,区间有人,
区间有人;
所以区间男员工少于女员工,故②错误;
对于③,区间有人,区间有人,
所以区间人数比区间多,
故③错误;
对于④,区间有人,
所以得分在区间的员工占总人数的,
故④错误;
综上:①正确,②③④错误,
故答案为:②③④.
14.(23-24高一下·福建厦门·阶段练习)厦门一中为提升学校食堂的服务水平,组织全校师生对学校食堂满意度进行评分,按照分层抽样方法,抽取200位师生的评分(满分100分)作为样本,在这200个样本中,所有学生评分样本的平均数为,方差为,所有教师评分样本的半均数为,方差为,总样本的平均数为,方差为,若,抽取的学生样本多于教师样本,则总样本中学生样本的个数至少为
160 .
【解题思路】假设在样本中,学生、教师的人数分别为,利用平均数公式可得出,利用方差公式结合已知条件可得出,令得,由结合已知条件可求得的取值范围,从而可得答案.
【解答过程】假设在样本中,学生、教师的人数分别为,
记样本中所有学生的评分为,所有教师的评分为,
由得,
所以
,
所以,即,
令,则,,
即,解得或,
因为且,得,所以.
所以总样本中学生样本的个数至少为160.
故答案为:160.
四、解答题
15.(23-24高一上·全国·课后作业)为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民.
(1)这项调查的总体是什么?
(2)你认为这样的调查结果会怎样?
【解题思路】(1)根据总体的概念分析可得;
(2)根据题意结合随机抽样的特征分析判断.
【解答过程】(1)总体是全体市民的意见.
(2)调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.
因此在调查时,要对生活在该城市的所有市民进行随机地抽样调查,不要只关注到拥有私家车的市民.
16.(24-25高一·全国·随堂练习)为了评估某校的教学水平,将抽取这个学校高三年级部分学生本学年的考试成绩进行考察.为了全面反映实际情况,采取以下两种抽样方式(已知该校高三年级共有10个教学班400名学生,并且每个班的学生都已经按随机方式编好了学号,假定每班人数都相同):
方式1:从全年级10个班中任意抽取一个班,考察他们的成绩;
方式2:把该校高三年级的学生按成绩分成优秀、良好、普通三个级别(若按成绩分,该校高三学生中优秀学生有60名,良好学生有180名,普通学生有160名),从中按比例抽取40名学生进行考察.
根据上面的叙述,试回答下列问题:
(1)上面两种抽样方式各自采用何种抽取样本的方法?
(2)分别写出上面两种抽样方式各自抽取样本的步骤.
【解题思路】(1)根据抽样的定义即可合理选取不同的抽样方式;
(2)利用简单随机抽样和分层抽样的定义即可写出具体步骤;
【解答过程】(1)根据题意可知,方式1采用的是简单随机抽样法,方式2采用的是分层抽样法;
(2)方式1抽样的步骤如下:
在全年级10个班中用抽签法任意抽取一个班级,考察他们的成绩;
方式2抽样的步骤如下:
第一步:分层
把该校高三年级的学生按成绩分成优秀、良好、普通三个级别;
第二步:确定各个层抽取的人数
由于样本容量与总体个数比值为,
所以每层抽取的个体数依次为人,人,人;
第三步:按层分别抽取样本人数
在优秀学生中用简单随机抽样法抽取6人,
在良好学生中用简单随机抽样法抽取18人,
在普通学生中用简单随机抽样法抽取16人.
17.(23-24高一下·广东梅州·期末)某中学新建了学校食堂,每天有近2000名学生在学校食堂用午餐,午餐开放时间约40分钟,食堂制作了三类餐食,第一类是选餐,学生凭喜好在做好的大约6种菜和主食米饭中任意选购;第二类是套餐,已按配套好菜色盛装好,可直接取餐;第三类是面食,如煮面、炒粉等,为了更合理地设置窗口布局,增加学生的用餐满意度,学校学生会在用餐的学生中对就餐选择、各类餐食的平均每份取餐时长以及可接受等待时间进行问卷调查,并得到以下的统计图表.
类别
选餐
套餐
面食
选择人数
50
30
20
平均每份取餐时长(单位:分钟)
2
0.5
1
已知饭堂的售饭窗口一共有20个,就餐高峰期时有200名学生在等待就餐.
(1)根据以上的调查统计,如果设置12个选餐窗口,4个套餐窗口,4个面食窗口,就餐高峰期时,假设大家在排队时自动选择较短的队伍等待(即各类餐食的窗口前队伍长度各自相同),问:选择选餐的同学最长等待时间是多少?这能否让80%的同学感到满意(即在接受等待时长内取到餐)?
(2)根据以上的调查统计,从等待时长和公平的角度上考虑,如何设置各类售饭窗口数更优化,并给出你的求解过程.
【解题思路】(1)求出就餐高峰期时选择选餐的总人数,确定平均每个窗口等待就餐的人数即可求得选择选餐同学的最长等待时间;根据频率分布直方图可计算可接受等待时长在15分钟以上的同学占比,即可得结论;
(2)假设设置m个选餐窗口,n个套餐窗口,k个面食窗口,表示出各队伍的同学最长等待时间,根据从等待时长和公平的角度上考虑即为要求每个队伍的最长等待时间大致相同,从而列式求解.
【解答过程】(1)由题意得,就餐高峰期时选择选餐的总人数为人;
这100人平均分布在12个选餐窗口,平均每个窗口等待就餐的人数为人,
所以选择选餐同学的最长等待时间为分钟,
由可接受等待时长的频率分布直方图可知,分组为的频率分别为,
所以可接受等待时长在15分钟以上的同学占,
故设置12个选餐窗口,4个套餐窗口,4个面食窗口,不能让80%的同学感到满意;
(2)假设设置m个选餐窗口,n个套餐窗口,k个面食窗口,则各队伍的同学最长等待时间如下:
类别
选餐
套餐
面食
高峰期就餐总人数
100
60
40
各队伍长度(人)
最长等待时间(分钟)
依题意,从等待时长和公平的角度上考虑,则要求每个队伍的最长等待时间大致相同,
即得,即有,
而,故,
因此建议设置选餐、套餐、面食三个类别的窗口数分别为个.
18.(24-25高一·全国·单元测试)某赛季甲、乙两名运动员在若干场比赛中的得分情况如下:
甲:18,20,21,22,23,25,28,29,30,30,32,34;
乙:8,13,14,16,23,26,28,33,38,39,48.求:
(1)分别计算甲、乙两人每场得分的平均数;
(2)计算甲、乙两人每场得分的中位数;
(3)计算甲、乙两人得分的标准差,并回答谁的成绩比较稳定.
【解题思路】(1)根据平均数的定义分别求甲、乙两人每场得分的平均数;
(2)根据中位数的定义分别求甲、乙两人每场得分的中位数;
(3)根据标准差的定义分别求甲、乙两人每场得分的标准差,由此确定谁的成绩比较稳定.
【解答过程】(1)设甲运动员的各场比赛得分的平均数为,乙运动员的各场比赛得分的平均数为,
因为甲运动员的12场比赛得分依次为18,20,21,22,23,25,28,29,30,30,32,34;
所以,
因为乙运动员的11场比赛得分依次为8,13,14,16,23,26,28,33,38,39,48,
所以,
所以甲每场得分的平均数为26,乙每场得分的平均数为26;
(2)由中位数定义可得甲每场得分的中位数为,乙每场得分的中位数为26;
(3)设甲运动员的各场比赛得分的标准差为,乙运动员的各场比赛得分的标准差为,
因为
,
,
,
,
因为甲运动员的各场比赛得分的标准差小于乙运动员的各场比赛得分的标准差,
所以甲运动员的成绩比乙运动员的成绩稳定.
19.(23-24高一下·云南昆明·期末)某中学举行了一次“环保知识竞赛”,全校学生参加了这次竞赛. 为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)作为样本进行统计. 请根据下面尚未完成并有局部污损的频率分布表(如图所示)和频率分布直方图(如图所示)解决下列问题:频率分布表:
组别
分组
频数
频率
第1组
8
0.16
第2组
第3组
20
0.40
第4组
0.08
第5组
2
合计
频率分布直方图:
(1)写出 的值;
(2)若根据这次成绩,学校准备淘汰 同学,仅留 的同学进入下一轮竞赛,请问晋级分数线划为多少合理?
(3)某老师在此次考试成绩中抽取10名学生的分数:,已知这10个分数的平均数,标准差 ,若剔除其中的100和80这两个分数,求剩余8个分数的平均数与标准差.
【解题思路】(1)根据频率和频数的关系以及直方图中小矩形的面积代表频率,进行计算即可;
(2)利用频率分布直方图计算第90百分位数即可;
(3)根据平均数和方差的计算公式求解即可.
【解答过程】(1)由题意可知抽取的学生人数为:,
则第四组人数为:,
所以,
,,.
(2)成绩落在内的频率为:,
落在内的频率为:,
设第90百分位数为,
则,解得,
故晋级分数线划为82.5合理.
(3)因为,所以.
标准差,所以,
则,
剔除其中的100和80两个分数,设剩余8个数为,
设平均数与标准差分别为,
则剩余8个分数的平均数为,
方差为,
故标准差为.
第 1 页 共 49 页
学科网(北京)股份有限公司
$$