内容正文:
第六章 统计 复习讲义
教学目标
1.理解直接获取与间接获取数据;
2.理解简单随机抽样、分层抽样的概念;
3.掌握常用的统计图表;
4.理解并掌握常用的数字特征.
教学重难点
1.重点:分层抽样、频率分布直方图、利用样本估计总体
2.难点:频率分布直方图、利用样本估计总体.
知识点01 获取数据的途径
1.直接获取与间接获取
(1)直接获取是指通过社会调查或观察、试验等途径获取数据,直接获取的数据称为直接数据或一手数据.
(2)间接获取是指借助各种媒介,包括报纸杂志、统计报表和年鉴、广播、电视或互联网等获取数据,间接获取的数据称为间接数据或二手数据.
2.普查与抽样调查
(1)普查是为了掌握调查对象的整体情况。
(2)一般地说,在调查过程中,有两种获取数据的方法:普查和抽样调查.从全体调查对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,并以此推断全体调查对象的状况.这种抽取一部分对象的调查方式叫作抽样调查,简称抽查.
3.总体与样本
(1)总体:所考察问题涉及的对象全体.
(2)个体:总体中的每个对象.
(3)样本:抽取的部分对象.
(4)样本容量∶一个样本中包含的个体数且.
(5)普查∶对总体中每个个体都进行考察的方法(也称为全面调查)
(6)抽样调查∶只抽取样本进行考察的方法.
【即学即练】
1.(24-25高一上·全国·课后作业)下列获取的数据属于直接数据的是( )
A.看报纸获得的数据
B.通过问卷调查获得的数据
C.通过网络获得的数据
D.听广播获得的数据
2.(25-26高一上·重庆·开学考试)下列调查中最适合采用全面调查(普查)的是( )
A.了解长寿沙田柚的甜度情况
B.了解某品牌新能源汽车电池的续航能力
C.了解重庆市中学生收看9月3日阅兵直播情况
D.对我国首艘电磁弹射航空母舰福建舰各零部件质量情况的调查
知识点02 抽样方法
1.简单随机抽样
(1)概念:一般地,从元素个数为N的总体中逐个不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样的方法:抽签法和随机数法
(3)适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小.
2.分层抽样
(1)概念:当总体由有明显差别的几部分组成时,为使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.
(2)总体由差异明显的几部分组成的情况;
分层后,在每一层抽样时可采用简单随机抽样或系统抽样.
(3)特征:等比例抽样
【即学即练】
1.(25-26高二上·广东·月考)采用简单随机抽样的方法,从含有4个个体的总体中抽取1个,某个个体被抽到的概率是( )
A. B. C. D.
2.(25-26高一上·河南南阳·月考)某社区为了调查小区居民对社区的满意度,利用随机数表对户居民进行抽样,先将户居民进行编号,,,…,,从中抽取个样本,下面是随机数表的第2行到第3行,若从随机数表的第2行第7列开始横向自左向右依次读取数据,则得到的第7个样本编号是( )
21 45 70 16 33 88 29 54 07 61 10 84 37 11 69 28 50 74 36 02 95
41 83 15 72 60 49 08 39 24 56 81 09 80 43 19 67 52 03 98 45 96
A. B. C. D.
3.(多选)(24-25高一下·河南·月考)2024年11月14日是第18个联合国糖尿病日,活动主题是“糖尿病与幸福感”.某市的糖尿病患者中中老年组、中年组、中青年组、青年组人数的比例为,为了解各年龄段群组(中老年组、中年组、中青年组、青年组)饮食结构之间的差异,市卫生局计划从糖尿病患者中抽取220人进行饮食结构调查,则下列说法正确的是( )
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.中年组患者应抽取60人
D.被抽到的中青年组患者和青年组患者人数之和比中年组患者人数多
知识点03 用样本估计总体
1.频率分布表
(1)定义:频率分布表是对大量数值型数据进行整理与分析的统计表格,通过将数据按 “等距区间” 分组,统计每组内数据的出现次数(频数),并计算每组频数占总数据的比例(频率),以此清晰呈现数据的分布特征.
(2).频率分布表的核心构成
分组区间:将数据划分的等距范围;
频数:每组区间内包含的原始数据个数;
频率:每组频数与总数据个数的比值(公式:频率 = 频数 ÷ 总数据数).
2.频率分布直方图
(1)频率分布直方图的画法:求极差;决定组距和组数;将数据分组;列频率分布表;画频率分布直方图:纵轴表示,
(2).频率分布直方图基础概念:①纵轴表示:,②频率:小长方形面积=频率.
3..频率、频数、样本容量的计算方法
(1)×组距=频率.(2)=频率,(3)=样本容量,(4)样本容量×频率=频数.
4.频率分布直方图性质
(1)最高的小长方形底边中点的横坐标即是众数.
(2)频率分布直方图中各个小方形的面积总和等于1.
(3)中位数左边和右边的小长方形的面积和是相等的.
设中位数为,利用左(右)侧矩形面积之和等于,即可求出.
(4)平均数是频率分布直方图的“重心”,
,其中为每个小长方形底边的中点,为每个小长方形的面积.
5.频率分布折线图
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体的分布规律.
【即学即练】
1.(24-25高一上·山东潍坊·期末)某市教育局对全市高三年级的学生身高进行抽样调查,随机抽取了200名学生,他们的身高分成,,,,五个组,根据抽样结果得到统计图表,则样本中( )
A.女生人数和男生人数一样多 B.组中男生人数多于女生人数
C.组男生人数为24人 D.组人数最少
2.(25-26高二上·北京海淀·月考)200辆汽车通过某一段公路时的时速频率分布直方图如图所示.则时速在的汽车大约有 辆.
知识点04 用样本估计总体的数字特征
1.众数、中位数、平均数.
(1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
(2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
若有奇数个数,则最中间的数是中位数;
若有偶数个数,则中间两数的平均数是中位数.
(3)平均数:个样本数据的平均数为,反映了一组数据的平均水平.
公式变形:.
2.总体百分位数的估计
(1)定义:一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若i不是整数而大于i的比邻整数j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第i+1项数据的平均数.
(3)四分位数
第25、50、75百分位数称为四分位数.它们把一组由小到大排列后的数据分成四等份.
3.标准差和方差
(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.
假设样本数据是,表示这组数据的平均数,
则标准差:.
(2)方差:方差就是标准差的平方,即:s2=.
显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
(3)数据特征
标准差、方差描述了一组数据围绕平均数波动程度的大小.
标准差、方差越大,则数据的离散程度越大;
标准差、方差越小,数据的离散程度越小.
反之亦可由离散程度的大小推算标准差、方差的大小.
4.平均数、方差的运算性质:如果数据的平均数为,方差为,标准差为,那么一组新数据:
的平均数为,方差是,标准差为.
5.分层抽样的平均数
(1)一般地,将样本 ,…, 和样本,…,合并成一个新样本,则这个新样本的平均数为,设上述两层构成的新样本中每层的平均数分别为 和于是,
=+=+
记,,,称为权重,则+
(2)推广:设样本中不同层的平均数和相应权重分别为,,…和,,…则这个样本的平均数为 +…为了简化表示,引进求和符号,记作
6.分层抽样的方差
(1).定义:一般地,将样本 ,…, 和样本,…,合并成一个新样本,则这个新样本的方差为,设
上述两层构成的新样本中每层的方差分别为,,于是,[+]+[+],
记,,,称为权重,则[+]+[+]
2)推广:设样本中不同层的方差和相应权重,及平均数分别为,,…和,,…,,,…则这个样本的方差为 [+]+[+]+[+]为了简化表示,引进求和符号,记作
【即学即练】
1.(25-26高三上·陕西咸阳·月考)某地7月11日到7月20日连续10天的最高气温分别为38,38,37,37,35,34,36,39,38,38(单位:),若这10个数据的平均数为,中位数为,极差为,方差为,则下列说法正确的有( )
A. B. C. D.
2.(多选)(四川省乐山市高中2026届高三上学期第一次调查研究考试数学试题)2025年9月20日,四川省城市足球联赛(简称“川超”)开幕式暨揭幕战观众达21448人.为了解各年龄层对“川超”的关注程度,随机选取了200名年龄在的观众进行调查,并绘制如下的频率分布直方图,则( )
A. B.该场观众年龄众数的估计值为40
C.该场观众年龄50%分位数的估计值为35 D.该场观众年龄平均数的估计值为35
题型01 获取数据的途径
【典例1-1】(25-26高一上·河南·月考)下列调查中最适合采用全面调查(普查)的是( )
A.了解某市小麦的根部生长情况
B.了解某品牌手机的防摔功能
C.了解某省高一学生坚持晨读的情况
D.对我国最新研发的“玄龙08战斗机”的各零部件质量情况的调查
【典例1-2】(25-26高一上·重庆潼南·开学考试)下列调查中,适合采用抽样调查的是( )
A.调查重庆市鲁能巴蜀中学九年级(1)班50名同学的视力情况
B.重庆西站对乘坐高铁的旅客进行安检
C.为保证飞机飞行安全,工人对其零部件进行检查
D.调查重庆市中学生的周末作业完成时间
【变式1-1】(24-25高一上·江西·月考)在下列调查中,适合用全面调查的是( )
A.调查一个水库所有鱼中草鱼所占的比例 B.调查一个县各村的粮食播种面积
C.调查一批炮弹的杀伤半径 D.调查一批玉米种子的发芽率
【变式1-2】(多选)(24-25高一下·广东揭阳·期中)从某市参加升学考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是( )
A.总体指的是该市参加升学考试的全体学生的数学成绩
B.样本是指1000名学生的数学成绩
C.样本量指的是1000名学生
D.个体指的是该市参加升学考试的每一名学生的数学成绩
题型02 抽样方法
【典例2-1】(24-25高一下·湖南岳阳·期末)某校高中生共有3600人,其中高一年级1300人,高二年级人,高三年级1100人,现采取分层抽样法抽取容量为36的样本,那么高一、高二、高三各年级抽取的人数分别为( )
A.11,14,11 B.12,12,12 C.14,12,10 D.13,12,11
【典例2-2】(25-26高二上·四川成都·月考)某高校对中文系新生进行体测,利用随机数表对400名学生进行抽样,先将400名学生进行编号,001,002,……,399,400.从中抽取40个样本,如图提供随机数表的第5行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第3个样本编号是( )
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77
A.457 B.253 C.007 D.860
【变式2-1】(云南省红河州、文山州2026届高中毕业生第一次复习统一检测数学试题)在孟德尔两对相对性状的豌豆杂交实验中,子二代豌豆性状表现型及理论比例为:黄色圆粒:黄色皱粒:绿色圆粒:绿色皱粒.现研究人员计划从大量该代豌豆种子中,随机抽取n粒豌豆作为样本进行研究.若希望样本中黄色皱粒豌豆的理论(期望)数量为30粒,则样本量n应为( )
A.160 B.190 C.220 D.250
【变式2-2】(25-26高二上·上海浦东新·月考)设总体由编号为00,01,…,59的60个个体组成,利用下面的随机数表选取6个个体,选取方法是从该随机数表第1行的第6个数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为 .
题型03 统计图表
【典例3-1】(25-26高一上·安徽阜阳·开学考试)某校为了解学生的身高情况,随机对部分学生进行抽样调查,已知抽取的样本中,男生、女生人数相同,分组情况为(单位:),,,,,利用所得数据绘制如下统计图表:
根据图表提供的信息,可知样本数据中下列信息正确的是( )
A.身高在区间的男生比女生多人
B.B组中男生和女生占比相同
C.超过一半的男生身高在以上
D.女生身高在组的人数有人
【典例3-2】(24-25高一上·江西抚州·月考)某中职学校为了解全校学生国庆小长假期间阅读古典名著的时间的情况,抽查了1000名学生,将他们的阅读时间进行分组抽样结果绘成的频率分布直方图如图所示,则实数 .
【变式3-1】(多选)(24-25高一上·辽宁葫芦岛·期末)为了关注学生的健康成长,某学校开展了一次高一年级学生身高的抽样调查,随机抽取了100名学生,将他们的身高划分成了A,B,C,D,E五个层次,根据抽样结果得到如下统计图,则从图中能得出的信息是( )
A.样本中A层次身高的女生少于男生
B.样本中B层次身高的学生人数最多
C.样本中D层次身高的学生人数占总人数的17%
D.样本中E层次身高的男生有6人
【变式3-2】(24-25高一下·安徽阜阳·期末)年度全省地区生产总值为本年度第一、二、三产业增加值之和.观察下列两个图表,则下列说法错误的是( )
A.2020至2024年第一产业增加值逐年下降
B.2020至2024年第二产业增加值逐年升高
C.2020至2024年第三产业增加值占地区生产总值比重逐年升高
D.2020至2024年全省地区生产总值逐年增长
【变式3-3】(2025·上海杨浦·一模)为了了解某校高三年级学生的体育成绩,随机选取名学生参加考核,将考核的成绩(满分分,成绩均为不低于分的整数)分成六组:,,,,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)在考核成绩为,,的三组学生中,用分层抽样的方法抽取人,则考核成绩在中的学生应抽取多少人?
题型04 样本数据特征的计算
【典例4-1】(湖北省云学联盟2025-2026学年高二上学期12月月考数学试题)从队20人、队30人中,按照分层随机抽样的方法从两队共抽取5人.进行一轮答题竞赛.相关统计情况如下:队答对题目数的平均数为2,方差为1.04;队答对题目数的平均数为1,方差为2.04,则这5人答对题目数的方差为( )
A.0.95 B.1.06 C.1.33 D.1.88
【典例4-3】(2026高三·全国·专题练习)2024年,我国彩电、智能手机、计算机等产量继续排名全球第一,这标志着我国消费电子产业已经实现从“跟随”到“引领”的转变,开启了高质量发展的新时代.如图是2024年3月至12月我国彩电月度产量及增长情况统计图(单位:万台,%),则关于这10个月的统计数据,下列说法正确的是(注:同比,即和去年同期相比)( )
A.这10个月我国彩电月度产量的中位数为1726万台
B.这10个月我国彩电月度平均产量不超过1600万台
C.自2024年9月起,各月我国彩电月度产量均同比下降
D.这10个月我国彩电月度产量同比增长率的极差不超过0.4
【变式4-1】(2026高三·全国·专题练习)已知某地区甲、乙两所高中学校的六次联合模拟考试的数学平均分数(满分150分)的统计如图所示,则下列说法错误的是( )
A.甲校的平均分均高于乙校的平均分
B.甲校六次平均分的方差小于乙校六次平均分的方差
C.甲校六次平均分的第25百分位数小于乙校六次平均分的第75百分位数
D.甲校的平均分极差小于乙校的平均分极差
【变式4-2】(24-25高一下·江苏泰州·月考)下面是校篮球队某队员若干场比赛的得分数据.
每场比赛得分
3
6
7
10
11
13
30
频数
2
1
2
2
1
1
1
则下列说法不正确的是( )
A.该队员得分的平均数是10 B.该队员得分的极差是27
C.该队员得分的第四十百分位数是7 D.该队员得分的方差是48.4
【变式4-3】(多选)(24-25高一下·福建福州·期末)某中学九年级在体能测试后,为分析学生的跳绳成绩,随机抽取了名学生的分钟跳绳的次数,将所得数据整理后,分为组画出如图频率分布直方图.为进一步分析学生的成绩分布情况,经计算得到这名学生中,跳绳次数位于的学生跳绳次数的方差为,跳绳次数位于的学生跳绳次数的方差为.(同一组中的数据以这组数据所在区间的中点值为代表)则下列正确的是( )
A.
B.估计该年级学生跳绳次数的分位数约为
C.估计该年级学生跳绳次数在次及以上的学生跳绳次数的平均数为
D.估计该年级学生跳绳次数在次及以上的学生跳绳次数的方差为
题型05 统计中的决策问题
【典例5-1】(24-25高一上·陕西咸阳·开学考试)某公司打算招聘一名职员.对甲、乙、丙三名应聘者进行了综合知识、工作经验、语言表达三方面的测试,他们的各项成绩如下表所示:
项目
应聘者
综合知识
工作经验
语言表达
甲
75
80
80
乙
85
80
70
丙
70
78
70
如果将每位应聘者的综合知识、工作经验、语言表达的成绩按5:2:3的比例计算其总成绩,并录用总成绩最高的应聘者,则被录用的是 .
【典例5-2】(25-26高一上·河北邯郸·开学考试)某社区组织了以“奔向幸福,‘毽’步如飞”为主题的踢毽子比赛活动,初赛结束后有甲、乙两个代表队进入决赛,已知每队有5名队员,按团体总数排列名次,在规定时间内每人踢100个以上(含100)为优秀.下表是两队各队员的比赛成绩.
1号
2号
3号
4号
5号
总数
甲队
103
102
98
100
97
500
乙队
97
99
100
96
108
500
经统计发现两队5名队员踢毽子的总个数相等,按照比赛规则,两队获得并列第一.
学习统计知识后,我们可以通过考查数据中的其它信息作为参考,进行综合评定:
(1)甲、乙两队的优秀率分别为_____________、________________;
(2)甲队比赛数据的中位数为___________个;乙队比赛数据的中位数为__________个;
(3)分别计算甲、乙两队比赛数据的方差;
(4)根据以上信息,你认为综合评定哪一个队的成绩好?简述理由.
【变式5-1】(24-25高一下·陕西咸阳·期末)某果园试种了,两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记,两个品种各10棵的产量的平均数分别为和,方差分别为和.
(单位:kg)
60
50
40
60
70
80
80
80
90
90
(单位:kg)
40
60
60
80
80
50
80
80
70
100
(1)求品种的10棵桃树产量的第80百分位数;
(2)求,,,;
(3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,并说明理由.
【变式5-2】(24-25高一下·广西河池·期末)2025年NBA选秀大会,我国选手杨瀚森将参加选秀,为备战选秀,运动员参加了联合试训,其中甲、乙两位运动员开展了队内三分投篮对抗赛.在对抗赛中两人每轮投篮10次,共进行10轮,每轮命中的成绩(个数)如下:
甲
4
7
6
5
4
9
10
7
8
10
乙
7
5
8
6
7
9
7
6
7
8
(1)求甲运动员的样本数据第75百分位数;
(2)分别计算这两位运动员10轮投篮成绩的平均数和方差;
(3)根据第二问结果回答下列问题:甲、乙两位运动员谁的发挥更稳定,为什么?
题型06 统计知识的综合应用
【典例6-1】(25-26高一上·河南南阳·月考)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第75百分位数;
(2)求样本成绩的平均数;
(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
【典例6-2】(25-26高一上·河南南阳·月考)为了解学生对A,B两家餐厅的满意度情况,现从在A,B两家餐厅都用过餐的学生中随机抽取了50人,每人分别对这两家餐厅的满意度进行打分(分数区间为),将其分数记为满意指数.根据打分结果按分组,得到如图所示的频率分布直方图,其中B餐厅的满意指数在内的学生有15人.
(1)求图中的值;
(2)利用样本估计总体的思想,比较A,B两家餐厅满意指数的平均数的大小;(计算平均数时同一组中的数据用该组区间的中点值作代表)
(3)若B餐厅满意指数频率分布直方图中第三组满意指数的方差为2,第四组满意指数的方差为1,估计在B餐厅用过餐的第三组与第四组所有学生的满意指数的方差.(计算平均数时同一组中的数据用该组区间的中点值作代表)
附:若数据的平均数为,方差为,数据的平均数为,方差为,将这两组数据混合在一起得到一组新数据,设新数据的平均数为,则新数据的方差.
变式6-1】(24-25高一下·吉林松原·期末)某地举办了“防电信诈骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第80百分位数;求样本平均数;
(2)已知落在区间的样本平均成绩是57,标准差是7,落在区间的样本平均成绩为66,标准差是4,求两组样本成绩合并后的平均数和方差.
【变式6-2】(25-26高二上·贵州遵义·期中)某校高二年级半期考试测试后,为了解本次测试的情况,在整个年级中随机抽取了200名学生的数学成绩.将成绩分为,,,,,,共6组,得到如图所示的频率分布直方图.
(1)在样本中,采取等比例分层抽样的方法从成绩在内的学生中抽取15名,则成绩在的同学有几个?
(2)根据图中的样本数据,假设同组中每个数据用该组区间的中点值代替,试估计本次考试的平均分和众数;
(3)若年级计划对本次测试优异的同学进行表彰,且表彰人数不超过6%,根据样本数据,试估计获得表彰的同学的最低分数.
一、单选题
1.(25-26高一上·河南·月考)下列调查中最适合采用全面调查(普查)的是( )
A.了解某市小麦的根部生长情况
B.了解某品牌手机的防摔功能
C.了解某省高一学生坚持晨读的情况
D.对我国最新研发的“玄龙08战斗机”的各零部件质量情况的调查
2.(2025高一·全国·专题练习)某班级有男生20人,女生30人,从中抽取10人作为样本,其中一次抽样结果是:抽到了4名男生、6名女生,则下列命题中正确的是( )
A.这次抽样可能采用的是简单随机抽样
B.这次抽样一定没有采用分层抽样
C.这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率
D.这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率
3.(25-26高二上·贵州贵阳·月考)某单位有职工750人,其中青年职工250人,中年职工350人,老年职工150人,为了了解该单位职工的心理健康情况,用按比例分层随机抽样的方法从中抽取样本,若样本中的中年职工为7人,则样本容量为( )
A.15 B.25 C.35 D.75
4.(24-25高一上·重庆长寿·期末)年月日时至次日时(次日的时间前加表示)重庆的温度走势
下列说法错误的是( )
A.月日时至时重庆气温逐渐升高,时到次日时重庆气温逐渐降低
B.月日时至次日时重庆的最低气温为,最高气温为
C.根据图象,这一天时所对应的温度为
D.根据图象,这一天时所对应的温度为
5.(25-26高三上·安徽蚌埠·月考)为了解某企业喜爱打羽毛球、打篮球和游泳的职工年龄情况,统计了该企业第一车间的所有职工喜爱打羽毛球、打篮球和游泳构成比例(每位职工必选一项体育活动且只选一项).得到如下饼图:
若喜爱打羽毛球的职工年龄(岁)的均值与方差分别为,喜爱打篮球的职工年龄(岁)的均值与方差分别为,喜爱游泳的职工年龄(岁)的均值与方差分别为.则下面结论中不正确的是( )
A.该企业喜欢打篮球的职工人数可能多于喜欢游泳的职工人数
B.第一车间喜欢打羽毛球的职工有一些年龄比较大
C.第一车间所有职工平均年龄为岁
D.第一车间所有职工年龄方差不超过喜爱打羽毛球、打篮球及游泳的职工的年龄方差之和
6.(22-23高一下·云南昆明·期末)二战期间,为估计德军坦克的月生产能力,盟军请统计学家参与情报的收集和分析,统计学家从缴获的德军坦克中,随机抽取某月生产的坦克编号作为样本来估计坦克月生产量.抽取的坦克编号从小到大依次为,假设坦克的月生产量为,将区间分成个小区间:,,……,,,统计学家利用前个区间的平均长度来估计所有个区间的平均长度,进而得到的估计值.若抽取的某月生产的坦克编号为2,13,41,75,107,118,159,194,206,230,则的估计值为( )
A.236 B.253 C.360 D.420
7.(2025高一·湖南·专题练习)设样本数据的平均数为,方差为,设,样本数据的平均数为,方差为,则下列选项错误的是( )
A. B.
C. D.
8.(25-26高二上·上海松江·期中)某课外活动小组为研究日平均气温的变化情况,将每连续5天的日平均气温(单位: )的记录数据作为一组样本,他们得到了满足下列条件的四个样本:①平均数为3,极差为2;②中位数为7,众数为9;③众数为5,极差为6;④平均数为4,方差为2;则这四个样本中,连续5天的日平均气温记录数据均低于的样本个数至少有( )
A.1个 B.2个 C.3个 D.4个
二、多选题
9.(25-26高一上·全国·单元测试)某大型企业对改善员工福利的A,B,C三种方案进行了问卷调查,调查结果如下(单位:人):
支持A方案
支持B方案
支持C方案
35岁以下
200
400
800
35岁及以上
100
100
400
则下列说法正确的是( )
A.所有参与调查的有2000人
B.按照年龄进行分层随机抽样,则抽取的35岁以下的人数和35岁及以上的人数之比为
C.从所有参与调查的人中,按支持方案进行分层随机抽样的方法抽取n人,已知从支持A方案的人中抽取了6人,则
D.从支持B方案的人中,用分层随机抽样的方法抽取5人,这5人中年龄在35岁及以上的人数是4
10.(四川省乐山市高中2026届高三上学期第一次调查研究考试数学试题)2025年9月20日,四川省城市足球联赛(简称“川超”)开幕式暨揭幕战观众达21448人.为了解各年龄层对“川超”的关注程度,随机选取了200名年龄在的观众进行调查,并绘制如下的频率分布直方图,则( )
A. B.该场观众年龄众数的估计值为40
C.该场观众年龄50%分位数的估计值为35 D.该场观众年龄平均数的估计值为35
11.(24-25高一下·湖北·期末)一组样本有互不相等的5个数据,平均数记为,方差记为,下列说法错误的是( )
A.去掉样本数据中的最大值和最小值后得到一组新数据,其平均数等于
B.去掉样本数据中的最大值和最小值后得到一组新数据,其方差小于
C.去掉样本数据中的最小值后得到一组新数据,其方差小于
D.去掉样本数据中的中位数后得到一组新数据,其方差小于
三、填空题
12.(25-26高二上·上海浦东新·月考)设总体由编号为00,01,…,59的60个个体组成,利用下面的随机数表选取6个个体,选取方法是从该随机数表第1行的第6个数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为 .
13.(25-26高一上·全国·课后作业)神舟十三号载人飞行任务的圆满成功,标志着空间站关键技术验证阶段任务圆满完成,中国空间站即将进入建造阶段.某机构研究室通过随机抽样的方式,对18岁及以上人群进行了“你是否曾有过航天梦想”的调查研究,得到如下的统计结果.
根据调查结果,以下说法正确的是 (填序号).
①在“曾有过航天梦想”的人群中,54岁及以上的人数最少;
②在“曾有过航天梦想”的人群中,年龄越大,在航天相关方面的人均消费越少;
③在“曾有过航天梦想”的人群中,18—29岁在航天相关方面的总消费最多.
14.(24-25高一下·广东广州·期末)在大数据时代,由于整合不同来源的数据需要以及在数据量庞大的情况下为减少计算量,实际上在计算机中计算方差是使用递推方法进行计算的.先计算前面k个数据的平均数和方差, 再计算前面k+1个数据的平均数和方,计算可利用递推式:,则 .
四、解答题
15. (24-25高一下·全国·单元测试)春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:
(1)交警小李对进站休息的驾驶人员的省籍询问采用的是普查还是抽查?
(2)用分层随机抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?
16.(24-25高一下·贵州黔东南·期末)中国AI大模型正处于一个技术进步迅速、市场规模快速增长的爆发式发展阶段.为了解中国AI大模型用户的年龄分布,A公司调查了500名中国AI大模型用户,统计他们的年龄(都在内),按照,,,,进行分组,得到如图所示的频率分布直方图.
(1)求m的值;
(2)求这500名中国AI大模型用户的年龄在内的人数;
(3)估计这500名中国AI大模型用户年龄的平均数(各组数据以该组区间的中点值作代表).
17.(25-26高一上·辽宁沈阳·月考)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值及样本成绩的第75百分位数;
(2)求样本成绩的中位数和平均数;
(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
18.(24-25高一下·湖南衡阳·期末)某校在组织选拔数学英才班的过程中,对高一年级的300名学生进行了一次测试.已知参加此次测试的学生的分数全部介于45分到95分之间,学校将所有分数分成5组:,,…,,整理得到如图所示的频率分布直方图(同组数据以这组数据的中间值作为代表).
(1)求的值,并估计此次校内测试分数的平均值;
(2)学校要求按照分数从高到低选拔前90名的学生进行培训,试估计这90名学生的最低分数(计算结果由四舍五入保留一位小数);
(3)试估计这300名学生的分数的方差,并判断此次得分为64分和87分的两名同学的成绩是否进入到了范围内?
(参考公式:,其中为各组频数,参考数据:).
19.(2025高二下·全国·专题练习)“地板函数”表示不超过的最大整数,如,.设函数.
(1)求的值及函数的最小正周期;
(2)已知函数,方程恰有30个非负实数解,它们构成一组数据,,…,.
(i)求这组数据的中位数的取值范围;
(ii)设这组数据的方差为,求.
参考公式:.
第 1 页 共 19 页
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
第六章 统计全章复习讲义
教学目标
1.理解直接获取与间接获取数据;
2.理解简单随机抽样、分层抽样的概念;
3.掌握常用的统计图表;
4.理解并掌握常用的数字特征.
教学重难点
1.重点:分层抽样、频率分布直方图、利用样本估计总体
2.难点:频率分布直方图、利用样本估计总体.
知识点01 获取数据的途径
1.直接获取与间接获取
(1)直接获取是指通过社会调查或观察、试验等途径获取数据,直接获取的数据称为直接数据或一手数据.
(2)间接获取是指借助各种媒介,包括报纸杂志、统计报表和年鉴、广播、电视或互联网等获取数据,间接获取的数据称为间接数据或二手数据.
2.普查与抽样调查
(1)普查是为了掌握调查对象的整体情况。
(2)一般地说,在调查过程中,有两种获取数据的方法:普查和抽样调查.从全体调查对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,并以此推断全体调查对象的状况.这种抽取一部分对象的调查方式叫作抽样调查,简称抽查.
3.总体与样本
(1)总体:所考察问题涉及的对象全体.
(2)个体:总体中的每个对象.
(3)样本:抽取的部分对象.
(4)样本容量∶一个样本中包含的个体数且.
(5)普查∶对总体中每个个体都进行考察的方法(也称为全面调查)
(6)抽样调查∶只抽取样本进行考察的方法.
【即学即练】
1.(24-25高一上·全国·课后作业)下列获取的数据属于直接数据的是( )
A.看报纸获得的数据
B.通过问卷调查获得的数据
C.通过网络获得的数据
D.听广播获得的数据
【答案】B
【详解】通过看报纸获得的数据,网络获得的数据以及听广播获得的数据叫做二手数据,故A、C、D均错误;
通过问卷调查获得的数据属于直接数据,故B正确.
故选:B
2.(25-26高一上·重庆·开学考试)下列调查中最适合采用全面调查(普查)的是( )
A.了解长寿沙田柚的甜度情况
B.了解某品牌新能源汽车电池的续航能力
C.了解重庆市中学生收看9月3日阅兵直播情况
D.对我国首艘电磁弹射航空母舰福建舰各零部件质量情况的调查
【答案】D
【分析】根据抽样调查和普查的特点逐一判断.
【详解】对于A,了解长寿沙田柚的甜度情况,普查工作量大且有破坏性,适合抽样调查;
对于B,了解某品牌新能源汽车电池的续航能力,普查工作量大且有破坏性,适合抽样调查;
对于C,了解重庆市中学生收看9月3日阅兵直播情况,普查工作量大,适合抽样调查;
对于D,对我国首艘电磁弹射航空母舰福建舰各零部件质量情况的调查,是精确度要求高的调查,适合全面调查.
故选:D.
知识点02 抽样方法
1.简单随机抽样
(1)概念:一般地,从元素个数为N的总体中逐个不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样的方法:抽签法和随机数法
(3)适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小.
2.分层抽样
(1)概念:当总体由有明显差别的几部分组成时,为使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.
(2)总体由差异明显的几部分组成的情况;
分层后,在每一层抽样时可采用简单随机抽样或系统抽样.
(3)特征:等比例抽样
【即学即练】
1.(25-26高二上·广东·月考)采用简单随机抽样的方法,从含有4个个体的总体中抽取1个,某个个体被抽到的概率是( )
A. B. C. D.
【答案】C
【分析】根据随机抽样的性质运算求解即可.
【详解】由随机抽样的性质可知:每个个体被抽到的概率均等,概率均为.
故选:C.
2.(25-26高一上·河南南阳·月考)某社区为了调查小区居民对社区的满意度,利用随机数表对户居民进行抽样,先将户居民进行编号,,,…,,从中抽取个样本,下面是随机数表的第2行到第3行,若从随机数表的第2行第7列开始横向自左向右依次读取数据,则得到的第7个样本编号是( )
21 45 70 16 33 88 29 54 07 61 10 84 37 11 69 28 50 74 36 02 95
41 83 15 72 60 49 08 39 24 56 81 09 80 43 19 67 52 03 98 45 96
A. B. C. D.
【答案】C
【分析】直接由随机数表依次读取数据,注意舍去超出范围的编号与重复的编号即可.
【详解】从随机数表中的第2行第7列开始向右读取数据,依次为163,388(超出299,舍去),295,407(超出299,舍去),611(超出299,舍去),084,371(超出299,舍去),169,285,074,360(超出299,舍去),295(与前样本重复,舍去),418(超出299,舍去),315(超出299,舍去),726(超出299,舍去),049,
故得到的第7个样本编号是049,
故选:C.
3.(多选)(24-25高一下·河南·月考)2024年11月14日是第18个联合国糖尿病日,活动主题是“糖尿病与幸福感”.某市的糖尿病患者中中老年组、中年组、中青年组、青年组人数的比例为,为了解各年龄段群组(中老年组、中年组、中青年组、青年组)饮食结构之间的差异,市卫生局计划从糖尿病患者中抽取220人进行饮食结构调查,则下列说法正确的是( )
A.应采用分层随机抽样抽取
B.应采用抽签法抽取
C.中年组患者应抽取60人
D.被抽到的中青年组患者和青年组患者人数之和比中年组患者人数多
【答案】AC
【分析】根据分层抽样的概念及计算公式即可分别判断.
【详解】因为糖尿病患者中中老年组、中年组、中青年组、青年组人数的比例不同,
所以应采用分层随机抽样抽取,故A正确,B错误;
依题意,被抽到的中年组患者人数为(人),
被抽到的中青年组患者和青年组患者人数之和为(人),所以C正确,D错误;
故选:AC.
知识点03 用样本估计总体
1.频率分布表
(1)定义:频率分布表是对大量数值型数据进行整理与分析的统计表格,通过将数据按 “等距区间” 分组,统计每组内数据的出现次数(频数),并计算每组频数占总数据的比例(频率),以此清晰呈现数据的分布特征.
(2).频率分布表的核心构成
分组区间:将数据划分的等距范围;
频数:每组区间内包含的原始数据个数;
频率:每组频数与总数据个数的比值(公式:频率 = 频数 ÷ 总数据数).
2.频率分布直方图
(1)频率分布直方图的画法:求极差;决定组距和组数;将数据分组;列频率分布表;画频率分布直方图:纵轴表示,
(2).频率分布直方图基础概念:①纵轴表示:,②频率:小长方形面积=频率.
3..频率、频数、样本容量的计算方法
(1)×组距=频率.(2)=频率,(3)=样本容量,(4)样本容量×频率=频数.
4.频率分布直方图性质
(1)最高的小长方形底边中点的横坐标即是众数.
(2)频率分布直方图中各个小方形的面积总和等于1.
(3)中位数左边和右边的小长方形的面积和是相等的.
设中位数为,利用左(右)侧矩形面积之和等于,即可求出.
(4)平均数是频率分布直方图的“重心”,
,其中为每个小长方形底边的中点,为每个小长方形的面积.
5.频率分布折线图
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体的分布规律.
【即学即练】
1.(24-25高一上·山东潍坊·期末)某市教育局对全市高三年级的学生身高进行抽样调查,随机抽取了200名学生,他们的身高分成,,,,五个组,根据抽样结果得到统计图表,则样本中( )
A.女生人数和男生人数一样多 B.组中男生人数多于女生人数
C.组男生人数为24人 D.组人数最少
【答案】C
【分析】根据给定的柱状图及饼状图,逐项判断即可.
【详解】对于A,女生组有18人,组有48人,组有30人,组有18人,组有6人,
女生共有人,男生有人,因此女生人数多于男生人数,A错误;
对于B,由扇形图,男生组有人,而女生有18人,因此女生多于男生,B错误;
对于C,组有人人,C正确;
对于D,组有人,组有人,组人数不是最少的,D错误.
故选:C
2.(25-26高二上·北京海淀·月考)200辆汽车通过某一段公路时的时速频率分布直方图如图所示.则时速在的汽车大约有 辆.
【答案】
【分析】根据频率分布直方图求得正确答案.
【详解】由图可知,时速在的汽车大约有辆.
知识点04 用样本估计总体的数字特征
1.众数、中位数、平均数.
(1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
(2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
若有奇数个数,则最中间的数是中位数;
若有偶数个数,则中间两数的平均数是中位数.
(3)平均数:个样本数据的平均数为,反映了一组数据的平均水平.
公式变形:.
2.总体百分位数的估计
(1)定义:一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若i不是整数而大于i的比邻整数j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第i+1项数据的平均数.
(3)四分位数
第25、50、75百分位数称为四分位数.它们把一组由小到大排列后的数据分成四等份.
3.标准差和方差
(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.
假设样本数据是,表示这组数据的平均数,
则标准差:.
(2)方差:方差就是标准差的平方,即:s2=.
显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
(3)数据特征
标准差、方差描述了一组数据围绕平均数波动程度的大小.
标准差、方差越大,则数据的离散程度越大;
标准差、方差越小,数据的离散程度越小.
反之亦可由离散程度的大小推算标准差、方差的大小.
4.平均数、方差的运算性质:如果数据的平均数为,方差为,标准差为,那么一组新数据:
的平均数为,方差是,标准差为.
5.分层抽样的平均数
(1)一般地,将样本 ,…, 和样本,…,合并成一个新样本,则这个新样本的平均数为,设上述两层构成的新样本中每层的平均数分别为 和于是,
=+=+
记,,,称为权重,则+
(2)推广:设样本中不同层的平均数和相应权重分别为,,…和,,…则这个样本的平均数为 +…为了简化表示,引进求和符号,记作
6.分层抽样的方差
(1).定义:一般地,将样本 ,…, 和样本,…,合并成一个新样本,则这个新样本的方差为,设
上述两层构成的新样本中每层的方差分别为,,于是,[+]+[+],
记,,,称为权重,则[+]+[+]
2)推广:设样本中不同层的方差和相应权重,及平均数分别为,,…和,,…,,,…则这个样本的方差为 [+]+[+]+[+]为了简化表示,引进求和符号,记作
【即学即练】
1.(25-26高三上·陕西咸阳·月考)某地7月11日到7月20日连续10天的最高气温分别为38,38,37,37,35,34,36,39,38,38(单位:),若这10个数据的平均数为,中位数为,极差为,方差为,则下列说法正确的有( )
A. B. C. D.
【答案】BC
【分析】依次计算平均数、中位数、极差、方差,再逐一验证选项.
【详解】数据总和为,故.
将数据排序:,
中位数为第5、6个数的平均数,即.
极差.
,
故.
所以BC选项正确,AD选项错误.
故选:BC
2.(多选)(四川省乐山市高中2026届高三上学期第一次调查研究考试数学试题)2025年9月20日,四川省城市足球联赛(简称“川超”)开幕式暨揭幕战观众达21448人.为了解各年龄层对“川超”的关注程度,随机选取了200名年龄在的观众进行调查,并绘制如下的频率分布直方图,则( )
A. B.该场观众年龄众数的估计值为40
C.该场观众年龄50%分位数的估计值为35 D.该场观众年龄平均数的估计值为35
【答案】AC
【分析】A选项,根据频率之和为1得到方程,求出;B选项,众数的估计值为;C选项,先确定50%分位数所在区间,设为,进而得到方程,求出答案;D选项,中间值作代表,求出平均数的估计值.
【详解】A选项,由题意得,解得,A正确;
B选项,由频率分布直方图可知,年龄处于区间的观众频率最大,
故该场观众年龄众数的估计值为,B错误;
C选项,由于,,
故该场观众年龄50%分位数处于中,设为,
则,解得,
所以该场观众年龄50%分位数的估计值为35,C正确;
D选项,该场观众年龄平均数的估计值为
,D错误.
故选:AC
题型01 获取数据的途径
【典例1-1】(25-26高一上·河南·月考)下列调查中最适合采用全面调查(普查)的是( )
A.了解某市小麦的根部生长情况
B.了解某品牌手机的防摔功能
C.了解某省高一学生坚持晨读的情况
D.对我国最新研发的“玄龙08战斗机”的各零部件质量情况的调查
【答案】D
【分析】根据抽样调查与普查的特点,逐一分析各个选项,即可得答案.
【详解】选项A:了解某市小麦的根部生长情况,普查工作量巨大且有破坏性,适合抽样调查,故A错误;
选项B:了解某品牌手机的防摔功能,普查工作量巨大且有破坏性,适合抽样调查,故B错误;
选项C:了解某省高一学生坚持晨读的情况,普查工作量巨大,适合抽样调查,故C错误;
选项D:“玄龙08战斗机”的各零部件数量有限,且是精确度要求较高的调查,
适合全面调查(普查),故D正确.
故选:D
【典例1-2】(25-26高一上·重庆潼南·开学考试)下列调查中,适合采用抽样调查的是( )
A.调查重庆市鲁能巴蜀中学九年级(1)班50名同学的视力情况
B.重庆西站对乘坐高铁的旅客进行安检
C.为保证飞机飞行安全,工人对其零部件进行检查
D.调查重庆市中学生的周末作业完成时间
【答案】D
【分析】根据抽样调查的特点,它适用于总体较大、全面调查不经济或不现实的情况,分析选项即可.
【详解】对于A,调查重庆市鲁能巴蜀中学九年级(1)班50名同学的视力情况:总体较小(仅50人),容易进行全面调查,不适合抽样调查,
对于B,重庆西站对乘坐高铁的旅客进行安检:安检涉及安全风险,必须对每位旅客进行全面检查,不适合抽样调查,
对于C,为保证飞机飞行安全,工人对其零部件进行检查:飞机零部件检查要求全面性,任何遗漏都可能造成安全事件,不适合抽样调查,
对于D,调查重庆市中学生的周末作业完成时间:调查对象是全市范围中学生,总体较大,适合抽样调查,
因此,适合采用抽样调查的是D,
故选:D.
【变式1-1】(24-25高一上·江西·月考)在下列调查中,适合用全面调查的是( )
A.调查一个水库所有鱼中草鱼所占的比例 B.调查一个县各村的粮食播种面积
C.调查一批炮弹的杀伤半径 D.调查一批玉米种子的发芽率
【答案】B
【分析】根据全面调查的定义可得出合适的选项.
【详解】全面调查是对调查对象的所有单位一一进行调查的调查方式,
A. 查一个水库所有鱼中草鱼所占的比例.,调查数目较多,不适合全面调查;
B. 调查一个县各村的粮食播种面积适合全面调查;
C.调查一批炮弹的杀伤半径,调查数目较多,可以使用抽样调查;
D. 调查一批玉米种子的发芽率,调查数目较多,且具有破坏性,不适合全面调查.
故选:B.
【变式1-2】(多选)(24-25高一下·广东揭阳·期中)从某市参加升学考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是( )
A.总体指的是该市参加升学考试的全体学生的数学成绩
B.样本是指1000名学生的数学成绩
C.样本量指的是1000名学生
D.个体指的是该市参加升学考试的每一名学生的数学成绩
【答案】ABD
【分析】根据总体、样本、样本容量和个体的定义直接判断选项即可.
【详解】总体指的是该市参加升学考试的全体学生的数学成绩,故A正确;
样本是指1000名学生的数学成绩,故B正确;样本量是1000,故C错误;
个体指的是该市参加升学考试的每一名学生的数学成绩,故D正确.
故选:ABD.
题型02 抽样方法
【典例2-1】(24-25高一下·湖南岳阳·期末)某校高中生共有3600人,其中高一年级1300人,高二年级人,高三年级1100人,现采取分层抽样法抽取容量为36的样本,那么高一、高二、高三各年级抽取的人数分别为( )
A.11,14,11 B.12,12,12 C.14,12,10 D.13,12,11
【答案】D
【分析】根据分层抽样的定义求得抽样比,分别计算每个年级被抽到的人数,可得答案.
【详解】用分层抽样在各层中的每个个体被抽到的可能性为,
则在高一年级抽取的人数是(人),
高二年级抽取的人数是(人),
高三年级抽取的人数是(人),
所以高一、高二、高三各年级抽取的人数分别为13,12,11,
故选:D.
【典例2-2】(25-26高二上·四川成都·月考)某高校对中文系新生进行体测,利用随机数表对400名学生进行抽样,先将400名学生进行编号,001,002,……,399,400.从中抽取40个样本,如图提供随机数表的第5行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第3个样本编号是( )
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77
A.457 B.253 C.007 D.860
【答案】C
【分析】根据随机数表读法,依次读取数据,不在范围的及与前面重复的都舍去,进而得到结论.
【详解】从表中第5行第6列开始向右读取数据为:253,313,457(舍),860(舍),736(舍),253(舍),007,328,所以第3个样本编号为007.故选:C.
【变式2-1】(云南省红河州、文山州2026届高中毕业生第一次复习统一检测数学试题)在孟德尔两对相对性状的豌豆杂交实验中,子二代豌豆性状表现型及理论比例为:黄色圆粒:黄色皱粒:绿色圆粒:绿色皱粒.现研究人员计划从大量该代豌豆种子中,随机抽取n粒豌豆作为样本进行研究.若希望样本中黄色皱粒豌豆的理论(期望)数量为30粒,则样本量n应为( )
A.160 B.190 C.220 D.250
【答案】A
【分析】根据分层抽样结合样本数量计算求解.
【详解】根据题意得,黄色皱粒豌豆所占总体比例为,所以样本量.
故选:A.
【变式2-2】(25-26高二上·上海浦东新·月考)设总体由编号为00,01,…,59的60个个体组成,利用下面的随机数表选取6个个体,选取方法是从该随机数表第1行的第6个数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为 .
【答案】56
【分析】依据随机数表的抽样规则确定符合条件的个体编号.
【详解】从该随机数表第1行的第6个数字'6'开始,由左到右依次选取两个数字。读取的数字对依次为:64(大于59,舍去),
42(选取,第1个),16(选取,第2个),60(大于59,舍去),65(大于59,舍去),80(大于59,舍去),46(选取,第3个),
26(选取,第4个),15(选取,第5个),56(选取,第6个)。故选出来的第6个个体的编号为56。
题型03 统计图表
【典例3-1】(25-26高一上·安徽阜阳·开学考试)某校为了解学生的身高情况,随机对部分学生进行抽样调查,已知抽取的样本中,男生、女生人数相同,分组情况为(单位:),,,,,利用所得数据绘制如下统计图表:
根据图表提供的信息,可知样本数据中下列信息正确的是( )
A.身高在区间的男生比女生多人
B.B组中男生和女生占比相同
C.超过一半的男生身高在以上
D.女生身高在组的人数有人
【答案】D
【分析】根据直方图即可求得抽取男生的总人数也就是女生的总人数,然后根据扇形统计图乘以对应的百分比即可求解.
【详解】解析:抽取的男生总人数为(人),
因为抽取的样本中,男生、女生人数相同,
所以抽取的女生总人数为人,
由直方图可知,身高在区间的男生人数为12人,
由扇形统计图可知,身高在区间的女生人数为(人),
则身高在区间的男生比女生少3人,选项A错误;
B组中男生和女生占比不相同,选项B错误;
男生身高在以上的占比为,则选项C错误;
女生中E组的人数为(人),则选项D正确;
故选:D.
【典例3-2】(24-25高一上·江西抚州·月考)某中职学校为了解全校学生国庆小长假期间阅读古典名著的时间的情况,抽查了1000名学生,将他们的阅读时间进行分组抽样结果绘成的频率分布直方图如图所示,则实数 .
【答案】
【分析】由频率分布直方图结合频率和为1可得答案.
【详解】由图可得各分组频率之和为:
因各分组频率之和为1,则
故答案为:0.14.
【变式3-1】(多选)(24-25高一上·辽宁葫芦岛·期末)为了关注学生的健康成长,某学校开展了一次高一年级学生身高的抽样调查,随机抽取了100名学生,将他们的身高划分成了A,B,C,D,E五个层次,根据抽样结果得到如下统计图,则从图中能得出的信息是( )
A.样本中A层次身高的女生少于男生
B.样本中B层次身高的学生人数最多
C.样本中D层次身高的学生人数占总人数的17%
D.样本中E层次身高的男生有6人
【答案】ABC
【分析】由题中统计图可判断各选项正误.
【详解】对于A,样本中女生人数为,则样本中男生有(人),样本中A层次身高的男生人数为,女生人数为4,所以样本中A层次身高的女生少于男生.故A正确;
对于B,因为男生中B层次身高的人数比例最大,女生中B层次身高的人数比例也最大,所以样本中B层次身高的学生人数最多.故B正确;
对于C,样本中D层次身高的女生有8人,D层次身高的男生有(人),所以样本中D层次身高的学生人数占总人数的比例为.故C正确;
对于D,样本中E层次身高的男生有(人).故D错误.
故选:ABC
【变式3-2】(24-25高一下·安徽阜阳·期末)年度全省地区生产总值为本年度第一、二、三产业增加值之和.观察下列两个图表,则下列说法错误的是( )
A.2020至2024年第一产业增加值逐年下降
B.2020至2024年第二产业增加值逐年升高
C.2020至2024年第三产业增加值占地区生产总值比重逐年升高
D.2020至2024年全省地区生产总值逐年增长
【答案】A
【分析】根据图1和图2,逐项分析判断即可.
【详解】结合图1和图2,计算可得2020至2024年第一产业增加值依次为
3167.578,3362.034,3505.425,3520.571,3543.75,成递增趋势,故A错误;
结合图1和图2,计算可得2020至2024年第二产业增加值依次为
15297.084,16939.479,17709.225,18712.076,19591.875,成递增趋势,故B正确;
由图2可知,2020至2024年第三产业增加值占地区生产总值比重逐年升高,故C正确;
由图1可知,2020至2024年全省地区生产总值逐年增长,故D正确.
故选:A.
【变式3-3】(2025·上海杨浦·一模)为了了解某校高三年级学生的体育成绩,随机选取名学生参加考核,将考核的成绩(满分分,成绩均为不低于分的整数)分成六组:,,,,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)在考核成绩为,,的三组学生中,用分层抽样的方法抽取人,则考核成绩在中的学生应抽取多少人?
【答案】(1)
(2)
【分析】(1)利用频率之和为结合频率分布直方图列式求出;
(2)利用频率分布直方图求出成绩为,,的学生人数,再根据分层抽样的概念求解即可;
【详解】(1)由频率分布直方图可得,
解得.
(2)由频率分布直方图知,样本考核成绩在,,的三组学生有(人),
其中样本考核成绩在的市民人数为,
用分层抽样的方法应从考核成绩在的市民中抽取(人).
题型04 样本数据特征的计算
【典例4-1】(湖北省云学联盟2025-2026学年高二上学期12月月考数学试题)从队20人、队30人中,按照分层随机抽样的方法从两队共抽取5人.进行一轮答题竞赛.相关统计情况如下:队答对题目数的平均数为2,方差为1.04;队答对题目数的平均数为1,方差为2.04,则这5人答对题目数的方差为( )
A.0.95 B.1.06 C.1.33 D.1.88
【答案】D
【分析】根据分层抽样的性质,结合样本方差的公式进行求解即可.
【详解】抽到5人中,队的人数为,队的人数为,
因为队答对题目数的平均数为2,方差为1.04;队答对题目数的平均数为1,方差为2.04,
这5人答对题目数的平均数为.
所以这5人答对题目数的方差为,
故选:D
【典例4-3】(2026高三·全国·专题练习)2024年,我国彩电、智能手机、计算机等产量继续排名全球第一,这标志着我国消费电子产业已经实现从“跟随”到“引领”的转变,开启了高质量发展的新时代.如图是2024年3月至12月我国彩电月度产量及增长情况统计图(单位:万台,%),则关于这10个月的统计数据,下列说法正确的是(注:同比,即和去年同期相比)( )
A.这10个月我国彩电月度产量的中位数为1726万台
B.这10个月我国彩电月度平均产量不超过1600万台
C.自2024年9月起,各月我国彩电月度产量均同比下降
D.这10个月我国彩电月度产量同比增长率的极差不超过0.4
【答案】D
【分析】根据中位数、平均数、极差的定义进行计算判断即可.
【详解】将这10个月我国彩电月度产量(单位:万台)按从小到大排列依次为
1513,1540,1553,1650,1727,1783,1802,1846,1926,2097,
中位数为第5个数与第6个数的平均数,即,A错误;
这10个月我国彩电月度平均产量为
万台,B错误;
自2024年9月起,我国彩电月度产量虽然逐月减少,但同比是与去年同月相比,
由同比增长率可知,9月、10月、11月的同比增长率均为正数,故月度产量同比有所增长,C错误;
由题图可知,这10个月产量的同比增长率的最大值与最小值分别为25.6%与-8.3%,
故其极差为,故D正确.
故选:D.
【变式4-1】(2026高三·全国·专题练习)已知某地区甲、乙两所高中学校的六次联合模拟考试的数学平均分数(满分150分)的统计如图所示,则下列说法错误的是( )
A.甲校的平均分均高于乙校的平均分
B.甲校六次平均分的方差小于乙校六次平均分的方差
C.甲校六次平均分的第25百分位数小于乙校六次平均分的第75百分位数
D.甲校的平均分极差小于乙校的平均分极差
【答案】A
【分析】根据平均数,方差,百分位数,极差定义计算判断各个选项.
【详解】对于A,甲校第2次考试的平均分低于乙校第2次考试的平均分,A错误;
对于B,由题图可知,甲校六次考试的平均分相对于乙校六次考试的平均分更加集中,说明数据更加稳定,
则甲校六次平均分的方差小于乙校六次平均分的方差,B正确;
对于C,,甲校六次考试的平均分按从小到大的顺序排列,第2个成绩为第25百分位数,
由题图可知,为第5次考试的平均分,约为90分;
,乙校六次考试的平均分按从小到大的顺序排列,第5个成绩为第75百分位数,
由题图可知,为第3次考试的平均分,高于90分;
甲校六次平均分的第25百分位数小于乙校六次平均分的第75百分位数,C正确;
对于D,由题图可知,甲校平均分的最高值和最低值的差明显小于乙校平均分最高值和最低值的差,
即甲校的平均分极差小于乙校的平均分极差,D正确.
故选:A.
【变式4-2】(24-25高一下·江苏泰州·月考)下面是校篮球队某队员若干场比赛的得分数据.
每场比赛得分
3
6
7
10
11
13
30
频数
2
1
2
2
1
1
1
则下列说法不正确的是( )
A.该队员得分的平均数是10 B.该队员得分的极差是27
C.该队员得分的第四十百分位数是7 D.该队员得分的方差是48.4
【答案】D
【分析】分别根据平均数,极差,百分位数,方差的定义即可判断.
【详解】该队员得分的平均数是,故A正确;极差是,故B正确;
,所以第百分位数是,故C正确;
方差是,故D错误.故选:D
【变式4-3】(多选)(24-25高一下·福建福州·期末)某中学九年级在体能测试后,为分析学生的跳绳成绩,随机抽取了名学生的分钟跳绳的次数,将所得数据整理后,分为组画出如图频率分布直方图.为进一步分析学生的成绩分布情况,经计算得到这名学生中,跳绳次数位于的学生跳绳次数的方差为,跳绳次数位于的学生跳绳次数的方差为.(同一组中的数据以这组数据所在区间的中点值为代表)则下列正确的是( )
A.
B.估计该年级学生跳绳次数的分位数约为
C.估计该年级学生跳绳次数在次及以上的学生跳绳次数的平均数为
D.估计该年级学生跳绳次数在次及以上的学生跳绳次数的方差为
【答案】BD
【分析】对于A选项,频率分布直方图里各长方形面积和为,把各区间频率系数相加乘组距得到总面积表达式,令其等于,即可求出;
对于B选项,先算出前几个矩形面积和,通过与比较,确定分位数所在区间.再根据百分位数的定义,用已有的面积和加上该区间的面积等于,列方程求解百分位数;
对于C选项,根据加权平均的方法,以比例为权重乘以对应数值,即可求解平均数;
对于D选项,根据方差公式,以不同区域的比例为权重,分别计算每个区间数值与平均数差值的平方加上给定值,再求和得到方差.
【详解】对于A,由频率分布直方图中各长方形面积和为,得,解得,故A错误;
对于B,根据百分位数的计算,假设该年级学生跳绳次数的分位数为,则,又,所以解得,故B正确;
对于C,该年级学生跳绳次数在次及以上的学生跳绳次数的平均数为,故C错误;
对于D,该年级学生跳绳次数在次及以上的学生跳绳次数的方差为,故D正确.
故选:BD.
题型05 统计中的决策问题
【典例5-1】(24-25高一上·陕西咸阳·开学考试)某公司打算招聘一名职员.对甲、乙、丙三名应聘者进行了综合知识、工作经验、语言表达三方面的测试,他们的各项成绩如下表所示:
项目
应聘者
综合知识
工作经验
语言表达
甲
75
80
80
乙
85
80
70
丙
70
78
70
如果将每位应聘者的综合知识、工作经验、语言表达的成绩按5:2:3的比例计算其总成绩,并录用总成绩最高的应聘者,则被录用的是 .
【答案】乙
【分析】根据题目所给比例计算三位应聘者得总成绩即可得到结论.
【详解】由题,对于甲,他的总成绩如下:
,
对于乙,他的总成绩:,
对于丙,他的总成绩:,
比较三者总成绩,乙的成绩最高。
故答案为:乙
【典例5-2】(25-26高一上·河北邯郸·开学考试)某社区组织了以“奔向幸福,‘毽’步如飞”为主题的踢毽子比赛活动,初赛结束后有甲、乙两个代表队进入决赛,已知每队有5名队员,按团体总数排列名次,在规定时间内每人踢100个以上(含100)为优秀.下表是两队各队员的比赛成绩.
1号
2号
3号
4号
5号
总数
甲队
103
102
98
100
97
500
乙队
97
99
100
96
108
500
经统计发现两队5名队员踢毽子的总个数相等,按照比赛规则,两队获得并列第一.
学习统计知识后,我们可以通过考查数据中的其它信息作为参考,进行综合评定:
(1)甲、乙两队的优秀率分别为_____________、________________;
(2)甲队比赛数据的中位数为___________个;乙队比赛数据的中位数为__________个;
(3)分别计算甲、乙两队比赛数据的方差;
(4)根据以上信息,你认为综合评定哪一个队的成绩好?简述理由.
【分析】(1)根据甲队和乙队每人踢100个以上(含100)的人数,除以总人数,即可求出甲乙两队的优秀率;
(2)根据中位数的定义先把数据从小到大排列,找出最中间的数即可;
(3)根据平均数的计算公式先求出甲和乙的平均数,再根据方差公式进行计算即可;
(4)分别从甲和乙的优秀率、中位数、方差,进行比较,即可得出答案.
【详解】(1)甲队的优秀率为:,
乙队的优秀率为:.
故答案为:;.
(2)甲队5名队员比赛成绩按从小到大的顺序排列为:97,98,100,102,103,
所以甲队比赛数据的中位数为100;
乙队5名队员比赛成绩按从小到大的顺序排列为:96,97,99,100,108,
所以乙队比赛数据的中位数为99.
故答案为:100;99.
(3)甲、乙两队比赛数据的平均数均为(个)
.
.
(4)综合评定甲队的成绩好,理由如下:
因为甲队的优秀率比乙队高;甲队的中位数比乙队大;甲队的方差比乙队低,比较稳定,综合评定甲队比较好.
【变式5-1】(24-25高一下·陕西咸阳·期末)某果园试种了,两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记,两个品种各10棵的产量的平均数分别为和,方差分别为和.
(单位:kg)
60
50
40
60
70
80
80
80
90
90
(单位:kg)
40
60
60
80
80
50
80
80
70
100
(1)求品种的10棵桃树产量的第80百分位数;
(2)求,,,;
(3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,并说明理由.
【分析】(1)根据百分数知识即可求解;
(2)根据平均数和方差公式求解即可求解;
(3)比较平均值和方差的大小即可求解.
【详解】(1)由题意将品种的棵桃树产量从小到大排列为:,,,,,,,,,;
且,则第百分位数为第位和第位数的平均数:.
故品种的棵桃树产量的第百分位数为.
(2)由题意可得,
则
;
,
.
(3)种植品种,因为,但是,所以品种产量较稳定.
【变式5-2】(24-25高一下·广西河池·期末)2025年NBA选秀大会,我国选手杨瀚森将参加选秀,为备战选秀,运动员参加了联合试训,其中甲、乙两位运动员开展了队内三分投篮对抗赛.在对抗赛中两人每轮投篮10次,共进行10轮,每轮命中的成绩(个数)如下:
甲
4
7
6
5
4
9
10
7
8
10
乙
7
5
8
6
7
9
7
6
7
8
(1)求甲运动员的样本数据第75百分位数;
(2)分别计算这两位运动员10轮投篮成绩的平均数和方差;
(3)根据第二问结果回答下列问题:甲、乙两位运动员谁的发挥更稳定,为什么?
【分析】(1)根据百分位数的计算公式即可求解,
(2)由平均数和方差的计算公式即可求解,,
(3)根据方差的大小即可比较作答.
【详解】(1)甲运动员的成绩从小到大排列为,
,故甲运动员的样本数据第75百分位数为9,
(2)甲的平均数为,
方差为
乙的平均数为
方差为
(3)由(2)知:,
故乙发挥的更加稳定.
题型06 统计知识的综合应用
【典例6-1】(25-26高一上·河南南阳·月考)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第75百分位数;
(2)求样本成绩的平均数;
(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
【分析】(1)根据频率分布直方图频率关系可得的值,再根据百分位数的概念求解样本成绩的第75百分位数即可;
(2)根据频率分布直方图计算平均数即可;
(3)根据样本的平均数与方差求解总体的平均数与方差即可.
【详解】(1)由频率分布直方图面积和为1,
可得,
解得;
成绩在的频率为,
则第75百分位数为.
(2)由频率分布直方图可得样本平均数为
.
(3)可知成绩落在的人数为人,
成绩落在的人数为人,
则两组总体成绩平均数为,
则总体方差为.
【典例6-2】(25-26高一上·河南南阳·月考)为了解学生对A,B两家餐厅的满意度情况,现从在A,B两家餐厅都用过餐的学生中随机抽取了50人,每人分别对这两家餐厅的满意度进行打分(分数区间为),将其分数记为满意指数.根据打分结果按分组,得到如图所示的频率分布直方图,其中B餐厅的满意指数在内的学生有15人.
(1)求图中的值;
(2)利用样本估计总体的思想,比较A,B两家餐厅满意指数的平均数的大小;(计算平均数时同一组中的数据用该组区间的中点值作代表)
(3)若B餐厅满意指数频率分布直方图中第三组满意指数的方差为2,第四组满意指数的方差为1,估计在B餐厅用过餐的第三组与第四组所有学生的满意指数的方差.(计算平均数时同一组中的数据用该组区间的中点值作代表)
附:若数据的平均数为,方差为,数据的平均数为,方差为,将这两组数据混合在一起得到一组新数据,设新数据的平均数为,则新数据的方差.
【分析】(1)根据频率分布直方图的频率和为1的性质,结合已知参数值求解;
(2)利用组中点值与对应频率的乘积和计算两个餐厅满意指数的平均数,并比较大小;
(3)先确定两组数据的人数,再根据混合数据的平均数和方差公式分步计算.
【详解】(1)B餐厅样本容量为50,区间频数为15,对应频率为.
频率分布直方图组距为2,故
所有区间频率和为,即,解得.
(2)餐厅满意指数平均数.
餐厅满意指数平均数.
故.
(3)B餐厅第三组频率为,人数为,平均数7,方差2;
第四组人数为,平均数9,方差1.
混合数据平均数.
方差.
【变式6-1】(24-25高一下·吉林松原·期末)某地举办了“防电信诈骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第80百分位数;求样本平均数;
(2)已知落在区间的样本平均成绩是57,标准差是7,落在区间的样本平均成绩为66,标准差是4,求两组样本成绩合并后的平均数和方差.
【分析】(1)由频率之和为1即可求a,先依次求出前4组和前5组频率之和得到样本成绩的第80百分位数所在区间即可计算求解,由频率分布直方图的平均数计算公式直接计算即可求平均数;
(2)先依次求出两区间的样本个数、样本平均成绩、方差,再由总体平均数公式和总体方差公式即可计算两组样本成绩合并后的平均数和方差.
【详解】(1)由题意,
所以前4组频率之和,
前5组频率之和,
所以样本成绩的第80百分位数在区间内,且为,
样本平均数为;
(2)由题可得落在区间的样本个数为,样本平均成绩是,方差是,
落在区间的样本个数为,样本平均成绩是,方差是,
所以两组样本成绩合并后的平均数为,
两组样本成绩合并后的方差为.
【变式6-2】(25-26高二上·贵州遵义·期中)某校高二年级半期考试测试后,为了解本次测试的情况,在整个年级中随机抽取了200名学生的数学成绩.将成绩分为,,,,,,共6组,得到如图所示的频率分布直方图.
(1)在样本中,采取等比例分层抽样的方法从成绩在内的学生中抽取15名,则成绩在的同学有几个?
(2)根据图中的样本数据,假设同组中每个数据用该组区间的中点值代替,试估计本次考试的平均分和众数;
(3)若年级计划对本次测试优异的同学进行表彰,且表彰人数不超过6%,根据样本数据,试估计获得表彰的同学的最低分数.
【分析】(1)根据频率分布直方图的性质,可求得a值,根据分层抽样的性质,计算即可得答案.
(2)根据频率分布直方图中平均数的求法,代入数据,即可得平均数,由图象可得众数,即可得答案.
(3)分析可得获得表彰的同学的最低分数位于内,且设为x,则,即可得答案.
【详解】(1)由频率分布直方图性质得,
解得,
所以的人数有个.
(2)本次考试的平均分
,
由频率分布直方图得:众数为100.
(3)的频率为,
所以获得表彰的同学的最低分数位于内,且设为x,
则,解得,即最低分数为138.
一、单选题
1.(25-26高一上·河南·月考)下列调查中最适合采用全面调查(普查)的是( )
A.了解某市小麦的根部生长情况
B.了解某品牌手机的防摔功能
C.了解某省高一学生坚持晨读的情况
D.对我国最新研发的“玄龙08战斗机”的各零部件质量情况的调查
【答案】D
【分析】根据抽样调查与普查的特点,逐一分析各个选项,即可得答案.
【详解】选项A:了解某市小麦的根部生长情况,普查工作量巨大且有破坏性,适合抽样调查,故A错误;
选项B:了解某品牌手机的防摔功能,普查工作量巨大且有破坏性,适合抽样调查,故B错误;
选项C:了解某省高一学生坚持晨读的情况,普查工作量巨大,适合抽样调查,故C错误;
选项D:“玄龙08战斗机”的各零部件数量有限,且是精确度要求较高的调查,
适合全面调查(普查),故D正确.
故选:D
2.(2025高一·全国·专题练习)某班级有男生20人,女生30人,从中抽取10人作为样本,其中一次抽样结果是:抽到了4名男生、6名女生,则下列命题中正确的是( )
A.这次抽样可能采用的是简单随机抽样
B.这次抽样一定没有采用分层抽样
C.这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率
D.这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率
【答案】A
【分析】根据简单随机抽样、分层抽样的定义可以判断A,B;通过计算概率可判断C,D.
【详解】对于A,这次抽样可能采用的是简单随机抽样,故A正确.
对于B,由知,采用的可以是分层抽样,故B错误.
对于C和D,抽样中每个女生被抽到的概率与每个男生被抽到的概率均等于,故C和D均错误.
故选:A.
3.(25-26高二上·贵州贵阳·月考)某单位有职工750人,其中青年职工250人,中年职工350人,老年职工150人,为了了解该单位职工的心理健康情况,用按比例分层随机抽样的方法从中抽取样本,若样本中的中年职工为7人,则样本容量为( )
A.15 B.25 C.35 D.75
【答案】A
【分析】根据题意,设样本容量为,利用分层抽样的定义和运算方法,列出方程,即可求解.
【详解】由题意知,该单位中中年职工的人数为350人,且样本中中年职工为7人,
设样本容量为,可得,解得.
故选:A.
4.(24-25高一上·重庆长寿·期末)年月日时至次日时(次日的时间前加表示)重庆的温度走势
下列说法错误的是( )
A.月日时至时重庆气温逐渐升高,时到次日时重庆气温逐渐降低
B.月日时至次日时重庆的最低气温为,最高气温为
C.根据图象,这一天时所对应的温度为
D.根据图象,这一天时所对应的温度为
【答案】C
【分析】根据折线图逐项判断.
【详解】A. 由折线图知:月日时至时重庆气温逐渐升高,时到次日时重庆气温逐渐降低,故正确;
B. 由折线图知:月日时至次日时重庆的最低气温为,最高气温为,故正确;
C.根据图象,这一天时所对应的温度约为,故错误;
D. 根据图象,这一天时所对应的温度为,故正确,
故选:C
5.(25-26高三上·安徽蚌埠·月考)为了解某企业喜爱打羽毛球、打篮球和游泳的职工年龄情况,统计了该企业第一车间的所有职工喜爱打羽毛球、打篮球和游泳构成比例(每位职工必选一项体育活动且只选一项).得到如下饼图:
若喜爱打羽毛球的职工年龄(岁)的均值与方差分别为,喜爱打篮球的职工年龄(岁)的均值与方差分别为,喜爱游泳的职工年龄(岁)的均值与方差分别为.则下面结论中不正确的是( )
A.该企业喜欢打篮球的职工人数可能多于喜欢游泳的职工人数
B.第一车间喜欢打羽毛球的职工有一些年龄比较大
C.第一车间所有职工平均年龄为岁
D.第一车间所有职工年龄方差不超过喜爱打羽毛球、打篮球及游泳的职工的年龄方差之和
【答案】D
【分析】逐项分析各选项对应的数据即可得到正确答案.
【详解】选项A:第一车间职工喜爱的体育活动情况不等同于该企业情况,所以选项A说法正确;
选项B:喜爱打羽毛球的职工年龄(岁)的均值与方差分别为,说明有些职工年龄比50大,所以选项B说法正确;
选项C:样本均值:,所以选项C说法正确;
选项D:样本方差:,所以选项D说法错误.
故选:D.
6.(22-23高一下·云南昆明·期末)二战期间,为估计德军坦克的月生产能力,盟军请统计学家参与情报的收集和分析,统计学家从缴获的德军坦克中,随机抽取某月生产的坦克编号作为样本来估计坦克月生产量.抽取的坦克编号从小到大依次为,假设坦克的月生产量为,将区间分成个小区间:,,……,,,统计学家利用前个区间的平均长度来估计所有个区间的平均长度,进而得到的估计值.若抽取的某月生产的坦克编号为2,13,41,75,107,118,159,194,206,230,则的估计值为( )
A.236 B.253 C.360 D.420
【答案】B
【分析】根据题意列出等式即可求解.
【详解】因为统计学家利用前个区间的平均长度来估计所有个区间的平均长度,
已知某月生产的坦克编号为2,13,41,75,107,118,159,194,206,230,
所以,
此时,解得.
故选:B.
7.(2025高一·湖南·专题练习)设样本数据的平均数为,方差为,设,样本数据的平均数为,方差为,则下列选项错误的是( )
A. B.
C. D.
【答案】B
【分析】利用均值的性质判断A,利用方差的性质判断B,再结合题意和均值,方差的定义计算判断C,D即可.
【详解】对于A,因为,所以,化简得,故A正确,
对于B,因为,所以由方差的性质得,故B错误,
对于C,由题意得,
由均值的性质得,得到,
则,故C正确,
对于D,由方差的性质得,则,
由题意得
,故D正确.
故选:B
8.(25-26高二上·上海松江·期中)某课外活动小组为研究日平均气温的变化情况,将每连续5天的日平均气温(单位: )的记录数据作为一组样本,他们得到了满足下列条件的四个样本:①平均数为3,极差为2;②中位数为7,众数为9;③众数为5,极差为6;④平均数为4,方差为2;则这四个样本中,连续5天的日平均气温记录数据均低于的样本个数至少有( )
A.1个 B.2个 C.3个 D.4个
【答案】C
【分析】将天数据从小到大排序为:,对于①,由平均数为3得,又极差为2,则,可推导,与平均值矛盾;对于②,根据中位数,纵数推导即可;对于③,根据题意可推导第天超过10即可判断;对于④,根据均值方差推导即可判断.
【详解】设“连续5天的日平均温度均低于”,将天数据从小到大排序为:,
①选项,,,若,则,
与平均数为矛盾,所以①选项正确;
②选项,中位数是,众数是,所以将数据从小到大排序后,第3个数是,
第个数为,所以个数据都小于,所以②选项正确;
③选项,众数是,极差为,如,第天超过,不符合,所以③选项错误;
④选项,,
,,
若,则,矛盾,所以④选项正确;
故选:C.
二、多选题
9.(25-26高一上·全国·单元测试)某大型企业对改善员工福利的A,B,C三种方案进行了问卷调查,调查结果如下(单位:人):
支持A方案
支持B方案
支持C方案
35岁以下
200
400
800
35岁及以上
100
100
400
则下列说法正确的是( )
A.所有参与调查的有2000人
B.按照年龄进行分层随机抽样,则抽取的35岁以下的人数和35岁及以上的人数之比为
C.从所有参与调查的人中,按支持方案进行分层随机抽样的方法抽取n人,已知从支持A方案的人中抽取了6人,则
D.从支持B方案的人中,用分层随机抽样的方法抽取5人,这5人中年龄在35岁及以上的人数是4
【答案】AC
【分析】根据分层抽样的概念、等比例性质分析判断各项的正误.
【详解】A:由题意得,所有参与调查的人数为,对;
B:35岁以下的人数为1400,35岁及以上的人数为600,
所以按照年龄进行分层随机抽样,抽取35岁以下的人数和35岁及以上的人数之比为,错;
C:从所有参与调查的人中,按支持方案进行分层随机抽样的方法抽取人,
已知从支持A方案的人中抽取了6人,则,解得,对;
D:从支持B方案的人中,用分层随机抽样抽取5人,年龄在35岁及以上的人数为,错.
故选:AC
10.(四川省乐山市高中2026届高三上学期第一次调查研究考试数学试题)2025年9月20日,四川省城市足球联赛(简称“川超”)开幕式暨揭幕战观众达21448人.为了解各年龄层对“川超”的关注程度,随机选取了200名年龄在的观众进行调查,并绘制如下的频率分布直方图,则( )
A. B.该场观众年龄众数的估计值为40
C.该场观众年龄50%分位数的估计值为35 D.该场观众年龄平均数的估计值为35
【答案】AC
【分析】A选项,根据频率之和为1得到方程,求出;B选项,众数的估计值为;C选项,先确定50%分位数所在区间,设为,进而得到方程,求出答案;D选项,中间值作代表,求出平均数的估计值.
【详解】A选项,由题意得,解得,A正确;
B选项,由频率分布直方图可知,年龄处于区间的观众频率最大,
故该场观众年龄众数的估计值为,B错误;
C选项,由于,,
故该场观众年龄50%分位数处于中,设为,
则,解得,
所以该场观众年龄50%分位数的估计值为35,C正确;
D选项,该场观众年龄平均数的估计值为
,D错误.
故选:AC
11.(24-25高一下·湖北·期末)一组样本有互不相等的5个数据,平均数记为,方差记为,下列说法错误的是( )
A.去掉样本数据中的最大值和最小值后得到一组新数据,其平均数等于
B.去掉样本数据中的最大值和最小值后得到一组新数据,其方差小于
C.去掉样本数据中的最小值后得到一组新数据,其方差小于
D.去掉样本数据中的中位数后得到一组新数据,其方差小于
【答案】ACD
【分析】AC选项,可举出实例;B选项,由方差的意义可得;D选项,当平均数和中位数相等时,掉样本数据中的中位数后,其方差为,D错误.
【详解】对于 A,设这5个互不相等的数据为,
则它们的平均数为,
去掉最大值和最小值后,新数据为,其平均数为,
一般情况下,
例如数据,其平均数为,
去掉1和10后,新数据的平均数为,不相等,故A选项错误;
对于B,方差反映数据的离散程度,原数据中最大值和最小值会使数据的离散程度较大,
去掉最大值和最小值后,数据相对更加集中,根据方差的意义,新数据的方差会小于原方差,故B选项正确;
对于C,去掉最小值后,新数据的方差不一定小于原方差,故C选项错误,
下面举出例子,设这5个互不相等的数据为0,0.1,0.2,0.3,4,
则它们的平均数为,
方差为,
去掉最小值0后,新数据为0.1,0.2,0.3,4,其平均数为,
其方差为,
,C错误;
对于 D,设这5个互不相等的数据为,
则它们的平均数为,
方差为,
中位数是将数据排序后位于中间位置的数,当去掉中位数后,
剩下的4个数其平均数为,
所以当时,其方差为,
其方差会大于原方差,故D错误.
故选:ACD
三、填空题
12.(25-26高二上·上海浦东新·月考)设总体由编号为00,01,…,59的60个个体组成,利用下面的随机数表选取6个个体,选取方法是从该随机数表第1行的第6个数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为 .
【答案】56
【分析】依据随机数表的抽样规则确定符合条件的个体编号.
【详解】从该随机数表第1行的第6个数字'6'开始,由左到右依次选取两个数字。读取的数字对依次为:64(大于59,舍去),
42(选取,第1个),16(选取,第2个),60(大于59,舍去),65(大于59,舍去),80(大于59,舍去),46(选取,第3个),
26(选取,第4个),15(选取,第5个),56(选取,第6个)。故选出来的第6个个体的编号为56。
故答案为:56
13.(25-26高一上·全国·课后作业)神舟十三号载人飞行任务的圆满成功,标志着空间站关键技术验证阶段任务圆满完成,中国空间站即将进入建造阶段.某机构研究室通过随机抽样的方式,对18岁及以上人群进行了“你是否曾有过航天梦想”的调查研究,得到如下的统计结果.
根据调查结果,以下说法正确的是 (填序号).
①在“曾有过航天梦想”的人群中,54岁及以上的人数最少;
②在“曾有过航天梦想”的人群中,年龄越大,在航天相关方面的人均消费越少;
③在“曾有过航天梦想”的人群中,18—29岁在航天相关方面的总消费最多.
【答案】①③
【分析】根据扇形图及折线图得出数据判断各个选项即可.
【详解】对于①,从“曾有过航天梦想”的人年龄分布图可知,在“曾有过航天梦想”的人群中,
54岁及以上的人数最少,所以①正确;
对于②,在“曾有过航天梦想”的人群中,随着年龄增大,在航天相关方面的人均消费先变大后再变小,所以②错误;
对于③,设总人数为岁在航天相关方面的总消费约为,
30-40岁在航天相关方面的总消费约为,
41-53岁在航天相关方面的总消费约为,
54岁及以上在航天相关方面的总消费约为.
所以在“曾有过航天梦想”的人群中,18-29岁在航天相关方面的总消费最多,所以③正确.
故答案为:①③.
14.(24-25高一下·广东广州·期末)在大数据时代,由于整合不同来源的数据需要以及在数据量庞大的情况下为减少计算量,实际上在计算机中计算方差是使用递推方法进行计算的.先计算前面k个数据的平均数和方差, 再计算前面k+1个数据的平均数和方,计算可利用递推式:,则 .
【答案】
【分析】由方差公式得,由前个数据的平均数为:,得,进行代入替换求解.
【详解】前个数据的方差为:,
前个数据的平均数为:,
得,
则,
因为,
所以
结合题意得,,
故.
四、解答题
15. (24-25高一下·全国·单元测试)春节前,有超过20万名广西、四川等省籍的外出务工人员选择驾乘摩托车沿321国道长途跋涉返乡过年,为防止摩托车驾驶人员因长途疲劳驾驶,手脚僵硬影响驾驶操作而引发交通事故,肇庆市公安交警部门在321国道沿线设立了多个长途行驶摩托车驾乘人员休息站,让返乡过年的摩托车驾乘人员有一个停车休息的场所.交警小李在某休息站连续5天对进站休息的驾驶人员每隔50辆摩托车就进行一次省籍询问,询问结果如图所示:
(1)交警小李对进站休息的驾驶人员的省籍询问采用的是普查还是抽查?
(2)用分层随机抽样的方法对被询问了省籍的驾驶人员进行抽样,若广西籍的有5人,则四川籍的应抽取几人?
【答案】(1)抽查;(2)2人
【分析】(1)利用普查和抽查的定义即可判断;
(2)由题图可分别求出被询问了省籍的驾驶人员广西籍和四川籍的人数,再利用分层抽样的比例关系即可求解.
【详解】(1)交警小李对进站休息的驾驶人员的省籍询问采用的是抽查的方法.
(2)从题图可知,被询问了省籍的驾驶人员广西籍的有(人),
四川籍的有(人),
设四川籍的驾驶人员应抽取人,
依题意得,解得,即四川籍的应抽取2人.
16.(24-25高一下·贵州黔东南·期末)中国AI大模型正处于一个技术进步迅速、市场规模快速增长的爆发式发展阶段.为了解中国AI大模型用户的年龄分布,A公司调查了500名中国AI大模型用户,统计他们的年龄(都在内),按照,,,,进行分组,得到如图所示的频率分布直方图.
(1)求m的值;
(2)求这500名中国AI大模型用户的年龄在内的人数;
(3)估计这500名中国AI大模型用户年龄的平均数(各组数据以该组区间的中点值作代表).
【分析】(1)由概率之和为1即可求解;
(2)由年龄在内的频率即可计算求解;
(3)由频率分布直方图的平均数计算公式计算即可求解.
【详解】(1)由题可得.
(2)这500名中国AI大模型用户的年龄在内的人数为人;
(3)估计这500名中国AI大模型用户年龄的平均数为
.
17.(25-26高一上·辽宁沈阳·月考)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值及样本成绩的第75百分位数;
(2)求样本成绩的中位数和平均数;
(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
【分析】(1)根据频率分布直方图的性质,以及由频率分布直方图求第百分位数的方法,求出结果即可.
(2)由频率分布直方图求中位数和平均数的方法,求出结果即可.
(3)根据平均数和方差的性质,由给出两组各自的均值和方差,求出合并后得均值和方差即可.
【详解】(1)由频率分布直方图面积和为,可得,
解得;
成绩在的频率为,
则第75百分位数为.
(2)由频率分布直方图可知成绩在的频率为,
则样本成绩的中位数为;
由频率分布直方图可得样本平均数为.
(3)可知成绩落在的人数为人,
成绩落在的人数为人,
则两组总体成绩平均数为,
则总体方差为.
18.(24-25高一下·湖南衡阳·期末)某校在组织选拔数学英才班的过程中,对高一年级的300名学生进行了一次测试.已知参加此次测试的学生的分数全部介于45分到95分之间,学校将所有分数分成5组:,,…,,整理得到如图所示的频率分布直方图(同组数据以这组数据的中间值作为代表).
(1)求的值,并估计此次校内测试分数的平均值;
(2)学校要求按照分数从高到低选拔前90名的学生进行培训,试估计这90名学生的最低分数(计算结果由四舍五入保留一位小数);
(3)试估计这300名学生的分数的方差,并判断此次得分为64分和87分的两名同学的成绩是否进入到了范围内?
(参考公式:,其中为各组频数,参考数据:).
【分析】(1)根据频率直方图,各组的频率之和为1,求出m,利用平均数的定义求出;
(2)先求出90名学生的最低分数就是该次校内测试分数的分位数,利用百分位的定义求解;
(3)先利用方差公式求出方差,再判断即可.
【详解】(1)由频率直方图总面积为1,可得:
,
解得,
根据频率分布直方图,各组中间值为:,对应频率为:
,所以:
.
(2)因为,
所以这90名学生的最低分数为该次校内测试分数的分位数.
又,
设这90名学生的最低分数为,所以,
所以分
(3)
所以,
所以,.
所以得分成绩区间为:故64分的同学成绩进入区间范围,87分的同学成绩未进入区间范围.
19.(2025高二下·全国·专题练习)“地板函数”表示不超过的最大整数,如,.设函数.
(1)求的值及函数的最小正周期;
(2)已知函数,方程恰有30个非负实数解,它们构成一组数据,,…,.
(i)求这组数据的中位数的取值范围;
(ii)设这组数据的方差为,求.
参考公式:
【分析】(1)将代入原函数即可求得结果,利用周期函数的定义即可求得函数的最小正周期;
(2)(i)将展开,结合的周期性,分析方程的解的分布,
构造新函数,再利用判别式的取值范围即可求得结果.
(ii)利用方差的公式计算即可得到结果.
【详解】(1).
因为.
当时,,则,说明没有比2小的正周期,
所以2是的最小正周期.
(2)(i)设,
,当时,,
所以,
令,得,,
所以,由题可知,,
解得.
不妨设,
则,是方程,的两个实根,
因此,,
所以这组数据的中位数为,
所以其取值范围为.
(ii)这30个零点的平均值为,
则,
所以,
所以
当时,直线与图象没有交点,
因此这部分抛物线的顶点应该在直线下方,得,
同理可知点在直线上方,因此,
函数在上单调递减,则,
注意到,,
所以,所以.
第 1 页 共 19 页
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$