第九章 统计(知识清单+6大易错训练)高一数学人教A版必修第二册
2026-05-21
|
2份
|
59页
|
125人阅读
|
2人下载
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版必修第二册 |
| 年级 | 高一 |
| 章节 | 小结 |
| 类型 | 题集-专项训练 |
| 知识点 | 统计 |
| 使用场景 | 同步教学-单元练习 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 9.86 MB |
| 发布时间 | 2026-05-21 |
| 更新时间 | 2026-05-21 |
| 作者 | 温老师高中数学铺子 |
| 品牌系列 | 上好课·上好课 |
| 审核时间 | 2026-05-21 |
| 下载链接 | https://m.zxxk.com/soft/57966840.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
**基本信息**
以“概念-方法-应用”为主线系统整合统计知识,通过清单梳理与易错突破培养数据观念与推理能力。
**专项设计**
|模块|题量/典例|方法提炼|知识逻辑|
|----|-----------|----------|----------|
|统计基础|13清单+6易错点|概念定义+步骤归纳+公式推导|从调查方法到抽样技术,构建统计研究框架|
|数据分析|综合题19道|图表绘制+数字特征计算+误差分析|从数据获取到特征估计,形成完整分析链条|
内容正文:
第九章 统计
清单01 全面调查(普查)、抽样调查
1.全面调查(普查):对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
总体:调查对象的全体.
个体:组成总体的每一个调查对象.
2.抽样调查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法.
样本:从总体中抽取的那部分个体.
样本量:样本中包含的个体数.
清单02 简单随机抽样
1.定义:一般地,设一个总体含有(为正整数)个个体,从中逐个抽取个个体作为样本.如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样,通过简单随机抽样获得的样本称为简单随机样本.
2.方法:抽签法和随机数法.
清单03 抽签法、随机数法
1.抽签法:把总体中的个个体编号,把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将号签放在一个不透明容器中,充分搅拌后,每次从中不放回地抽取一个号签,连续抽取次,使与号签上的编号对应的个体进入样本,就得到一个容量为的样本.
2.随机数法
(1)用随机试验生成随机数
(2)用信息技术生成随机数:①用计算器生成随机数;②用电子表格软件生成随机数;③用R统计软件生成随机数.
清单04 用样本平均数估计总体平均数
1.总体平均数
一般地,总体中有个个体,它们的变量值分别为,则称
为总体均值,又称总体平均数.
2.样本平均数
如果从总体中抽取一个容量为的样本,它们的变量值分别为,则称
为样本均值,又称样本平均数.
清单05 分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.
(1)每一个子总体称为层,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(2)如果总体分为2层,两层包含的个体数分别为,两层抽取的样本量分别为,两层的样本平均数分别为,两层的总体平均数分别为,总体平均数为,样本平均数为.
则 ,
(3)在比例分配的分层随机抽样中,可以直接用样本平均数估计总体平均数.
清单06 获取数据的途径
获取数据的基本途径有通过调查获取数据、通过试验获取数据、通过观察获取数据、通过查询获得数据等.
清单07 频率分布直方图
作频率分布直方图的步骤
1.求极差:极差为一组数据中最大值与最小值的差.
2.决定组距与组数
将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.
3.将数据分组
4.列频率分布表
各小组的频率=.
5.画频率分布直方图
纵轴表示,实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×=频率.
清单08 常见统计图表的特点与区别
扇形图主要用于直观描述各类数据占总数的比例,
条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,条形图适用于描述离散型数据,直方图适用于描述连续型数据.
折线图主要用于描述数据随时间的变化趋势.
清单09 百分位数
1.百分位数定义:一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有的数据大于或等于这个值.
2.常用的百分位数
(1)四分位数:第25百分位数,第50百分位数,第75百分位数.
(2)其它常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第99百分位数.
3.计算一组个数据的第百分位数的一般步骤如下:
第1步,按从小到大排列原始数据;
第2步,计算;
第3步,若不是整数,而大于的比邻整数为,则第p百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
清单10 众数、中位数、平均数
1.众数:一组数据中出现次数最多的数.
2.中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.
3.平均数:如果个数,那么
叫做这n个数的平均数.
清单11 总体集中趋势的估计
1.平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.
2.一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
清单12 频率分布直方图中平均数、中位数、众数的求法
1.样本平均数:可以用每个小矩形底边中点的横坐标与小矩形面积的乘积之和近似代替.
2.在频率分布直方图中,中位数左边和右边的直方图的面积应相等.
3.将最高小矩形所在的区间中点作为众数的估计值.
清单13 方差、标准差
1.假设一组数据为,则这组数据的平均数,方差为
标准差为
2.如果总体中所有个体的变量值分别为,总体平均数为,则称
为总体方差,为总体标准差.
如果总体的N个变量值中,不同的值共有个,不妨记为,其中出现的频数为,则总体方差为
3.如果一个样本中个体的变量值分别为,样本平均数为,则称为样本方差,为样本标准差.
4.标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
【易错01:百分位数的计算出错】
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
【典例】
1.(25-26高一下·江西景德镇·期末)已知某班级某小组学生的一次考试中化学成绩(单位:分)分别是,则他们的化学成绩的第一四分位数是__________(分).
【答案】52
【分析】根据百分位数的定义排序计算即得.
【详解】将这组数据按照从小到大顺序排列为:,
,故这组化学成绩的第一四分位数是第3与第4两个数据的平均数,
即.
故答案为:52.
2.在一次数学测验中,某小组的7位同学的成绩分别为89,109,122,126,131,134,140,则这7位同学成绩的上四分位数与下四分位数的差为___________.
【答案】25
【分析】根据给定条件,利用上四分位数与下四分位数的定义分别求出,再求其差即可.
【详解】由,得这组数据的下四分位数为109,
由,得这组数据的上四分位数为134,
所以所求差为.
故答案为:25
【针对训练】
1.样本数据62,75,81,73,90,68,85,78的上四分位数为_____.
【答案】
【分析】排序后,由分位数计算方式可得答案.
【详解】将数据从小到大排序为:.
上四分位数即为分位数,,则样本数据的分位数为
第个数据与第7个数据的平均数,为:.
故答案为:.
2.(24-25高一下·山东青岛·期末)一组数据:1,2,3,4,5,5,6,6,6,7,8,9,9,10的众数为a,第三四分位数为b,则________.
【答案】14
【分析】根据给定条件,求出众数及第三四分位数即可.
【详解】这组数据的众数是6,即;
由,因此这组数据的第三四分位数为8,即,
所以.
故答案为:14
【易错02:平均数、方差的等数字特征的性质问题】
①如果两组数和的平均数分别是和,则一组数的平均数是;
②如果一组数的平均数为,则一组数的平均数为。
③如果一组数的平均数为,则一组数的平均数为
④如果一组数的方差为,则一组数的方差为;
⑤如果一组数的方差为,则一组数的方差为.
【典例】
1.(多选题)已知样本数据,()(),则( )
A.若样本数据的极差为R,则样本数据的极差为
B.若样本数据的平均值为,则样本数据的平均值为
C.若样本数据的众数为N,则样本数据的众数为
D.若样本数据的方差为,则样本数据的方差为
【答案】ACD
【分析】根据极差的定义即可判断A;根据平均数的性质即可判断B;根据众数的定义即可判断C;根据方差的性质即可判断D.
【详解】对于A,设样本数据中,最大值为,最小值为,则,
由于在上单调递增,
故样本数据中,最大值为,最小值为,
故,
则样本数据的极差为,故A正确:
对于B,由平均数的性质可得,样本数据的平均值为,故B错误;
对于C,根据众数的定义可得,样本数据的众数为,故C正确;
对于D,根据方差的性质可知,样本数据的方差为,故D正确,
故选:ACD.
2.(多选题)已知一组大小不等的数据的平均数为,方差为,标准差为,极差为,若,则下列关于数据的结论正确的是( )
A.平均数为 B.方差为 C.标准差为 D.极差为
【答案】AB
【分析】根据平均数,方差,标准差,极差的定义及性质可得答案.
【详解】因为一组大小不等的数据的平均数为,而,所以数据的平均数为,所以A正确;
数据的方差为,由方差的性质可得数据的方差为,所以B正确;
标准差为方差的算术平方根,取非负数,所以数据的标准差为,所以C错误;
极差为最大值减最小值,所以原数据极差,新数据的极差应为,所以D错误.
【针对训练】
1.已知样本,,,,的平均数为12,样本,,,的平均数为16,则样本,,,,,,,,的平均数为( )
A.13.5 B.14 C.14.5 D.15
【答案】D
【分析】由平均数的计算公式求解即可.
【详解】由题知:样本,,,,的平均数为12,
故++++;
样本,,,的平均数为16,
故+++;
所以样本,,,,,,,,的平均数为:
++++++++,
故选:D.
2.(24-25高一下·山东滨州·期末)设一组样本数据的平均数为3,方差为4,则数据,,,,的平均数和方差分别为( )
A.4,14 B.4,16 C.5,14 D.5,16
【答案】C
【分析】由平均数公式可得,由方差公式可得,再利用平均数和方差公式可求得结果.
【详解】由样本数据的平均数为,方差为,得,,
则,,
因此数据,的平均数为
,
方差为
.
故选:C
【易错03:分层随机抽样中平均数与方差的计算】
分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为,样本方差为s2.
以分两层抽样的情况为例.假设第一层有m个数分别为x1,x2,…,xm,平均数为,方差为;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为.则=,=,=,=.
(1)则=+;
(2)s2={m[s+(-)2]+n[s+(-)2]}.
【典例】
1.(24-25高一下·福建南平·期末)研究人员从某公司员工的体检数据中,采用比例分配的分层随机抽样的方法抽取10名女工员、名男员工的体重数据,计算得到10名女员工的平均体重为52(单位:kg),方差为6;20名男员工的平均体重为64(单位:kg),方差为3.则这30名员工体重的平均数是__________,方差是__________.
【答案】 60 36
【分析】利用加权平均数公式求解第一空,利用加权方差公式求解第二空即可.
【详解】由题意得总体平均数为,
总体方差为.
故答案为:60;36
【针对训练】
1.为了解学生的课外阅读情况,某校采用样本量比例分配的分层随机抽样对高中三个年级的学生进行平均每周课外阅读时间(单位:小时)的调查,所得样本数据如下:
年级
抽样人数
样本平均数
样本方差
高一
40
5
3.5
高二
30
2
高三
30
3
已知高中三个年级学生的总样本平均数为4.1,总样本方差为3.14,则高二年级学生的样本平均数______,高三年级学生的样本方差______.
【答案】 4 1.5
【分析】分别由总样本的平均数公式和总样本方差公式求解即可.
【详解】由题意得高中三个年级学生的总样本平均数为4.1,
可得,解得;
因为总样本方差为3.14,
所以,
解得.
故答案为:4;1.5.
【易错04:频率分布直方图的绘制】
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在左闭右开区间,最后一组取闭区间;
也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图.
【典例】
1.(25-26高一下·全国·课堂例题)从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:,2;,3;,10;,15;,12;,8.
(1)列出样本的频率分布表(含累积频率);
(2)画出频率分布直方图:
(3)估计成绩在分的学生比例.
【答案】(1)分布表见解析
(2)直方图见解析
(3)
【分析】(1)频率分布表的四列应该依次为分组、频数、频率、累积频率,依据条件绘制即可;
(2)由题意,频率分布直方图的组距为10,横轴为分组,纵轴为频率组距,依据条件绘制即可;
(3)先计算学生成绩在分的频率,由频率估计学生比例即可.
【详解】(1)频率分布表如下:
成绩分组
频数累计
频数
频率
2
2
0.04
5
3
0.06
15
10
0.2
30
15
0.3
42
12
0.24
50
8
0.16
合计
50
1.00
(2)频率分布直方图如图所示.
(3)学生成绩在分的频率为,
所以估计成绩在分的学生比例为.
【针对训练】
1.(25-26高一下·全国·课堂例题)为了解一片经济林的生长情况,随机测量100株树木的底部周长,得到如下数据:(单位:cm)
135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109
104 112 109 124 87 131 97 102 123 104 104 128 105 123 111 103 105 92
114 108 104 102 129 126 97 100 115 111 106 117 104 109 111 89 110 121
80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116
97 102 108 111 95 107 101 102 108 117 99 118 106 119 97 126 108 123
119 98 121 101 113 102 103 104 108
(1)编制频率分布表;
(2)绘制频率分布直方图、折线图;
(3)估计该片经济林中底部周长小于100cm的树木约占多少,周长不小于120cm的树木约占多少?
【答案】(1)分布表见解析
(2)答案见解析
(3),19%
【分析】(1)根据数据计算极差,再分为11组,列表(包含:分组、频数、频率、频率/组距)即可;
(2)依据频率分布表画出频率分布直方图,并取矩形中点依次连线即可;
(3)分别计算周长小于100cm、周长不小于120cm的频率即可.
【详解】(1)从数据中可以看出,这组数据的最大值为135cm,最小值为80cm,故极差为55cm,可将其分为11组,组距为5.
从第一组开始,将各组的频数和频率/组距填入表中:
分组
频数
频率
频率/组距
1
0.01
0.002
2
0.02
0.004
4
0.04
0.008
14
0.14
0.028
24
0.24
0.048
15
0.15
0.030
12
0.12
0.024
9
0.09
0.018
11
0.11
0.022
6
0.06
0.012
2
0.02
0.004
合计
100
1
0.2
(2)这组数据的频率分布直方图、折线图如下图所示.
(3)从频率分布表可以看出,该样本中小于100cm的频率为,不小于120cm的频率为,
故可估计该片经济林中底部周长小于100cm的树林约占21%,周长不小于120cm的约占19%.
【易错05:频率分布直方图中数字特征的计算】
1、频率分布直方图中的“平均数”:因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
2、频率分布直方图中的“中位数”:根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也就有50%的个体大于或等于中位数。因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值。
3、频率分布直方图中的“众数”:根据众数的意义,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数。一般用中点近似值代替.
【典例】
1.(多选题)(25-26高一下·甘肃武威·月考)某中学举行电脑知识竞赛,现将高一参赛学生的成绩(单位:分)进行整理后分成五组绘制成如图所示的频率分布直方图.
下列说法正确的是( )
A.高一参赛学生成绩的众数是
B.高一参赛学生成绩在的频率是
C.高一参赛学生成绩在的频率是
D.高一参赛学生成绩的平均数是
【答案】ABD
【详解】对于A,频率分布直方图中,众数是最高矩形底边中点的横坐标,所以,A正确;
对于B,高一参赛学生成绩在的频率是,B正确;
对于C,高一参赛学生成绩在的频率是,C错误;
对于D,高一参赛学生成绩的平均数是,D正确.
2.(多选题)某批产品检验后的评分,由统计结果制成如图所示的频率分布直方图,下列说法中正确的是( )
A.a=0.005
B.评分的众数估值为 70
C.评分的第25百分位数估值为 67.5
D.评分的平均数估值为76
【答案】AC
【详解】对于A,由频率之和为,得,故A正确;
对于B,评分的众数约为,故B错误;
对于C,因为,所以第百分位数在内,第百分位数约为,故C正确;
对于D,评分的平均数约为,故D错误.
【针对训练】
1.(多选题)(25-26高一下·全国·课后作业)为征求个人所得税法修改建议,某机构调查了10000名当地职工的月收入情况,并根据所得数据画出了样本的频率分布直方图.
下列说法正确的是( )
A.月收入低于或等于5000元的职工有5500名
B.如果个税起征点调整至5000元,估计有50%的当地职工会被征税
C.月收入高于或等于7000元的职工约为当地职工的5%
D.根据此次调查,为使60%以上的职工不用缴纳个税,起征点应调整至5200元
【答案】ACD
【详解】月收入低于或等于5000元的职工有名,A正确;
如果个税起征点调整至5000元,由,
可估计有的当地职工会被征税,B不正确;
月收入高于或等于7000元的职工约占,C正确,
根据此次调查,为使以上的职工不用缴纳个税,
则由B可得前3组频率和为,则起征点应调整至元,D正确.
2.(多选题)(25-26高一·全国·寒假作业)为激发中学生对天文学的兴趣,某校举办了“2024~2025学年中学生天文知识竞赛”,并随机抽取了200名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,下列说法不正确的是( )
A.直方图中x的值为0.035
B.估计全校学生的平均成绩不低于80分
C.估计全校学生成绩的样本数据的第60百分位数约为60分
D.在被抽取的学生中,成绩在区间的学生数为10
【答案】ACD
【分析】由频率分布直方图性质,平均数、百分位数的计算公式逐项判断即可.
【详解】由频率分布直方图可得,故,故A错误;
由频率分布直方图可得全校学生的平均成绩估计为:,故B正确;
前4组的频率为,故全校学生成绩的样本数据的第60百分位数大于80,故C错误;
区间对应的频率为,故对应的人数为,故D错误.
故选:ACD.
【易错06:大数据量的统计图表问题】
【典例】
1.(多选题)某地区2025年2月至10月地方一般公共预算收入累计的统计图表如下(条形图为月累计值,折线图为与上年同月累计值的环比增长率):
月份
2月
3月
4月
5月
6月
7月
8月
9月
10月
累计收入(亿元)
43.88
66.57
83.96
96.87
134.69
150.09
161.05
191.67
213.39
同比增长率(%)
2
2.1
2.1
3
1
4.2
4.8
根据图表,下列说法正确的是( )
A.该地区2025年每月的地方一般公共预算收入一直递增
B.2025年8月该地区的地方一般公共预算收入超过22亿元
C.2025年9月该地区的地方一般公共预算收入比2024年9月高
D.2024年前9个月,该地区地方一般公共预算收入平均数高于20亿元
【答案】CD
【详解】对于A,由图表可知,3月的地方一般公共预算收入为(亿元),
4月的地方一般公共预算收入为(亿元),故A错误;
对于B,8月该地区的地方一般公共预算收入为(亿元),故B错误;
对于C,由图表可知,2025年9月该地区的地方一般公共预算收入为(亿元),
而2025年9月该地区的地方一般公共预算收入累计同比增长,
所以2024年9月该地区的地方一般公共预算收入累计为(亿元),
2025年8月该地区的地方一般公共预算收入累计同比增长,
所以2024年8月该地区的地方一般公共预算收入累计为(亿元),
所以2024年9月该地区的地方一般公共预算收入为(亿元),比2025年9月少,故C正确;
对于D,由C选项可知,2024年9月该地区的地方一般公共预算收入累计为(亿元),
所以2024年前9个月,该地区地方一般公共预算收入平均数为(亿元),故D正确.
2.(多选题)(23-24高一下·广西南宁·期末)某市2023年经过招商引资后,经济收入较前一年增加了一倍,实现翻番,为更好地了解该市的经济收入的变化情况,统计了该市招商引资前后的年经济收入构成比例,得到如下扇形图.则下列结论中正确的是( )
A.招商引资后,工资净收入较前一年减少
B.招商引资后,转移净收入是前一年的2.5倍
C.招商引资后,转移净收入与财产净收入的总和超过了该年经济收入的
D.招商引资后,经营净收入较前一年增加了一倍
【答案】BD
【分析】依题意招商引资后,经济收入较前一年增加了一倍,再依据招商引资前后的年经济收入构成比例计算即可得出结论.
【详解】根据题意,可设招商引资前的经济收入为,则招商引资后的经济收入为;
对于A,由招商引资前后的年经济收入构成比例可知招商引资前的工资收入为,招商引资后的工资收入为,
可知招商引资后,工资净收入较前一年增多,即A错误;
对于B,招商引资前的转移净收入为,招商引资后的工资收入为,
即招商引资后,转移净收入是前一年的2.5倍,可得B正确;
对于C,由招商引资后的年经济收入构成比例可知转移净收入与财产净收入的总和占比为,小于,即C错误;
对于D,招商引资后的经营净收入为,招商引资前的经营净收入为,
可得招商引资后,经营净收入较前一年增加了一倍,即D正确.
故选:BD
【针对训练】
1.三次产业增加值占国内生产总值的比重是衡量一个国家或地区经济发展阶段、产业结构优化程度以及未来经济发展潜力的重要指标、其中第一产业包括农业、林业、渔业等;第二产业涵盖制造业、建筑业等;第三产业则包括服务业、金融业、信息技术等.如图为我国2020-2024年三次产业增加值占国内生产总值比重的等高堆积条形图,则( )
A.2020-2024年第一产业增加值占国内生产总值比重逐年递增
B.2020-2024年第二产业增加值占国内生产总值比重的中位数为36.9%
C.2020-2024年第三产业增加值占国内生产总值比重的平均数为55.1%
D.2020-2024年三次产业中增加值占国内生产总值比重极差最大的是第二产业
【答案】B
【分析】选项A,依据表中数据求出2020-2024年第一产业增加值占国内生产总值比重,通过数据判断选项A错误;选项B,利用中位数的定义得到结论;选项C,求出平均数得解;选项D,分别求出每个产业的极差,从而得解.
【详解】选项A,年第一产业增加值占国内生产总值比重为,
年第一产业增加值占国内生产总值比重为,
年第一产业增加值占国内生产总值比重为,
年第一产业增加值占国内生产总值比重为,
年第一产业增加值占国内生产总值比重为,
从数据上看,2020-2021年第一产业增加值占国内生产总值比重递减,2021-2022年第一产业增加值占国内生产总值比重持平,2022-2024年第一产业增加值占国内生产总值比重递减,
故选项A错误;
选项B,2020-2024年第二产业增加值占国内生产总值比重依次为,
将这个数从小到大排列为,则这个数的中位数为,
故2020-2024年第二产业增加值占国内生产总值比重的中位数为36.9%,故答案B正确;
选项C,2020-2024年第三产业增加值占国内生产总值比重依次为,
则这个数的平均数为,
2020-2024年第三产业增加值占国内生产总值比重的平均数为,故答案C错误;
选项D,2020-2024年第一产业增加值占国内生产总值比重依次为,
这个数中的最小值为,最大值为,故极差为,
2020-2024年第二产业增加值占国内生产总值比重依次为,
这个数中的最小值为,最大值为,故极差为,
2020-2024年第三产业增加值占国内生产总值比重依次为,这个数中的最小值为,最大值为,故极差为,
故2020-2024年三次产业中增加值占国内生产总值比重极差最大的是第三产业,
故选项D不正确.
故选:B.
2.南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔(Florence Nightingale1820-1910)设计的,图中每个扇形圆心角都相等,半径长短表示数量大小.某机构统计了近些年中国知识付费用户数量(单位:亿人次),并绘制成南丁格尔玫瑰图如下,根据此图,下列说法错误的是( )
A.2015年至2022年,知识付费用户数量逐年增加
B.2017年至2018年,知识付费用户数量增加量为近些年来最多
C.2022年知识付费用户数量超过2015年知识付费用户数量的10倍
D.2016年至2022年,知识付费用户数量的年增加量逐年递增
【答案】D
【分析】利用题中所给的南丁格尔玫瑰图逐一考查所给选项,即可得解.
【详解】对于A,由图可知,2015年至2022年,知识付费用户数量逐年增加,故A正确;
对于BD,知识付费用户数量的逐年增加量分别为:2016年,;
2017年,;2018年,;2019年,;
2020年,;2021年,;2022年,,
可知知识付费用户数量逐年增加量2018年最多,故B正确,D错误;
对于C,由,即2022年知识付费用户数量超过2015年知识付费用户数量的10倍,故C正确;
故选:D
3.(24-25高一下·全国·课后作业)某地自2018年起实行湖长制后,境内湖泊水质不断提升.为了解治理成效,环境监测部门每年在该地所有湖泊中随机选取80个进行水质调查,得到数据如下,并且五年来,该地通过退耕还湖,湖泊总量由160个增加至200个.下列说法正确的是( )
A.估计该地水质差的湖泊数量逐年递增
B.估计该地水质好的湖泊数量逐年递增
C.该地平均每年新增8个湖泊
D.估计该地平均每年新增45个水质好的湖泊
【答案】B
【分析】对于A,由题图分别估计各个年份水质差的湖泊数量可判断选项正误;
对于B,由题图分别估计各个年份水质好的湖泊数量可判断选项正误;
对于C,由题图可计算湖泊总数量的平均增长量;
对于D,由B分析可计算水质好湖泊每年的平均增长量;
【详解】对于A,根据题图可得,2018年到2022年,估计该地水质差的湖泊总量分别为,,,,,故A错误;
对于B,根据题图可得,2018年到2022年,估计该地水质好的湖泊总量分别为,,,,,
该地水质好的湖泊总量数逐年递增,故B正确;
对于C,根据题图中湖泊总量折线图可得,从2018年到2022年,该地平均每年新增的湖泊个数为,故C错误;
对于D,从2018年到2022年,估计该地平均每年新增水质好的湖泊个数为
,故D错误.
故选:B
1.(24-25高一下·河北·期末)设一组样本的容量为60,经过数据整理,得出了如下所示的频数分布表,则该组样本的第75百分位数为( )
数据分组区间
频数
16
20
12
6
6
A.31 B.32 C.33 D.34
【答案】C
【分析】根据百分位数的定义和公式进行求解即可.
【详解】因为,,,
故第75百分位数必在内,
设第75百分位数为,则有,解得.
故选:C.
2.在年巴黎奥运会上,我国网球选手郑钦文历经场比赛,勇夺巴黎奥运会女子网球单打冠军,书写了中国网球新的历史.某学校有名学生,一机构在该校随机抽取了名学生对郑钦文奥运会期间场单打比赛的收看情况进行了调查,将数据分组整理后,列表如下:
观看场次
观看人数占调查
人数的百分比
从表中数据可以得出的正确结论为( ).
A.表中的数值为
B.观看场次不超过场的学生的比例为
C.估计该校观看场次不超过场的学生约为人
D.估计该校观看场次不低于场的学生约为人
【答案】D
【分析】对于A,根据数据百分比的和为可以计算出的值;对于B,计算出观看场次为、、、场的百分比和即可得出所求比例;对于C、D,分别计算出符合问题的百分比和,再乘以总人数,即可求得结果.
【详解】由表可知,,
解得,选项A错误;
观看场次不超过场的学生的比例为,选项B错误;
观看场次不超过场的学生的比例为,
则观看场次不超过场的学生约为人,选项C错误;
观看场次不低于场的学生的比例为,
则观看场次不低于场的学生约为人,选项D正确.
故选:D
3.(25-26高一下·湖南邵阳·期末)已知在某市委宣传部举办的中小学“红心向党”主题演讲比赛中,某选手共得9位评委的原始评分,若去掉一个最高分和一个最低分,得到7个有效评分,则这7个有效评分与9个原始评分相比,一定不变的数字特征是( )
A.中位数 B.平均数 C.方差 D.极差
【答案】A
【分析】理解中位数、平均数、方差、极差的概念即可求解.
【详解】设将原始评分按从小到大排列为,
则去掉一个最高分和一个最低分后,与原始评分相比,
新的极差为,由于,所以,通常情况下极差会变小,故不一定不变;
数据波动不变(当且仅当所有的数相等)或变小,即方差不变或变小;
平均数可能发生变化;
唯一不变的是中位数,即中间的数不变.
故选:A.
4.(24-25高一下·广东揭阳·月考)某校组织50名学生参加庆祝中华人民共和国成立75周年知识竞赛,经统计这50名学生的成绩都在区间内,按分数分成5组:,,,,,得到如图所示的频率分布直方图(不完整),根据图中数据,下列结论正确的是( )
A.成绩在上的人数最多 B.成绩不低于70分的学生所占比例为70%
C.50名学生成绩的平均分小于中位数 D.50名学生成绩的极差为50
【答案】ABC
【分析】根据频率分布直方图求出的频率,A项可由各矩形高度可判断 ;B项由频率计算可判断;C项分别求出平均数、中位数比较可判断;D项由极差定义可判断.
【详解】设组的频率为,则由各组频率之和为1可得
,解得;
,,,,各组频率依次为:,,,,:
对于A,组频率最大,即成绩在上的人数最多,故A正确;
对于B,成绩低于70分的学生频率为,即不低于70分的学生频率为,
所以成绩不低于70分的学生所占比例为,故B正确;
对于C,根据频率分布直方图,可得50名学生成绩的平均数是,
由,故50名学生成绩的中位数为80,
所以50名学生成绩的平均分小于中位数,故选项C正确;
对于D,极差为数据中最大值与最小值的差, 已知50名学生的成绩都在区间内, 但成绩的最大值不一定是100,最小值也不一定是50,故极差小于等于50,
但不一定等于50,故D错误.
故选:ABC.
5.若A组数据,,,的平均数为25,方差为5,B组数据,,,,5m的方差为8,则( )
A.8 B.4 C.4或5 D.4或6
【答案】D
【分析】根据方差的定义计算即可.
【详解】由已知得,,
又,
所以数据的方差为
所以,
即,
所以,
所以,
即,解得或.
6.(25-26高一下·北京房山·期末)已知一组样本数据的平均数为2025,则下列叙述中错误的是( )
A.的平均数等于的平均数
B.的方差不大于的方差
C.的中位数等于的中位数
D.的极差等于的极差
【答案】C
【分析】根据平均数、方差、中位数、极差的概念及含义逐项计算分析可得.
【详解】对于A,的平均数等于,故A正确;
对于B,因为的平均数等于,
所以的方差等于,
即的方差不大于的方差,故B正确;
对于C,不妨设,
则的中位数为,
若,则的中位数,故C错误;
对于D,当均相等时,因为其平均数为,
所以,此时,的极差等于的极差,等于;
当不全相等时,不妨设为最小数,是最大数,因为其平均数为,所以.
此时,的极差等于的极差,等于.故D正确.
故选:C.
7.(25-26高一下·北京石景山·期末)已知样本数据为,该样本平均数为2025,方差为1,现加入一个数2025,得到新样本的平均数为,方差为,则( )
A. B.
C. D.
【答案】B
【分析】根据题意,结合平均数和方差的计算公式,求得新数据的平均数和方差,即可求解.
【详解】因为样本数据的平均数为,方差为,
现加上一个数,得到新样本的平均数为,方差为,
可得,
由,可得,
则新样本数据的方差为,
所以.
故选:B.
8.(多选题)(25-26高一下·江西九江·期末)某高中学校高一年级参加“三新”联考,现从高一(1),(2),(3)班共120名学生的数学成绩中随机抽取30份,若按性别比例分层随机抽样,则男生数学成绩抽取18份,被抽取的女生平均分为100分,方差为5,男生平均分为110分,方差为10.则下列结论正确的有( )
A.样本容量为30
B.120名学生的数学成绩中男生有72人
C.估计高一年级数学平均分为106分
D.估计高一年级数学方差为7
【答案】ABC
【分析】对A,根据样本容量的概念判断;对B,根据分层抽样的定义计算;对C,根据分层抽样的平均数公式计算;对D,根据分层抽样的方差公式计算.
【详解】对于A,从中随机抽取30名,则样本量为30,故A正确;
对于B,设120名学生的数学成绩中男生有人,因为按性别比例分层随机抽样时男生抽取18人,
所以,解得,所以120名学生的数学成绩中男生有72人,故B正确;
对于C,按性别比例分层随机抽样,男生数学成绩抽取18份,则女生数学成绩抽取12份,
设高一年级数学平均分为,所以,故C正确;
对于D,估计高一年级数学方差,故D错误.
故选:ABC.
9.(多选题)(24-25高一下·广东河源·期末)2025年4月23日,在第四届全民阅读大会上正式发布了2024年度中国数字阅读报告.统计了我国近五年数字阅读用户规模和网民规模数据,如图所示,则( )
A.2024年,我国数字阅读用户规模占网民规模的五成以上
B.近五年,我国数字阅读用户规模的增长量比网民规模的增长量大
C.从2020年至2024年,我国数字阅读用户规模逐年递增
D.从2020年至2024年,我国网民规模的增长率逐年递增
【答案】ABC
【分析】根据条形图,逐项判断即可.
【详解】对于A,根据条形图,2024年,我国数字阅读用户规模为6.7亿,网民规模为11.1亿,数字阅读用户规模约占网民规模的,故A正确;
对于B,近五年,我国数字阅读用户规模的增长量为亿,网民规模的增长量为亿,
数字阅读用户规模的增长量大于网民规模的增长量,故B正确;
对于C,根据条形图,可以看出,从2020年至2024年,我国数字阅读用户规模在逐年递增,故C正确;
对于D,根据条形图,从2020年至2021年,我国网民规模的增长率为,
从2023年至2024年,我国网民规模的增长率为,增长率减小了,故D错误.
故选:ABC.
10.(多选题)(24-25高一下·广东佛山·期末)佛山50公里徒步自2016年首次推出5条路线实现“五龙汇聚”,参与人数逐年增加,到2025年,现场参与人数为45万人,这不仅是一场全民健身的狂欢,更是佛山城市品牌的一次璀璨展示.下面分别为2016年佛山50公里徒步参与人数的扇形统计图(图1)、2025年佛山50公里徒步参与人数的条形统计图(图2,单位:万人),已知2025年高明线的参与人数是2016年的2倍,则( )
A.2016年佛山50公里徒步总的参与人数是20万
B.2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和
C.五条线的参与人数2025年与2016年相比增加人数最少的是三水线
D.五条线的参与人数2025年与2016年相比增长率最高的是南海线
【答案】ABD
【分析】根据扇形图及条形图得出5条线路的各个数据,再结合选项分别判断即可.
【详解】因为2025年高明线的参与人数是2016年的2倍,则2016年的高明线的参与人数是万人,
对于A:根据扇形图得出万,所以2016年佛山50公里徒步总的参与人数是20万,A选项正确;
2016年佛山50公里徒步高明线,三水线,禅城线,顺德线,南海线参与人数分别为:万,万,万,万,万,
2025年佛山50公里徒步高明线,三水线,禅城线,顺德线,南海线参与人数分别为:万,万,万,万,万,
对于B:因为,2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和,B选项正确;
对于C:五条线的参与人数2025年与2016年相比增加人数最少的是高明线,C选项错误;
对于D:南海线的参与人数2025年与2016年相比增长率,顺德线的参与人数2025年与2016年相比增长率,
禅城线的参与人数2025年与2016年相比增长率,三水线的参与人数2025年与2016年相比增长率,
高明线的参与人数2025年与2016年相比增长率,所以五条线的参与人数2025年与2016年相比增长率最高的是南海线,D选项正确;
故选:ABD.
11.(多选题)海水养殖场进行某水产品两种养殖方法的产量对比,甲试验区选择第一种养殖方法,乙试验区选择第二种养殖方法.收获时,从两个试验区各随机抽取了100个网箱,测量各箱水产品的产量(单位:千克),其频率分布直方图如下图所示.
记事件C=“乙试验区产量不低于19千克”,根据直方图得到的估计值为0.70,则( )
A.乙试验区产量频率分布直方图中,
B.甲试验区产量的众数大于乙试验区产量的众数
C.甲试验区产量的平均数小于乙试验区产量的平均数
D.甲试验区产量的75%分位数大于乙试验区产量的中位数
【答案】AC
【分析】根据频率分布直方图的概率公式、众数、平均数、百分位数和中位数计算判断各个选项;
【详解】对于A,记事件C=“乙试验区产量不低于19千克”,根据直方图得到的估计值为0.70,
则,
解得,A正确;
对于B,甲试验区产量的众数为,乙试验区产量的众数为,
甲试验区产量的众数小于乙试验区产量的众数,B错误;
对于C,甲试验区产量的平均数为
乙试验区产量的平均数为
甲试验区产量的平均数小于乙试验区产量的平均数,C正确;
对于D,设甲试验区产量的75%分位数为,则,
解得
设乙试验区产量的中位数为,则,解得
甲试验区产量的75%分位数小于乙试验区产量的中位数,D错误;
故选:AC.
12.(多选题)已知样本数据的平均数为3,方差为3,样本数据的平均数为3,方差为6,则下列结论正确的是( )
A.数据的平均数为7
B.数据的方差为11
C.数据的平均数为3
D.数据的方差为5
【答案】ACD
【分析】利用平均数的性质判断A,C,利用方差的性质判断B,D即可.
【详解】对于A,因为样本数据的平均数为3,
所以由平均数性质得数据的平均数为,故A正确,
对于B,因为样本数据的方差为6,
所以数据的方差为,故B错误,
对于C,因为样本数据的平均数为3,样本数据的平均数为3,
所以数据的平均数为,故C正确,
对于D,由已知得数据的平均数为,
则新方差为,故D正确.
故选:ACD
13.(多选题)有一组样本数据,其平均数为4,方差为,中位数为.在这组数中,去掉一个最大的数6和一个最小的数2,余下6个数据的中位数为,方差为,极差为,则( )
A. B. C. D.
【答案】AC
【详解】不妨设,则,
因为与,的中位数都是,所以,A正确;
当时,,所以B错误;
由条件知,
因为,所以,
所以余下6个数据的方差,
所以,C正确;
,D错误.
14.(24-25高一下·山东菏泽·月考)一组数据:1,2,3,4,5,5,5,6,6,7,8,9,9,10的众数为a,上四分位数为b,则______;
【答案】13
【分析】根据众数的概念求得众数,从小到大排列后,利用四舍五入法求得上四分位数.
【详解】众数为5,故,
将这组数据从小到大排列为:1,2,3,4,5,5,5,6,6,7,8,9,9,10,
因为数据个数为14,,所以这组数据的上四分位数是第11个数,故8.
.
故答案为:13.
15.(23-24高一下·浙江湖州·阶段检测)在一次高三年级统一考试中,数学试卷有两道满分均为10分的选做题,学生可以从A,B两道题目中任选一题作答,某校有900名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从900名学生的选做题成绩中随机抽取一个容量为10的样本,为此将900名学生的选做题成绩随机编号为.若采用分层随机抽样,按照学生选择A题目或B题目,将成绩分为两层,且样本中选择A题目的成绩有8个,平均数为7,方差为4;样本中选择B题目的成绩有2个,平均数为8,方差为1,则估计该校900名学生的选做题得分的平均数为______,方差为______.
【答案】 7.2 3.56
【分析】借助分层抽样的平均数公式与方差公式计算即可得.
【详解】设样本中选择A题目的成绩的平均数为,方差为,
样本中选择B题目的成绩的平均数为,方差为,
则,
所以样本的平均数为,
方差为.
则估计该校900名学生选做题得分的平均数为7.2,方差为3.56.
故答案为:7.2;3.56.
16.(23-24高一下·广东·期末)一家品牌连锁公司旗下共有100所加盟店.公司在年底对所有加盟店本年度营销总额(单位:百万元)进行统计,制作频率分布表如下:
分组
频数
频率
10
0.1
x
0.15
20
0.2
30
y
15
0.15
5
0.05
5
0.05
合计
100
1.00
(1)请求出频率分布表中x,y的值,并画出频率分布直方图;
(2)请估计这100所加盟店去年销售总额的平均数(同一组中的数据,用该组区间的中点值作代表);
(3)为了评选本年度优秀加盟店,公司将依据营销总额制定评选标准,按照“不超过的加盟店获评优秀加盟店称号”的要求,请根据频率分布直方图,为该公司提出本年度“评选标准”建议.
【答案】(1),频率分布直方图见解析.
(2)
(3)选取本年度营销总额大于百万元的加盟店获评优秀加盟店称号.
【分析】(1)根据频率与频数的关系,即可求解,再把频率除以组距即可画出频率分布直方图.
(2)根据平均数计算公式即可求解.
(3)根据百分位数公式即可求解.
【详解】(1),频率分布直方图如图所示,
(2),
故这100所加盟店去年销售总额的平均数为18.2.
(3)第40百分位数为,故应选取本年度营销总额大于百万元的加盟店获评优秀加盟店称号.
17.(23-24高一下·河南信阳·期中)树人中学男女学生比例约为,某数学兴趣社团为了解该校学生课外体育锻炼情况(锻炼时间长短(单位:小时)),采用样本量比例分配的分层抽样,抽取男生人,女生人进行调查.记男生样本为,样本平均数、方差分别为;女生样本为,样本平均数、方差分别为;总样本平均数、方差分别为.
(1)该兴趣社团通过分析给出以上两个统计图,假设两个统计图中每个组内的数据均匀分布,根据两图信息分别估计男生样本、女生样本的平均数;
(2)已知男生样本方差,女生样本方差,请结合(2)问的结果计算总样本方差的估计值.
【答案】(1);
(2)
【分析】(1)利用各组区间中点值代表该组的各个值,由频率分布直方图、扇形统计图估计平均数的方法可求得结果;
(2)根据分层抽样计算平均数和方差的方法直接求解即可.
【详解】(1)每个组内的数据均匀分布,以各组的区间中点值代表该组的各个值;
由频率分布直方图估计男生样本课外体育锻炼时间的平均数;
由扇形图估计女生样本课外体育锻炼时间的平均数.
(2)采用按比例分配的分层随机抽样,;
估计树人中学学生课外运动时间的平均数,
.
18.(25-26高一下·甘肃·月考)某高校承办了地铁站的志愿者选拔面试工作,现随机抽取了200名候选人的面试成绩(成绩均在内)并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.
(1)求a的值,并估计这200名候选者面试成绩的平均数(同一组中的数据用该组区间的中点值为代表);
(2)现从第四组和第五组中用分层随机抽样的方法选取20人的成绩,若这20人中来自第四组候选者的面试成绩的平均数和方差分别为80和6.5,来自第五组候选者的测试成绩的平均数和方差分别为90和3.5,据此估计这次第四组和第五组所有参与测试的候选者的成绩的方差.
【答案】(1),平均数为69.5
(2)21.9
【分析】(1)根据频率分布直方图中所有小矩形面积和为1,可得a值,根据频率分布直方图中平均数的求法,代入数据,即可得答案.
(2)根据第四组和第五组的频率之比,可得合并后的平均数,根据合并后的方差的公式,代入求解,即可得答案.
【详解】(1)由题意知,解得.
估计这200名候选者面试成绩的平均数,
即估计这200名候选者面试成绩的平均数为69.5.
(2)设第四组、第五组候选者的测试成绩的平均数和方差分别为,,,,
则,,,,
且这两组的频率之比为4:1,则这两组的平均数为,
所以第四组和第五组所有参与测试的候选者的测试成绩的方差为:
所以第四组和第五组所有参与测试的候选者的成绩的方差为21.9.
19.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机选取了 10个轮胎,将每个轮胎的宽度(单位:mm) 记录下来并绘制出折线图:
(1)分别计算甲、 乙两厂提供10个轮胎宽度的平均值;
(2)轮胎的宽度在[193,195]内,则称这个轮胎是标准轮胎,试比较甲、 乙两厂分别提供的 10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好.
【答案】(1)甲、 乙两厂提供10个轮胎宽度的平均值分别为195,194.
(2)从平均数上来看:乙厂提供的 10个轮胎中所有标准轮胎宽度高于甲厂提供的 10个轮胎中所有标准轮胎宽度,但乙厂提供的 10个轮胎中所有标准轮胎宽度方差较大,不够稳定.
【分析】(1)由折线图提供的数据,利用平均数公式代入计算即可;
(2)分别找出甲乙两厂的所有标准轮胎宽度的数据,再分别求出平均值与方差,即可判断.
【详解】(1)由题:甲厂轮胎宽度的平均值为:
;
乙厂轮胎宽度的平均值为:
;
所以甲、 乙两厂提供10个轮胎宽度的平均值分别为195,194.
(2)由题,甲厂提供的 10个轮胎中所有标准轮胎宽度为:
,其平均数为:,
其方差为:;
乙厂提供的 10个轮胎中所有标准轮胎宽度为:
,其平均数为:,
其方差为:;
从平均数上来看:乙厂提供的 10个轮胎中所有标准轮胎宽度高于甲厂提供的 10个轮胎中所有标准轮胎宽度,但乙厂提供的 10个轮胎中所有标准轮胎宽度方差较大,不够稳定.
1 / 6
学科网(北京)股份有限公司
$
第九章 统计
清单01 全面调查(普查)、抽样调查
1.全面调查(普查):对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
总体:调查对象的全体.
个体:组成总体的每一个调查对象.
2.抽样调查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法.
样本:从总体中抽取的那部分个体.
样本量:样本中包含的个体数.
清单02 简单随机抽样
1.定义:一般地,设一个总体含有(为正整数)个个体,从中逐个抽取个个体作为样本.如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样,通过简单随机抽样获得的样本称为简单随机样本.
2.方法:抽签法和随机数法.
清单03 抽签法、随机数法
1.抽签法:把总体中的个个体编号,把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将号签放在一个不透明容器中,充分搅拌后,每次从中不放回地抽取一个号签,连续抽取次,使与号签上的编号对应的个体进入样本,就得到一个容量为的样本.
2.随机数法
(1)用随机试验生成随机数
(2)用信息技术生成随机数:①用计算器生成随机数;②用电子表格软件生成随机数;③用R统计软件生成随机数.
清单04 用样本平均数估计总体平均数
1.总体平均数
一般地,总体中有个个体,它们的变量值分别为,则称
为总体均值,又称总体平均数.
2.样本平均数
如果从总体中抽取一个容量为的样本,它们的变量值分别为,则称
为样本均值,又称样本平均数.
清单05 分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.
(1)每一个子总体称为层,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(2)如果总体分为2层,两层包含的个体数分别为,两层抽取的样本量分别为,两层的样本平均数分别为,两层的总体平均数分别为,总体平均数为,样本平均数为.
则 ,
(3)在比例分配的分层随机抽样中,可以直接用样本平均数估计总体平均数.
清单06 获取数据的途径
获取数据的基本途径有通过调查获取数据、通过试验获取数据、通过观察获取数据、通过查询获得数据等.
清单07 频率分布直方图
作频率分布直方图的步骤
1.求极差:极差为一组数据中最大值与最小值的差.
2.决定组距与组数
将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.
3.将数据分组
4.列频率分布表
各小组的频率=.
5.画频率分布直方图
纵轴表示,实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×=频率.
清单08 常见统计图表的特点与区别
扇形图主要用于直观描述各类数据占总数的比例,
条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,条形图适用于描述离散型数据,直方图适用于描述连续型数据.
折线图主要用于描述数据随时间的变化趋势.
清单09 百分位数
1.百分位数定义:一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有的数据大于或等于这个值.
2.常用的百分位数
(1)四分位数:第25百分位数,第50百分位数,第75百分位数.
(2)其它常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第99百分位数.
3.计算一组个数据的第百分位数的一般步骤如下:
第1步,按从小到大排列原始数据;
第2步,计算;
第3步,若不是整数,而大于的比邻整数为,则第p百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
清单10 众数、中位数、平均数
1.众数:一组数据中出现次数最多的数.
2.中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.
3.平均数:如果个数,那么
叫做这n个数的平均数.
清单11 总体集中趋势的估计
1.平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.
2.一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
清单12 频率分布直方图中平均数、中位数、众数的求法
1.样本平均数:可以用每个小矩形底边中点的横坐标与小矩形面积的乘积之和近似代替.
2.在频率分布直方图中,中位数左边和右边的直方图的面积应相等.
3.将最高小矩形所在的区间中点作为众数的估计值.
清单13 方差、标准差
1.假设一组数据为,则这组数据的平均数,方差为
标准差为
2.如果总体中所有个体的变量值分别为,总体平均数为,则称
为总体方差,为总体标准差.
如果总体的N个变量值中,不同的值共有个,不妨记为,其中出现的频数为,则总体方差为
3.如果一个样本中个体的变量值分别为,样本平均数为,则称为样本方差,为样本标准差.
4.标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
【易错01:百分位数的计算出错】
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
【典例】
1.(25-26高一下·江西景德镇·期末)已知某班级某小组学生的一次考试中化学成绩(单位:分)分别是,则他们的化学成绩的第一四分位数是__________(分).
2.在一次数学测验中,某小组的7位同学的成绩分别为89,109,122,126,131,134,140,则这7位同学成绩的上四分位数与下四分位数的差为___________.
【针对训练】
1.样本数据62,75,81,73,90,68,85,78的上四分位数为_____.
2.(24-25高一下·山东青岛·期末)一组数据:1,2,3,4,5,5,6,6,6,7,8,9,9,10的众数为a,第三四分位数为b,则________.
【易错02:平均数、方差的等数字特征的性质问题】
①如果两组数和的平均数分别是和,则一组数的平均数是;
②如果一组数的平均数为,则一组数的平均数为。
③如果一组数的平均数为,则一组数的平均数为
④如果一组数的方差为,则一组数的方差为;
⑤如果一组数的方差为,则一组数的方差为.
【典例】
1.(多选题)已知样本数据,()(),则( )
A.若样本数据的极差为R,则样本数据的极差为
B.若样本数据的平均值为,则样本数据的平均值为
C.若样本数据的众数为N,则样本数据的众数为
D.若样本数据的方差为,则样本数据的方差为
2.(多选题)已知一组大小不等的数据的平均数为,方差为,标准差为,极差为,若,则下列关于数据的结论正确的是( )
A.平均数为 B.方差为 C.标准差为 D.极差为
【针对训练】
1.已知样本,,,,的平均数为12,样本,,,的平均数为16,则样本,,,,,,,,的平均数为( )
A.13.5 B.14 C.14.5 D.15
2.(24-25高一下·山东滨州·期末)设一组样本数据的平均数为3,方差为4,则数据,,,,的平均数和方差分别为( )
A.4,14 B.4,16 C.5,14 D.5,16
【易错03:分层随机抽样中平均数与方差的计算】
分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为,样本方差为s2.
以分两层抽样的情况为例.假设第一层有m个数分别为x1,x2,…,xm,平均数为,方差为;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为.则=,=,=,=.
(1)则=+;
(2)s2={m[s+(-)2]+n[s+(-)2]}.
【典例】
1.(24-25高一下·福建南平·期末)研究人员从某公司员工的体检数据中,采用比例分配的分层随机抽样的方法抽取10名女工员、名男员工的体重数据,计算得到10名女员工的平均体重为52(单位:kg),方差为6;20名男员工的平均体重为64(单位:kg),方差为3.则这30名员工体重的平均数是__________,方差是__________.
【针对训练】
1.为了解学生的课外阅读情况,某校采用样本量比例分配的分层随机抽样对高中三个年级的学生进行平均每周课外阅读时间(单位:小时)的调查,所得样本数据如下:
年级
抽样人数
样本平均数
样本方差
高一
40
5
3.5
高二
30
2
高三
30
3
已知高中三个年级学生的总样本平均数为4.1,总样本方差为3.14,则高二年级学生的样本平均数______,高三年级学生的样本方差______.
【易错04:频率分布直方图的绘制】
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在左闭右开区间,最后一组取闭区间;
也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图.
【典例】
1.(25-26高一下·全国·课堂例题)从某校高三学生中抽取50名参加数学竞赛,成绩分组(单位:分)及各组的频数如下:,2;,3;,10;,15;,12;,8.
(1)列出样本的频率分布表(含累积频率);
(2)画出频率分布直方图:
(3)估计成绩在分的学生比例.
【针对训练】
1.(25-26高一下·全国·课堂例题)为了解一片经济林的生长情况,随机测量100株树木的底部周长,得到如下数据:(单位:cm)
135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109
104 112 109 124 87 131 97 102 123 104 104 128 105 123 111 103 105 92
114 108 104 102 129 126 97 100 115 111 106 117 104 109 111 89 110 121
80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116
97 102 108 111 95 107 101 102 108 117 99 118 106 119 97 126 108 123
119 98 121 101 113 102 103 104 108
(1)编制频率分布表;
(2)绘制频率分布直方图、折线图;
(3)估计该片经济林中底部周长小于100cm的树木约占多少,周长不小于120cm的树木约占多少?
【易错05:频率分布直方图中数字特征的计算】
1、频率分布直方图中的“平均数”:因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
2、频率分布直方图中的“中位数”:根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也就有50%的个体大于或等于中位数。因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值。
3、频率分布直方图中的“众数”:根据众数的意义,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数。一般用中点近似值代替.
【典例】
1.(多选题)(25-26高一下·甘肃武威·月考)某中学举行电脑知识竞赛,现将高一参赛学生的成绩(单位:分)进行整理后分成五组绘制成如图所示的频率分布直方图.
下列说法正确的是( )
A.高一参赛学生成绩的众数是
B.高一参赛学生成绩在的频率是
C.高一参赛学生成绩在的频率是
D.高一参赛学生成绩的平均数是
2.(多选题)某批产品检验后的评分,由统计结果制成如图所示的频率分布直方图,下列说法中正确的是( )
A.a=0.005
B.评分的众数估值为 70
C.评分的第25百分位数估值为 67.5
D.评分的平均数估值为76
【针对训练】
1.(多选题)(25-26高一下·全国·课后作业)为征求个人所得税法修改建议,某机构调查了10000名当地职工的月收入情况,并根据所得数据画出了样本的频率分布直方图.
下列说法正确的是( )
A.月收入低于或等于5000元的职工有5500名
B.如果个税起征点调整至5000元,估计有50%的当地职工会被征税
C.月收入高于或等于7000元的职工约为当地职工的5%
D.根据此次调查,为使60%以上的职工不用缴纳个税,起征点应调整至5200元
2.(多选题)(25-26高一·全国·寒假作业)为激发中学生对天文学的兴趣,某校举办了“2024~2025学年中学生天文知识竞赛”,并随机抽取了200名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,下列说法不正确的是( )
A.直方图中x的值为0.035
B.估计全校学生的平均成绩不低于80分
C.估计全校学生成绩的样本数据的第60百分位数约为60分
D.在被抽取的学生中,成绩在区间的学生数为10
【易错06:大数据量的统计图表问题】
【典例】
1.(多选题)某地区2025年2月至10月地方一般公共预算收入累计的统计图表如下(条形图为月累计值,折线图为与上年同月累计值的环比增长率):
月份
2月
3月
4月
5月
6月
7月
8月
9月
10月
累计收入(亿元)
43.88
66.57
83.96
96.87
134.69
150.09
161.05
191.67
213.39
同比增长率(%)
2
2.1
2.1
3
1
4.2
4.8
根据图表,下列说法正确的是( )
A.该地区2025年每月的地方一般公共预算收入一直递增
B.2025年8月该地区的地方一般公共预算收入超过22亿元
C.2025年9月该地区的地方一般公共预算收入比2024年9月高
D.2024年前9个月,该地区地方一般公共预算收入平均数高于20亿元
2.(多选题)(23-24高一下·广西南宁·期末)某市2023年经过招商引资后,经济收入较前一年增加了一倍,实现翻番,为更好地了解该市的经济收入的变化情况,统计了该市招商引资前后的年经济收入构成比例,得到如下扇形图.则下列结论中正确的是( )
A.招商引资后,工资净收入较前一年减少
B.招商引资后,转移净收入是前一年的2.5倍
C.招商引资后,转移净收入与财产净收入的总和超过了该年经济收入的
D.招商引资后,经营净收入较前一年增加了一倍
【针对训练】
1.三次产业增加值占国内生产总值的比重是衡量一个国家或地区经济发展阶段、产业结构优化程度以及未来经济发展潜力的重要指标、其中第一产业包括农业、林业、渔业等;第二产业涵盖制造业、建筑业等;第三产业则包括服务业、金融业、信息技术等.如图为我国2020-2024年三次产业增加值占国内生产总值比重的等高堆积条形图,则( )
A.2020-2024年第一产业增加值占国内生产总值比重逐年递增
B.2020-2024年第二产业增加值占国内生产总值比重的中位数为36.9%
C.2020-2024年第三产业增加值占国内生产总值比重的平均数为55.1%
D.2020-2024年三次产业中增加值占国内生产总值比重极差最大的是第二产业
2.南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔(Florence Nightingale1820-1910)设计的,图中每个扇形圆心角都相等,半径长短表示数量大小.某机构统计了近些年中国知识付费用户数量(单位:亿人次),并绘制成南丁格尔玫瑰图如下,根据此图,下列说法错误的是( )
A.2015年至2022年,知识付费用户数量逐年增加
B.2017年至2018年,知识付费用户数量增加量为近些年来最多
C.2022年知识付费用户数量超过2015年知识付费用户数量的10倍
D.2016年至2022年,知识付费用户数量的年增加量逐年递增
3.(24-25高一下·全国·课后作业)某地自2018年起实行湖长制后,境内湖泊水质不断提升.为了解治理成效,环境监测部门每年在该地所有湖泊中随机选取80个进行水质调查,得到数据如下,并且五年来,该地通过退耕还湖,湖泊总量由160个增加至200个.下列说法正确的是( )
A.估计该地水质差的湖泊数量逐年递增
B.估计该地水质好的湖泊数量逐年递增
C.该地平均每年新增8个湖泊
D.估计该地平均每年新增45个水质好的湖泊
1.(24-25高一下·河北·期末)设一组样本的容量为60,经过数据整理,得出了如下所示的频数分布表,则该组样本的第75百分位数为( )
数据分组区间
频数
16
20
12
6
6
A.31 B.32 C.33 D.34
2.在年巴黎奥运会上,我国网球选手郑钦文历经场比赛,勇夺巴黎奥运会女子网球单打冠军,书写了中国网球新的历史.某学校有名学生,一机构在该校随机抽取了名学生对郑钦文奥运会期间场单打比赛的收看情况进行了调查,将数据分组整理后,列表如下:
观看场次
观看人数占调查
人数的百分比
从表中数据可以得出的正确结论为( ).
A.表中的数值为
B.观看场次不超过场的学生的比例为
C.估计该校观看场次不超过场的学生约为人
D.估计该校观看场次不低于场的学生约为人
3.(25-26高一下·湖南邵阳·期末)已知在某市委宣传部举办的中小学“红心向党”主题演讲比赛中,某选手共得9位评委的原始评分,若去掉一个最高分和一个最低分,得到7个有效评分,则这7个有效评分与9个原始评分相比,一定不变的数字特征是( )
A.中位数 B.平均数 C.方差 D.极差
4.(24-25高一下·广东揭阳·月考)某校组织50名学生参加庆祝中华人民共和国成立75周年知识竞赛,经统计这50名学生的成绩都在区间内,按分数分成5组:,,,,,得到如图所示的频率分布直方图(不完整),根据图中数据,下列结论正确的是( )
A.成绩在上的人数最多 B.成绩不低于70分的学生所占比例为70%
C.50名学生成绩的平均分小于中位数 D.50名学生成绩的极差为50
5.若A组数据,,,的平均数为25,方差为5,B组数据,,,,5m的方差为8,则( )
A.8 B.4 C.4或5 D.4或6
6.(25-26高一下·北京房山·期末)已知一组样本数据的平均数为2025,则下列叙述中错误的是( )
A.的平均数等于的平均数
B.的方差不大于的方差
C.的中位数等于的中位数
D.的极差等于的极差
7.(25-26高一下·北京石景山·期末)已知样本数据为,该样本平均数为2025,方差为1,现加入一个数2025,得到新样本的平均数为,方差为,则( )
A. B.
C. D.
8.(多选题)(25-26高一下·江西九江·期末)某高中学校高一年级参加“三新”联考,现从高一(1),(2),(3)班共120名学生的数学成绩中随机抽取30份,若按性别比例分层随机抽样,则男生数学成绩抽取18份,被抽取的女生平均分为100分,方差为5,男生平均分为110分,方差为10.则下列结论正确的有( )
A.样本容量为30
B.120名学生的数学成绩中男生有72人
C.估计高一年级数学平均分为106分
D.估计高一年级数学方差为7
9.(多选题)(24-25高一下·广东河源·期末)2025年4月23日,在第四届全民阅读大会上正式发布了2024年度中国数字阅读报告.统计了我国近五年数字阅读用户规模和网民规模数据,如图所示,则( )
A.2024年,我国数字阅读用户规模占网民规模的五成以上
B.近五年,我国数字阅读用户规模的增长量比网民规模的增长量大
C.从2020年至2024年,我国数字阅读用户规模逐年递增
D.从2020年至2024年,我国网民规模的增长率逐年递增
10.(多选题)(24-25高一下·广东佛山·期末)佛山50公里徒步自2016年首次推出5条路线实现“五龙汇聚”,参与人数逐年增加,到2025年,现场参与人数为45万人,这不仅是一场全民健身的狂欢,更是佛山城市品牌的一次璀璨展示.下面分别为2016年佛山50公里徒步参与人数的扇形统计图(图1)、2025年佛山50公里徒步参与人数的条形统计图(图2,单位:万人),已知2025年高明线的参与人数是2016年的2倍,则( )
A.2016年佛山50公里徒步总的参与人数是20万
B.2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和
C.五条线的参与人数2025年与2016年相比增加人数最少的是三水线
D.五条线的参与人数2025年与2016年相比增长率最高的是南海线
11.(多选题)海水养殖场进行某水产品两种养殖方法的产量对比,甲试验区选择第一种养殖方法,乙试验区选择第二种养殖方法.收获时,从两个试验区各随机抽取了100个网箱,测量各箱水产品的产量(单位:千克),其频率分布直方图如下图所示.
记事件C=“乙试验区产量不低于19千克”,根据直方图得到的估计值为0.70,则( )
A.乙试验区产量频率分布直方图中,
B.甲试验区产量的众数大于乙试验区产量的众数
C.甲试验区产量的平均数小于乙试验区产量的平均数
D.甲试验区产量的75%分位数大于乙试验区产量的中位数
12.(多选题)已知样本数据的平均数为3,方差为3,样本数据的平均数为3,方差为6,则下列结论正确的是( )
A.数据的平均数为7
B.数据的方差为11
C.数据的平均数为3
D.数据的方差为5
13.(多选题)有一组样本数据,其平均数为4,方差为,中位数为.在这组数中,去掉一个最大的数6和一个最小的数2,余下6个数据的中位数为,方差为,极差为,则( )
A. B. C. D.
14.(24-25高一下·山东菏泽·月考)一组数据:1,2,3,4,5,5,5,6,6,7,8,9,9,10的众数为a,上四分位数为b,则______;
15.(23-24高一下·浙江湖州·阶段检测)在一次高三年级统一考试中,数学试卷有两道满分均为10分的选做题,学生可以从A,B两道题目中任选一题作答,某校有900名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从900名学生的选做题成绩中随机抽取一个容量为10的样本,为此将900名学生的选做题成绩随机编号为.若采用分层随机抽样,按照学生选择A题目或B题目,将成绩分为两层,且样本中选择A题目的成绩有8个,平均数为7,方差为4;样本中选择B题目的成绩有2个,平均数为8,方差为1,则估计该校900名学生的选做题得分的平均数为______,方差为______.
16.(23-24高一下·广东·期末)一家品牌连锁公司旗下共有100所加盟店.公司在年底对所有加盟店本年度营销总额(单位:百万元)进行统计,制作频率分布表如下:
分组
频数
频率
10
0.1
x
0.15
20
0.2
30
y
15
0.15
5
0.05
5
0.05
合计
100
1.00
(1)请求出频率分布表中x,y的值,并画出频率分布直方图;
(2)请估计这100所加盟店去年销售总额的平均数(同一组中的数据,用该组区间的中点值作代表);
(3)为了评选本年度优秀加盟店,公司将依据营销总额制定评选标准,按照“不超过的加盟店获评优秀加盟店称号”的要求,请根据频率分布直方图,为该公司提出本年度“评选标准”建议.
17.(23-24高一下·河南信阳·期中)树人中学男女学生比例约为,某数学兴趣社团为了解该校学生课外体育锻炼情况(锻炼时间长短(单位:小时)),采用样本量比例分配的分层抽样,抽取男生人,女生人进行调查.记男生样本为,样本平均数、方差分别为;女生样本为,样本平均数、方差分别为;总样本平均数、方差分别为.
(1)该兴趣社团通过分析给出以上两个统计图,假设两个统计图中每个组内的数据均匀分布,根据两图信息分别估计男生样本、女生样本的平均数;
(2)已知男生样本方差,女生样本方差,请结合(2)问的结果计算总样本方差的估计值.
18.(25-26高一下·甘肃·月考)某高校承办了地铁站的志愿者选拔面试工作,现随机抽取了200名候选人的面试成绩(成绩均在内)并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.
(1)求a的值,并估计这200名候选者面试成绩的平均数(同一组中的数据用该组区间的中点值为代表);
(2)现从第四组和第五组中用分层随机抽样的方法选取20人的成绩,若这20人中来自第四组候选者的面试成绩的平均数和方差分别为80和6.5,来自第五组候选者的测试成绩的平均数和方差分别为90和3.5,据此估计这次第四组和第五组所有参与测试的候选者的成绩的方差.
19.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机选取了 10个轮胎,将每个轮胎的宽度(单位:mm) 记录下来并绘制出折线图:
(1)分别计算甲、 乙两厂提供10个轮胎宽度的平均值;
(2)轮胎的宽度在[193,195]内,则称这个轮胎是标准轮胎,试比较甲、 乙两厂分别提供的 10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好.
1 / 6
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。