内容正文:
清单05 第九章 统计
(5个考点梳理+9题型解读+提升训练)
清单01 总体百分位数
(1)计算第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;
若是整数,则第百分位数为第项与第项数据的平均数.
清单02 平均数,众数,中位数计算
(1)平均数
①定义:一组数据的和与这组数据的个数的商.数据,,的平均数为.
(2)众数
①定义:一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数。
(3)中位数
①定义:一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
清单03 平均数,众数,中位数估计值
在频率分布直方图中平均数,中位数,众数的估计值
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)众数:众数是最高小矩形底边的中点所对应的数据.
清单04 平均数,方差性质
平均数,方差的线性关系:
数据
平均数
方差
,,,
,,,
,,,
,,,
清单05 标准差与方差
如果有个数据,,,那么平均数,标准差为:,方差:
【考点题型一】随机数表法()
【例1】(23-24高一上·江西·阶段练习)某班级共有52位同学,现随机抽取8位同学参加学校组织的“校园读书节”活动,老师将班级同学进行编号:01,02,03,……,52,若从随机数表的第3行第27列开始,依次往右读数,直到取足样本为止,则第6位被抽到的同学对应的编号为( )
95 33 95 22 00 18 74 72 00 18 38 79 58 69 32 81 76 80 26 92 82 80 84 25 39
90 84 60 79 80 24 36 59 87 38 82 07 53 89 35 56 35 23 79 18 05 98 90 07 35
46 40 62 98 80 54 97 20 56 95 15 74 80 08 32 16 46 70 50 80 67 72 16 42 79
20 31 89 03 43 38 46 82 68 72 32 14 82 99 70 80 60 47 18 97 63 49 30 21 30
71 59 73 05 50 08 22 23 71 77 91 01 93 20 49 82 96 59 26 94 66 39 67 98 60
A.16 B.42 C.50 D.80
【答案】B
【知识点】随机数表法
【分析】利用随机数表法即可得解.
【详解】由随机数法,抽取的同学对应的编号为08,32,16,46,50,42,…,
故第6位同学的编号为42.
故选:B.
【变式1-1】.(23-24高一上·江西赣州·阶段练习)总体由编号为01,02,…,39,40的40个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6列和第7列数开始由左到右依次选取两个数,则选出来的第5个个体的编号为( )
50 44 66 44 21 66 06 58 05 62 61 65 54
35 02 42 35 48 96 32 14 52 41 52 48 22
66 22 15 86 26 63 75 41 99 58 42 36 72
24 58 37 52 18 51 03 37 18 39 11 79 33
A.23 B.21 C.35 D.32
【答案】B
【知识点】随机数表法
【分析】从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,于是将两个数字构成的编号依次写出,然后读取出在01,02,…,39,40编号内编号(重复的算一次),依次选取5个不重复的即可得到
【详解】随机数表第1行的第6列和第7列数字为6、4,所以从这两个数字开始,
由左向右依次选取两个数字如下:64,42,16,60,65,80,56,26,16,55,43,50,24,23,54,89,
其中落在编号为01,02,…,39,40内的有:16,26,24,23,21,…,故第5个编号为21.
故选:B.
【变式1-2】.(24-25高一上·全国·随堂练习)一个总体的60个个体编号为00,01,…,59,现需从中抽取一个容量为6的样本,请从下面给出的随机数表的第10列开始向右读取,直到取足样本,则抽取的第五个样本的号码是 .
95 33 95 22 00 18 74 72 00 18 38 79 58 69 32 81 76 80 26 92 82 80 84 25 39
【答案】17
【知识点】随机数表法
【分析】根据给定条件,利用随机数表法按要求抽取即得.
【详解】依题意,抽取的前5个号码依次是:01,47,20,28,17,
所以抽取的第五个号码是17.
故答案为:17
【变式1-3】.(2024高一·全国·专题练习)欲利用随机数表从00,01,02,…,59这些编号中抽取一个容量为6的样本,抽取方法是从下面的随机数表的第1行第11列开始向右读取,每次读取两位,直到取足样本,则第4个被抽取的样本的编号为 .
【答案】10
【知识点】随机数表法
【分析】根据随机数表,写出样本的前4个个体的编号,即可得出结果
【详解】从随机数表的第1行第11列开始向右读取,每次读取两位编号有:16,95,55,67,19,98,10,……,不大于59的有16,55,19,10,……,第4个被抽取的样本的编号为10.
故答案为:10
【变式1-4】(2024高一下·全国·专题练习)现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为 .
95226000 49840128 66175168 39682927 43772366 27096623
92580956 43890890 06482834 59741458 29778149 64608925
【答案】14
【知识点】随机数表法
【分析】根据随机数表法的读取规则,即可求解.
【详解】由题意可知,第一支为01,以后依次为17,09,08,06,14,所以第6支水笔的编号为14.
故答案为:14
【考点题型二】分层抽样()
【例2】(24-25高一上·安徽宿州·期末)某校高中部高一、高二、高三人数之比为5:4:3,其中女生有600人,现准备从该校所有高中学生中抽取容量为120的样本.若根据年级采用按比例分配的分层随机抽样,抽取的高三学生为n个人;若根据性别采用按比例分配的分层随机抽样,抽取的女生为m个人,且,则该校高中部学生人数为 .
【答案】1800
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】根据给定条件,利用分层抽样的定义列式计算得解.
【详解】设该校高中部高一、高二、高三人数分别为5k,4k,3k,
依题意,,,,
所以该校高中部人数为1800.
故答案为:1800
【变式2-1】.(24-25高一下·甘肃兰州·阶段练习)用同比例分层抽样的方法对某品牌暖风机同一批次的甲、乙两种型号的产品进行抽样调查,已知样本量为80,其中有50件甲型号产品.若乙型号产品的总数为2100,则该批次产品的总数为( )
A.5460 B.3500 C.3350 D.5600
【答案】D
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】先求出乙型号产品的抽样比,再根据乙型号产品的总数得到该批次产品的总数.
【详解】由题意可得抽取的样本中乙型号产品所占比例为,
所以该批次产品的总数为.
故选:D.
【变式2-2】.(24-25高一上·江西·阶段练习)某高校共有本科生1000人,硕士生200人,博士生20人申请报名做中国航展的志愿者,现用分层随机抽样方法从中抽取一批志愿者,若抽取的博士生是5人,则从该高校抽取的志愿者总人数为( )
A.265人 B.285人 C.305人 D.325人
【答案】C
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】由分层抽样相关知识可得答案.
【详解】设从高校抽取的志愿者总人数为n,
则.
故选:C
【变式2-3】.(24-25高一上·北京海淀·期末)某校高一年级有名男生,名女生.为了解高一学生研学路线的选择意向,采用分层抽样的方法,从该校高一学生中抽取容量为的样本进行调查,其中女生名,则的值为( )
A. B.
C. D.
【答案】B
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】利用分层抽样的定义,列式计算得解.
【详解】依题意,,所以.
故选:B
【变式2-4】.(24-25高二上·四川成都·阶段练习)某校高一年级共有学生200人,其中1班60人,2班40人,3班50人,4班50人.该校要了解高一学生对食堂菜品的看法,准备从高一年级学生中随机抽取50人进行访谈,若采取按比例分配的分层抽样,则应从高一2班抽取的人数是 .
【答案】10
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】根据分层抽样的方法计算即可.
【详解】由题意可知四个班级的人数比例分别为,
即2班占全部学生的比例为,
所以抽取50人访谈需从2班抽取人.
故答案为:
【考点题型三】总体百分位数估计值()
【例3】(24-25高一上·辽宁大连·期末)为了快速了解某学校学生体重(单位:kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示,估计这个学校学生体重的40%分位数为 kg.
【答案】48
【知识点】总体百分位数的估计
【分析】根据百分位数的定义结合题意求解即可.
【详解】这10个数从小到大依次45,46,46,47,49,49,51,58,59,60,
因为,
所以这10个数的40%分位数为,
所以这个学校学生体重的40%分位数约为48 kg.
故答案为:48.
【变式3-1】.(24-25高三上·云南楚雄·期末)按从小到大排列的一组数据的分位数为( )
A.96 B.96.5 C.97 D.97.5
【答案】D
【知识点】总体百分位数的估计
【分析】利用百分位数的计算原理计算即可.
【详解】共10个数,,所以分位数为第8个,第9个数据的平均数,即
故选:D
【变式3-2】.(24-25高一下·甘肃兰州·阶段练习)已知一组数据3,4,5,6,7,8,9,10,则这组数据的第20百分位数是( )
A. B.4 C. D.5
【答案】B
【知识点】总体百分位数的估计
【分析】根据百分位数的定义求解即可.
【详解】这组数据从小到大的顺序为3,4,5,6,7,8,9,10,
因为,所以第20百分位数是这组数据的第二个数,
所以这组数据的第20百分位数为.
故选:.
【变式3-3】.(24-25高一上·湖南衡阳·期末)一组数据15,18,23,24,28,36,39,42,47,53,60,78的第75百分位数是 .
【答案】50
【知识点】总体百分位数的估计
【分析】根据给定条件,利用第75百分位数的定义求解即得.
【详解】依题意,,所以所求的第75百分位数是.
故答案为:50
【变式3-4】.(24-25高一上·江西景德镇·期末)已知某组数据分别为3,5,6,7,8,9,9,11,则这组数据的分位数为 .
【答案】
【知识点】总体百分位数的估计
【分析】将数据由小到大进行排序,利用百分位数的定义可求得这组数据的分位数.
【详解】将8个数据由小到大排序依次为:3,5,6,7,8,9,9,11,
因为,因此,这组数据的分位数是由小到大第5个数.
故答案为:8.
【考点题型四】频率分布直方图()
【例4】(24-25高一上·江西赣州·开学考试)为弘扬中华传统文化,某校组织若干名学生参加汉字听写大赛,为了解学生整体听写能力,从中抽取部分学生的成绩(得分取正整数,满分为100分)进行统计分析,请根据尚未完成的下列图表,解答问题:
分组
49.5~59.5
59.5~69.5
69.5~79.5
79.5~89.5
89.5~100.5
频数
2
a
20
16
8
频率
0.04
0.08
0.40
0.32
b
(1)本次抽样调查的样本容量为_______,此样本中成绩的中位数落在_______范围内.表中_______,_______;
(2)补全频数分布直方图;
(3)若该校共有初中生3000名,若成绩超过80分为优秀,请估计该校汉字听写能力为优秀的约有多少人.
【答案】(1)50,,,
(2)频率直方图见解析
(3)
【知识点】补全频率分布直方图、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】(1)由频率、频数,中位数的概念即可求解;
(2)由表格数据即可求解;
(3)由频率分布直方图确定频率即可求解;
【详解】(1)学生总数是:(人),(人),;
∴本次抽样调查的样本容量为50,成绩的中位数落在范围内,(人),;
(2)根据(1)得出的a的值,补图如下:
(3)(人).
该校汉字听写能力为优秀的约有人.
【变式4-1】.(2024·全国·模拟预测)以“建设包容、普惠、有韧性的数字世界——携手构建网络空间命运共同体”为主题的2023年世界互联网大会乌镇峰会于11月8日至10日在中国浙江省乌镇举行.为保障大会顺利进行,世界互联网大会的秘书处从招募的志愿者中随机抽取100名进行了一次互联网知识竞赛,所得成绩(单位:分)均在内,并制成如下频数分布表:
成绩/分
频数
8
28
20
12
(1)根据频数分布表,在下图中作出频率分布直方图;
(2)以样本估计总体,记竞赛成绩不低于86分的志愿者为优秀志愿者,则优秀志愿者的占比能否达到20%?
【答案】(1)频率分布直方图见解析
(2)能达到20%
【知识点】补全频率分布直方图、由频率分布直方图计算频率、频数、样本容量、总体容量、频率分布直方图的实际应用
【分析】(1)先求出n值,再确定每组的频率再画图即可;
(2)计算出不低于86分的志愿者的频率即可求解.
【详解】(1),
不同成绩对应的频率如下表:
成绩/分
频数
8
28
32
20
12
频率
0.08
0.28
0.32
0.20
0.12
作出频率分布直方图如图所示:
(2)在随机抽取的100名志愿者中,不低于86分的志愿者的频率为,故优秀志愿者的占比能达到20%.
【变式4-2】.(23-24高二上·浙江·期中)据调查,某市政府为了鼓励居民节约用水,减少水资源的浪费,计划在本市试行居民生活用水定额管理,即确定一个合理的居民用水量标准(单位:吨),月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解全市居民用水量分布情况,通过抽样,获得了户居民某年的月均用水量(单位:吨),其中月均用水量在内的居民人数为39人,并将数据制成了如图所示的频率分布直方图.
(1)求和的值;
(2)若该市政府希望使的居民月用水量不超过标准吨,试估计的值;
(3)在(2)的条件下,若实施阶梯水价,月用水量不超过吨时,按3元吨计算,超出吨的部分,按5元吨计算.现市政府考核指标要求所有居民的月用水费均不超过70元,则该市居民月用水量最多为多少吨?
【答案】(1),
(2)16.6吨
(3)20.64吨
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、频率分布直方图的实际应用
【分析】(1)频率分布直方图总面积为1,由此即可求解.
(2)先判断所求值所在的区间,再按比例即可求解.
(3)按题意列不等式即可求解.
【详解】(1),
用水量在的频率为,(户)
(2),
,
(吨)
(3)设该市居民月用水量最多为吨,因为,所以,
则,解得,
答:该市居民月用水量最多为20.64吨.
【变式4-3】.(24-25高一上·北京·阶段练习)为调查某校学生的校志愿者活动情况,现抽取一个容量为100的样本,统计了这些学生一周内的校志愿者活动时长,并绘制了如下图所示的频率分布直方图,记数据分布在的频率分别为.已知.
(1)求的值;
(2)求样本中在内的频数;
(3)若全校共2000名学生,请根据样本数据估计:全校学生一周内的校志愿者活动时长不少于250分钟的人数.
【答案】(1),
(2)65
(3)600人
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、频率分布直方图的实际应用
【分析】(1)由频率分布直方图可求得,结合已知可求得,根据,可得,结合已知求解即可;
(2)由(1)易求得样本中在内的频率;
(3)样本中在内的频率为,从而可得结论.
【详解】(1)由图知:,
,
,
,
由于,则.
(2)样本中在内的频率为,
相应的频数为.
(3)样本中在内的频率为,
全校学生一周内的校志愿者活动时长不少于250分钟的人数估计值为:人.
【变式4-4】.(2024高一下·全国·专题练习)某电视台在本省内15~65岁的人群中随机抽取了n人回答问题“本省著名旅游景点有哪些”,统计结果如图表所示.
组号
分组
回答正确的人数
回答正确的人数占本组的频率
第1组
a
0.5
第2组
18
x
第3组
b
0.9
第4组
9
0.36
第5组
3
y
(1)分别求出a,b,x,y的值;
(2)从第2,3,4组回答正确的人中用分层随机抽样的方法抽取6人,求第2,3,4组每组各抽取多少人?
【答案】(1),,,;
(2)第2组抽取2(人);第3组抽取3(人);第4组抽取1(人)
【知识点】抽样比、样本总量、各层总数、总体容量的计算、由频率分布直方图计算频率、频数、样本容量、总体容量、频率分布直方图的实际应用
【分析】(1)先由第四组数据求出n,进而可依次求出a,b,x,y的值.
(2)根据分层抽样的概念结合各组数据的比例即可求解.
【详解】(1)由频率分布表中第4组数据可知,第4组总人数为,
再结合频率分布直方图可知,
所以,
,.
(2)第2,3,4组回答正确的共有18+27+9=54(人).
利用分层随机抽样的方法在54人中抽取6人,
所以第2组抽取 (人);第3组抽取 (人);第4组抽取(人).
【考点题型五】平均数,众数,中位数的计算()
【例5-1】(24-25高一上·四川成都·开学考试)如表是某公司员工月收入的资料.
月收入/元
45000
18000
10000
5500
5000
3400
3300
1000
人数
1
1
1
3
6
1
11
1
能够反映该公司全体员工月收入水平的统计量是( )
A.平均数和众数 B.平均数和中位数
C.中位数和众数 D.平均数和方差
【答案】C
【知识点】计算几个数的众数、计算几个数的中位数、用中位数的代表意义解决实际问题、计算几个数的平均数
【分析】求出数据的众数和中位数,再与25名员工的收入进行比较即可.
【详解】公司共有员工1+1+1+3+6+1+11+1=25人,
该公司员工月收入的众数为3300元,在25名员工中有13人这此数据之上,
因此众数能够反映该公司全体员工月收入水平;
月收入由小到大排列,3400为第13个数,因此该公司员工月收入的中位数为3400元;
在25名员工中在此数据及以上的有13人,则中位数也能够反映该公司全体员工月收入水平,
而25名员工月收入的平均数元
受极端数据45000、18000等影响,平均数偏离多数人的收入水平,而方差是表征数据波动大小的量,
所以能够反映该公司全体员工月收入水平的统计量是中位数和众数.
故选:C
【例5-2】(23-24高一下·全国·课堂例题)一组数据的中位数是( )
A. B. C. D.
【答案】A
【知识点】计算几个数的中位数
【分析】将这组数据从小到大排列,再根据中位数的定义即可得答案.
【详解】解:将该组数据从小到大排列为,共个数,
中位数为从小到大第个数,即为.
故选:A.
【例5-3】(24-25高一上·辽宁沈阳·期末)已知一组数据丢失了其中一个,剩下的六个数据分别是、、、、、,若这组数据的平均数与众数的和是中位数的倍,则丢失数据的所有可能值构成的集合为 .
【答案】
【知识点】计算几个数的中位数、根据平均数求参数、根据众数计算参数
【分析】设丢失的数据为,对的取值进行分类讨论,求出这七个数的平均数、众数和中位数,根据题意可得出关于的方程,解之即可.
【详解】设丢失的数据为,则这七个数的平均数为,众数为,
因为这组数据的平均数与众数的和是中位数的倍,分以下几种情况讨论:
若,则中位数为,此时,,解得;
若,则中位数为,此时,,解得;
若,则中位数为,此时,,解得.
综上可知,丢失数据所有可能取值构成的集合为.
故答案为:.
【变式5-1】.(24-25高一上·全国·课后作业)某地铁的开通运营极大地方便了市民的出行.某时刻从A站驶往B站的过程中,10个车站上车的人数统计如下:70,60,60,60,50,40,40,30,30,10.这组数据的平均数,众数,分位数的和为( )
A.125 B.135 C.165 D.170
【答案】D
【知识点】计算几个数的平均数、总体百分位数的估计、计算几个数的众数
【分析】利用定义求出这组数据的平均数,众数,的分位数可得答案.
【详解】这组数据的平均数为,
众数为,分位数为,
所以这组数据的平均数,众数,的分位数的和为.
故选:D.
【变式5-2】.(24-25高一上·四川成都·开学考试)一组数据按从小到大顺序排列为:,则这组数据的中位数是 ,众数是 .
【答案】 7
【知识点】计算几个数的众数、计算几个数的中位数
【分析】根据中位数和众数的定义求解即可.
【详解】数据按从小到大排列:,所以中位数是7;
数据出现2次,次数最多,所以众数是.
故答案为:7;.
【变式5-3】.(24-25高一上·四川成都·开学考试)廖老师为了了解学生周末利用网络进行学习的时间,在所任教班级随机调查了10名学生,其统计数据如下表:
时间(单位:小时)
4
3
2
l
0
人数
3
4
1
1
1
则这10名学生周末利用网络进行学习的平均时间是 小时.
【答案】2.7
【知识点】计算几个数的平均数
【分析】依据加权平均数的概念求解可得.
【详解】这10名学生周末利用网络进行学习的平均时间是:
.
故答案为:2.7
【变式5-4】.(24-25高一上·全国·课前预习)下表是五年级一、二两个班各11名同学1分钟仰卧起坐的成绩(单位:次):
一班
19
33
26
29
28
33
34
35
33
33
30
二班
25
27
29
28
29
30
29
35
29
30
29
(1)这两组数据的平均数、中位数和众数各是多少?
(2)你认为哪个数表示两个班的成绩更合适?
【答案】(1)平均数为30.27次;29.09次;中位数33次,29次,众数33次,29次.
(2)平均数
【知识点】计算几个数的中位数、计算几个数的平均数、计算几个数的众数
【分析】(1)利用平均数、中位数和众数的概念计算即可;
(2)利用平均数、中位数和众数的统计意义分析即可.
【详解】(1)一班平均数为(次),
一班数据从小到大排列为:19,26,28,29,30,33,33,33,33,34,35,
所以一班的中位数为33次,33出现的次数最多,众数是33次;
二班平均数为(次),
二班数据从小到大排列为:25,27,28,29,29,29,29,29,30,30,35,
所以二班的中位数是29次,29出现的次数最多,所以二班的众数是29次.
(2)运用平均数表示两个班的成绩更合适.
【考点题型六】平均数,众数,中位数的估计值()
【例6-1】(25-26高一上·全国·课后作业)2023年8月8日,世界大学生运动会在成都成功举行闭幕式.某校抽取100名学生进行了大运会知识竞赛并记录得分(满分:100,所有人的成绩都在内),根据得分将他们的成绩分成六组,制成如图所示的频率分布直方图.
(1)求图中a的值;
(2)估计这100人竞赛成绩的平均数(同一组中的数据用该组区间的中点值为代表)、众数及中位数.
【答案】(1)
(2)平均数72分,众数约为75(分),中位数为(分)
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计平均数、由频率分布直方图估计中位数、根据频率分布直方图计算众数
【分析】(1)由所有频率之和为1列方程即可求解;
(2)由频率分布直方图中平均数、众数以及中位数的计算公式直接计算即可求解.
【详解】(1)由题意知,即,得.
(2)由频率分布直方图可知这100人竞赛成绩的平均数约为
(分).
众数约为(分).
前3组的频率为,前4组的频率为,
所以中位数为(分).
【例6-2】(23-24高一下·河南周口·期末)某校从高一年级学生中随机抽取60名学生,将期中考试的数学成绩均为整数分成六组:后得到如图所示频率分布直方图.
(1)求的值;
(2)根据频率分布直方图,求众数和中位数;
(3)用比例分配的分层随机抽样的方法在各分数段的学生中抽取一个容量为20的样本,求在分数段抽取的人数;
【答案】(1)
(2)众数为75,中位数
(3)11
【知识点】抽样比、样本总量、各层总数、总体容量的计算、由频率分布直方图估计中位数、补全频率分布直方图、根据频率分布直方图计算众数
【分析】(1)根据小矩形面积之和为建立等式求解即可;
(2)找到最高的小矩形的底所在的两个端点值求解即可;首先确定中位数在那一组内,再利用从左到右面积等于建立等式求解;
(3)确定抽相比,然后乘以分数段的人数即可求解.
【详解】(1)由题意可得,
解得;
(2)根据频率分布直方图可知,分数段的频率最高,因此众数为75,
设中位数为,则,
解得;
(3)因为总体共60名学生,样本容量为20,因此抽样比为.
又在分数段共有(人),
因此在分数段抽取的人数是(人).
【变式6-1】.(2024·广东韶关·一模)众数、平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据的分布形态有关.根据某小区1000户居民的月均用水量数据(单位:),得到如图所示的频率分布直方图,记该组数据的众数为,中位数为,平均数为,则( )
A. B.
C. D.
【答案】D
【知识点】由频率分布直方图估计中位数、根据频率分布直方图计算众数、由频率分布直方图估计平均数
【分析】由频率分布直方图结合中位数以及众数的计算即可比较大小.
【详解】观察频率分布直方图,发现是属于右边“拖尾”,所以平均数大于中位数为,
由于第一个小矩形面积为,
前2个小矩形面积之和为,
所以中位数位于之间,故可得,解得,
由频率分布直方图可知众数,
故,
故选:D.
【变式6-2】.(23-24高一下·河北张家口·期末)某时间段公路上车速的频率分布直方图如图所示,则( )
A. B.车速的众数估计值是70
C.车速的平均数估计值大于其中位数的估计值 D.车速的中位数估计值是62.5
【答案】D
【知识点】补全频率分布直方图、由频率分布直方图估计中位数、由频率分布直方图估计平均数、根据频率分布直方图计算众数
【分析】利用频率分布直方图求出、众数、平均数、中位数判断即得.
【详解】对于A,由,得,A错误;
对于B,车速在内的频率最大,车速的众数估计值是65,B错误;
对于C,车速的平均数为,
车速的中位数,则,解得,C错误;
对于D,车速的中位数估计值是62.5.
故选:D
【变式6-3】.(23-24高一下·四川达州·期末)在某次考试成绩中随机抽取50个,成绩均在之间,将这些成绩共分成五组:,,,,,得到如图所示的频率分布直方图,由图中数据估计总体的众数和中位数(中位数精确到个位)分别是( ).
A.65,70 B.65,71 C.65,72 D.65,73
【答案】D
【知识点】由频率分布直方图估计中位数、根据频率分布直方图计算众数
【分析】本题根据众数和中位数的概念以及在频率分布直方图的表达方法即可计算求解.
【详解】众数是频率分布直方图中最高的矩形的中点的坐标,即众数为,
设把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标为,
先求图中的a值,由得,,
则,所以.
故选:D.
【变式6-4】.(23-24高一下·江苏南京·期末)从全校学生的期末考试成绩(均为整数)中随机抽取一个样本,将样本分成5组,绘成频率分布直方图,如图中从左到右各小组的小矩形的高之比为,最左边的一组频数是6.
(1)求样本容量;
(2)求这一组的频数及频率;
(3)估计这组样本数据的众数和中位数.
【答案】(1)
(2)频数为,频率为
(3)众数为:,中位数为113
【知识点】由频率分布直方图估计中位数、根据频率分布直方图计算众数、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】(1)根据矩形面积比与频率比的关系即可得到样本容量;
(2)根据面积比即可求出频率,再根据样本容量即可求出频数;
(3)根据众数和中位数计算公式即可.
【详解】(1)小矩形的高之比为频率之比,
所以从左到右的频率之比为.
最左边的一级所占的频率为,
所以样本容量;
(2)这一组的频率为,所以频数为;
(3)由频率分布直方图得:
众数为:.
成绩在内的频率为,
成绩在内的频率为,
成绩在内的频率为,
则,,
设中位数为,
,解得,
即中位数为113.
【变式6-5】(23-24高一下·内蒙古通辽·阶段练习)某百货公司连续40天的销售额数据(单位:万元)如下:
41 25 29 47 38 34 30 38 43 40
46 36 45 37 37 36 45 43 33 44
35 28 46 34 30 37 44 26 38 44
42 36 37 37 49 39 42 32 36 35
(1)取组距为5,起点为25,列出样本的频数分布表,并绘制频率分布直方图;
(2)在绘制的频率分布直方图上指出数据组的中位数、众数、平均数所在区域,并比较它们之间的大小;
(3)试估计该百货公司一年(按365天计算)的销售额.
【答案】(1)答案见解析
(2)中位数、众数、平均数都在内,其平均数最大,中位数和众数相等
(3)13815.25(万元)
【知识点】绘制频率分布直方图、计算几个数的中位数、绘制频率分布表、计算几个数的平均数
【分析】(1)列出频率分布表,再根据频率分布表绘制频率分布直方图;
(2)将40个数据从小到大排列,求出中位数,并得到众数,计算出平均数,得到结论;
(3)在(2)的基础上,得到估计该百货公司一年的销售额.
【详解】(1)销售额的频数分布表如下:
组段
频数
频率
[25,30)
4
0.10
[30,35)
6
0.15
[35,40)
15
0.375
[40,45)
9
0.225
[45,50]
6
0.15
销售额的频率分布直方图如下:
(2)将40个数据从小到大排列依次为25,26,28,29,30,30,32,33,34,34,35,35,
36,36,36,36,37,37,37,37,37,38,38,38,39,40,41,42,42,43,43,
44,44,44,45,45,46,46,47,49,
选择第20个和第21个数据的平均数作为中位数,即,
37出现了5次,次数最多,
所以中位数为37,众数为37,
平均数为,
中位数、众数、平均数都在内,其平均数最大,中位数和众数相等.
(3)由(2)可知平均每天的销售额为37.85万元,
所以该百货公司一年的销售额约为365×37.85=13815.25(万元).
【变式6-6】(23-24高一下·福建南平·期中)用分层随机抽样从某校高一年级640名学生的数学周测成绩(满分为100分,成绩都是整数)中抽取一个样本量为100的样本,其中男生成绩数据40个,女生成绩数据60个,再将40个男生成绩样本数据分为6组:,,,,,,绘制得到如图所示的频率分布直方图.
(1)估计男生成绩样本数据的第80百分位和上四分位数;
(2)已知男生成绩样本数据的平均数为81,女生成绩样本数据的平均数为79,请估计总体平均数.
【答案】(1)第80百分位为84,上四分位数为82
(2)79.8分
【知识点】计算几个数的平均数、总体百分位数的估计
【分析】(1)先求各组的频率,根据百分位数的定义分析求解;
(2)记男生成绩数据为,女生成绩数据为,可得,结合平均数的定义分析求解.
【详解】(1)由题意可知:每组的频率依次为,
因为,
可知第80百分位,则,解得;
可知上四分位数,则,解得;
故估计男生成绩样本数据的第80百分位为84,上四分位数为82.
(2)记男生成绩数据为,女生成绩数据为,
由题意可知:,
故估计总体平均数为分.
【考点题型七】平均数,方差性质()
【例7】(多选)(2025·山西太原·一模)已知样本数据的平均数为3,方差为3,样本数据的平均数为3,方差为6,则下列结论正确的是( )
A.数据的平均数为7
B.数据的方差为11
C.数据的平均数为3
D.数据的方差为5
【答案】ACD
【知识点】各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响、平均数的和差倍分性质
【分析】利用平均数的性质判断A,C,利用方差的性质判断B,D即可.
【详解】对于A,因为样本数据的平均数为3,
所以由平均数性质得数据的平均数为,故A正确,
对于B,因为样本数据的方差为6,
所以数据的方差为,故B错误,
对于C,因为样本数据的平均数为3,样本数据的平均数为3,
所以数据的平均数为,故C正确,
对于D,由已知得数据的平均数为,
则新方差为,故D正确.
故选:ACD
【变式7-1】.(多选)(2025·贵州安顺·模拟预测)已知一组样本数据为,下列结论正确的是( )
A.若的平均数为,则的平均数为
B.若的方差为,则的方差为
C.若样本数据满足,则样本数据的极差为
D.若样本数据满足,则样本数据的分位数为
【答案】AC
【知识点】各数据同时乘除同一数对方差的影响、总体百分位数的估计、平均数的和差倍分性质、各数据同时加减同一数对方差的影响
【分析】对于A和B,根据条件,直接用平均数、方差的性质,即可判断;对于C,利用极差的定义即可判断;对于D,利用百分位数的定义,即可求解.
【详解】对于A,因为的平均数为,由平均数的性质知的平均数为,故A正确;
对于B,因为的方差为,由方差的性质知的方差为,故B错误;
对于C,因,则的极差为,故C正确;
对于D,因为,故的分位数为,故D错误.
故选:AC.
【变式7-2】.(多选)(2025·安徽·一模)已知数据的平均数为10,方差为1,且,则下列说法正确的是( )
A.数据的方差为4
B.数据的平均数为17
C.数据的平均数为10,方差大于1
D.若数据的中位数为分位数为,则
【答案】AB
【知识点】各数据同时乘除同一数对方差的影响、总体百分位数的估计、计算几个数的中位数、计算几个数的平均数
【分析】根据方差性质计算判断A,根据平均数及方差计算求解判断B,C,特例法,先从小到大排列,计算中位数及分位数判断D.
【详解】对于A:数据的方差为,A选项正确;
对于B:数据的平均数为,B选项正确;
对于C:数据的平均数为,
方差,C选项错误;
对于D:若取数据,平均数为10,方差为1,
则中位数为,因为,所以第5个数为分位数,
所以,D选项错误.
故选:AB.
【变式7-3】.(24-25高三上·浙江宁波·期末)已知数据的平均数为3,方差为1,则数据,,,…,的平均数与方差的和为 .
【答案】19
【知识点】平均数的和差倍分性质、各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响
【分析】根据平均数和方差的公式即可计算.
【详解】设数据,,,…,的平均数为,方差为,
设,设的平均数为,方程为,
则有
,
,
所以,
故答案为:19.
【变式7-4】.(24-25高一上·北京西城·阶段练习)若,,…,的平均数为5,方差为4,则,,…,的平均数为 ;方差为 .
【答案】
【知识点】平均数的和差倍分性质、各数据同时乘除同一数对方差的影响、各数据同时加减同一数对方差的影响
【分析】利用平均数与方差的性质即可得解.
【详解】因为,,…,的平均数为5,方差为4,
所以数据,,…,的平均数为:,
方差为.
故答案为:;.
【考点题型八】方差的应用()
【例8】(24-25高一上·江西·阶段练习)甲、乙两名运动员参加射击选拔赛,两人在相同条件下各射击100次,组委会从两人的成绩中各随机抽取6次成绩(满分10分,8分及以上为优秀).如下表所示:
甲射击成绩
10
9
7
8
10
10
乙射击成绩
10
6
10
10
9
9
(1)以频率作为概率,估计甲、乙两人射击成绩的优秀率;
(2)分别求出甲、乙6次射击成绩的平均数与方差,以此为依据,判断哪位运动员的射击成绩更好?
【答案】(1)甲的优秀率为,乙的优秀率为
(2)甲的射击成绩更好
【知识点】用方差、标准差说明数据的波动程度、用频率估计概率、计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】(1)直接由表得出结论;
(2)分别计算甲乙两名运动员的平均数和方差,通过,判断甲成绩更好.
【详解】(1)由表可知:甲的优秀率为,乙的优秀率为.
(2)甲运动员此射击成绩的平均数为,
所以甲运动员此射击成绩的方差为,
乙运动员此射击成绩的平均数为,
所以乙运动员此射击成绩的方差为,
因为,,所以甲、乙两名运动员的平均成绩相同,
但是甲运动员的射击成绩更稳定,所以甲运动员的射击成绩更好.
【变式8-1】.(24-25高二上·四川成都·期中)庚子新春,“新冠”肆虐,面对新冠肺炎的发生,某医疗小组提出了一种治疗的新方案.为测试该方案的治疗效果,此医疗小组选取了患病程度相同的12名病人志愿者,将他们随机分成两组,每组6人.第一组用新方案治疗,第二组用旧方案治疗.统计病人的痊愈时间(单位:天)如下表:
新方案治疗
3
6
6
7
10
10
旧方案治疗
5
8
9
11
12
15
记新方案和旧方案治疗病人痊愈时间的平均数分别为和,方差分别为和.
(1)求,,,;
(2)判断新方案的治疗效果较旧方案是否有显著提高.
说明:如果,则认为新方案的治疗效果较旧方案是有显著提高,否则不认为有显著提高.
【答案】(1),,,
(2)新方案的治疗效果较旧方案有显著提高
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】(1)根据平均数和方差的计算公式求解即可;
(2)根据题设判断即可.
【详解】(1)由已知可得,
,
同理可得,,
.
(2),,
新方案的治疗效果较旧方案有显著提高.
【变式8-2】.(23-24高二·上海·课堂例题)下面是甲、乙两名运动员在某次男子10米气手枪射击比赛中的得分数据(单位:环),试比较两名运动员的射击水平.
甲
9.6
9.9
9.2
9.4
9.9
10.1
10.2
9.7
9.6
9.3
10.0
10.4
10.1
9.9
乙
10.2
10.7
9.7
10.0
9.1
10.0
8.6
9.8
9.6
9.7
10.9
9.5
10.3
9.2
【答案】答案见解析.
【知识点】计算几个数据的极差、方差、标准差、用方差、标准差说明数据的波动程度、计算几个数的平均数
【分析】根据平均数和方差的计算公式,结合方差的意义进行分析判断即可.
【详解】设甲、乙两名运动员得分的平均数分别为,标准差分别为,
,
,
因为,,
所以甲运动员比乙运动员射击水平稳定.
【变式8-3】.(23-24高二·上海·课堂例题)某果园种植了两个品种的苹果,现从两个品种中各随机抽取10个,测得它们的质量(单位:g)分别为:
甲品种/g
203
185
190
192
185
192
179
193
195
186
乙品种/g
192
184
195
187
196
196
183
186
192
189
问:哪个品种的苹果质量更均匀?
【答案】乙
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】可以算得它们的平均数一样,只需比较两组苹果质量的方差即可得解.
【详解】设10个甲品种苹果、乙品种苹果的平均数分别为,方差分别为,
所以,
,
,
,
所以,
这表明乙品种的苹果质量更均匀.
【变式8-4】.(23-24高一下·安徽亳州·期末)某校高一(1)班、(2)班的学生人数分别为40,42,在某次测验中,记(1)班所有学生的成绩分别为,,…,,平均成绩为,方差为,已知,.
(1)求,;
(2)记(2)班所有学生的成绩分别为,,…,,其平均成绩为82,,试求两个班的所有学生的平均成绩(结果保留整数),并说明哪一个班的成绩比较稳定.
【答案】(1),
(2)81,(1)班的成绩比较稳定
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差、用方差、标准差说明数据的波动程度
【分析】(1)根据平均值以及方差的计算公式,即可求得答案;
(2)用总分数除以总人数即可求得两个班的所有学生的平均成绩,计算(2)班的方差,比较大小,即得结论.
【详解】(1)由题意知,得,
.
(2)记(2)班的平均成绩为,方差为,
则,所以,
所以两个班所有学生的平均成绩为,
,
因为,所以(1)班的成绩比较稳定.
【考点题型九】分层抽样中的方差()
【例9】(23-24高一下·甘肃兰州·期中)某中学名学生参加全市高中数学竞赛,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了名学生,记录他们的分数,将数据分成组:,并整理得到如下频率分布直方图:
(1)根据频率分布直方图求出分数大于的频率与频数;
(2)根据频率分布直方图求样本中分位数;
(3)已知样本中男生与女生的比例是,男生样本的均值为,方差为,女生样本的均值为,方差为,请计算样本的均值与方差.
【答案】(1)0.6;60
(2)
(3)72.5,
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、计算几个数的平均数、估计总体的方差、标准差、总体百分位数的估计
【分析】(1)计算出分数大于70的频率,进而得到频数;
(2)计算出分位数,在区间内,设出未知数,得到方程,求出答案;
(3)解法一:计算出总样本的均值,利用方差的定义进行计算推导,得到总样本的方差;
解法二:利用相关公式,代入直接求解.
【详解】(1)根据频率分布直方图知分数大于70的频率为,
故
(2)落在的频率为,落在的频率为,
故根据频率分布直方图知分位数,在区间上,设其为,
则,解得,
所以样本中分位数是:.
(3)解法一:总样本的均值为,
设男生个体依次为,女生个体依次为,
则,,
,
,
总体样本方差为,
其中
同理,
所以总样本的方差为,
解法二:总样本的均值为,
由可得
故总样本的方差为.
【变式9-1】.(24-25高一上·全国·课后作业)某快餐店统计了近100天内每日接待的顾客人数,将前50天的数据进行整理得到频率分布表和频率分布直方图.
组别
分组
频数
频率
第1组
[20,30)
4
0.08
第2组
[30,40)
a
第3组
[40,50)
20
b
第4组
[50,60)
0.32
第5组
[60,70)
4
0.08
合计
50
1.00
(1)求a,b,c的值,并估计该快餐店在前50天内每日接待的顾客人数的平均数;
(2)已知该快餐店在前50天内每日接待的顾客人数的方差为104,在后50天内每日接待的顾客人数的平均数为51,方差为100,估计这家快餐店这100天内每日接待的顾客人数的平均数和方差.
【答案】(1)a=6,,,47.
(2)平均数49,方差为106
【知识点】补全频率分布表、计算几个数的平均数、估计总体的方差、标准差
【分析】(1)根据频率与频数的关系即可求解,由平均数的计算个数即可求解,
(2)由整体平均数和方差的计算公式即可求解.
【详解】(1)由表可知第4组的频数为,所以,,
第2组的频率为,
,
前50天内每日接待的顾客人数的平均数为.
(2)设前50天接待的顾客人数分别为,,…,,
后50天接待的顾客人数分别为,,…,,
则由(1)知,前50天内每日接待的顾客人数的平均数,
方差,
后50天内每日接待的顾客人数的平均数,方差,
故这100天内每日接待的顾客人数的平均数为,
方差为
【变式9-2】.(23-24高一下·陕西榆林·期末)某学校高一年级进行某学科的考试,所有学生的成绩做成的频率分布直方图如图所示,第一组成绩在,第二组成绩在,第三组成绩在,第四组成绩在,第五组成绩在.
(1)求图中的值;
(2)年级准备表扬在本次考试中成绩在前的同学,定为成绩优胜,估计此次考试成绩优胜的分数线;
(3)现从以上各组中用分层随机抽样的方法选取20人,进行成绩情况调研.若抽取的同学中,第二组的成绩的平均数和方差分别为65和40,第四组的成绩的平均数和方差分别为83和70,据此估计第二组和第四组抽取的所有同学中成绩的方差.
【答案】(1)
(2)85
(3)平均数77,方差132
【知识点】抽样比、样本总量、各层总数、总体容量的计算、由频率分布直方图计算频率、频数、样本容量、总体容量、估计总体的方差、标准差、总体百分位数的估计
【分析】(1)根据频率分布直方图的面积之和为即可求解;
(2)根据频率分布直方图的百分位数的求法即可求解;
(3)根据样本平均数和方差估计总体平均数和方差的知识即可求解.
【详解】(1),解得.
(2)年级准备表扬在本次考试中成绩在前的同学,定为成绩优胜,故求第分位数的分数即可,
,故分位数在内,
故第分位数的分数为分,故此次考试成绩优胜的分数线为分.
(3)因为现从以上各组中用分层随机抽样的方法选取20人,
所以第二组抽取的人数为人,第四组抽取的人数为人,
由总体平均数的知识可知总体平均数为,
由总体方差的知识可知总体方差为.
【变式9-3】.(23-24高二上·云南昆明·期末)某学校有高中学生500人,其中男生300人,女生200人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:),计算得男生样本的均值为170,方差为17,女生样本的均值为160,方差为30.
(1)根据以上信息,能够计算出总样本的均值和方差吗?为什么?
(2)如果已知男、女样本量按比例分配,你能计算出总样本的均值和方差各为多少吧?
【答案】(1)不能,因为题目没有给出男、女生的样本量
(2)均值为166,方差为46.2
【知识点】计算几个数的平均数、估计总体的方差、标准差
【分析】(1)由于不知道男、女生的样本量,故无法得到总样本的均值和方差;
(2)根据男、女样本量按比例分配,得到总样本的均值,再根据公式得到总样本的方差.
【详解】(1)不能,因为题目没有给出男、女生的样本量.
(2)总体样本的均值为,
总体样本的方差为.
【变式9-4】(23-24高一下·陕西西安·期末)某市为了了解人们对“中国梦”的伟大构想的认知程度,针对该市不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(95分及以上为认知程度高),结果认知程度高的有m人,按年龄分为5组,其中第一组为,第二组为,第三组为,第四组为,第五组为,得到如图所示的频率分布直方图,已知第一组有10人.
(1)根据频率分布直方图,估计这m人的平均年龄.
(2)现从以上各组中用分层随机抽样的方法抽取20人,担任本市的“中国梦”宣传使者.若第四组宣传志愿者年龄的平均数与方差为37和,第五组宣传志愿者年龄的平均数与方差为43和1,据此估计这m人中35~45所有人的年龄的方差.
【答案】(1)(岁)
(2)估计这m人中年龄在35~45岁的所有人的年龄的方差约为10
【知识点】由频率分布直方图估计平均数、计算几个数据的极差、方差、标准差、估计总体的方差、标准差
【分析】(1)中间值作代表求解平均值;
(2)计算出第四组、第五组的宣传志愿者年龄的平均数和方差,利用公式求出整体平均数和方差.
【详解】(1)这m人的平均年龄为,
则
(岁).
(2)由题意得,这五组的频率之比为,
故第四组应抽取人,第五组应抽取人
设第四组、第五组的宣传志愿者年龄的平均数分别为,,方差分别为,,
则,,方差分别为,,
设第四组和第五组所有宣传志愿者的年龄平均数为,方差为,
则,
,
据此估计这m人中年龄在35~45岁的所有人的年龄的方差约为10.
提升训练
一、单选题
1.(2025·湖北武汉·二模)随着Deepseek的流行,各种AI大模型层出不穷,现有甲、乙两个AI大模型,在对甲、乙两个大模型进行深度体验后,6位评委分别对甲、乙进行打分(满分10分),得到如图所示的统计表格,则下列结论不正确的是( )
评委编号模型名称
1
2
3
4
5
6
甲
7.0
9.3
8.3
9.2
8.9
8.9
乙
8.1
9.1
8.5
8.6
8.7
8.6
A.甲得分的平均数大于乙得分的平均数 B.甲得分的众数大于乙得分的众数
C.甲得分的中位数大于乙得分的中位数 D.甲得分的方差大于乙得分的方差
【答案】A
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差、计算几个数的众数、计算几个数的中位数
【分析】根据已知数据分别应用中位数,众数,平均数及方差定义分别计算判断各个选项.
【详解】甲、乙的得分从小到大排列如下:
甲:,乙:,
甲得分的中位数为,乙得分的中位数为,甲得分的中位数大于乙得分的中位数,故C正确;
甲得分的众数,乙得分的众数为,甲得分的众数大于乙得分的众数,故B正确;
甲得分的平均数,
乙得分的平均数,所以甲得分的平均数等于乙得分的平均数,故A错误;
甲的方差,
乙的方差为
故甲得分的方差大于乙得分的方差,故D正确.
故选:A.
2.(2025·河北张家口·二模)在某次高三模拟考试后,数学老师随机抽取了6名同学第一个解答题的得分情况如下:7,9,5,8,4,1,则这组数据的平均数和极差分别为( )
A. B. C. D.
【答案】A
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】根据平均数,极差的定义求解.
【详解】根据题意,这组数据的平均数,极差为.
故选:A.
3.(24-25高二下·浙江·期中)某人在一次考试中每门课得分如下:则数据的第百分位数为( )
A.87.5 B.85 C.90 D.100
【答案】C
【知识点】总体百分位数的估计
【分析】利用百分位数的概念来求解即可.
【详解】把以上六个数据按从小到大排列:,
由,所以取第5个数作为第75百分位数,即90,
故选:C.
4.(23-24高一下·云南昭通·期末)高一(1)班有学生45人,高一(2)班有学生27人,高一(3)班有学生36人,用分层抽样的方法从这三个班中抽出一部分人组成的方队,进行体操比赛,则高一(1)班、高一(2)班、高一(3)班分别被抽取的人数是( )
A.15,9,12 B.9,15,12 C.12,9,15 D.15,12,9
【答案】A
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】由分层抽样的方法结合题意计算即可.
【详解】利用分层抽样的方法得,高一(1)班应抽出(人),
高一(2)班应抽出(人),
高一(3)班应抽出(人),
则高一(1)班,高一(2)班,高一(3)班分别被抽取的人数是15,9,12,
故选:A.
5.(2025·浙江温州·二模)某班级有30名男生和20名女生,现调查学生周末在家学习时长(单位:小时),得到男生样本数据的平均值为8,方差为2,女生样本数据的平均值为10.5,方差为0.75,则该班级全体学生周末在家学习时长的平均值和方差的值分别是( )
A. B.
C. D.
【答案】D
【知识点】平均数的和差倍分性质、估计总体的方差、标准差
【分析】根据分层随机抽样的平均数和方差公式即可算出答案.
【详解】,
故选:D
6.(2025·山西·二模)AI正悄然改变着我们的生活.某在线平台利用AI技术为学生提供个性化学习路径,为了解学生对平台的满意程度,随机抽取使用该平台的学生进行打分,将收集到的分数数据按照分组,画出频率分布直方图如图所示,则这些数据的中位数约为( )
A.85 B.80 C.77.5 D.75
【答案】C
【知识点】由频率分布直方图估计中位数
【分析】根据中位数的意义,在样本中,有的个体小于或等于中位数,也有的个体大于或等于中位数,然后解题即可.
【详解】由于,,
因此中位数落在区间内,设中位数为,
由,得,因此,中位数约为77.5.
故选:C
7.(2025·贵州·二模)已知一组数据1,4,5,,3,4,5,1,,7,4的平均数为4,其中,均为正整数,则当取得最小值时,这组数据的方差为( )
A. B. C. D.
【答案】D
【知识点】计算几个数据的极差、方差、标准差、基本不等式“1”的妙用求最值、根据平均数求参数
【分析】利用平均数的定义列式求出,再利用基本不等式“1”的妙用求出取最小值的条件,然后利用方差的定义求解.
【详解】依题意,,解得,
则,
当且仅当,即时取等号,因此当时,取得最小值,
所以这组数据的方差为.
故选:D
8.(2025高三·广东江苏·专题练习)一组数据满足,若去掉后组成一组新数据.则新数据与原数据相比( )
A.极差变大 B.平均数变大
C.方差变小 D.第25百分位数变小
【答案】C
【知识点】计算几个数据的极差、方差、标准差、各数据同时加减同一数对方差的影响、计算几个数的平均数、总体百分位数的估计
【分析】根据极差,平均数,方差与百分位数的定义计算出去掉前后的相关数据,比较厚得到答案.
【详解】由于,
故,,……,,,
A选项,原来的极差为,去掉后,极差为,极差变小,故A错误;
B选项,原来的平均数为,
去掉后的平均数为,平均数不变,故B错误;
C选项,原来的方差为,
去掉后的方差为,
方差变小,故C正确;
D选项,,从小到大排列,选第个数作为第百分位数,即,
,故从小到大排列,选择第个和第个数作为第百分位数,即,
由于,去掉后第25百分位数变大,故D错误.
故选:C
二、多选题
9.(安徽省淮北、淮南市2025届高三下学期第二次质量检测数学试题)某校100名学生学业水平测试数学成绩的频率分布直方图如图所示,已知所有学生成绩均在区间内,则( )
A.图中的值为0.005
B.这组数据的平均数为73
C.这组数据的众数为75
D.这组数据的中位数约为71.7
【答案】ABD
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计中位数、由频率分布直方图估计平均数、根据频率分布直方图计算众数
【分析】根据频率分布直方图中各小矩形得面积之和为1,可求出的值,再结合平均数、众数、中位数的定义判断BCD.
【详解】对于A,由频率分布图可知:,解得,故A正确;
对于B,由频率分布图可知:,故B正确;
对于C,由频率分布图可知众数为65,故C错误;
对于D,设这组数据的中位数约为,因为,,
所以中位数在区间内,则,解得,故D正确;
故选:ABD.
10.(2025·广东揭阳·二模)洛阳是我国著名的牡丹之乡,以“洛阳地脉花最宜,牡丹尤为天下奇”流传于世.某种植基地通过植株高度研究牡丹的生长情况,从同一批次牡丹中随机抽取100株的植株高度(单位:)作为样本,得到如图所示的频率分布直方图,则下列结论正确的是( )
A.基地牡丹植株高度的极差的估计值大于50
B.基地牡丹植株高度不高于70的频率估计值为30%
C.基地牡丹植株高度的众数与中位数的估计值相等
D.基地牡丹植株高度的第75百分位数的估计值小于80
【答案】BC
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计中位数、总体百分位数的估计、根据频率分布直方图计算众数
【分析】根据频率分布直方图的数据可得出极差,判断A项;计算各小组频率可判断B项;分析可知中位数位于,列方程计算即可得出中位数,根据频率分布直方图可直接估算众数;根据各小组的概率可知基地牡丹植株高度的第75百分位数的估计值应在内.
【详解】对于A项,由图象可知,基地牡丹植株高度范围在之间,所以极差的估计值应不大于50,故A错误;
对于B项,基地牡丹植株高度不高于70的频率为.故B正确;
对于C项,由频率分布直方图可知,基地牡丹植株高度不高于70的频率为,不高于的频率为,
所以中位数位于,设为,
则应有,计算可得.
众数估计为的中点,也是,与中位数相同.故C正确;
对于D项,基地牡丹植株高度不高于的频率为,不高于的频率为,
所以,基地牡丹植株高度的第75百分位数的估计值应在内.故D错误.
故选:BC.
11.(24-25高二下·浙江杭州·阶段练习)投掷一枚均匀的骰子次,记录每次骰子出现的点数.根据部分统计结果,可以推断出点数至少被投掷出过次的是( )
A.第25百分位数为2,极差为4 B.平均数为3.5,第75百分位数为3.5
C.平均数为3,方差为3 D.众数为4,平均数为4.75
【答案】BD
【知识点】计算几个数据的极差、方差、标准差、总体百分位数的估计、计算几个数的中位数、计算几个数的平均数
【分析】对于A,可采用特值法;对于B,根据平均数和百分位数,即可判断,对于C, 可采用特值法;对于D,可假设这8个数没有6点,根据题设推出矛盾,即可判断.
【详解】不妨设,则
对于A,这8个数可以是,故不一定出现点数6,故A错误;
对于B,因为平均数为3,5,所以,
又第75百分位数为3.5,所以,∴,
当,即,,
此时,
所以,且,,
所以,所以.所以一定出现点数6, 故B正确;
对于C,这8个数可以是,
,,
故不一定出现点数6,故C错误;
对于D, 因为平均数为,所以,
又众数为4,假设这8个数没有6点,则和最大的情况为,和题设矛盾,故一定出现点数6,故D正确.
故选:BD.
三、填空题
12.(2026高三·全国·专题练习)某学校统计教师职称及年龄,中级职称教师的人数为50,其平均年龄为38岁,方差是2,高级职称的教师中有3人58岁,5人40岁,2人38岁,则该校中级职称和高级职称教师年龄的平均数和方差分别为
【答案】39,20.67
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】求出高级职称的教师年龄平均数及方差,再利用分层抽样的平均数及方差公式计算得解.
【详解】依题意,高级职称教师的平均年龄为(岁),
高级职称教师年龄的方差为,
所以该校中级职称和高级职称教师的平均年龄为(岁),
该校中级职称和高级职称教师年龄的方差为.
故答案为:39;20.67
13.(2025·新疆省直辖县级单位·模拟预测)某水产单位对其投放的网箱产量(单位:kg)进行了样本统计,得到样本数据的频率分布直方图如下图所示,请根据频率分布直方图估计该水产单位所有网箱产量的72%分位数为 kg.
【答案】49
【知识点】总体百分位数的估计
【分析】根据百分位数的定义计算.
【详解】设分位数为,
因为,,
所以分位数在区间上,
则,解得.
故答案为:49.
14.(2025·上海闵行·二模)已知数据的平均数为2,方差为5,则的平均数为 .
【答案】9
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】由方差和平均数的计算公式结合已知计算即可.
【详解】由题意可得,,
所以,
又,
即,即,
所以的平均数为9.
故答案为:9.
四、解答题
15.(24-25高一下·甘肃兰州·阶段练习)某校从高二年级学生中随机抽取60名学生,将期中考试的政治成绩(均为整数)分成六段:,,,…,后得到如下频率分布直方图(同一组中的数据用组中值作代表).
(1)根据频率分布直方图求众数;
(2)用分层抽样的方法在各分数段的学生中抽取一个容量为20的样本,则在分数段抽取的人数是多少?
【答案】(1)75
(2)11
【知识点】抽样比、样本总量、各层总数、总体容量的计算、根据频率分布直方图计算众数、补全频率分布直方图
【分析】(1)先根据频率之和为1,可求出,再由频率最大的一组,得到众数;
(2)先由题意确定抽样比,进而可求出在分数段抽取的人数.
【详解】(1)由题意得,,解得,
根据频率分布直方图可知,分段的频率最高,因此众数为75.
(2)因为总体共60名学生,样本容量为20,因此抽样比为,
又分数段共有人,
因此在分数段抽取的人数是人.
16.(24-25高二下·上海青浦·期中)某同学为了解我国文化教育普及程度,收集了我国部分省级行政区15岁及以上男性和女性的文盲人口比重(%)情况,经统计得到如下的茎叶图.
(1)根据茎叶图判断男性样本数据和女性样本数据的离散程度,并求离散程度较小的样本数据的第80百分位数;
(2)若女性样本数据的极差为12.7,求该样本数据的平均数与方差;(结果精确到0.1)
(3)为了调查今年某地区15岁及以上男性和女性文盲人口情况,研究小组准备采用分层随机抽样方法抽取5000人进行调查.已知该地区15岁及以上的男性约有4.2百万人,女性约有3.8百万人.分别求出抽取的男性人数和女性人数.
【答案】(1)
(2)平均数为,方差为
(3)男性人数为,女性人数为,
【知识点】由茎叶图计算平均数、总体百分位数的估计、抽样比、样本总量、各层总数、总体容量的计算、计算几个数据的极差、方差、标准差
【分析】(1)根据百分位数的定义即可求解;
(2)根据平均数和,方差公式即可求解;
(3)根据分层抽样方法即可求解.
【详解】(1)由茎叶图可得女性样本数据较分散,男性样本数据较集中,故男生离散程度较小.
又因为茎叶图中数据从小到大排列,可知,男性共有30个数据,则第80百分位数为,
所以第80百分位数即为从小到大排列数中第24位与第25位的平均值,即,
(2)由茎叶图可得,
又因为女性的极差为,所以,
所以,
,
(3)因为男性与女性人数之比为,
根据分层抽样,从5000人中抽取男性人数为人,女性人数为人.
17.(22-23高一下·云南昭通·期末)为了解某校高一年级学生数学学习的阶段性表现,年级组织了一次阶段测试.已知此次考试共有450名学生参加,考试成绩的频率分布直方图如图所示(同一组中的数据以该区间的中点值为代表).
(1)求a的值;
(2)估计这次数学考试成绩的众数、中位数和平均数(结果保留两位小数);
(3)估计该校学生的数学成绩的第70百分位数(结果保留两位小数).
【答案】(1)
(2)众数为65,中位数为67.69,平均成绩为67.60
(3)第70的分位数为75.83
【知识点】由频率分布直方图估计中位数、由频率分布直方图估计平均数、由频率分布直方图计算频率、频数、样本容量、总体容量、总体百分位数的估计
【分析】(1)由频率分布直方图面积为1,求解即可;
(2)由众数、中位数、平均数的计算公式即可求解;
(3)由百分位数的计算公式即可求解;
【详解】(1)由,解得.
(2)由频率分布直方图知:众数为65,设中位数为x,
因为,,故中位数位于内,
则有,解得.
所以中位数为67.69.
这次数学考试的平均成绩为
.
(3)成绩小于70分所占的比例为,
成绩小于80分所占的比例为,
所以第70的分位数在内,
所以第70的分位数为.
18.(24-25高二上·四川成都·阶段练习)某校高一年级有男生200人,女生100人.为了解该校全体高一学生的身高信息,按性别比例进行分层随机抽样,抽取总样本为30的样本,并观测样本的指标值(单位:cm),计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据;
抽取次序
1
2
3
4
5
6
7
8
9
10
身高
155
158
156
157
160
161
159
162
169
163
记抽取的第个女生的身高为,样本平均数,方差.
参考数据:,,.
(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身高在范围内的人数;
(2)用总样本平均数和标准差分别估计该校高一学生总体身高的平均数和标准差,求,的值.
【答案】(1)40
(2)
【知识点】分层抽样的概率、估计总体的方差、标准差
【分析】(1)根据样本数据在范围内的占比易求得女生总体在此范围内的人数;
(2)先利用加权平均数公式求出总样本的平均数,再利用混合样本的方差公式计算,最后对,进行估计即可.
【详解】(1)因女生样本中,身高在范围内的占比为,
故该校高一女生身高在范围内的人数估计为.
(2)记总样本的平均数为,标准差为,
由题意,设男生样本(20人)的身高平均数为,方差为,
女生样本(10人)的身高平均数为,方差,
则,
,
故.
19.(23-24高一下·广东深圳·阶段练习)2023年10月22日,汉江生态城2023襄阳马拉松在湖北省襄阳市成功举行,志愿者的服务工作是马拉松成功举办的重要保障,襄阳市新时代文明实践中心承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率相同.
(1)估计这100名候选者面试成绩的平均数和第25百分位数;
(2)现从以上各组中用分层随机抽样的方法选取20人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为72和30,第四组面试者的面试成绩的平均数和方差分别为90和60,据此估计这次第二组和第四组所有面试者的面试成绩的方差.
【答案】(1)平均数69.5,第25百分位数为63;
(2)
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计平均数、估计总体的方差、标准差、总体百分位数的估计
【分析】(1)根据频率分布直方图分别表示出各组的频率,由第一、二组的频率之和为0.3及总的频率之和为1列方程组解出,的值;分别写出每一组的频率,由平均数计算公式得到平均数,根据频率和得到第25百分位数所在的组,由概率和为0.25解出第25百分位数的值;
(2)由第二组、第四组的频率之比得到分层抽样后两组人数所占比例,再结合两组各自的平均数和方差,由公式,分别求出两组所有面试者的方差.
【详解】(1)由题意可知:,
解得;
由图可知,每组的频率依次为:0.05,0.25,0.45,0.2,0.05,
所以平均数为,
因为,设第25百分位数为,则,,
则,解得,
故第25百分位数为63;
(2)设第二组、第四组面试者的面试成绩的平均数与方差分别为,
且两组频率之比为,
则第二组和第四组所有面试者的面试成绩的平均数
第二组和第四组所有面试者的面试成绩的方差
.
故估计第二组和第四组所有面试者的面试成绩的方差是.
3 / 3
学科网(北京)股份有限公司
$$
清单05 第九章 统计
(5个考点梳理+9题型解读+提升训练)
清单01 总体百分位数
(1)计算第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;
若是整数,则第百分位数为第项与第项数据的平均数.
清单02 平均数,众数,中位数计算
(1)平均数
①定义:一组数据的和与这组数据的个数的商.数据,,的平均数为.
(2)众数
①定义:一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数。
(3)中位数
①定义:一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
清单03 平均数,众数,中位数估计值
在频率分布直方图中平均数,中位数,众数的估计值
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)众数:众数是最高小矩形底边的中点所对应的数据.
清单04 平均数,方差性质
平均数,方差的线性关系:
数据
平均数
方差
,,,
,,,
,,,
,,,
清单05 标准差与方差
如果有个数据,,,那么平均数,标准差为:,方差:
【考点题型一】随机数表法()
【例1】(23-24高一上·江西·阶段练习)某班级共有52位同学,现随机抽取8位同学参加学校组织的“校园读书节”活动,老师将班级同学进行编号:01,02,03,……,52,若从随机数表的第3行第27列开始,依次往右读数,直到取足样本为止,则第6位被抽到的同学对应的编号为( )
95 33 95 22 00 18 74 72 00 18 38 79 58 69 32 81 76 80 26 92 82 80 84 25 39
90 84 60 79 80 24 36 59 87 38 82 07 53 89 35 56 35 23 79 18 05 98 90 07 35
46 40 62 98 80 54 97 20 56 95 15 74 80 08 32 16 46 70 50 80 67 72 16 42 79
20 31 89 03 43 38 46 82 68 72 32 14 82 99 70 80 60 47 18 97 63 49 30 21 30
71 59 73 05 50 08 22 23 71 77 91 01 93 20 49 82 96 59 26 94 66 39 67 98 60
A.16 B.42 C.50 D.80
【变式1-1】.(23-24高一上·江西赣州·阶段练习)总体由编号为01,02,…,39,40的40个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6列和第7列数开始由左到右依次选取两个数,则选出来的第5个个体的编号为( )
50 44 66 44 21 66 06 58 05 62 61 65 54
35 02 42 35 48 96 32 14 52 41 52 48 22
66 22 15 86 26 63 75 41 99 58 42 36 72
24 58 37 52 18 51 03 37 18 39 11 79 33
A.23 B.21 C.35 D.32
【变式1-2】.(24-25高一上·全国·随堂练习)一个总体的60个个体编号为00,01,…,59,现需从中抽取一个容量为6的样本,请从下面给出的随机数表的第10列开始向右读取,直到取足样本,则抽取的第五个样本的号码是 .
95 33 95 22 00 18 74 72 00 18 38 79 58 69 32 81 76 80 26 92 82 80 84 25 39
【变式1-3】.(2024高一·全国·专题练习)欲利用随机数表从00,01,02,…,59这些编号中抽取一个容量为6的样本,抽取方法是从下面的随机数表的第1行第11列开始向右读取,每次读取两位,直到取足样本,则第4个被抽取的样本的编号为 .
【变式1-4】(2024高一下·全国·专题练习)现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为 .
95226000 49840128 66175168 39682927 43772366 27096623
92580956 43890890 06482834 59741458 29778149 64608925
【考点题型二】分层抽样()
【例2】(24-25高一上·安徽宿州·期末)某校高中部高一、高二、高三人数之比为5:4:3,其中女生有600人,现准备从该校所有高中学生中抽取容量为120的样本.若根据年级采用按比例分配的分层随机抽样,抽取的高三学生为n个人;若根据性别采用按比例分配的分层随机抽样,抽取的女生为m个人,且,则该校高中部学生人数为 .
【变式2-1】.(24-25高一下·甘肃兰州·阶段练习)用同比例分层抽样的方法对某品牌暖风机同一批次的甲、乙两种型号的产品进行抽样调查,已知样本量为80,其中有50件甲型号产品.若乙型号产品的总数为2100,则该批次产品的总数为( )
A.5460 B.3500 C.3350 D.5600
【变式2-2】.(24-25高一上·江西·阶段练习)某高校共有本科生1000人,硕士生200人,博士生20人申请报名做中国航展的志愿者,现用分层随机抽样方法从中抽取一批志愿者,若抽取的博士生是5人,则从该高校抽取的志愿者总人数为( )
A.265人 B.285人 C.305人 D.325人
【变式2-3】.(24-25高一上·北京海淀·期末)某校高一年级有名男生,名女生.为了解高一学生研学路线的选择意向,采用分层抽样的方法,从该校高一学生中抽取容量为的样本进行调查,其中女生名,则的值为( )
A. B.
C. D.
【变式2-4】.(24-25高二上·四川成都·阶段练习)某校高一年级共有学生200人,其中1班60人,2班40人,3班50人,4班50人.该校要了解高一学生对食堂菜品的看法,准备从高一年级学生中随机抽取50人进行访谈,若采取按比例分配的分层抽样,则应从高一2班抽取的人数是 .
【考点题型三】总体百分位数估计值()
【例3】(24-25高一上·辽宁大连·期末)为了快速了解某学校学生体重(单位:kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示,估计这个学校学生体重的40%分位数为 kg.
【变式3-1】.(24-25高三上·云南楚雄·期末)按从小到大排列的一组数据的分位数为( )
A.96 B.96.5 C.97 D.97.5
【变式3-2】.(24-25高一下·甘肃兰州·阶段练习)已知一组数据3,4,5,6,7,8,9,10,则这组数据的第20百分位数是( )
A. B.4 C. D.5
【变式3-3】.(24-25高一上·湖南衡阳·期末)一组数据15,18,23,24,28,36,39,42,47,53,60,78的第75百分位数是 .
【变式3-4】.(24-25高一上·江西景德镇·期末)已知某组数据分别为3,5,6,7,8,9,9,11,则这组数据的分位数为 .
【考点题型四】频率分布直方图()
【例4】(24-25高一上·江西赣州·开学考试)为弘扬中华传统文化,某校组织若干名学生参加汉字听写大赛,为了解学生整体听写能力,从中抽取部分学生的成绩(得分取正整数,满分为100分)进行统计分析,请根据尚未完成的下列图表,解答问题:
分组
49.5~59.5
59.5~69.5
69.5~79.5
79.5~89.5
89.5~100.5
频数
2
a
20
16
8
频率
0.04
0.08
0.40
0.32
b
(1)本次抽样调查的样本容量为_______,此样本中成绩的中位数落在_______范围内.表中_______,_______;
(2)补全频数分布直方图;
(3)若该校共有初中生3000名,若成绩超过80分为优秀,请估计该校汉字听写能力为优秀的约有多少人.
【变式4-1】.(2024·全国·模拟预测)以“建设包容、普惠、有韧性的数字世界——携手构建网络空间命运共同体”为主题的2023年世界互联网大会乌镇峰会于11月8日至10日在中国浙江省乌镇举行.为保障大会顺利进行,世界互联网大会的秘书处从招募的志愿者中随机抽取100名进行了一次互联网知识竞赛,所得成绩(单位:分)均在内,并制成如下频数分布表:
成绩/分
频数
8
28
20
12
(1)根据频数分布表,在下图中作出频率分布直方图;
(2)以样本估计总体,记竞赛成绩不低于86分的志愿者为优秀志愿者,则优秀志愿者的占比能否达到20%?
【变式4-2】.(23-24高二上·浙江·期中)据调查,某市政府为了鼓励居民节约用水,减少水资源的浪费,计划在本市试行居民生活用水定额管理,即确定一个合理的居民用水量标准(单位:吨),月用水量不超过的部分按平价收费,超出的部分按议价收费.为了了解全市居民用水量分布情况,通过抽样,获得了户居民某年的月均用水量(单位:吨),其中月均用水量在内的居民人数为39人,并将数据制成了如图所示的频率分布直方图.
(1)求和的值;
(2)若该市政府希望使的居民月用水量不超过标准吨,试估计的值;
(3)在(2)的条件下,若实施阶梯水价,月用水量不超过吨时,按3元吨计算,超出吨的部分,按5元吨计算.现市政府考核指标要求所有居民的月用水费均不超过70元,则该市居民月用水量最多为多少吨?
【变式4-3】.(24-25高一上·北京·阶段练习)为调查某校学生的校志愿者活动情况,现抽取一个容量为100的样本,统计了这些学生一周内的校志愿者活动时长,并绘制了如下图所示的频率分布直方图,记数据分布在的频率分别为.已知.
(1)求的值;
(2)求样本中在内的频数;
(3)若全校共2000名学生,请根据样本数据估计:全校学生一周内的校志愿者活动时长不少于250分钟的人数.
【变式4-4】.(2024高一下·全国·专题练习)某电视台在本省内15~65岁的人群中随机抽取了n人回答问题“本省著名旅游景点有哪些”,统计结果如图表所示.
组号
分组
回答正确的人数
回答正确的人数占本组的频率
第1组
a
0.5
第2组
18
x
第3组
b
0.9
第4组
9
0.36
第5组
3
y
(1)分别求出a,b,x,y的值;
(2)从第2,3,4组回答正确的人中用分层随机抽样的方法抽取6人,求第2,3,4组每组各抽取多少人?
【考点题型五】平均数,众数,中位数的计算()
【例5-1】(24-25高一上·四川成都·开学考试)如表是某公司员工月收入的资料.
月收入/元
45000
18000
10000
5500
5000
3400
3300
1000
人数
1
1
1
3
6
1
11
1
能够反映该公司全体员工月收入水平的统计量是( )
A.平均数和众数 B.平均数和中位数
C.中位数和众数 D.平均数和方差
【例5-2】(23-24高一下·全国·课堂例题)一组数据的中位数是( )
A. B. C. D.
【例5-3】(24-25高一上·辽宁沈阳·期末)已知一组数据丢失了其中一个,剩下的六个数据分别是、、、、、,若这组数据的平均数与众数的和是中位数的倍,则丢失数据的所有可能值构成的集合为 .
【变式5-1】.(24-25高一上·全国·课后作业)某地铁的开通运营极大地方便了市民的出行.某时刻从A站驶往B站的过程中,10个车站上车的人数统计如下:70,60,60,60,50,40,40,30,30,10.这组数据的平均数,众数,分位数的和为( )
A.125 B.135 C.165 D.170
【变式5-2】.(24-25高一上·四川成都·开学考试)一组数据按从小到大顺序排列为:,则这组数据的中位数是 ,众数是 .
【变式5-3】.(24-25高一上·四川成都·开学考试)廖老师为了了解学生周末利用网络进行学习的时间,在所任教班级随机调查了10名学生,其统计数据如下表:
时间(单位:小时)
4
3
2
l
0
人数
3
4
1
1
1
则这10名学生周末利用网络进行学习的平均时间是 小时.
【变式5-4】.(24-25高一上·全国·课前预习)下表是五年级一、二两个班各11名同学1分钟仰卧起坐的成绩(单位:次):
一班
19
33
26
29
28
33
34
35
33
33
30
二班
25
27
29
28
29
30
29
35
29
30
29
(1)这两组数据的平均数、中位数和众数各是多少?
(2)你认为哪个数表示两个班的成绩更合适?
【考点题型六】平均数,众数,中位数的估计值()
【例6-1】(25-26高一上·全国·课后作业)2023年8月8日,世界大学生运动会在成都成功举行闭幕式.某校抽取100名学生进行了大运会知识竞赛并记录得分(满分:100,所有人的成绩都在内),根据得分将他们的成绩分成六组,制成如图所示的频率分布直方图.
(1)求图中a的值;
(2)估计这100人竞赛成绩的平均数(同一组中的数据用该组区间的中点值为代表)、众数及中位数.
【例6-2】(23-24高一下·河南周口·期末)某校从高一年级学生中随机抽取60名学生,将期中考试的数学成绩均为整数分成六组:后得到如图所示频率分布直方图.
(1)求的值;
(2)根据频率分布直方图,求众数和中位数;
(3)用比例分配的分层随机抽样的方法在各分数段的学生中抽取一个容量为20的样本,求在分数段抽取的人数;
【变式6-1】.(2024·广东韶关·一模)众数、平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据的分布形态有关.根据某小区1000户居民的月均用水量数据(单位:),得到如图所示的频率分布直方图,记该组数据的众数为,中位数为,平均数为,则( )
A. B.
C. D.
【变式6-2】.(23-24高一下·河北张家口·期末)某时间段公路上车速的频率分布直方图如图所示,则( )
A. B.车速的众数估计值是70
C.车速的平均数估计值大于其中位数的估计值 D.车速的中位数估计值是62.5
【变式6-3】.(23-24高一下·四川达州·期末)在某次考试成绩中随机抽取50个,成绩均在之间,将这些成绩共分成五组:,,,,,得到如图所示的频率分布直方图,由图中数据估计总体的众数和中位数(中位数精确到个位)分别是( ).
A.65,70 B.65,71 C.65,72 D.65,73
【变式6-4】.(23-24高一下·江苏南京·期末)从全校学生的期末考试成绩(均为整数)中随机抽取一个样本,将样本分成5组,绘成频率分布直方图,如图中从左到右各小组的小矩形的高之比为,最左边的一组频数是6.
(1)求样本容量;
(2)求这一组的频数及频率;
(3)估计这组样本数据的众数和中位数.
【变式6-5】(23-24高一下·内蒙古通辽·阶段练习)某百货公司连续40天的销售额数据(单位:万元)如下:
41 25 29 47 38 34 30 38 43 40
46 36 45 37 37 36 45 43 33 44
35 28 46 34 30 37 44 26 38 44
42 36 37 37 49 39 42 32 36 35
(1)取组距为5,起点为25,列出样本的频数分布表,并绘制频率分布直方图;
(2)在绘制的频率分布直方图上指出数据组的中位数、众数、平均数所在区域,并比较它们之间的大小;
(3)试估计该百货公司一年(按365天计算)的销售额.
【变式6-6】(23-24高一下·福建南平·期中)用分层随机抽样从某校高一年级640名学生的数学周测成绩(满分为100分,成绩都是整数)中抽取一个样本量为100的样本,其中男生成绩数据40个,女生成绩数据60个,再将40个男生成绩样本数据分为6组:,,,,,,绘制得到如图所示的频率分布直方图.
(1)估计男生成绩样本数据的第80百分位和上四分位数;
(2)已知男生成绩样本数据的平均数为81,女生成绩样本数据的平均数为79,请估计总体平均数.
【考点题型七】平均数,方差性质()
【例7】(多选)(2025·山西太原·一模)已知样本数据的平均数为3,方差为3,样本数据的平均数为3,方差为6,则下列结论正确的是( )
A.数据的平均数为7
B.数据的方差为11
C.数据的平均数为3
D.数据的方差为5
【变式7-1】.(多选)(2025·贵州安顺·模拟预测)已知一组样本数据为,下列结论正确的是( )
A.若的平均数为,则的平均数为
B.若的方差为,则的方差为
C.若样本数据满足,则样本数据的极差为
D.若样本数据满足,则样本数据的分位数为
【变式7-2】.(多选)(2025·安徽·一模)已知数据的平均数为10,方差为1,且,则下列说法正确的是( )
A.数据的方差为4
B.数据的平均数为17
C.数据的平均数为10,方差大于1
D.若数据的中位数为分位数为,则
【变式7-3】.(24-25高三上·浙江宁波·期末)已知数据的平均数为3,方差为1,则数据,,,…,的平均数与方差的和为 .
【变式7-4】.(24-25高一上·北京西城·阶段练习)若,,…,的平均数为5,方差为4,则,,…,的平均数为 ;方差为 .
【考点题型八】方差的应用()
【例8】(24-25高一上·江西·阶段练习)甲、乙两名运动员参加射击选拔赛,两人在相同条件下各射击100次,组委会从两人的成绩中各随机抽取6次成绩(满分10分,8分及以上为优秀).如下表所示:
甲射击成绩
10
9
7
8
10
10
乙射击成绩
10
6
10
10
9
9
(1)以频率作为概率,估计甲、乙两人射击成绩的优秀率;
(2)分别求出甲、乙6次射击成绩的平均数与方差,以此为依据,判断哪位运动员的射击成绩更好?
【变式8-1】.(24-25高二上·四川成都·期中)庚子新春,“新冠”肆虐,面对新冠肺炎的发生,某医疗小组提出了一种治疗的新方案.为测试该方案的治疗效果,此医疗小组选取了患病程度相同的12名病人志愿者,将他们随机分成两组,每组6人.第一组用新方案治疗,第二组用旧方案治疗.统计病人的痊愈时间(单位:天)如下表:
新方案治疗
3
6
6
7
10
10
旧方案治疗
5
8
9
11
12
15
记新方案和旧方案治疗病人痊愈时间的平均数分别为和,方差分别为和.
(1)求,,,;
(2)判断新方案的治疗效果较旧方案是否有显著提高.
说明:如果,则认为新方案的治疗效果较旧方案是有显著提高,否则不认为有显著提高.
【变式8-2】.(23-24高二·上海·课堂例题)下面是甲、乙两名运动员在某次男子10米气手枪射击比赛中的得分数据(单位:环),试比较两名运动员的射击水平.
甲
9.6
9.9
9.2
9.4
9.9
10.1
10.2
9.7
9.6
9.3
10.0
10.4
10.1
9.9
乙
10.2
10.7
9.7
10.0
9.1
10.0
8.6
9.8
9.6
9.7
10.9
9.5
10.3
9.2
【变式8-3】.(23-24高二·上海·课堂例题)某果园种植了两个品种的苹果,现从两个品种中各随机抽取10个,测得它们的质量(单位:g)分别为:
甲品种/g
203
185
190
192
185
192
179
193
195
186
乙品种/g
192
184
195
187
196
196
183
186
192
189
问:哪个品种的苹果质量更均匀?
【变式8-4】.(23-24高一下·安徽亳州·期末)某校高一(1)班、(2)班的学生人数分别为40,42,在某次测验中,记(1)班所有学生的成绩分别为,,…,,平均成绩为,方差为,已知,.
(1)求,;
(2)记(2)班所有学生的成绩分别为,,…,,其平均成绩为82,,试求两个班的所有学生的平均成绩(结果保留整数),并说明哪一个班的成绩比较稳定.
【考点题型九】分层抽样中的方差()
【例9】(23-24高一下·甘肃兰州·期中)某中学名学生参加全市高中数学竞赛,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了名学生,记录他们的分数,将数据分成组:,并整理得到如下频率分布直方图:
(1)根据频率分布直方图求出分数大于的频率与频数;
(2)根据频率分布直方图求样本中分位数;
(3)已知样本中男生与女生的比例是,男生样本的均值为,方差为,女生样本的均值为,方差为,请计算样本的均值与方差.
【变式9-1】.(24-25高一上·全国·课后作业)某快餐店统计了近100天内每日接待的顾客人数,将前50天的数据进行整理得到频率分布表和频率分布直方图.
组别
分组
频数
频率
第1组
[20,30)
4
0.08
第2组
[30,40)
a
第3组
[40,50)
20
b
第4组
[50,60)
0.32
第5组
[60,70)
4
0.08
合计
50
1.00
(1)求a,b,c的值,并估计该快餐店在前50天内每日接待的顾客人数的平均数;
(2)已知该快餐店在前50天内每日接待的顾客人数的方差为104,在后50天内每日接待的顾客人数的平均数为51,方差为100,估计这家快餐店这100天内每日接待的顾客人数的平均数和方差.
【变式9-2】.(23-24高一下·陕西榆林·期末)某学校高一年级进行某学科的考试,所有学生的成绩做成的频率分布直方图如图所示,第一组成绩在,第二组成绩在,第三组成绩在,第四组成绩在,第五组成绩在.
(1)求图中的值;
(2)年级准备表扬在本次考试中成绩在前的同学,定为成绩优胜,估计此次考试成绩优胜的分数线;
(3)现从以上各组中用分层随机抽样的方法选取20人,进行成绩情况调研.若抽取的同学中,第二组的成绩的平均数和方差分别为65和40,第四组的成绩的平均数和方差分别为83和70,据此估计第二组和第四组抽取的所有同学中成绩的方差.
【变式9-3】.(23-24高二上·云南昆明·期末)某学校有高中学生500人,其中男生300人,女生200人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:),计算得男生样本的均值为170,方差为17,女生样本的均值为160,方差为30.
(1)根据以上信息,能够计算出总样本的均值和方差吗?为什么?
(2)如果已知男、女样本量按比例分配,你能计算出总样本的均值和方差各为多少吧?
【变式9-4】(23-24高一下·陕西西安·期末)某市为了了解人们对“中国梦”的伟大构想的认知程度,针对该市不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(95分及以上为认知程度高),结果认知程度高的有m人,按年龄分为5组,其中第一组为,第二组为,第三组为,第四组为,第五组为,得到如图所示的频率分布直方图,已知第一组有10人.
(1)根据频率分布直方图,估计这m人的平均年龄.
(2)现从以上各组中用分层随机抽样的方法抽取20人,担任本市的“中国梦”宣传使者.若第四组宣传志愿者年龄的平均数与方差为37和,第五组宣传志愿者年龄的平均数与方差为43和1,据此估计这m人中35~45所有人的年龄的方差.
提升训练
一、单选题
1.(2025·湖北武汉·二模)随着Deepseek的流行,各种AI大模型层出不穷,现有甲、乙两个AI大模型,在对甲、乙两个大模型进行深度体验后,6位评委分别对甲、乙进行打分(满分10分),得到如图所示的统计表格,则下列结论不正确的是( )
评委编号模型名称
1
2
3
4
5
6
甲
7.0
9.3
8.3
9.2
8.9
8.9
乙
8.1
9.1
8.5
8.6
8.7
8.6
A.甲得分的平均数大于乙得分的平均数 B.甲得分的众数大于乙得分的众数
C.甲得分的中位数大于乙得分的中位数 D.甲得分的方差大于乙得分的方差
2.(2025·河北张家口·二模)在某次高三模拟考试后,数学老师随机抽取了6名同学第一个解答题的得分情况如下:7,9,5,8,4,1,则这组数据的平均数和极差分别为( )
A. B. C. D.
3.(24-25高二下·浙江·期中)某人在一次考试中每门课得分如下:则数据的第百分位数为( )
A.87.5 B.85 C.90 D.100
4.(23-24高一下·云南昭通·期末)高一(1)班有学生45人,高一(2)班有学生27人,高一(3)班有学生36人,用分层抽样的方法从这三个班中抽出一部分人组成的方队,进行体操比赛,则高一(1)班、高一(2)班、高一(3)班分别被抽取的人数是( )
A.15,9,12 B.9,15,12 C.12,9,15 D.15,12,9
5.(2025·浙江温州·二模)某班级有30名男生和20名女生,现调查学生周末在家学习时长(单位:小时),得到男生样本数据的平均值为8,方差为2,女生样本数据的平均值为10.5,方差为0.75,则该班级全体学生周末在家学习时长的平均值和方差的值分别是( )
A. B.
C. D.
6.(2025·山西·二模)AI正悄然改变着我们的生活.某在线平台利用AI技术为学生提供个性化学习路径,为了解学生对平台的满意程度,随机抽取使用该平台的学生进行打分,将收集到的分数数据按照分组,画出频率分布直方图如图所示,则这些数据的中位数约为( )
A.85 B.80 C.77.5 D.75
7.(2025·贵州·二模)已知一组数据1,4,5,,3,4,5,1,,7,4的平均数为4,其中,均为正整数,则当取得最小值时,这组数据的方差为( )
A. B. C. D.
8.(2025高三·广东江苏·专题练习)一组数据满足,若去掉后组成一组新数据.则新数据与原数据相比( )
A.极差变大 B.平均数变大
C.方差变小 D.第25百分位数变小
二、多选题
9.(安徽省淮北、淮南市2025届高三下学期第二次质量检测数学试题)某校100名学生学业水平测试数学成绩的频率分布直方图如图所示,已知所有学生成绩均在区间内,则( )
A.图中的值为0.005
B.这组数据的平均数为73
C.这组数据的众数为75
D.这组数据的中位数约为71.7
10.(2025·广东揭阳·二模)洛阳是我国著名的牡丹之乡,以“洛阳地脉花最宜,牡丹尤为天下奇”流传于世.某种植基地通过植株高度研究牡丹的生长情况,从同一批次牡丹中随机抽取100株的植株高度(单位:)作为样本,得到如图所示的频率分布直方图,则下列结论正确的是( )
A.基地牡丹植株高度的极差的估计值大于50
B.基地牡丹植株高度不高于70的频率估计值为30%
C.基地牡丹植株高度的众数与中位数的估计值相等
D.基地牡丹植株高度的第75百分位数的估计值小于80
11.(24-25高二下·浙江杭州·阶段练习)投掷一枚均匀的骰子次,记录每次骰子出现的点数.根据部分统计结果,可以推断出点数至少被投掷出过次的是( )
A.第25百分位数为2,极差为4 B.平均数为3.5,第75百分位数为3.5
C.平均数为3,方差为3 D.众数为4,平均数为4.75
三、填空题
12.(2026高三·全国·专题练习)某学校统计教师职称及年龄,中级职称教师的人数为50,其平均年龄为38岁,方差是2,高级职称的教师中有3人58岁,5人40岁,2人38岁,则该校中级职称和高级职称教师年龄的平均数和方差分别为
13.(2025·新疆省直辖县级单位·模拟预测)某水产单位对其投放的网箱产量(单位:kg)进行了样本统计,得到样本数据的频率分布直方图如下图所示,请根据频率分布直方图估计该水产单位所有网箱产量的72%分位数为 kg.
14.(2025·上海闵行·二模)已知数据的平均数为2,方差为5,则的平均数为 .
四、解答题
15.(24-25高一下·甘肃兰州·阶段练习)某校从高二年级学生中随机抽取60名学生,将期中考试的政治成绩(均为整数)分成六段:,,,…,后得到如下频率分布直方图(同一组中的数据用组中值作代表).
(1)根据频率分布直方图求众数;
(2)用分层抽样的方法在各分数段的学生中抽取一个容量为20的样本,则在分数段抽取的人数是多少?
16.(24-25高二下·上海青浦·期中)某同学为了解我国文化教育普及程度,收集了我国部分省级行政区15岁及以上男性和女性的文盲人口比重(%)情况,经统计得到如下的茎叶图.
(1)根据茎叶图判断男性样本数据和女性样本数据的离散程度,并求离散程度较小的样本数据的第80百分位数;
(2)若女性样本数据的极差为12.7,求该样本数据的平均数与方差;(结果精确到0.1)
(3)为了调查今年某地区15岁及以上男性和女性文盲人口情况,研究小组准备采用分层随机抽样方法抽取5000人进行调查.已知该地区15岁及以上的男性约有4.2百万人,女性约有3.8百万人.分别求出抽取的男性人数和女性人数.
17.(22-23高一下·云南昭通·期末)为了解某校高一年级学生数学学习的阶段性表现,年级组织了一次阶段测试.已知此次考试共有450名学生参加,考试成绩的频率分布直方图如图所示(同一组中的数据以该区间的中点值为代表).
(1)求a的值;
(2)估计这次数学考试成绩的众数、中位数和平均数(结果保留两位小数);
(3)估计该校学生的数学成绩的第70百分位数(结果保留两位小数).
18.(24-25高二上·四川成都·阶段练习)某校高一年级有男生200人,女生100人.为了解该校全体高一学生的身高信息,按性别比例进行分层随机抽样,抽取总样本为30的样本,并观测样本的指标值(单位:cm),计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据;
抽取次序
1
2
3
4
5
6
7
8
9
10
身高
155
158
156
157
160
161
159
162
169
163
记抽取的第个女生的身高为,样本平均数,方差.
参考数据:,,.
(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身高在范围内的人数;
(2)用总样本平均数和标准差分别估计该校高一学生总体身高的平均数和标准差,求,的值.
19.(23-24高一下·广东深圳·阶段练习)2023年10月22日,汉江生态城2023襄阳马拉松在湖北省襄阳市成功举行,志愿者的服务工作是马拉松成功举办的重要保障,襄阳市新时代文明实践中心承办了志愿者选拔的面试工作.现随机抽取了100名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为0.3,第一组和第五组的频率相同.
(1)估计这100名候选者面试成绩的平均数和第25百分位数;
(2)现从以上各组中用分层随机抽样的方法选取20人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为72和30,第四组面试者的面试成绩的平均数和方差分别为90和60,据此估计这次第二组和第四组所有面试者的面试成绩的方差.
3 / 3
学科网(北京)股份有限公司
$$