内容正文:
第14章 统计 易错训练与压轴训练
01 目录
易错题型一 随机数表法取数时忽略了重复数字需跳过 1
易错题型二 忽视中位数需先从小到大排序,而是直接找中间的数而致错 2
易错题型三 总体百分位数忽略了将数据从小到大排序 2
压轴题型一分层抽样均值与方差 3
02 易错题型
易错题型一 随机数表法取数时忽略了重复数字需跳过
例题1:(23-24高一下·四川·期末)某企业利用随机数表对生产的60个太阳能面板进行抽样测试,先将60个太阳能面板进行编号,.从中抽取12个样本,下图提供随机数表的第6行至第8行,若从表中第7行第9列开始向右读取数据,则得到的第6个样本编号是( )
12 23 43 56 77
32 21 18 34 29
78 64 54 07 32
52 42 06 44 38
35 78 90 56 42
25 30 07 32 86
23 45 58 89 07
23 18 96 08 04
84 42 12 53 31
34 57 86 07 36
34 89 94 83 75
32 56 78 08 43
67 89 53 55 77
22 53 55 78 32
45 77 89 23 45
A.07 B.18 C.23 D.08
例题2:(23-24高一下·陕西咸阳·阶段练习)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,,649,650.从中抽取50个样本,如图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第4个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.007 B.253 C.328 D.860
巩固训练
1.(23-24高一下·云南昆明·阶段练习)总体由编号为01,02,…,39,40的40个个体组成,从中选取5个个体.利用科学计算器依次生成一组随机数如下,则选出来的第5个个体的编号为( )
66 06 58 61 54 35 02 42 35 48 96 21 14 32 52 41 52 48
A.54 B.14 C.21 D.32
2.(23-24高一上·江西景德镇·期末)国家高度重视青少年心理健康问题,某校为了调查学生的心理健康状况,决定从每班随机抽取5名学生进行调查.若某班有45名学生,将每一学生从01到45编号,从下面所给的随机数表的第2行第9列的数开始,每次从左向右选取两个数字,则选取的第三个号码为( )随机数表如图:
2512
6317
6323
2616
8045
6011
2432
5327
0941
1457
2042
5332
3732
2707
3607
7424
6762
4281
2191
3726
3890
0140
0523
2617
3014
2310
2118
A.32 B.37 C.27 D.07
易错题型二 忽视中位数需先从小到大排序,而是直接找中间的数而致错
例题1:(24-25高三上·辽宁辽阳·期末)若数据的中位数是,则的取值范围是( )
A. B. C. D.
例题2:(24-25高二上·四川雅安·阶段练习)已知数据1,3,5,7,的平均数与中位数相等,则 .
巩固训练
1.(24-25高三上·湖北十堰·期末)已知,且的中位数为1,则( )
A. B. C.1 D.
2.(24-25高三上·甘肃武威·期末)已知,,,的中位数为,则( )
A. B. C. D.1
易错题型三 总体百分位数忽略了将数据从小到大排序
例题1:(24-25高一上·河南南阳·期末)某赛季篮球运动员甲参加了13场比赛,每场比赛个人得分分别为:12,15,24,25,31,31,35,36,36,39,41,44,50.则该组数据的四分位数分别为( )
A.25,35,39 B.24,35,41
C.28,31,39 D.,35,
例题2:(24-25高一上·河南南阳·期末)将10个数据按照从小到大的顺序排列如下:7,8,13,15,17,18,18,,25,27,若该组数据的70%分位数是19,则( )
A.20 B.21 C.23 D.24
巩固训练
1.(贵州省黔南布依族苗族自治州2024-2025学年高三上学期1月期末质量监测数学试题)若样本数据10,18,a,16,24,6,8,22的平均数为14,则该样本数据的第75百分位数是 .
2.(24-25高二上·内蒙古赤峰·期末)某健康体检中心随机抽取了6位体检者的收缩压数据,分别为,则这组数据的分位数为 .
03 压轴题型
压轴题型一分层抽样均值与方差
例题1:(24-25高一上·江西南昌·期末)随着手机和网络的普及,外卖行业得到迅速的发展.某外卖平台为了解某地区用户对其提供的服务的满意度,随机调查了个用户,得到用户的满意度评分,系统自动将评分按从大到小顺序排列如下:
用户编号
评分
用户编号
评分
用户编号
评分
用户编号
评分
01
97
11
86
21
81
31
76
02
96
12
86
22
81
32
76
03
95
13
85
23
81
33
76
04
93
14
85
24
80
34
75
05
92
15
84
25
79
35
74
06
91
16
84
26
79
36
74
07
89
17
83
27
78
37
73
08
89
18
83
28
78
38
72
09
88
19
82
29
78
39
66
10
88
20
82
30
77
40
63
(1)请你估计该地区所有用户评分的,分位数;
(2)若从这个用户中抽取一个容量为的样本,有一个数据不小心丢失了,抽到的其他个用户的评分分别为,且这个数据的平均数,记这个数据的方差为,若用户的满意度评分在内,则满意度等级为“级”,试用样本估计总体的思想,根据所抽到的个数据,估计该地区满意度等级为“级”的用户所占的百分比.
(3)平台为拓展客流,开发了一个新的评价系统.把(2)中样本的平均数和方差作为老评价系统的数据,且老系统的总数据占两个系统所有数据总和的新系统得出的评分平均数为89分,方差为12.据此计算新老系统所有评分的方差.
附:;参考数据:,,.
例题2:(24-25高二上·四川成都·期中)年月日,成都市举办马拉松比赛,其中志愿者的服务工作是马拉松成功举办的重要保障.当时成都市文体广电旅游局承办了志愿者选拔的面试工作.随机抽取了名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.
(1)求的值,并估计这名候选者面试成绩的平均数;
(2)若从以上各组中用分层随机抽样的方法选取人,担任了本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为和,第四组面试者的面试成绩的平均数和方差分别为和,请据此估计这次第二组和第四组所有面试者的面试成绩的方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:,,;,,,记两组数据总体的样本平均数为.则总体样本方差.
巩固训练
1.(24-25高一上·江西宜春·阶段练习)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第75百分位数,中位数;
(2)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.(附:设两组数据的样本量、样本平均数和样本方差分别为:,,,;,,,记两组数据总体的样本平均数为.则总体样本方差.
2.(24-25高二上·湖北·期中)某地区有小学生9000人,初中生8600人,高中生4400人,教育局组织网络“防溺水”网络知识问答,现用分层抽样的方法从中抽取220名学生,对其成绩进行统计分析,得到如下图所示的频率分布直方图.
(1)成绩位列前的学生平台会生成“防溺水达人”优秀证书,试估计获得“防溺水达人”的成绩至少为多少分;
(2)已知落在内的平均成绩为67,方差是9,落在内的平均成绩是73,方差是29,求落在内的平均成绩和方差.(附:设两组数据的样本量、样本平均数和样本方差分别为:,,;,,,两组数据总体的样本平均数为,则总体样本方差)
/
学科网(北京)股份有限公司
$$
第14章 统计 易错训练与压轴训练
01 目录
易错题型一 随机数表法取数时忽略了重复数字需跳过 1
易错题型二 忽视中位数需先从小到大排序,而是直接找中间的数而致错 3
易错题型三 总体百分位数忽略了将数据从小到大排序 4
压轴题型一分层抽样均值与方差 6
02 易错题型
易错题型一 随机数表法取数时忽略了重复数字需跳过
例题1:(23-24高一下·四川·期末)某企业利用随机数表对生产的60个太阳能面板进行抽样测试,先将60个太阳能面板进行编号,.从中抽取12个样本,下图提供随机数表的第6行至第8行,若从表中第7行第9列开始向右读取数据,则得到的第6个样本编号是( )
12 23 43 56 77
32 21 18 34 29
78 64 54 07 32
52 42 06 44 38
35 78 90 56 42
25 30 07 32 86
23 45 58 89 07
23 18 96 08 04
84 42 12 53 31
34 57 86 07 36
34 89 94 83 75
32 56 78 08 43
67 89 53 55 77
22 53 55 78 32
45 77 89 23 45
A.07 B.18 C.23 D.08
【答案】D
【知识点】随机数表法
【分析】利用随机数表法来选取样本编号即可.
【详解】从第7行第9列开始向右读取数据,开始为86,不符合要求,第一个数是23,第二个数是45,第三个数是58,下一个数是89,不符合要求,第四个数是07,下一个数是23,重复,第五个数是18,下一个数是96,不符合要求,第六个数是08;
故选:D.
例题2:(23-24高一下·陕西咸阳·阶段练习)某高校对中文系新生进行体测,利用随机数表对650名学生进行抽样,先将650名学生进行编号,001,002,,649,650.从中抽取50个样本,如图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第4个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.007 B.253 C.328 D.860
【答案】A
【知识点】随机数表法
【分析】按照随机数表提供的数据,三位一组的读数,并取001到650内的数,重复的只取一次,读取到第4个即可.
【详解】从第5行第6列开始向右读取数据,
第一个数为253,第二个数是313,
第三个数是457,下一个数是860,不符合要求,
下一个数是736,不符合要求,下一个是253,重复,
第四个是007,故A正确.
故选:A.
巩固训练
1.(23-24高一下·云南昆明·阶段练习)总体由编号为01,02,…,39,40的40个个体组成,从中选取5个个体.利用科学计算器依次生成一组随机数如下,则选出来的第5个个体的编号为( )
66 06 58 61 54 35 02 42 35 48 96 21 14 32 52 41 52 48
A.54 B.14 C.21 D.32
【答案】B
【知识点】随机数表法
【分析】根据随机数表法可得结果.
【详解】生成的随机数中落在编号01,02,…,39,40内的依次有06,35,02,35(重复),
21,14,32,故第5个编号为14,
故选:B.
2.(23-24高一上·江西景德镇·期末)国家高度重视青少年心理健康问题,某校为了调查学生的心理健康状况,决定从每班随机抽取5名学生进行调查.若某班有45名学生,将每一学生从01到45编号,从下面所给的随机数表的第2行第9列的数开始,每次从左向右选取两个数字,则选取的第三个号码为( )随机数表如图:
2512
6317
6323
2616
8045
6011
2432
5327
0941
1457
2042
5332
3732
2707
3607
7424
6762
4281
2191
3726
3890
0140
0523
2617
3014
2310
2118
A.32 B.37 C.27 D.07
【答案】C
【知识点】随机数表法
【分析】利用随机数表法,按照给定条件一次选取符合要求的号码即可.
【详解】从随机数表第2行第9列的数开始,每次从左向右选取两个数字,去掉超过45和重复的号码,选取的前3个数依次为32、37、27,故选取的第三个号码为27.
故选:C
易错题型二 忽视中位数需先从小到大排序,而是直接找中间的数而致错
例题1:(24-25高三上·辽宁辽阳·期末)若数据的中位数是,则的取值范围是( )
A. B. C. D.
【答案】B
【知识点】计算几个数的中位数、用中位数的代表意义解决实际问题
【分析】根据中位数的概念求解.
【详解】因为数据的中位数是,
所以,即的取值范围为.
故选:B.
例题2:(24-25高二上·四川雅安·阶段练习)已知数据1,3,5,7,的平均数与中位数相等,则 .
【答案】4或9
【知识点】计算几个数的中位数、计算几个数的平均数、根据平均数求参数
【分析】根据平均数、中位数的定义,结合平均数与中位数相等分情况讨论求解即可.
【详解】数据的平均数为,
若,则中位数为5,即,解得,符合题意;
若,则中位数为,则,解得,符合题意;
若,则中位数为3,则,解得,不符合题意;
所以或.
故答案为:4或9.
巩固训练
1.(24-25高三上·湖北十堰·期末)已知,且的中位数为1,则( )
A. B. C.1 D.
【答案】B
【知识点】计算几个数的中位数
【分析】先根据题意判断出,再分别讨论和即可求解.
【详解】因为,所以,又的中位数为1,所以,
当时,分别为,则中位数为,不符合题意;
当时,,则中位数为,解得.
故选:B
2.(24-25高三上·甘肃武威·期末)已知,,,的中位数为,则( )
A. B. C. D.1
【答案】A
【知识点】计算几个数的中位数
【分析】根据中位数为求出的取值范围,即可确定四个数的大小关系,列方程即可求解.
【详解】∵,,,共四个数,中位数为,,,
∴,∴,
∴,
∴,解得.
故选:A.
易错题型三 总体百分位数忽略了将数据从小到大排序
例题1:(24-25高一上·河南南阳·期末)某赛季篮球运动员甲参加了13场比赛,每场比赛个人得分分别为:12,15,24,25,31,31,35,36,36,39,41,44,50.则该组数据的四分位数分别为( )
A.25,35,39 B.24,35,41
C.28,31,39 D.,35,
【答案】A
【知识点】总体百分位数的估计
【分析】根据给定条件,利用四分位数的定义埏判断即可.
【详解】由,
得该组数据的四分位数分别为第4,7,10位置数字,即25,35,39.
故选:A
例题2:(24-25高一上·河南南阳·期末)将10个数据按照从小到大的顺序排列如下:7,8,13,15,17,18,18,,25,27,若该组数据的70%分位数是19,则( )
A.20 B.21 C.23 D.24
【答案】A
【知识点】总体百分位数的估计
【分析】根据百分位的定义计算即可求解.
【详解】因为,所以该组数据的70%分位数是第7个数据和第8个数据的平均数,
所以,解得.
故选:A.
巩固训练
1.(贵州省黔南布依族苗族自治州2024-2025学年高三上学期1月期末质量监测数学试题)若样本数据10,18,a,16,24,6,8,22的平均数为14,则该样本数据的第75百分位数是 .
【答案】20
【知识点】根据平均数求参数、总体百分位数的估计
【分析】先根据平均数得,排序后根据求百分位数的方法可得.
【详解】由平均数的计算公式得,解得.
将样本数据按从小到大的顺序排列得,数据中,
则第75百分位数为.
故答案为:20
2.(24-25高二上·内蒙古赤峰·期末)某健康体检中心随机抽取了6位体检者的收缩压数据,分别为,则这组数据的分位数为 .
【答案】
【知识点】总体百分位数的估计
【分析】应用百分位数的定义求分位数.
【详解】由题设,6位体检者数据从小到大依次为,
又,故这组数据的分位数为第三个数据.
故答案为:
03 压轴题型
压轴题型一分层抽样均值与方差
例题1:(24-25高一上·江西南昌·期末)随着手机和网络的普及,外卖行业得到迅速的发展.某外卖平台为了解某地区用户对其提供的服务的满意度,随机调查了个用户,得到用户的满意度评分,系统自动将评分按从大到小顺序排列如下:
用户编号
评分
用户编号
评分
用户编号
评分
用户编号
评分
01
97
11
86
21
81
31
76
02
96
12
86
22
81
32
76
03
95
13
85
23
81
33
76
04
93
14
85
24
80
34
75
05
92
15
84
25
79
35
74
06
91
16
84
26
79
36
74
07
89
17
83
27
78
37
73
08
89
18
83
28
78
38
72
09
88
19
82
29
78
39
66
10
88
20
82
30
77
40
63
(1)请你估计该地区所有用户评分的,分位数;
(2)若从这个用户中抽取一个容量为的样本,有一个数据不小心丢失了,抽到的其他个用户的评分分别为,且这个数据的平均数,记这个数据的方差为,若用户的满意度评分在内,则满意度等级为“级”,试用样本估计总体的思想,根据所抽到的个数据,估计该地区满意度等级为“级”的用户所占的百分比.
(3)平台为拓展客流,开发了一个新的评价系统.把(2)中样本的平均数和方差作为老评价系统的数据,且老系统的总数据占两个系统所有数据总和的新系统得出的评分平均数为89分,方差为12.据此计算新老系统所有评分的方差.
附:;参考数据:,,.
【答案】(1),
(2)
(3)
【知识点】计算几个数据的极差、方差、标准差、总体百分位数的估计、根据平均数求参数、平均数的和差倍分性质
【分析】(1)根据百分位数的定义求解即可;
(2)先根据平均数的计算公式求出丢失的数据,再计算方差,根据评分范围求解即可;
(3)根据平均数和参考中方差的计算公式求解即可.
【详解】(1)由表可知这个用户评分按从小到大排列如下:,,,,,,,,
,,,,,,,,,,,,,,,,
,,,,,,,,,,,,,,, ,
因为,,
所以这个用户评分的,分位数分别为第项数据和第项和第项数据的平均数,
分别为,,据此估计该地区所有用户评分的,分位数分别约为和.
(2)设丢失数据为,
则,解得,
所以
,
由题意知评分在,即内的满意度等级为“级”,
样本中评分在内的有人,
则可估计该地区满意度等级为“级”的用户所占的百分比约为.
(3)由题意,,,,
因为老系统的10个数据占两个系统所有数据总和的
所以,,
即新老系统所有评分的方差为.
例题2:(24-25高二上·四川成都·期中)年月日,成都市举办马拉松比赛,其中志愿者的服务工作是马拉松成功举办的重要保障.当时成都市文体广电旅游局承办了志愿者选拔的面试工作.随机抽取了名候选者的面试成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示的频率分布直方图.
(1)求的值,并估计这名候选者面试成绩的平均数;
(2)若从以上各组中用分层随机抽样的方法选取人,担任了本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为和,第四组面试者的面试成绩的平均数和方差分别为和,请据此估计这次第二组和第四组所有面试者的面试成绩的方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:,,;,,,记两组数据总体的样本平均数为.则总体样本方差.
【答案】(1);
(2)
【知识点】由频率分布直方图估计平均数、计算频率分布直方图中的方差、标准差
【分析】(1)根据频率分布直方图的概率乘以组距等于,可求得,根据频率分布直方图中平均数的计算方法即可求解;
(3)先计算出第二组和第四组所有面试者的面试成绩的平均数,由题意,再根据分层抽样的方差公式求解即可.
【详解】(1)由图得,
解之可得;
根据题意知,
(2)设第二组、第四组所有面试者的面试成绩的平均数、方差分别为
,,
且两组的频率之比为,
则第二组和第四组所有面试者的面试成绩的平均数为,
第二组和第四组所有面试者的面试成绩的方差为,
,
则第二组和第四组所有面试者的面试成绩的方差为.
巩固训练
1.(24-25高一上·江西宜春·阶段练习)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第75百分位数,中位数;
(2)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.(附:设两组数据的样本量、样本平均数和样本方差分别为:,,,;,,,记两组数据总体的样本平均数为.则总体样本方差.
【答案】(1);第75百分位数为84,中位数为75.
(2)总平均数为;总方差为
【知识点】计算几个数据的极差、方差、标准差、总体百分位数的估计、由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计中位数
【分析】(1)根据每组小矩形的面积之和为1即可求解;由频率分布直方图求百分位数的计算公式即可求解;
(2)根据分层抽样的平均数和方差的计算公式即可求解.
【详解】(1)因为每组小矩形的面积之和为1,
所以,
解得.
成绩落在内的频率为,
落在内的频率为,
设第75百分位数为m,则,
由,得,所以样本成绩的第75百分位数为84.
成绩落在[40,70)内的频率为,
成绩落在内的频率为,
故中位数在[70,80)内,由,所以样本成绩的中位数为75.
(2)由图可知,成绩在的市民人数为,
成绩在的市民人数为,
故这两组成绩的总平均数为,
由样本方差计算总体方差公式可得总方差为:
.
2.(24-25高二上·湖北·期中)某地区有小学生9000人,初中生8600人,高中生4400人,教育局组织网络“防溺水”网络知识问答,现用分层抽样的方法从中抽取220名学生,对其成绩进行统计分析,得到如下图所示的频率分布直方图.
(1)成绩位列前的学生平台会生成“防溺水达人”优秀证书,试估计获得“防溺水达人”的成绩至少为多少分;
(2)已知落在内的平均成绩为67,方差是9,落在内的平均成绩是73,方差是29,求落在内的平均成绩和方差.(附:设两组数据的样本量、样本平均数和样本方差分别为:,,;,,,两组数据总体的样本平均数为,则总体样本方差)
【答案】(1)88分
(2)平均成绩为76,方差为12
【知识点】估计总体的方差、标准差、总体百分位数的估计
【分析】(1)根据百分位数的计算公式,即可求即可,
(2)计算频率,即可得比例,即可根据总体方差的计算公式求解.
【详解】(1)前4组的频率之和为,
前5组的频率之和为,
第分位数落在第5组,设为,则,解得.
“防溺水达人”的成绩至少为88分.
(2)的频率为0.15,的频率为0.30,所以
的频率与的频率之比为
的频率与的频率之比为
设内的平均成绩和方差分别为,
依题意有,解得,
,解得
所以内的平均成绩为76,方差为12.
/
学科网(北京)股份有限公司
$$