专题13 统计的综合应用(7大题型)-2024-2025学年高一数学下学期期末必考题型归纳及过关测试(苏教版2019)

2025-05-22
| 2份
| 50页
| 283人阅读
| 10人下载
冠一高中数学精品打造
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 高中数学苏教版必修 第二册
年级 高一
章节 -
类型 题集-专项训练
知识点 统计
使用场景 同步教学-期末
学年 2025-2026
地区(省份) 江苏省
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 5.28 MB
发布时间 2025-05-22
更新时间 2025-05-22
作者 冠一高中数学精品打造
品牌系列 -
审核时间 2025-05-22
下载链接 https://m.zxxk.com/soft/52226681.html
价格 3.00储值(1储值=1元)
来源 学科网

内容正文:

专题13 统计的综合应用 【题型归纳目录】 题型一:随机数表法 题型二:分层抽样 题型三:频率分布直方图 题型四:计算一些数据的平均数、方差、众数、中位数、百分位数 题型五:样本估计总体 题型六:分层方差的计算 题型七:平均数、方差的性质 【知识点梳理】 1、统计的相关概念 (1)普查 像人口普查这样,对每一个调查对象都进行调查的方法,称为全面调查,又称普查. (2)总体、个体 在一个调查中,我们把调查对象的全体称为总体.组成总体的每一个调查对象称为个体.为了强调调查目的,也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体. (3)抽样调查 根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查. (4)样本、样本量 我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量. 2、简单随机抽样 一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.除非特殊声明,本章所称的简单随机抽样指不放回简单随机抽样. 3、简单随机抽样的方法 (1)抽签法: 把总体中的N个个体编号,把编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需的个数. (2)随机数法: 用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需的个数. ①用随机试验生成随机数; ②用信息技术生成随机数; ③用计算器生成随机数; ④用电子表格软件生成随机数; ⑤用R统计软件生成随机数. 4、总体均值 一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称 为总体均值,又称总体平均数. 如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式 5、样本均值 如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称 为样本均值,又称样本平均数. 探究:总体均值与样本均值有何区别与联系? 答案:(1)区别:当总体中个体较多时,总体均值不易计算,样本均值比较方便计算.总体均值是一个确定的数,样本均值具有随机性. (2)联系:在简单随机抽样中,我们常用样本均值估计总体均值. 6、分层抽样定义 一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫分层抽样. 7、分层抽样适用范围 当总体是由差异明显的几个部分组成时,往往采用分层抽样. 8、分层抽样的步骤 (1)根据已掌握的信息,将总体分成若干部分. (2)根据总体中的个体数N和样本容量n计算出抽样比k=. (3)根据抽样比k计算出各层中应抽取的个体数:·Ni (其中Ni为第i层所包含的个体总数). (4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n的样本. 9、两种抽样方法的区别和联系 类别 共同点 各自特点 相互联系 适用范围 简单随机抽样 抽样过程中各个个体被抽到的机会相等,且都是不放回抽取 从总体中逐个抽取 最基本的抽样方法 总体容量较少 分层抽样 抽样过程中各个个体被抽到的机会相等,且都是不放回抽取 将总体分成几部分,每一部分按比例抽取 每层抽样时采用简单随机抽样 总体由差异明显的若干部分组成 10、获取数据的途径 统计学是通过收集数据和分析数据来认识未知现象的,因此如何收集数据,像统计报表和年鉴、社会调查、普查和抽样、互联网、试验设计等等都是常见的. (1)通过调查获取数据 适用范围:对于有限总体问题,一般通过抽样调查或普查的方法获取数据. 注意事项:充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误. (2)通过试验获取数据. 适用范围:没有现存的数据可以查询,就需要通过对比试验的方法去获取样本观测数据. 注意事项:严格控制试验环境,通过精心的设计安排试验,以提高数据质量,为获得好的分析结果奠定基础. (3)通过观察获取数据. 适用范围:自然现象. 注意事项:需要专业测量设备获取观测数据. (4)通过查询获得数据. 适用范围:二手数据. 注意事项:数据来历和渠道多样,所以质量会参差不齐,必须根据问题背景知识“清洗”数据,去伪存真. 11、频率分布直方图绘制步骤 ①求极差,即一组数据中的最大值与最小值的差. ②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”. ③将数据分组. ④列频率分布表.计算各小组的频率,第i组的频率是. ⑤画频率分布直方图.其中横轴表示分组,纵轴表示,实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度. 12、频率分布直方图意义:各个小长方形的面积表示相应各组的频率,频率分布直方图以面积的形式反映数据落在各个小组的频率的大小,各小长方形的面积的总和等于1. 13、总体取值规律的估计:我们可以用样本观测数据的频率分布估计总体的取值规律. 14、频率分布直方图的特征:当频率分布直方图的组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原式数据信息;当频率分布直方图的组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易从中看出总体数据的分布特点. 15、常见的其他统计图:条形图、扇形图、折线图. 扇形图主要用于直观描述各类数据占总数的比例; 条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率; 折线图主要用于描述数据随时间的变化趋势. 16、各个统计图特点 (1)不同的统计图在表示数据上有不同的特点.如扇形图主要用于直观描述各类数据占总数的比例,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,折线图主要用于描述数据随时间的变化趋势. (2)不同的统计图适用的数据类型也不同.如条形图适用于描述离散型的数据,直方图适用于描述连续性数据. 17、第p百分位数的定义 一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值. 18、计算第百分位数的步骤 第1步:按从小到大排列原始数据. 第2步:计算. 第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第项数据的平均数. 19、四分位数 常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等. 20、众数、中位数、平均数定义 (1)众数:一组数据中重复出现次数最多的数. (2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数据的中位数. (3)平均数:如果个数,那么叫做这个数的平均数. 21、频率分布直方图中的众数、中位数、平均数 ①在频率分布直方图中,众数是最高矩形中点的横坐标; ②中位数左边和右边的直方图的面积应该相等; ③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 12、方差、标准差的定义 一组数据,用表示这组数据的平均数,则这组数据的方差为,标准差为. 23、总体方差、总体标准差的定义 如果总体中所有个体的变量值分别为,总体平均数为,则称为总体方差,为总体标准差.如果总体的个变量值中,不同的值共有个,记为,,其中出现的频数为,则总体方差为. 24、样本方差、样本标准差的定义 如果一个样本中个体的变量值分别为,样本平均数为,则称为样本方差,为样本标准差. 25、方差、标准差特征 标准差、方差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差. 【典型例题】 题型一:随机数表法 【典例1-1】(24-25高二上·新疆喀什·期中)从某班57名同学中选出4人参加户外活动,利用随机数表法抽取样本时,先将57名同学按01、02、…、57进行编号,然后从随机数表第一行的第7列和第8列数字开始往右依次选取两个数字,则选出的第4个同学的编号为(    ) 0347 4373 8636 9647 3661 4698 6371 6297 7424 6292 4281 1457 2042 5332 3732 1676 (注:表中的数据为随机数表第一行和第二行) A.24 B.36 C.42 D.52 【答案】A 【解析】从随机数表第一行第列和第列数字开始往右依次选:、、、, 选出的第4个同学的编号为24. 故选:A. 【典例1-2】(24-25高二上·黑龙江哈尔滨·阶段练习)总体由编号01,02,…,29,30的30个个体组成,利用下面的随机数选取6个个体,选取方法是从如下随机数的第1行的第6列和第7列数字开始由左向右依次选取两个数字,则选出来的第6个个体的编号为(    ) 第1行  78  16  62  32  08  02  62  42  62  52  53  69  97  28  01  98 第2行  32  04  92  34  49  35  82  00  36  23  48  69  69  38  74  81 A.27 B.26 C.25 D.19 【答案】D 【解析】从第1行的第6列和第7列数字开始由左向右依次选取两个数,符合条件的编号依次有23,20,26,24,25,19,03,…, 故第6个个体编号为19. 故选:D 【变式1-1】(23-24高一下·四川·期末)某企业利用随机数表对生产的60个太阳能面板进行抽样测试,先将60个太阳能面板进行编号,.从中抽取12个样本,下图提供随机数表的第6行至第8行,若从表中第7行第9列开始向右读取数据,则得到的第6个样本编号是(    ) 12 23 43 56 77 32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 35 78 90 56 42 25 30 07 32 86 23 45 58 89 07 23 18 96 08 04 84 42 12 53 31 34 57 86 07 36 34 89 94 83 75 32 56 78 08 43 67 89 53 55 77 22 53 55 78 32 45 77 89 23 45 A.07 B.18 C.23 D.08 【答案】D 【解析】从第7行第9列开始向右读取数据,开始为86,不符合要求,第一个数是23,第二个数是45,第三个数是58,下一个数是89,不符合要求,第四个数是07,下一个数是23,重复,第五个数是18,下一个数是96,不符合要求,第六个数是08; 故选:D. 【变式1-2】(23-24高一下·山西太原·期末)某场乒乓球单打比赛按三局两胜的赛制进行,甲乙两人参加比赛.已知每局比赛甲获胜的概率为0.4,乙获胜的概率为0.6.现用计算机产生1~5之间的整数随机数,当出现1或2时,表示此局比赛甲获胜,当出现3,4或5时,表示此局比赛乙获胜.在一次试验中,产生了20组随机数如下: 534  123  512  114  125  334  432  332  314  152 423  443  423  344  541  453  525  151  354  345 根据以上数据,利用随机模拟试验,估计甲获得冠军的概率为(    ) A.0.24 B.0.3 C.0.7 D.0.76 【答案】B 【解析】根据题意,在20组随机数中,表示甲获胜的有:123,512,114,125,152,151,共6种情况, 所以可估计甲获得冠军的概率为. 故选:B. 题型二:分层抽样 【典例2-1】(24-25高一下·甘肃兰州·期中)一个公司共有名210员工,要采用分层抽样方法从全体员工中抽取一个容量为30的样本.已知某部门有70名员工,那么从这一部门抽取的员工人数为(   ) A.9 B.6 C.10 D.8 【答案】C 【解析】设所求为,则,解得. 故选:C. 【典例2-2】(24-25高一下·甘肃张掖·期中)某学校有教师人,男学生人,女学生人.现用分层抽样的方法从全体师生中抽取一个容量为的样本,已知从女学生中抽取的人数为,则的值为(      ) A. B. C. D. 【答案】B 【解析】由题得,,解得, 故选:B. 【变式2-1】(24-25高一下·甘肃白银·期中)一个志愿者组织有成员45人,40岁以上的成员有25人,如果按照年龄进行分层随机抽样,要抽取一个容量为18的样本,则应抽取40岁以上成员的人数为(   ) A.12 B.10 C.8 D.6 【答案】B 【解析】因为分层抽样的抽取比例为,所以应抽取40岁以上成员的人数为. 故选:B 【变式2-2】(24-25高一上·甘肃甘南·期末)某单位有员工500人,青年员工、中年员工、老年员工的人数分别为300人, 150人和50人,在一项调查中需要按照年龄层次进行分层抽样,若抽出的青年职工为30人,则抽出的老年职工的人数为(    ) A.5 B.15 C.30 D.50 【答案】A 【解析】设抽出的样本总人数为人,则由题意可得 ,解得, 所以抽出的老年职工的人数为人. 故选:A 题型三:频率分布直方图 【典例3-1】(23-24高一下·广东潮州·期末)某校为了解全校高中学生五一小长假参加实践活动的情况,抽查了100名学生,统计他们假期参加实践活动的时间,绘成的频率分布直方图如图所示.这100名学生中参加实践活动时间在4~10小时内的人数为 . 【答案】82 【解析】依题意,100名学生中参加实践活动的时间在4~10小时内的人数为: , 即这100名学生中参加实践活动时间在4~10小时内的人数为82. 故答案为:82. 【典例3-2】(2024·河北石家庄·三模)为了解全市高三学生的体能素质情况,在全市高三学生中随机抽取了1000名学生进行体能测试,并将这1000名学生的体能测试成绩整理成如下频率分布直方图.则直方图中实数的值为 . 【答案】 【解析】由直方图可知:组距为, 所以, 解得. 故答案为:. 【变式3-1】(2024高三·全国·专题练习)为贯彻五育并举的教育方针,某校对全体高一年级学生进行了体育测试,并将成绩(单位:分)分为6组:加以统计,得到如图所示的频率分布直方图.已知高一年级共有750名同学参加测试,则成绩达标的(不少于60分)学生人数为 . 【答案】600 【解析】根据频率分布直方图,成绩不低于60分的频率为, 可知该体育测试成绩不少于60分的学生人数为. 故答案为: 【变式3-2】(23-24高一上·辽宁沈阳·期末)在某市高一年级举行的一次数学调研考试中,为了了解考生的成绩状况,现抽取了样本容量为n的部分学生成绩,作出如图所示的频率分布直方图(所有考生成绩均在,按照,,,,分组),若在样本中,成绩在的人数为50,则成绩在的人数为 . 【答案】30 【解析】依题意,,得, 所以成绩在的人数为. 故答案为:30 题型四:计算一些数据的平均数、方差、众数、中位数、百分位数 【典例4-1】(24-25高二上·四川成都·期中)2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是(   ) A.该组数据的第60百分位数为7.5 B.该组数据的极差为5 C.该组数据的平均数为7.5 D.该组数据的中位数为7 【答案】C 【解析】A选项:,因此该组数据的第60百分位数为,故A正确; B选项:该组数据最大为9,最小为4,因此极差为,故B正确; C选项:该组数据的平均数为,故C错误; D选项:该组数据的中位数为第五个和第六个数据的平均值7,故D正确, 故选:C. 【典例4-2】(2024·广东广州·模拟预测)已知数据,且满足,若去掉,后组成一组新数据,则新数据与原数据相比,有可能变大的是(   ) A.平均数 B.中位数 C.极差 D.方差 【答案】A 【解析】由于,所以原来的极差为,新数据的极差为,故极差变小, 原来和新数据的中位数均为,故中位数不变, 去掉,后,数据波动性变小,故方差变小, 因此可能变大的是平均数,比如,原数据的平均数为6.6,去掉1和12后, 新数据的平均数为,但,故A正确. 故选:A 【变式4-1】(23-24高一下·新疆·期末)已知在高考前最后一次模拟考试中,高三某班8名同学的物理成绩分别为84,79,84,86,95,84,87,93,则该组数据的平均数和众数分别是(    ) A.86,84 B.84.5,85 C.85,84 D.86.5,84 【答案】D 【解析】将样本数据按升序排列为79,84,84,84,86,87,93,95,可得平均数, 因为84出现了三次,且次数最多,所以众数为84. 故选:D 【变式4-2】(23-24高一下·黑龙江大庆·期末)一个同学投掷10次骰子,记录出现的点数,根据统计结果,在下列情况中一定不能出现点数6的是(    ) A.平均数为3,中位数为4 B.中位数为4,众数为3 C.平均数为2,方差为2.1 D.中位数为3,方差为0.85 【答案】C 【解析】对于A,10次点数为符合题意,故A错误; 对于B,10次点数为符合题意,故B错误 ; 对于C,设10次点数为,且,平均数为, 假设有一次点数为6,不妨设, 由方差公式, 代入,,, 则,则最大取4, 不妨设,则,方程无解,故, 当,,最大取3, 不妨设,则,则, 则这10次点数为,但平均数为,不合题意,故; 当时,,方程无解,故; 当时,,方程无解, 综上所述,假设有一次点数为6不成立,故C正确; 对于D,10次点数为符合题意,故D错误 ; 故选:C. 【变式4-3】(2025·贵州铜仁·三模)在处理一组数据时,若未计入数值9,计算所得的平均值为9,方差为3.若将数值9纳入分析,则该组数据(    ) A.平均数等于9,方差等于3 B.平均数等于9,方差小于3 C.平均数大于9,方差小于3 D.平均数小于9,方差大于3 【答案】B 【解析】设末计入9时的数据有个,这些数的和为, 那么加入9后,数据总和为,数据个数变为,新的平均数为. 根据方差公式,加入9后,,且分母增大,所以方差变小. 故选:B. 题型五:样本估计总体 【典例5-1】(24-25高一下·甘肃白银·期中)某校高一学生有2000名,为了了解高一学生的体能情况,该校随机抽取部分学生进行1分钟跳绳测试,将所得数据整理后,将得到的数据按,分为5组,画出频率分布直方图,如图所示. (1)求的值; (2)若跳绳次数不少于115为达标,估计该校全体高一学生达标的人数; (3)估计该校全体高一学生跳绳次数的平均数.(同一组中的数据用该组区间的中点值作为代表) 【解析】(1)由图可得,得. (2)样本中的达标率为, 则估计该校全体高一学生达标的人数为. (3)估计该校全体高一学生跳绳次数的平均数为. 【典例5-2】(24-25高一下·甘肃兰州·期中)兴隆山自然保护区位于兰州市东南公里的榆中县境内,年建立,年批准为国家级自然保护区,总面积公顷.是国家“”级旅游胜地,在一片绿海碧涛之中,著名的栖云山景区、马衔山景区、官滩沟景区等三十余处景点,宛如玛瑙镶嵌在翠玉之上,光彩夺目.现为更好地提升旅游品质,兴隆山风景区的工作人员随机选择名游客对景区进行满意度评分(满分分),根据评分,制成如图所示的频率分布直方图. (1)根据频率分布直方图,求的值; (2)估计这名游客对景区满意度评分的分位数和平均数(得数保留两位小数). 【解析】(1)由图知:,可得. (2)由, 所以分位数在区间内,令其为, 则,解得. 所以满意度评分的分位数约为. 由频率分布直方图可知,平均数为. 【变式5-1】(22-23高一下·云南昭通·期末)为了解某校高一年级学生数学学习的阶段性表现,年级组织了一次阶段测试.已知此次考试共有450名学生参加,考试成绩的频率分布直方图如图所示(同一组中的数据以该区间的中点值为代表). (1)求a的值; (2)估计这次数学考试成绩的众数、中位数和平均数(结果保留两位小数); (3)估计该校学生的数学成绩的第70百分位数(结果保留两位小数). 【解析】(1)由,解得. (2)由频率分布直方图知:众数为65,设中位数为x, 因为,,故中位数位于内, 则有,解得. 所以中位数为67.69. 这次数学考试的平均成绩为 . (3)成绩小于70分所占的比例为, 成绩小于80分所占的比例为, 所以第70的分位数在内, 所以第70的分位数为. 【变式5-2】(24-25高一上·湖南邵阳·期末)某校高一(三)班数学研究小组随机抽取100名同学,获得了他们一周课外锻炼时长(单位:小时)的数据,并整理得到相应的频数分布表和频率分布直方图,如表(一),图(一)所示 组号 分组 频数 1 5 2 7 3 13 4 18 5 27 6 a 7 9 8 4 9 4 合计 100 表(一) 结合以上信息,回答下列问题: (1)求a,b的值; (2)假设同一组中的每个数据可用该组对应区间的中点值代替,试估计样本中的100名同学该周课外锻炼时长的平均数; (3)试估计样本中的100名同学该周课外锻炼时长的中位数.(保留三位有效数字) 【解析】(1)由表(一)可知:,解得; 位于区间的频数为,则频率为,所以. (2)样本中的100名同学该周课外锻炼时长的平均数为: . (3)设样本中的100名同学该周课外锻炼时长的中位数为, 由表(一)可知,位于区间的频率为,位于区间的频率为, 所以中位数位于区间, 所以,. 因此,估计样本中的100名同学该周课外锻炼时长的中位数为. 题型六:分层方差的计算 【典例6-1】(24-25高一下·江西抚州·期中)某地举办了“防电信诈骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,,得到如图所示的频率分布直方图. (1)求频率分布直方图中的值及样本成绩的第80百分位数; (2)已知落在区间的样本平均成绩是57,方差是7,落在区间的样本平均成绩为66,方差是4,求两组样本成绩合并后的平均数和方差. 参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,,;,,记总的样本平均数为,样本方差为,则. 【解析】(1)由题意知,解得; 成绩在的频率为0.65,成绩在的频率为0.9, 故第80百分位数在之间,则, 解得, 故第80百分位数为86; (2)由频率分布直方图知,这100份答卷分数在的份数为, 分数在的份数为, 所以, 总方差. 【典例6-2】(24-25高二上·贵州毕节·阶段练习)黔西一中为了提高学生对“黔西一中校史”的了解,举办了“知史爱校守初心”的知识竞赛活动,现从所有竞答试卷的卷面成绩中随机抽取100份作为样本数据,将样本答卷中分数x()的整数分成六段:,并作出如图所示的频率分布直方图. (1)求频率分布直方图中a的值; (2)求样本数据的第59百分位数; (3)已知样本数据落在的平均数是52,方差是6;落在的平均数是64,方差是3.求这两组数据的总平均数和总方差. 【解析】(1)由题意,解得; (2)由直方图知,前3组数的频率为 前4组数的频率为, 因此第59百分位数在第4组即区间上,设第59百分位数为x, 则,解得; (3)样本数据在区间的个数为,在区间上的个数为, 所以, 总方差为. 【变式6-1】(24-25高一上·辽宁抚顺·期末)2024年5月22日至5月28日是第二届全国城市生活垃圾分类宣传周,本次宣传周的主题为“践行新时尚分类志愿行”.某中学高一年级举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(单位:分,得分取正整数,满分为100分)作为样本进行统计,将成绩进行整理后,分为五组(,,,,),其中第二组的频数是第一组频数的2倍,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题: (1)求a,b的值,并估计这次竞赛成绩的中位数(同一组中的数据用该组区间的中点值作代表); (2)如果用分层抽样的方法从样本成绩为和的学生中共抽取6人,再从6人中选2人,求2人分数恰好来自同一组的概率; (3)某老师在此次竞赛成绩中抽取了10名学生的分数:,已知这10个分数的平均数,标准差,若剔除其中的75和85这两个分数,求剩余8个分数的平均数与方差. 【解析】(1)由第二组的频数是第一组的2倍,可得第二组的频率为第一组的2倍,所以, 解得 又,解得 成绩落在内的频率为:, 落在内的频率为:, 因此中位数落在区间内, 设中位数为,则,解得. 故估计这次竞赛成绩的中位数约为70.5. (2)第四组的抽取人数为4,设所抽取的人为, 第五组的抽取人数为2,设所抽取的人为, 则从中随机抽取两名学生有,,,,,,,,,,,,,,共15种情况, 记事件“抽取的两名学生在同一组”,所以事件A包含的基本事件为,,,,,,共7种情况. 所以 (3)由,得:. 又, 所以:. 剔除其中的75和85两个分数,设剩余8个数为 平均数与标准差分别为,, 则剩余8个分数的平均数:; 所以 即:. 方差: 故剩余8个分数的平均数为80,方差为37.5. 【变式6-2】(24-25高一上·辽宁沈阳·期末)某医疗单位为了迎接医师节,针对本单位不同年龄的员工举办了一次实践技能大比拼活动,满分100分(95分及以上为优秀医师),共有100人荣获“优秀医师”称号,将其按年龄分成以下五组:第一组,第二组,第三组,第四组,第五组,得到如图所示的频率分布直方图. (1)根据频率分布直方图,估计这些人的平均年龄; (2)若从第三组,第四组,第五组三组中分层抽取6人,再从这6人中随机抽取2人,求抽取的2人年龄在不同组的概率; (3)若第四组的年龄的平均数与方差分别为54和1,第五组的年龄的平均数与方差分别为66和4,据此计算这100人中第四组与第五组所有人的年龄的方差. 附: 【解析】(1)这些人的平均年龄(岁). (2)第三组,第四组,第五组的频率分别为0.3,0.2,0.1, 从这三组中分层抽取6人,则第三组抽3人,记为;第四组抽2人,记为; 第五组抽1人,记为, 样本空间,共15个样本点, 设事件为“从6人中随机抽取两人,所抽取的2人年龄在不同组”, ,共11个样本点, 所以抽取的2人年龄在不同组的概率. (3)设第四组、第五组年龄的平均数分别为,方差分别为, 则, 第四组有20人,第五组有10人,设第三组和第四组所有人的年龄平均数为,方差为, 则, . 所以这100人中第四组与第五组所有人的年龄的方差为34. 题型七:平均数、方差的性质 【典例7-1】(23-24高一下·天津滨海新·期末)已知一组数据的平均数是3.6,方差是2,则新数据的平均数是 ,方差是 . 【答案】 5.6 2 【解析】由已知得, , 所以, . 故答案为:5.6;2. 【典例7-2】(23-24高一下·吉林长春·期末)若样本数据的标准差为8,则数据的方差为 【答案】256 【解析】因为样本数据的标准差为8,则其方差为64, 故数据的方差为. 故答案为:256 【变式7-1】(24-25高一上·甘肃兰州·期末)若的方差为4,且,则新数据的标准差为 . 【答案】6 【解析】因为的方差为,, 所以的方差为,故标准差为6 故答案为:6 【变式7-2】(23-24高一下·陕西宝鸡·期末)若一组样本数据,,,的标准差为4,则数据,,,的标准差为 . 【答案】8 【解析】 样本数据 ,,,的标准差为4, 样本数据 ,,,的方差为16, 数据,,,的方差为, 所以数据 ,,,的标准差为8, 故答案为:8 【变式7-3】(23-24高一下·重庆巫山·期末)已知一组样本数据的样本平均数为3,方差为2,由生成一组新的样本数据,则新数据的平均数为 ;样本方差为 . 【答案】 7; 8. 【解析】因为数据的样本平均数为3,方差为2, 所以数据的样本平均数为,方差为. 故答案为:7;8 【强化训练】 1.四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的是(    ) A.平均数为3,中位数为2 B.平均数为2,方差为2.4 C.中位数为3,众数为2 D.中位数为3,方差为2.8 【答案】B 【解析】对于A,当投掷骰子出现结果为1,1,2,5,6时,满足平均数为3,中位数为2,可以出现点数6,故A错误; 对于B,若平均数为2,且出现6点,则方差, 则平均数为2,方差为时,一定没有出现点数6,故B正确; 对于C,当投掷骰子出现结果为2,2,3,4,6时,满足中位数为3,众数为2,可以出现点数6,故C错误; 对于D,当投掷骰子出现结果为1,2,3,3,6时,满足中位数为3, 平均数为, 方差为, 可以出现点数6,故D错误; 故选:B. 2.(23-24高一下·北京通州·期中)已知样本数据为:,,,,,,,,,. 去掉一个最大值和一个最小值后的数据与原来的数据相比,下列数字特征的值一定不变的是(    ) A.平均数 B.众数 C.极差 D.中位数 【答案】D 【解析】样本数据为,,,,,,,,,, 去掉一个最大值和一个最小值后的数据与原来的数据相比,假设从小到大就是从到,极差和众数可能变化,故BC错; 平均数为,可能变,故A错; 中位数还是按从小到大排序中间两个数的平均数,即,故D正确; 故选:D. 3.(23-24高一下·重庆·期末)某人投掷骰子5次,由于记录遗失,只有数据平均数为3和方差不超过1,则这5次点数中(    ) A.众数可为3 B.中位数可为2 C.极差可为1 D.最大点数可为5 【答案】A 【解析】对于A,如果五次都是3,满足题意,且众数为3,故A正确; 对于B,若中位数为2,则点数为2、2、2、4、5,显然此时平均数为3,方差最小, ,故B错误; 对于C,若点数的平均数为2,则极差不可能为1,故C错误; 对于D,若最大点数为5,当方差最小且平均数为3时,点数为2、2、3、3、5, 由,故D错误. 故选:A. 4.(23-24高一下·福建福州·期末)四名同学各掷骰子5次,分别记录每次骰了出现的点数,根据四名同学的统计结果,可以判断出一定没有出现点数6的是 (   ) A.平均数为3,中位数为2 B.平均数为3,方差为2 C.中位数为3,众数为2 D.中位数为3,方差为1.6 【答案】B 【解析】对于选项A,当投掷骰子出现的结果为时,满足平均数为,中位数为,可以出现点数,所以选项A错误; 对于选项B,若平均数为,且出现点数,则必出现小于的点数,且至少有个, 所以方差, 所以平均数为,方差为时,一定没有出现点数,所以选项B正确; 对于选项C,当投掷骰子出现结果为2,2,3,4,6时,满足中位数为3,众数为2,可以出现点数6,所以选项C错误; 对于选项D,当投掷骰子出现的结果为时,满足中位数为, 此时平均数为,所以方差为, 此时出现点数,所以选项D错误, 故选:B. 5.(24-25高一下·安徽宿州·期中)已知互不相等的一组数的平均数为,方差为,若,的方差为,则(   ) A. B. C. D.与的大小关系不确定 【答案】C 【解析】由题意可知,, 所以,则, 所以数据的平均数是, 又 ,, 与的分子相同,比较分母,可知. 故选:C 6.(24-25高三下·广东肇庆·阶段练习)已知一组数据的平均数为16,则这组数据的第65百分位数为(    ) A.17 B.16.5 C.16 D.15.5 【答案】A 【解析】由数据的平均数为16,可得,可得, 将这组数据从小到大排列,可得, 因为,所以这组数据的第65百分位数为. 故选:A. 7.(24-25高一下·甘肃白银·期中)2019-2023年甘肃省地区生产总值指数依次为106.2,103.8,106.9,104.4,106.4,则这组数据的分位数是(   ) A.106.9 B.106.2 C.105.3 D.105.35 【答案】C 【解析】这组数据从小到大为103.8,104.4,106.2,106.4,106.9, 因为,所以这组数据的分位数是. 故选:C 8.(24-25高一下·甘肃兰州·期中)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,、、分别对应这组数据的平均数、中位数和众数,则下列关系正确的是(   ) A. B. C. D. 【答案】C 【解析】由数据分布图知,众数是最高矩形下底边的中点横坐标,因此众数为右起第二个矩形下底边的中点值, 直线左右两边矩形面积相等,而直线左边矩形面积大于右边矩形面积,则, 又数据分布图左拖尾,则平均数小于中位数,即, 所以. 故选:C. 9.(多选题)(24-25高一下·甘肃兰州·期中)已知数据,,…,的平均数为10,方差为1,且,则下列说法正确的是(    ) A.数据,,…,的方差为2; B.数据,,…,的平均数为24; C.数据,,…,,10的平均数为10,方差大于1; D.若数据,,…,的中位数为m、75%分位数为n,则. 【答案】BD 【解析】若表示的均值和方差,表示的均值和方差, 而,,而, 所以,,A错,B对, 对于C,数据的平均数为,方差为,错; 对于D,若,则其中位数为, 而,则75%分位数为,故,D对. 故选:BD 10.(多选题)(24-25高一下·甘肃张掖·期中)以下关于统计学中数字特征的说法,正确的是(      ) A.若一组数据的平均数为,给这组数据中的每个数都加上一个常数,新数据的平均数为 B.方差是用来衡量一组数据波动大小的量,若数据的方差为,则的方差为 C.众数是一组数据中出现次数最多的数.对于数据,众数是 D.数据中位数是;对于数据中位数是 【答案】ABC 【解析】对于A选项,已知数据的平均数为,根据平均数的计算公式. 给这组数据中的每个数都加上一个常数,则新数据为, 其平均数为:,所以A选项正确. 对于B选项,若数据的方差为,根据方差公式. 对于数据(为非零常数),其平均数为,则方差为: ,所以B选项正确. 对于C选项,在数据,,,,,,中,数字出现的次数最多,所以众数是,C选项正确. 对于D选项,对于数据,,,,,,,从小到大排序为,,,,,,,数据个数为,是奇数,中间的数是,所以中位数是,而不是. 对于数据,,,,,,从小到大排序后,数据个数为,是偶数,中间两个数是和,则中位数为.所以D选项错误. 故答案为:ABC. 11.(多选题)(24-25高一下·甘肃白银·期中)在某次测量中得到的样本数据为6,7,9,13,13,18,若样本数据恰好是样本数据每个都减2后所得数据,则两个样本的下列数字特征对应相同的是(   ) A.极差 B.众数 C.平均数 D.方差 【答案】AD 【解析】由题意得B样本数据为4,5,7,11,11,16,样本A的极差为, 样本B的极差为,极差相同,A正确. 样本A的众数为13,样本B的众数为11,B错误. 样本A的平均数比样本B的平均数大2,C错误. 样本A和B中的数据的稳定性相同,则样本A和B的方差相同,D正确. 故选:AD 12.(24-25高二下·江苏镇江·期中)学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为的样本,其频率直方图如图所示,其中支出在[20,30)内的同学有10人,则的值为 .    【答案】 【解析】 由频率直方图可得,支出在内的频率为, 所以有 故答案为:. 13.(2025高三·全国·专题练习)有一组样本数据5,,,,,已知它的平均数为5,方差为20,则新数据的方差为 . 【答案】24 【解析】由题意,得新数据的平均数为, 设其方差为.因为, 所以.所以. 故答案为:24 14.(24-25高一上·江西抚州·期末)抚州市政府为了促进十一黄金假期期间文昌里文化街区餐饮服务质量的提升,抚州市旅游管理部门需了解游客对餐饮服务工作的认可程度.为此该部门随机调查了名游客,把这名游客对餐饮服务工作认可程度给出的评分分成、、、、五组,得到如图所示的频率分布直方图.则直方图中的值为 ,评分的平均数为 . 【答案】 【解析】因为频率分布直方图中所有矩形面积之和为, 则有,解得, 评分的平均数为. 故答案为:;. 15.(24-25高一上·山东潍坊·期末)已知一组数据的标准差为3,且,则的方差为 . 【答案】36 【解析】因为,又数据的标准差为3, 所以, 又, 所以 . 故答案为:. 16.(24-25高一上·江西宜春·阶段练习)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,,得到如图所示的频率分布直方图. (1)求频率分布直方图中的值及样本成绩的第75百分位数,中位数; (2)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.(附:设两组数据的样本量、样本平均数和样本方差分别为:,,,;,,,记两组数据总体的样本平均数为.则总体样本方差. 【解析】(1)因为每组小矩形的面积之和为1, 所以, 解得. 成绩落在内的频率为, 落在内的频率为, 设第75百分位数为m,则, 由,得,所以样本成绩的第75百分位数为84. 成绩落在[40,70)内的频率为, 成绩落在内的频率为, 故中位数在[70,80)内,由,所以样本成绩的中位数为75. (2)由图可知,成绩在的市民人数为, 成绩在的市民人数为, 故这两组成绩的总平均数为, 由样本方差计算总体方差公式可得总方差为: . 17.(24-25高一下·云南昆明·期中)云南师大附中在组织选拔数学英才班的过程中,对高一年级的300名学生进行了一次测试.已知参加此次测试的学生的分数全部介于45分到95分之间,学校将所有分数分成5组:,,…,,整理得到如图所示的频率分布直方图(同组数据以这组数据的中间值作为代表). (1)求的值,并估计此次校内测试分数的平均值; (2)学校要求按照分数从高到低选拔首100名的学生进行培训,试估计这100名学生的最低分数(计算结果保留一位小数); (3)试估计这300名学生的分数的方差,并判断此次得分为63分和86分的两名同学的成绩是否进人到了范围内? (参考公式:,其中为各组频数,参考数据:). 【解析】(1),所以, 所以该次校内考试测试分数的平均数的估计值为: 分. (2)因为, 设这100名学生的最低分数为, 则,解得 所以这100名学生的最低分数的估计值为分. (3) , , 故得分为63分的同学的成绩没有进入到内, 得分为86分的同学的成绩进入到了内. 即:得分为63分的同学的成绩没有进入到范围, 得分为86分的同学的成绩进入到范围了. 18.(24-25高一下·重庆·期中)在重庆复旦中学“复旦好声音”校园歌手决赛中,由9名专业人士和9名观众代表各组成一个评委小组,给参赛选手打分,下面是两组评委对同一名选手的打分: 小组A:85 86   92 87 89   95 82 91 85 小组B:95 93 51 88   90 89 91 92 94 (1)分别求两组评委打分的平均分. (2)判断小组A和小组B中哪一个更像是由专业人士组成,根据所学的统计知识,说明理由. 【解析】(1)记小组A的数据依次为,小组B的数据依次为,, 由题意可得:每组的平均数分别为:,. (2)A组更像是由专业人士组成, 两组的方差分别为:,. 由于专业人士给分更符合专业规则,相似程度更高,,, 因而, 根据方差越大数据波动越大,因此A组更像是由专业人士组成的. 14 学科网(北京)股份有限公司 $$ 专题13 统计的综合应用 【题型归纳目录】 题型一:随机数表法 题型二:分层抽样 题型三:频率分布直方图 题型四:计算一些数据的平均数、方差、众数、中位数、百分位数 题型五:样本估计总体 题型六:分层方差的计算 题型七:平均数、方差的性质 【知识点梳理】 1、统计的相关概念 (1)普查 像人口普查这样,对每一个调查对象都进行调查的方法,称为全面调查,又称普查. (2)总体、个体 在一个调查中,我们把调查对象的全体称为总体.组成总体的每一个调查对象称为个体.为了强调调查目的,也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体. (3)抽样调查 根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查. (4)样本、样本量 我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量. 2、简单随机抽样 一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.除非特殊声明,本章所称的简单随机抽样指不放回简单随机抽样. 3、简单随机抽样的方法 (1)抽签法: 把总体中的N个个体编号,把编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需的个数. (2)随机数法: 用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需的个数. ①用随机试验生成随机数; ②用信息技术生成随机数; ③用计算器生成随机数; ④用电子表格软件生成随机数; ⑤用R统计软件生成随机数. 4、总体均值 一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称 为总体均值,又称总体平均数. 如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式 5、样本均值 如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称 为样本均值,又称样本平均数. 探究:总体均值与样本均值有何区别与联系? 答案:(1)区别:当总体中个体较多时,总体均值不易计算,样本均值比较方便计算.总体均值是一个确定的数,样本均值具有随机性. (2)联系:在简单随机抽样中,我们常用样本均值估计总体均值. 6、分层抽样定义 一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫分层抽样. 7、分层抽样适用范围 当总体是由差异明显的几个部分组成时,往往采用分层抽样. 8、分层抽样的步骤 (1)根据已掌握的信息,将总体分成若干部分. (2)根据总体中的个体数N和样本容量n计算出抽样比k=. (3)根据抽样比k计算出各层中应抽取的个体数:·Ni (其中Ni为第i层所包含的个体总数). (4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n的样本. 9、两种抽样方法的区别和联系 类别 共同点 各自特点 相互联系 适用范围 简单随机抽样 抽样过程中各个个体被抽到的机会相等,且都是不放回抽取 从总体中逐个抽取 最基本的抽样方法 总体容量较少 分层抽样 抽样过程中各个个体被抽到的机会相等,且都是不放回抽取 将总体分成几部分,每一部分按比例抽取 每层抽样时采用简单随机抽样 总体由差异明显的若干部分组成 10、获取数据的途径 统计学是通过收集数据和分析数据来认识未知现象的,因此如何收集数据,像统计报表和年鉴、社会调查、普查和抽样、互联网、试验设计等等都是常见的. (1)通过调查获取数据 适用范围:对于有限总体问题,一般通过抽样调查或普查的方法获取数据. 注意事项:充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误. (2)通过试验获取数据. 适用范围:没有现存的数据可以查询,就需要通过对比试验的方法去获取样本观测数据. 注意事项:严格控制试验环境,通过精心的设计安排试验,以提高数据质量,为获得好的分析结果奠定基础. (3)通过观察获取数据. 适用范围:自然现象. 注意事项:需要专业测量设备获取观测数据. (4)通过查询获得数据. 适用范围:二手数据. 注意事项:数据来历和渠道多样,所以质量会参差不齐,必须根据问题背景知识“清洗”数据,去伪存真. 11、频率分布直方图绘制步骤 ①求极差,即一组数据中的最大值与最小值的差. ②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”. ③将数据分组. ④列频率分布表.计算各小组的频率,第i组的频率是. ⑤画频率分布直方图.其中横轴表示分组,纵轴表示,实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度. 12、频率分布直方图意义:各个小长方形的面积表示相应各组的频率,频率分布直方图以面积的形式反映数据落在各个小组的频率的大小,各小长方形的面积的总和等于1. 13、总体取值规律的估计:我们可以用样本观测数据的频率分布估计总体的取值规律. 14、频率分布直方图的特征:当频率分布直方图的组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原式数据信息;当频率分布直方图的组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易从中看出总体数据的分布特点. 15、常见的其他统计图:条形图、扇形图、折线图. 扇形图主要用于直观描述各类数据占总数的比例; 条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率; 折线图主要用于描述数据随时间的变化趋势. 16、各个统计图特点 (1)不同的统计图在表示数据上有不同的特点.如扇形图主要用于直观描述各类数据占总数的比例,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,折线图主要用于描述数据随时间的变化趋势. (2)不同的统计图适用的数据类型也不同.如条形图适用于描述离散型的数据,直方图适用于描述连续性数据. 17、第p百分位数的定义 一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值. 18、计算第百分位数的步骤 第1步:按从小到大排列原始数据. 第2步:计算. 第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第项数据的平均数. 19、四分位数 常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等. 20、众数、中位数、平均数定义 (1)众数:一组数据中重复出现次数最多的数. (2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数据的中位数. (3)平均数:如果个数,那么叫做这个数的平均数. 21、频率分布直方图中的众数、中位数、平均数 ①在频率分布直方图中,众数是最高矩形中点的横坐标; ②中位数左边和右边的直方图的面积应该相等; ③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 12、方差、标准差的定义 一组数据,用表示这组数据的平均数,则这组数据的方差为,标准差为. 23、总体方差、总体标准差的定义 如果总体中所有个体的变量值分别为,总体平均数为,则称为总体方差,为总体标准差.如果总体的个变量值中,不同的值共有个,记为,,其中出现的频数为,则总体方差为. 24、样本方差、样本标准差的定义 如果一个样本中个体的变量值分别为,样本平均数为,则称为样本方差,为样本标准差. 25、方差、标准差特征 标准差、方差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差. 【典型例题】 题型一:随机数表法 【典例1-1】(24-25高二上·新疆喀什·期中)从某班57名同学中选出4人参加户外活动,利用随机数表法抽取样本时,先将57名同学按01、02、…、57进行编号,然后从随机数表第一行的第7列和第8列数字开始往右依次选取两个数字,则选出的第4个同学的编号为(    ) 0347 4373 8636 9647 3661 4698 6371 6297 7424 6292 4281 1457 2042 5332 3732 1676 (注:表中的数据为随机数表第一行和第二行) A.24 B.36 C.42 D.52 【典例1-2】(24-25高二上·黑龙江哈尔滨·阶段练习)总体由编号01,02,…,29,30的30个个体组成,利用下面的随机数选取6个个体,选取方法是从如下随机数的第1行的第6列和第7列数字开始由左向右依次选取两个数字,则选出来的第6个个体的编号为(    ) 第1行  78  16  62  32  08  02  62  42  62  52  53  69  97  28  01  98 第2行  32  04  92  34  49  35  82  00  36  23  48  69  69  38  74  81 A.27 B.26 C.25 D.19 【变式1-1】(23-24高一下·四川·期末)某企业利用随机数表对生产的60个太阳能面板进行抽样测试,先将60个太阳能面板进行编号,.从中抽取12个样本,下图提供随机数表的第6行至第8行,若从表中第7行第9列开始向右读取数据,则得到的第6个样本编号是(    ) 12 23 43 56 77 32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 35 78 90 56 42 25 30 07 32 86 23 45 58 89 07 23 18 96 08 04 84 42 12 53 31 34 57 86 07 36 34 89 94 83 75 32 56 78 08 43 67 89 53 55 77 22 53 55 78 32 45 77 89 23 45 A.07 B.18 C.23 D.08 【变式1-2】(23-24高一下·山西太原·期末)某场乒乓球单打比赛按三局两胜的赛制进行,甲乙两人参加比赛.已知每局比赛甲获胜的概率为0.4,乙获胜的概率为0.6.现用计算机产生1~5之间的整数随机数,当出现1或2时,表示此局比赛甲获胜,当出现3,4或5时,表示此局比赛乙获胜.在一次试验中,产生了20组随机数如下: 534  123  512  114  125  334  432  332  314  152 423  443  423  344  541  453  525  151  354  345 根据以上数据,利用随机模拟试验,估计甲获得冠军的概率为(    ) A.0.24 B.0.3 C.0.7 D.0.76 题型二:分层抽样 【典例2-1】(24-25高一下·甘肃兰州·期中)一个公司共有名210员工,要采用分层抽样方法从全体员工中抽取一个容量为30的样本.已知某部门有70名员工,那么从这一部门抽取的员工人数为(   ) A.9 B.6 C.10 D.8 【典例2-2】(24-25高一下·甘肃张掖·期中)某学校有教师人,男学生人,女学生人.现用分层抽样的方法从全体师生中抽取一个容量为的样本,已知从女学生中抽取的人数为,则的值为(      ) A. B. C. D. 【变式2-1】(24-25高一下·甘肃白银·期中)一个志愿者组织有成员45人,40岁以上的成员有25人,如果按照年龄进行分层随机抽样,要抽取一个容量为18的样本,则应抽取40岁以上成员的人数为(   ) A.12 B.10 C.8 D.6 【变式2-2】(24-25高一上·甘肃甘南·期末)某单位有员工500人,青年员工、中年员工、老年员工的人数分别为300人, 150人和50人,在一项调查中需要按照年龄层次进行分层抽样,若抽出的青年职工为30人,则抽出的老年职工的人数为(    ) A.5 B.15 C.30 D.50 题型三:频率分布直方图 【典例3-1】(23-24高一下·广东潮州·期末)某校为了解全校高中学生五一小长假参加实践活动的情况,抽查了100名学生,统计他们假期参加实践活动的时间,绘成的频率分布直方图如图所示.这100名学生中参加实践活动时间在4~10小时内的人数为 . 【典例3-2】(2024·河北石家庄·三模)为了解全市高三学生的体能素质情况,在全市高三学生中随机抽取了1000名学生进行体能测试,并将这1000名学生的体能测试成绩整理成如下频率分布直方图.则直方图中实数的值为 . 【变式3-1】(2024高三·全国·专题练习)为贯彻五育并举的教育方针,某校对全体高一年级学生进行了体育测试,并将成绩(单位:分)分为6组:加以统计,得到如图所示的频率分布直方图.已知高一年级共有750名同学参加测试,则成绩达标的(不少于60分)学生人数为 . 【变式3-2】(23-24高一上·辽宁沈阳·期末)在某市高一年级举行的一次数学调研考试中,为了了解考生的成绩状况,现抽取了样本容量为n的部分学生成绩,作出如图所示的频率分布直方图(所有考生成绩均在,按照,,,,分组),若在样本中,成绩在的人数为50,则成绩在的人数为 . 题型四:计算一些数据的平均数、方差、众数、中位数、百分位数 【典例4-1】(24-25高二上·四川成都·期中)2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是(   ) A.该组数据的第60百分位数为7.5 B.该组数据的极差为5 C.该组数据的平均数为7.5 D.该组数据的中位数为7 【典例4-2】(2024·广东广州·模拟预测)已知数据,且满足,若去掉,后组成一组新数据,则新数据与原数据相比,有可能变大的是(   ) A.平均数 B.中位数 C.极差 D.方差 【变式4-1】(23-24高一下·新疆·期末)已知在高考前最后一次模拟考试中,高三某班8名同学的物理成绩分别为84,79,84,86,95,84,87,93,则该组数据的平均数和众数分别是(    ) A.86,84 B.84.5,85 C.85,84 D.86.5,84 【变式4-2】(23-24高一下·黑龙江大庆·期末)一个同学投掷10次骰子,记录出现的点数,根据统计结果,在下列情况中一定不能出现点数6的是(    ) A.平均数为3,中位数为4 B.中位数为4,众数为3 C.平均数为2,方差为2.1 D.中位数为3,方差为0.85 【变式4-3】(2025·贵州铜仁·三模)在处理一组数据时,若未计入数值9,计算所得的平均值为9,方差为3.若将数值9纳入分析,则该组数据(    ) A.平均数等于9,方差等于3 B.平均数等于9,方差小于3 C.平均数大于9,方差小于3 D.平均数小于9,方差大于3 题型五:样本估计总体 【典例5-1】(24-25高一下·甘肃白银·期中)某校高一学生有2000名,为了了解高一学生的体能情况,该校随机抽取部分学生进行1分钟跳绳测试,将所得数据整理后,将得到的数据按,分为5组,画出频率分布直方图,如图所示. (1)求的值; (2)若跳绳次数不少于115为达标,估计该校全体高一学生达标的人数; (3)估计该校全体高一学生跳绳次数的平均数.(同一组中的数据用该组区间的中点值作为代表) 【典例5-2】(24-25高一下·甘肃兰州·期中)兴隆山自然保护区位于兰州市东南公里的榆中县境内,年建立,年批准为国家级自然保护区,总面积公顷.是国家“”级旅游胜地,在一片绿海碧涛之中,著名的栖云山景区、马衔山景区、官滩沟景区等三十余处景点,宛如玛瑙镶嵌在翠玉之上,光彩夺目.现为更好地提升旅游品质,兴隆山风景区的工作人员随机选择名游客对景区进行满意度评分(满分分),根据评分,制成如图所示的频率分布直方图. (1)根据频率分布直方图,求的值; (2)估计这名游客对景区满意度评分的分位数和平均数(得数保留两位小数). 【变式5-1】(22-23高一下·云南昭通·期末)为了解某校高一年级学生数学学习的阶段性表现,年级组织了一次阶段测试.已知此次考试共有450名学生参加,考试成绩的频率分布直方图如图所示(同一组中的数据以该区间的中点值为代表). (1)求a的值; (2)估计这次数学考试成绩的众数、中位数和平均数(结果保留两位小数); (3)估计该校学生的数学成绩的第70百分位数(结果保留两位小数). 【变式5-2】(24-25高一上·湖南邵阳·期末)某校高一(三)班数学研究小组随机抽取100名同学,获得了他们一周课外锻炼时长(单位:小时)的数据,并整理得到相应的频数分布表和频率分布直方图,如表(一),图(一)所示 组号 分组 频数 1 5 2 7 3 13 4 18 5 27 6 a 7 9 8 4 9 4 合计 100 表(一) 结合以上信息,回答下列问题: (1)求a,b的值; (2)假设同一组中的每个数据可用该组对应区间的中点值代替,试估计样本中的100名同学该周课外锻炼时长的平均数; (3)试估计样本中的100名同学该周课外锻炼时长的中位数.(保留三位有效数字) 题型六:分层方差的计算 【典例6-1】(24-25高一下·江西抚州·期中)某地举办了“防电信诈骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,,得到如图所示的频率分布直方图. (1)求频率分布直方图中的值及样本成绩的第80百分位数; (2)已知落在区间的样本平均成绩是57,方差是7,落在区间的样本平均成绩为66,方差是4,求两组样本成绩合并后的平均数和方差. 参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,,;,,记总的样本平均数为,样本方差为,则. 【典例6-2】(24-25高二上·贵州毕节·阶段练习)黔西一中为了提高学生对“黔西一中校史”的了解,举办了“知史爱校守初心”的知识竞赛活动,现从所有竞答试卷的卷面成绩中随机抽取100份作为样本数据,将样本答卷中分数x()的整数分成六段:,并作出如图所示的频率分布直方图. (1)求频率分布直方图中a的值; (2)求样本数据的第59百分位数; (3)已知样本数据落在的平均数是52,方差是6;落在的平均数是64,方差是3.求这两组数据的总平均数和总方差. 【变式6-1】(24-25高一上·辽宁抚顺·期末)2024年5月22日至5月28日是第二届全国城市生活垃圾分类宣传周,本次宣传周的主题为“践行新时尚分类志愿行”.某中学高一年级举行了一次“垃圾分类知识竞赛”,为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(单位:分,得分取正整数,满分为100分)作为样本进行统计,将成绩进行整理后,分为五组(,,,,),其中第二组的频数是第一组频数的2倍,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题: (1)求a,b的值,并估计这次竞赛成绩的中位数(同一组中的数据用该组区间的中点值作代表); (2)如果用分层抽样的方法从样本成绩为和的学生中共抽取6人,再从6人中选2人,求2人分数恰好来自同一组的概率; (3)某老师在此次竞赛成绩中抽取了10名学生的分数:,已知这10个分数的平均数,标准差,若剔除其中的75和85这两个分数,求剩余8个分数的平均数与方差. 【变式6-2】(24-25高一上·辽宁沈阳·期末)某医疗单位为了迎接医师节,针对本单位不同年龄的员工举办了一次实践技能大比拼活动,满分100分(95分及以上为优秀医师),共有100人荣获“优秀医师”称号,将其按年龄分成以下五组:第一组,第二组,第三组,第四组,第五组,得到如图所示的频率分布直方图. (1)根据频率分布直方图,估计这些人的平均年龄; (2)若从第三组,第四组,第五组三组中分层抽取6人,再从这6人中随机抽取2人,求抽取的2人年龄在不同组的概率; (3)若第四组的年龄的平均数与方差分别为54和1,第五组的年龄的平均数与方差分别为66和4,据此计算这100人中第四组与第五组所有人的年龄的方差. 附: 题型七:平均数、方差的性质 【典例7-1】(23-24高一下·天津滨海新·期末)已知一组数据的平均数是3.6,方差是2,则新数据的平均数是 ,方差是 . 【典例7-2】(23-24高一下·吉林长春·期末)若样本数据的标准差为8,则数据的方差为 【变式7-1】(24-25高一上·甘肃兰州·期末)若的方差为4,且,则新数据的标准差为 . 【变式7-2】(23-24高一下·陕西宝鸡·期末)若一组样本数据,,,的标准差为4,则数据,,,的标准差为 . 【变式7-3】(23-24高一下·重庆巫山·期末)已知一组样本数据的样本平均数为3,方差为2,由生成一组新的样本数据,则新数据的平均数为 ;样本方差为 . 【强化训练】 1.四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的是(    ) A.平均数为3,中位数为2 B.平均数为2,方差为2.4 C.中位数为3,众数为2 D.中位数为3,方差为2.8 2.(23-24高一下·北京通州·期中)已知样本数据为:,,,,,,,,,. 去掉一个最大值和一个最小值后的数据与原来的数据相比,下列数字特征的值一定不变的是(    ) A.平均数 B.众数 C.极差 D.中位数 3.(23-24高一下·重庆·期末)某人投掷骰子5次,由于记录遗失,只有数据平均数为3和方差不超过1,则这5次点数中(    ) A.众数可为3 B.中位数可为2 C.极差可为1 D.最大点数可为5 4.(23-24高一下·福建福州·期末)四名同学各掷骰子5次,分别记录每次骰了出现的点数,根据四名同学的统计结果,可以判断出一定没有出现点数6的是 (   ) A.平均数为3,中位数为2 B.平均数为3,方差为2 C.中位数为3,众数为2 D.中位数为3,方差为1.6 5.(24-25高一下·安徽宿州·期中)已知互不相等的一组数的平均数为,方差为,若,的方差为,则(   ) A. B. C. D.与的大小关系不确定 6.(24-25高三下·广东肇庆·阶段练习)已知一组数据的平均数为16,则这组数据的第65百分位数为(    ) A.17 B.16.5 C.16 D.15.5 7.(24-25高一下·甘肃白银·期中)2019-2023年甘肃省地区生产总值指数依次为106.2,103.8,106.9,104.4,106.4,则这组数据的分位数是(   ) A.106.9 B.106.2 C.105.3 D.105.35 8.(24-25高一下·甘肃兰州·期中)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,、、分别对应这组数据的平均数、中位数和众数,则下列关系正确的是(   ) A. B. C. D. 9.(多选题)(24-25高一下·甘肃兰州·期中)已知数据,,…,的平均数为10,方差为1,且,则下列说法正确的是(    ) A.数据,,…,的方差为2; B.数据,,…,的平均数为24; C.数据,,…,,10的平均数为10,方差大于1; D.若数据,,…,的中位数为m、75%分位数为n,则. 10.(多选题)(24-25高一下·甘肃张掖·期中)以下关于统计学中数字特征的说法,正确的是(      ) A.若一组数据的平均数为,给这组数据中的每个数都加上一个常数,新数据的平均数为 B.方差是用来衡量一组数据波动大小的量,若数据的方差为,则的方差为 C.众数是一组数据中出现次数最多的数.对于数据,众数是 D.数据中位数是;对于数据中位数是 11.(多选题)(24-25高一下·甘肃白银·期中)在某次测量中得到的样本数据为6,7,9,13,13,18,若样本数据恰好是样本数据每个都减2后所得数据,则两个样本的下列数字特征对应相同的是(   ) A.极差 B.众数 C.平均数 D.方差 12.(24-25高二下·江苏镇江·期中)学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为的样本,其频率直方图如图所示,其中支出在[20,30)内的同学有10人,则的值为 .    13.(2025高三·全国·专题练习)有一组样本数据5,,,,,已知它的平均数为5,方差为20,则新数据的方差为 . 14.(24-25高一上·江西抚州·期末)抚州市政府为了促进十一黄金假期期间文昌里文化街区餐饮服务质量的提升,抚州市旅游管理部门需了解游客对餐饮服务工作的认可程度.为此该部门随机调查了名游客,把这名游客对餐饮服务工作认可程度给出的评分分成、、、、五组,得到如图所示的频率分布直方图.则直方图中的值为 ,评分的平均数为 . 15.(24-25高一上·山东潍坊·期末)已知一组数据的标准差为3,且,则的方差为 . 16.(24-25高一上·江西宜春·阶段练习)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,,得到如图所示的频率分布直方图. (1)求频率分布直方图中的值及样本成绩的第75百分位数,中位数; (2)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.(附:设两组数据的样本量、样本平均数和样本方差分别为:,,,;,,,记两组数据总体的样本平均数为.则总体样本方差. 17.(24-25高一下·云南昆明·期中)云南师大附中在组织选拔数学英才班的过程中,对高一年级的300名学生进行了一次测试.已知参加此次测试的学生的分数全部介于45分到95分之间,学校将所有分数分成5组:,,…,,整理得到如图所示的频率分布直方图(同组数据以这组数据的中间值作为代表). (1)求的值,并估计此次校内测试分数的平均值; (2)学校要求按照分数从高到低选拔首100名的学生进行培训,试估计这100名学生的最低分数(计算结果保留一位小数); (3)试估计这300名学生的分数的方差,并判断此次得分为63分和86分的两名同学的成绩是否进人到了范围内? (参考公式:,其中为各组频数,参考数据:). 18.(24-25高一下·重庆·期中)在重庆复旦中学“复旦好声音”校园歌手决赛中,由9名专业人士和9名观众代表各组成一个评委小组,给参赛选手打分,下面是两组评委对同一名选手的打分: 小组A:85 86   92 87 89   95 82 91 85 小组B:95 93 51 88   90 89 91 92 94 (1)分别求两组评委打分的平均分. (2)判断小组A和小组B中哪一个更像是由专业人士组成,根据所学的统计知识,说明理由. 14 学科网(北京)股份有限公司 $$

资源预览图

专题13 统计的综合应用(7大题型)-2024-2025学年高一数学下学期期末必考题型归纳及过关测试(苏教版2019)
1
专题13 统计的综合应用(7大题型)-2024-2025学年高一数学下学期期末必考题型归纳及过关测试(苏教版2019)
2
专题13 统计的综合应用(7大题型)-2024-2025学年高一数学下学期期末必考题型归纳及过关测试(苏教版2019)
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。