专题9.1 统计(七大重难点题型精讲)-备战2025年高考数学一轮复习题型精讲与精练(新高考通用)

2025-03-11
| 2份
| 67页
| 455人阅读
| 9人下载
3456数学工作室
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 -
年级 高三
章节 -
类型 题集-专项训练
知识点 -
使用场景 高考复习-一轮复习
学年 2025-2026
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 4.41 MB
发布时间 2025-03-11
更新时间 2025-03-11
作者 3456数学工作室
品牌系列 -
审核时间 2025-03-11
下载链接 https://m.zxxk.com/soft/50922952.html
价格 3.00储值(1储值=1元)
来源 学科网

内容正文:

专题9.1 统计 目录 一、考纲要求 1.理解随机抽样、分层抽样的必要性和重要性; 2.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点; 3.理解样本数据标准差的意义和作用,会计算数据标准差; 4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想; 5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. 二、考点网络 三、考情分析 考点要求 考题统计 考情分析 (1)会用简单随机抽样的方法从总体中抽取样本,了解分层随机抽样. (2)理解统计图表的含义. (3)会用统计图表对总体进行估计,会求n个数据的第p百分位数. (4)能用数字特征估计总体集中趋势和总体离散程度. 2023年上海卷第14题,4分 2023年上海卷第9题,5分 2023年I卷第9题,5分 2022年甲卷(文)第2题,5分 统计学是“大数据”技术的关键,在互联网时代具有强大的社会价值和经济价值,在高考中受重视程度越来越大,未来在考试中的出题角度会更加与实际生活紧密联系,背景新颢、形式多样. 四、考点梳理 知识点一、抽样 1、抽样调查 (1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体. (2)个体:构成总体的每一个元素叫做个体. (3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样本中个体的数目叫做样本容量. 2、简单随机抽样 (1)定义 一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本. (2)两种常用的简单随机抽样方法 ①抽签法:一般地,抽签法就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取次,就得到一个容量为的样本. ②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字,,,…,组成,并且每个数字在表中各个位置出现的机会都是一样的. 注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置. (3)抽签法与随机数法的适用情况 抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况,但是当总体容量很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便. (4)简单随机抽样的特征 ①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析. ②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作. ③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算. ④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平. 只有四个特点都满足的抽样才是简单随机抽样. 3、分层抽样 (1)定义 一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样. 分层抽样适用于已知总体是由差异明显的几部分组成的. (2)分层抽样问题类型及解题思路 ①求某层应抽个体数量:按该层所占总体的比例计算. ②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算. ③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比==” 注意:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取()个个体(其中是层数,是抽取的样本容量,是第层中个体的个数,是总体容量). 知识点二、用样本估计总体 1、频率分布直方图 (1)频率、频数、样本容量的计算方法 ①×组距=频率. ②=频率,=样本容量,样本容量×频率=频数. ③频率分布直方图中各个小方形的面积总和等于. 2、频率分布直方图中数字特征的计算 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积. 3、百分位数 (1)定义 一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值. (2)计算一组个数据的的第百分位数的步骤 ①按从小到大排列原始数据. ②计算. ③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数. (3)四分位数 我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数. 4、样本的数字特征 (1)众数、中位数、平均数 ①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平. ②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平. ③平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:. 5、标准差和方差 (1)定义 ①标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差. ②方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差. (2)数据特征 标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小. (3)平均数、方差的性质 如果数据的平均数为,方差为,那么 ①一组新数据的平均数为,方差是. ②一组新数据的平均数为,方差是. ③一组新数据的平均数为,方差是. 重难点题型(一) 随机抽样、分层抽样 例1.(24-25高三下·辽宁·阶段练习)某工厂生产了类、类、类三种产品各1080件、900件、360件,用分层随机抽样的方法从中抽取130件产品进行质量检测,则类与类产品共抽取的件数为(    ) A.110 B.90 C.60 D.50 【答案】A 【难度】0.94 【知识点】抽样比、样本总量、各层总数、总体容量的计算 【分析】由分层抽样抽样比即可求解. 【详解】设类与类产品共抽取的件数为, 由题意,可得, 解得. 故选:A 例2.(2024·江西宜春·模拟预测)(多选题)某学校高三年级共有900人,其中男生500人,现采用按性别比例分配的分层抽样抽取了容量为90的样本.  经计算得男生的身高均值为170,方差为19,女生样本的身高均值为161,方差为19,则下列说法中正确的是(    ) A.女生的样本容量为40 B.女生甲被抽到的概率为 C.估计该校高三年级学生身高的均值为166 D.估计该校高三年级学生身高的方差大于19 【答案】ACD 【难度】0.65 【知识点】抽样比、样本总量、各层总数、总体容量的计算、分层抽样的概率、估计总体的方差、标准差 【分析】由题意先得抽样比例,进而得男生和女生的样本容量即可判断A、B,再根据分层随机抽样总样本均值公式和方差公式即可求解. 【详解】由题抽样比例为,故男生被抽到人数为人;女生被抽到人数为人,故A对; 所以女生甲被抽到的概率为,故B错; 由上以及题意得总样本均值为:; 总样本方差为:,故C、D对. 故选:ACD. 【变式训练1】.(2025·江西萍乡·一模)某中学有初中生600名,高中生200名,为保障学生的身心健康,学校举办“校园安全知识”了竞赛.现按比例分配的分层随机抽样的方法,分别抽取初中生名,高中生名,经统计:名学生的平均成饽为74分,其中名初中生的平均成绩为72分,名高中生的平均成绩为分,则(    ) A.74 B.76 C.78 D.80 【答案】D 【难度】0.65 【知识点】抽样比、样本总量、各层总数、总体容量的计算、计算几个数的平均数 【分析】根据分层随机抽样的特点求出与的关系,再利用平均数的计算公式列出关于的方程,进而求解的值. 【详解】由题意,得可得,解得. 故选:D. 【变式训练2】.总体由编号为的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始从左到右依次选取两个数字,则选出来的第5个个体的编号为 . 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 【答案】01 【难度】0.94 【知识点】随机数表法 【分析】根据规则选出个编号,再去掉不在编号范围内的编号以及重复的编号可得答案. 【详解】从随机数表第1行的第5列和第6列数字开始从左到右依次选取两个数字,得,去掉不在编号范围内的,再去掉一个重复的,得前个个体的编号为, 故选出来的第5个个体的编号为. 故答案为:. 重难点题型(二) 统计图表 例3.(2024·山西·模拟预测)某商场为了了解顾客的停车时长(单位:分钟),现随机抽取了100辆该商场到访顾客的车辆进行停车时长调查,将数据整理得到如下频率分布直方图:        则样本中停车时长在区间上的车辆数为 辆. 【答案】 【难度】0.85 【知识点】补全频率分布直方图、由频率分布直方图计算频率、频数、样本容量、总体容量 【分析】利用频率直方图中频率之和为1求得的频率,进而求得的频数,从而得解. 【详解】依题意,设的频率为, 则,解得, 所以样本中停车时长在区间上的车辆数为. 故答案为:. 例4.(2025·陕西西安·一模)某校组织1000名学生参加“新中国成立75周年”知识竞赛,经统计这1000名学生的成绩都在区间内,按分数分成5组:,,,,,得到如图所示的频率分布直方图,根据图中数据,下列结论正确的是(   ) A.1000名学生成绩的平均数是77 B.成绩不低于80分的学生所占比例为40% C.用分层抽样从该校学生中抽取容量为100的样本,则应在内抽取30人 D.这1000名学生成绩的第50百分位数是80 【答案】D 【难度】0.85 【知识点】抽样比、样本总量、各层总数、总体容量的计算、由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计平均数、总体百分位数的估计 【分析】利用频率分布直方图估计平均数判断A;计算不低于80分的频率和判断B;利用分层抽样的特点计算判断C;求出第50百分位数判断D. 【详解】对于A,由频率分布直方图,得1000名学生成绩的平均数是 ,A错误; 对于B,成绩不低于80分的学生频率为,成绩不低于80分的学生所占比例为,B错误; 对于C,由分层抽样特点得,则应在内抽取人 ,C错误; 对于D, 1000名学生成绩的第50百分位数即中位数为80,D正确. 故选:D 【变式训练3】.(2025·贵州遵义·模拟预测)遵义羊肉粉是黔北民众最喜爱的小吃之一.2024年12月16日,遵义市第七届羊肉粉节在凤凰山文化广场盛大开幕,某商家为了调研顾客对本店就餐的满意度,从用过餐的顾客中随机抽取100名进行评分.整理评分数据,将收集到的顾客满意度分值数据(满分100分)分成六段:,,…,,得到如图所示的频率分布直方图,则下列选项正确的是(   ) A.这100名顾客评分的极差介于40分至50分之间 B.这100名顾客评分的中位数小于80分 C. D.这100名顾客评分的平均值介于60分到70分之间 【答案】C 【难度】0.65 【知识点】由频率分布直方图估计中位数、由频率分布直方图估计平均数、由频率分布直方图计算频率、频数、样本容量、总体容量 【分析】由极差的概念可得A错误;由频率分布直方图的面积和为1可得C正确;由后两个矩形的面积大于可得B错误;由频率分布直方图平均值的求法可得D错误. 【详解】对于A,由频率分布直方图可知,这100名顾客评分的极差最小不低于,最大为,故A错误; 对于C,由面积和为可得,故C正确; 对于B,后两个矩形的面积为,所以这100名顾客评分的中位数应该在倒数第二个区间内,不小于80分,故B错误; 对于D,这100名顾客评分的平均值为,故D错误; 故选:C. 【变式训练4】.(2025·辽宁·模拟预测)(多选题)某寄宿制学校为调查该校学生一天内在食堂的消费情况,随机抽取了名学生的消费金额作为样本,得到如图所示的频率分布直方图,则下列说法正确的是(    ) A. B.这名学生消费金额的众数为 C.这名学生消费金额的平均数为 D.为了解学生消费金额较低的原因,从消费金额低于元的学生中用分层随机抽样的方法随机抽取人座谈,则应抽取消费金额在区间内的学生人 【答案】BCD 【难度】0.85 【知识点】抽样比、样本总量、各层总数、总体容量的计算、补全频率分布直方图、由频率分布直方图估计平均数、根据频率分布直方图计算众数 【分析】由频率分布直方图中所有矩形的面积之和为求出的值,可判断A选项;利用众数的定义可判断B选项;利用平均数公式可判断C选项;利用分层抽样可判断D选项. 【详解】对于A选项,由于频率分布直方图中所有矩形的面积之和为, 则,得,A错; 对于B选项,消费金额在区间内的人数最多,所以众数为,B对; 对于C选项,平均数为,C对; 对于D选项,消费金额在区间内的人数为, 消费金额在区间内的人数为, 根据分层随机抽样的方法,从区间内抽取的人数为,D对. 故选:BCD. 重难点题型(三) 频率分布直方图 例5.(2024·四川绵阳·模拟预测)某教育机构为调查中小学生每日完成作业的时间,收集了某位学生100天每天完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了下列结论,其中正确的是(    )    A.估计该学生每日完成作业的时间在2小时至2.5小时的有50天 B.估计该学生每日完成作业时间超过3小时的概率为0.3 C.估计该学生每日完成作业时间的中位数为2.625小时 D.估计该学生每日完成作业时间的众数为2.3小时 【答案】C 【难度】0.65 【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计中位数、用频率估计概率、根据频率分布直方图计算众数 【分析】利用频率分别直方图、频数、频率、中位数、众数直接求解. 【详解】对于A,该学生每日完成作业的时间在2小时至2.5小时的天数为:天,故A错误; 对于B,估计该学生每日完成作业时间超过3小时的概率为,故B错误; 对于C,的频率为,的频率为, 则该学生每日完成作业时间的中位数为,故C正确; 对于D,估计该学生每日完成作业时间的众数为,故D错误; 故选:C 例6.(2025·广东广州·模拟预测)(多选题)某校高三年级在一次考试后,为分析学生的学习情况,从中随机抽取了200名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析学生的成绩分布情况,经计算得到这200名学生中,成绩位于的学生成绩方差为13.75,成绩位于的学生成绩方差为7.75.则(   )    A. B.估计该年级学生成绩的中位数约为76.14 C.估计该年级在80分及以上的学生成绩的平均数为87.50 D.估计该年级在80分及以上的学生成绩的方差为31 【答案】ACD 【难度】0.65 【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计平均数、由频率分布直方图估计中位数、计算频率分布直方图中的方差、标准差 【分析】A选项利用各长方形的面积之和为1可求;B选项利用中位数左边的直方图的面积等于0.5即可列式求解;C,D选项利用平均数和方差的计算公式进行求解即可. 【详解】对于A选项,在频率分布直方图中,各长方形的面积之和为1, 则,解得,故A正确; 对于B选项,前两个矩形的面积之和为, 前三个矩形的面积之和为, 设该年级学生成绩的中位数为,则, 根据中位数的定义可得,解得, 所以,估计该年级学生成绩的中位数约为77.14,故B错误; 对于C选项,估计成绩在80分以上的同学的成绩的平均数为 分,故C正确; 对于D选项,估计该年级成绩在80分及以上的学生成绩的方差为 ,故D正确. 故选:ACD. 【变式训练5】.(2024·甘肃张掖·一模)(多选题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图. 根据此频率分布直方图,下面结论中正确的有(   ) A.该地家庭年收入低于5.5万元的农户所占比例估计为 B.估计该地农户家庭年收入的分位数为9万元 C.估计该地农户家庭年收入的平均值不超过6.5万元 D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间 【答案】ABD 【难度】0.65 【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计平均数、总体百分位数的估计 【分析】根据频率分布直方图求出各组频率即可判断AD,确定分位数判断B,利用频率分布直方图的平均数运算法则求解判断C. 【详解】对于A,由频率分布直方图知,家庭年收入低于5.5万元的农户所占比例约为 ,A正确; 对于B,由频率分布直方图知, 家庭年收入不超过8.5万元的农户约占, 家庭年收入不超过9.5万元的农户约占, 因此分位数为9,B正确; 对于C,由频率分布直方图知,该地农户家庭年收入的平均值约为 (万元) (万元),C错误; 对于D,家庭年收入介于4.5万元至8.5万元之间的农户约占, D正确. 故选:ABD. 【变式训练6】、(2024·四川·模拟预测)某市教育主管部门为了解高三年级学生学业达成的情况,对高三年级学生进行抽样调查,随机抽取了1000名学生,他们的学业达成情况按照从高到低都分布在五个层次内,分男、女生统计得到以下样本分布统计图,则下列叙述正确的是(    ) A.样本中层次的女生比相应层次的男生人数多 B.估计样本中男生学业达成的中位数比女生学业达成的中位数小 C.层次的女生和层次的男生在整个样本中频率相等 D.样本中层次的学生数和层次的学生数一样多 【答案】B 【难度】0.65 【知识点】根据扇形统计图解决实际问题、由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计中位数 【分析】频率分布直方图,得女生学业达成在各层次的频率,对选项中的频率频数问题进行判断. 【详解】对于AC,设女生学业达成频率分布直方图中的组距为, 由,得, 所以女生学业达成频率分布直方图中层次频率为,层次频率为, 层次频率为,层次频率为,层次频率为, 因为男、女生样本数未知,所以层次中男、女生人数不能比较,即A选项错误; 同理,层次女生在女生样本数中频率与层次男生在男生样本数中频率相等,都是, 但因男、女生人数未知,所以在整个样本中频率不一定相等,即C选项错误; 对于D,设女生人数为,男生人数为,但因男、女生人数可能不相等, 则层次的学生数为, 层次的学生数为, 因为不确定,所以与可能不相等,即D选项错误; 对于B,女生两个层次的频率之和为, 所以女生的样本学业达成的中位数为B,C层次的分界点, 男生两个层次的频率之和为,显然中位数落在C层次内, 所以样本中男生学业达成的中位数比女生学业达成的中位数小,B选项正确. 故选:B. 重难点题型(四) 百分位数 例7.(2024·天津·二模)为深入贯彻落实习近平总书记对天津工作“三个着力”重要要求,天津持续深化改革,创建全国文明城区,城市文明程度显著提升,人民群众的梦想不断实现.在创建文明城区的过程中,中央文明办对某小区居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了50名居民的问卷结果,统计其得分数据,将所得50份数据的得分结果分为6组:,并整理得到如下的频率分布直方图,则该小区居民得分的第70百分位数为(    )    A.89.09 B.86.52 C.84.55 D.81.32 【答案】C 【难度】0.65 【知识点】频率分布直方图的实际应用、总体百分位数的估计 【分析】利用百分位数的概念以及频率分布直方图求解. 【详解】由题意得, 解得, 因为前4组数据的频率之和为, 前5组数据的频率之和为, 则分位数在内,设分位数为x, 则,解得, 所以分位数约为. 故选:C. 例8.(22-23高三下·河南安阳·阶段练习)《中国居民膳食指南(2022)》数据显示,岁至岁儿童青少年超重肥胖率高达为了解某地中学生的体重情况,某机构从该地中学生中随机抽取名学生,测量他们的体重单位:千克,根据测量数据,按,,,,,分成六组,得到的频率分布直方图如图所示,根据调查的数据,估计该地中学生体重的分位数是 . 【答案】 【难度】0.85 【知识点】总体百分位数的估计 【分析】先根据频率分布直方图判断分位数的位置,然后列方程求解即可. 【详解】因为前2组的频率和为, 前3组的频率和为, 所以分位数在内, 设分位数为,则,解得. 故答案为: 【变式训练7】.(2024·安徽芜湖·二模)从某工厂生产的零件中随机抽取11个,其尺寸值为43,45,45,45,49,50,50,51,51,53,57(单位:mm),现从这11个零件中任取3个,则3个零件的尺寸刚好为这11个零件尺寸的平均数、第六十百分位数、众数的概率为 . 【答案】 【难度】0.65 【知识点】实际问题中的组合计数问题、计算古典概型问题的概率、计算几个数的平均数、总体百分位数的估计 【分析】分别求出11个零件的平均数49、第六十百分位数50,众数45,然后分别求出取出3个零件有165种,3个零件符合平均数、第六十百分位数、众数有6种情况,再利用古典概率从而可求解. 【详解】由题意知11个零件的平均数为, 第六十百分位数的位置为,即取第7位数50,故第六十百分位数为50, 由题可知众数为45, 所以当从11中取出3个零件共有种情况, 则3个数分别为平均数49、第六十百分位数50,众数45共有种情况, 所以其概率为, 故答案为:. 【变式训练8】.(2023·天津河西·一模)某市为了解全市12000名高一学生的体能素质情况,在全市高一学生中随机抽取了1000名学生进行体能测试,并将这1000名的体能测试成绩整理成如下频率分布直方图.根据此频率分布直方图,下列结论中正确的是(    ) A.图中的值为0.020; B.同一组中的数据用该组区间的中点值做代表,则这1000名学生的平均成绩约为80.5; C.估计样本数据的75%分位数为88; D.由样本数据可估计全市高一学生体测成绩优异(80分及以上)的人数约为5000人. 【答案】B 【难度】0.65 【知识点】由频率分布直方图估计平均数、总体百分位数的估计、补全频率分布直方图、由频率分布直方图计算频率、频数、样本容量、总体容量 【分析】A.根据频率和为1,计算的值;B.根据平均数公式,判断B;C.根据百分位数公式,判断C;计算体测成绩在内的频率,再结合总人数,即可判断D. 【详解】A.由频率分布直方图可知,, 得:,故A错误; B.,故B正确; C.设百分位数,易得, 则, 解得:,故C错误; D.则体测成绩在的频率为, 估计全市高一学生体测成绩优异(80分及以上)的人数约为人,故D错误. 故选:B. 重难点题型(五) 样本的数字特征 例9.(2025·湖北·模拟预测)甲、乙、丙、丁对某组数据(该组数据由5个整数组成)进行分析,得到以下数字特征,则不能判断这组数据一定都小于12的是(   ) A.甲:中位数为9,众数为11 B.乙:中位数为9,极差为3 C.丙:平均数为8,极差为4 D.丁:平均数为8,方差为3 【答案】B 【难度】0.65 【知识点】计算几个数的中位数、计算几个数据的极差、方差、标准差、计算几个数的众数、计算几个数的平均数 【分析】通过理解中位数,众数,极差,平均数,方差的概念及相关知识,再对5个数据进行举例假设分析,即可得到判断. 【详解】对于A,中位数为9,众数为11,说明11至少有两个数,不妨取两个11, 则由中位数可知另外两个数肯定不超过9,故A能判断这组数据都小于12,所以不能选A; 对于B,中位数为9,极差为3,由于极差是5个数中最大与最小的差, 由于该组数据由5个整数组成,所以不妨取4个9,1个12,这样不能判断该组数据一定小于12,故选B; 对于C,平均数为,极差为,由于个数都是整数,根据条件可知,这个数中肯定最大数与最小数的差为,则可知最大数肯定大于,最小数肯定小于,故最小数加得最大数肯定小于,从而能判断这组数据一定都小于12,故不能选C; 对于D,平均数为8,方差为3,由方差公式可得, 若存在数12,则 ,这与方差为3相矛盾,所以最大数也一定小于12,故不能选D; 故选:B. 例10.(2024·山东·二模)甲乙两名歌手参加选拔赛,5位评委评分情况如下:甲:;乙:,记甲、乙两人的平均得分分别为,则下列判断正确的是(    ) A.,甲比乙成绩稳定 B.,乙比甲成绩稳定 C.,甲比乙成绩稳定 D.,乙比甲成绩稳定 【答案】B 【难度】0.65 【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差 【分析】由平均数和方差公式求出,,,即可得出答案. 【详解】; ; , 所以,乙比甲成绩稳定. 故选:B. 【变式训练9】.(2024·山东济南·模拟预测)|(多选题)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这100名学生中,成绩位于内的学生成绩方差为12,成绩位于内的同学成绩方差为10.则(    ) A. B.估计该年级学生成绩的中位数约为77.14 C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50 D.估计该年级成绩在80分及以上的学生成绩的方差为30.25 【答案】BCD 【难度】0.65 【知识点】补全频率分布直方图、计算频率分布直方图中的方差、标准差、由频率分布直方图估计中位数、由频率分布直方图估计平均数 【分析】A项,由各组频率之和为求参数;B项可由频率分布直方图面积与比较,估计中位数所在区间,利用面积关系建方程求解可得;C项,两组求加权平均数可得;D项,由分别两组成绩的方差与两组总方差的关系求解即可. 【详解】A项,在频率分布直方图中,所有直方图的面积之和为1, 则,解得,故A错误; 项,前两个矩形的面积之和为 前三个矩形的面积之和为. 设该年级学生成绩的中位数为,则, 根据中位数的定义可得,解得, 所以,估计该年级学生成绩的中位数约为,故B正确; C项,估计成绩在80分以上的同学的成绩的平均数为 分,故C正确; D项,估计该年级成绩在80分及以上的学生成绩的方差为 ,故D正确. 故选:BCD. 【变式训练10】.(2025·湖北·一模)(多选题)天道酬勤,主动学习方能追求卓越.高三年级的小艾同学决定对函数、三角、数列、立几这四个内容的复习效果进行一次自我检测,每个内容各准备了10道典型题目.做完后对照答案记录每道题的失分(均为非负整数)情况,若某内容每道题失分都不超过7分,则认定该内容为“复习效果达标内容”,已知四个内容失分情况的相关数据信息如下,则一定为“复习效果达标内容”的是(   ) A.函数内容的10道题失分记录的中位数为3,极差为4 B.三角内容的10道题失分记录的平均数为2,众数为2 C.数列内容的10道题失分记录的平均数为3,方差为2.4 D.立几内容的10道题失分记录的平均数为3,第65百分位数为6 【答案】AC 【难度】0.65 【知识点】总体百分位数的估计、计算几个数的众数、计算几个数的中位数、计算几个数据的极差、方差、标准差 【分析】根据中位数、极差、平均数、众数、方差、百分位数等知识对选项进行分析,从而确定正确答案. 【详解】对于选项A,假设函数内容有一道题失分大于等于8分, 则由极差为4可知,函数内容失分最少的题的失分数据大于等于4, 则失分记录的中位数不可能为3,与题设中位数为3矛盾,故假设不成立, 所以函数内容每一道题失分都不超过7分, 故函数内容为“复习效果达标内容”,所以A正确; 对于选项B,设三角内容这10道题失分记录为0,0,1,1,2,2,2,2,8, 满足题设失分记录的平均数为2,众数为2的条件, 由定义知三角内容不是“复习效果达标内容”,所以B错误; 对于选项C,设数列内容这10道题失分记录从小到大依次为 , 则由平均数为3,方差为2.4可知,, 从而,若,则, 所以,故数列内容为“复习效果达标内容”,所以C正确; 对于选项D,设立几内容这10道题失分记录为0,0,0,0,0,0,6,6,6,12, 满足题设平均数为3,第65百分位数为6的条件, 由定义知立几内容不是“复习效果达标内容”,所以D错误; 故选:AC 重难点题型(六) 分层方差问题 例11.(2024·安徽·模拟预测)某小学对四年级的某个班进行数学测试,男生的平均分和方差分别为91和11,女生的平均分和方差分别为86和8,已知该班男生有30人,女生有20人,则该班本次数学测试的总体方差为 . 【答案】 【难度】0.65 【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差 【分析】先求出总体的平均数,在利用计算得解. 【详解】设全体同学数学成绩的平均分为,方差为, 记,,,,,, 依题意有, 则 . 故答案为:. 例12.(22-23高三下·安徽亳州·开学考试)现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为(    ) A. B. C. D. 【答案】D 【难度】0.4 【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差 【分析】利用平均数和方差公式可求得新数据的方差. 【详解】设甲组数据分别为、、、,乙组数据分别为、、、, 甲组数据的平均数为,可得,方差为,可得, 乙组数据的平均数为,可得,方差为,可得, 混合后,新数据的平均数为, 方差为 . 故选:D. 【变式训练11】.(2023·吉林·一模)吉林市一中学有男生900人,女生600人.在“书香校园”活动中,为了解全校学生的读书时间,按性别比例分层随机抽样的方法抽取100名学生,其中男生、女生每天读书时间的平均值分别为60分钟和80分钟,方差分别为10和15.结合上述数据估计该校学生每天读书时间的平均值为 分钟,方差为 . 【答案】 68 108 【难度】0.65 【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差、抽样比、样本总量、各层总数、总体容量的计算、估计总体的方差、标准差 【分析】利用分层抽样的平均值与方差公式计算即可. 【详解】由题意可知男生女生抽取比例分别为:, 故抽取样本的平均值为:, 方差为:. 以此估计该校学生每天读书时间的平均值为68;方差为108. 故答案为:68;108. 【变式训练12】.已知一组数据,,,…,的平均数为,方差为.若,,,…,的平均数比方差大4,则的最大值为 . 【答案】-1 【难度】0.4 【知识点】根据方差、标准差求参数、各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响 【分析】设新数据的平均数为,方差为,可得,,由新数据的平均数比方差大4可得,可得,代入可得其最大值. 【详解】解:设新数据,,,…,的平均数为,方差为, 可得:,,由新数据平均数比方差大4, 可得,可得, 可得:, 由,可得, 可得当时,可得的最大值为:, 故答案为:. 【点睛】本题主要考查数据的平均数、方差及其计算,属于中档题. 重难点题型(七) 综合应用 例13.(24-25高三上·广西柳州·阶段练习)在全球抗击新冠肺炎疫情期间,我国医疗物资生产企业加班加点生产口罩、防护服、消毒水等防疫物品,保障抗疫一线医疗物资供应,在国际社会上赢得一片赞誉.我国某口罩生产厂商在加大生产的同时,狠抓质量管理,不定时抽查口罩质量、该厂质检人员从某日生产的口罩中随机抽取了100个,将其质量指标值分成以下五组:,得到如下频率分布直方图.规定:口罩的质量指标值越高,说明该口罩质量越好,其中质量指标值低于130的为二级口罩,质量指标值不低于130的为一级口罩. (1)求该厂商生产口罩质量指标值的平均数和第60百分位数; (2)现从样本口罩中利用分层抽样的方法随机抽取8个口罩,再从中抽取3个,记其中一级口罩个数为,求的分布列及方差; (3)在2024年“五一”劳动节前,甲、乙两人计划同时在该型号口罩的某网络购物平台上分别参加两店各一个订单“秒杀”抢购,其中每个订单由个该型号口罩构成.假定甲、乙两人在两店订单“秒杀”成功的概率分别为,记甲、乙两人抢购成功的口罩总数量为,求当的数学期望取最大值时正整数的值. 【答案】(1)平均数为123,第60百分位数为125; (2)分布列见解析,方差为 (3)6 【难度】0.4 【知识点】由频率分布直方图估计平均数、写出简单离散型随机变量分布列、由导数求函数的最值(不含参)、离散型随机变量的方差与标准差 【分析】(1)利用中间值作代表求出平均数;判断出第60百分位数落在内,设其为,列出方程,求出答案; (2)求出一级口罩与二级口罩的个数比,从而得到抽取8个口罩中,一级口罩有2个,二级口罩有6个,的可能取值为0,1,2,并得到相应的概率,得到分布列和方差; (3)的可能取值为,并求出相应的概率,得到,换元后,求导,得到其单调性,从而确定当时,取最大值. 【详解】(1)该厂商生产口罩质量指标值的平均数为 ; , 故第60百分位数落在内,设其为, 则, 解得,故第60百分位数为125; (2)一级口罩与二级口罩的个数比为, 现从样本口罩中利用分层抽样的方法随机抽取8个口罩, 则一级口罩有个,二级口罩有个, 再从中抽取3个,记其中一级口罩个数为,的可能取值为0,1,2, ,,, 故的分布列如下: 0 1 2 数学期望为, 方差为 (3)的可能取值为, , , , 故, 令,设,则, 因为, 当时,,当时,, 在上单调递增,在上单调递减, 当,即时,取最大值. 【点睛】关键点点睛:表达出,用换元思想,进而求导,求解最值. 例14.(2024·河南驻马店·二模)某汽车销售公司为了提升公司的业绩,现将最近300个工作日每日的汽车销售情况进行统计,如图所示.    (1)求的值以及该公司这300个工作日每日汽车销售量的平均数(同一组中的数据用该组区间的中点值作代表); (2)以频率估计概率,若在所有工作日中随机选择4天,记汽车销售量在区间内的天数为,求的分布列及数学期望; (3)为增加销售量,公司规定顾客每购买一辆汽车可以进行一次抽奖活动,规则如下:抽奖区有两个盒子,其中盒中放有9张金卡、1张银卡,盒中放有2张金卡、8张银卡,顾客在不知情的情况下随机选择其中一个盒子进行抽奖,直到抽到金卡则抽奖结束(每次抽出一张卡,然后放回原来的盒中,再进行下次抽奖,中途可更换盒子),卡片结果的排列对应相应的礼品.已知顾客小明每次抽奖选择两个盒子的概率相同,求小明在首次抽奖抽出银卡的条件下,第二次从另外一个盒子中抽奖抽出金卡的概率. 【答案】(1),150 (2)分布列见解析, (3) 【难度】0.4 【知识点】计算条件概率、利用二项分布求分布列、由频率分布直方图估计平均数、二项分布的均值 【分析】(1)利用频率分布直方图中所有的矩形面积之和等于1求得值,根据平均数公式列式计算即得; (2)理解题意,判断,分别计算的所有可能指的概率,列出分布列,计算数学期望即得; (3)根据条件概率的计算公式可求该概率. 【详解】(1)依题意得 解得. 所求平均数为. (2)因汽车销售量在区间内的概率为, 在所有工作日中随机选择4天,相当于一个4重伯努利试验,故, 则,                0 1 2 3 4 故. (3)设为“小明在首次抽奖抽出银卡”,则, 设为“小明第二次从另外一个盒子中抽奖抽出金卡”, 则, 故. 【点睛】关键点点睛:本题主要考查频率分布直方图,二项分布以及条件概率公式的应用,属于较难题. 解题关键在于根据题设条件,确定伯努利概型并进行计算,设出相应的事件,正确理解题意,利用条件概率公式计算. 【变式训练13】.(2024·全国·模拟预测)某地脐橙,因“果皮中厚、脆而易剥,肉质细嫩化渣、无核少络,酸甜适度,汁多爽口,余味清香”而闻名.为了防止返贫,巩固脱贫攻坚成果,各职能部门对脐橙种植、销售、运输、改良等各方面给予大力支持.已知脐橙分类标准:果径为一级果,果径为二级果,果径或以上为三级果.某农产品研究所从种植园采摘的大量该地脐橙中随机抽取1000个,测量这些脐橙的果径(单位:),得到如图所示的频率分布直方图. (1)试估计这1000个脐橙的果径的中位数; (2)在这1000个脐橙中,按分层抽样的方法在果径中抽出9个脐橙,为进一步测量其他指标,在抽取的9个脐橙中再抽出3个,求抽到的一级果个数的分布列和数学期望; (3)以样本估计总体,用频率代替概率,某顾客从种植园的这批脐橙中随机购买100个,其中一级果的个数为,记一级果的个数为的概率为,写出的表达式,并求出当为何值时,最大? 【答案】(1) (2)分布列见解析, (3),30 【难度】0.4 【知识点】服从二项分布的随机变量概率最大问题、超几何分布的分布列、由频率分布直方图估计中位数、求离散型随机变量的均值 【分析】(1)利用频率分布直方图求中位数的方法即可得解; (2)根据题意,分析得一级果、二级果、三级果个数分别为4,3,2个,从而得到的所有可能取值,再利用超几何分布的分布列即可得解; (3)利用二项分布得到,再利用作商法判断出当时,最大,从而得解. 【详解】(1)果径的频率为, 果径的频率为. 故果径的中位数在,不妨设为, 则,解得, 所以估计这1000个脐橙的果径的中位数为. (2)果径的频率之比为, 所以分层抽样过程中,一级果、二级果、三级果个数分别为4,3,2个, 故随机变量的所有可能取值为, 则,, ,. 所以的分布列为 0 1 2 3 期望. (3)依题意知,这批果实中一级果的概率, 每个果实相互独立,则, 则, 令,解得, 故当时,, 即; 当时,, 即, 所以,即一级果的个数最有可能为30个. 【点睛】方法点睛:求二项分布中的最大值,一般有作差法与作商法,构建不等式组两种方法,但从解题便捷的角度,作商法会更容易点. 【变式训练14】.(2023·福建莆田·二模)互花米草是禾本科草本植物,其根系发达,具有极高的繁殖系数,对近海生态具有较大的危害.为尽快消除互花米草危害,2022年10月24日,市政府印发了《莆田市互花米草除治攻坚实施方案》,对全市除治攻坚行动做了具体部署.某研究小组为了解甲、乙两镇的互花米草根系分布深度情况,采用按比例分层抽样的方法抽取样本.已知甲镇的样本容量,样本平均数,样本方差;乙镇的样本容量,样本平均数,样本方差. (1)求由两镇样本组成的总样本的平均数及其方差; (2)为营造“广泛发动、全民参与”的浓厚氛围,甲、乙两镇决定进行一次“互花米草除治大练兵”比赛,两镇各派一支代表队参加,经抽签确定第一场在甲镇举行.比赛规则: 每场比赛直至分出胜负为止,胜方得1分,负方得0分,下一场在负方举行,先得2分的代表队获胜,比赛结束. 当比赛在甲镇举行时,甲镇代表队获胜的概率为,当比赛在乙镇举行时,甲镇代表队获胜的概率为.假设每场比赛结果相互独立.甲镇代表队的最终得分记为X,求. 参考数据:. 【答案】(1), (2) 【难度】0.4 【知识点】写出简单离散型随机变量分布列、计算几个数据的极差、方差、标准差、求离散型随机变量的均值 【分析】(1)利用平均数的计算公式求得,再利用方差的计算公式进行转化求解即可得解; (2)先根据题意得到的所有可能取值,再利用独立事件的概率公式分别求得各个取值的概率,从而利用数学期望的计算公式即可得解. 【详解】(1)根据题意,得, 因为, 同理, 所以 , 所以总样本的平均数为,方差. (2)依题意可知,的所有可能取值为, 设“第场比赛在甲镇举行,甲镇代表队获胜”为事件,“第场比赛在乙镇举行,甲镇代表队获胜”为事件, 则, 所以, , , 所以. 1.(2023·天津·高考真题)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰:“鸢飞戾天,鱼跃余渊”. 鸢尾花因花瓣形如鸢尾而得名,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制散点图如图所示,计算得样本相关系数为,利用最小二乘法求得相应的经验回归方程为,根据以上信息,如下判断正确的为(    ) A.花瓣长度和花萼长度不存在相关关系 B.花瓣长度和花萼长度负相关 C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值为 D.若从样本中抽取一部分,则这部分的相关系数一定是 【答案】C 【难度】0.85 【知识点】判断正、负相关、相关系数的意义及辨析 【分析】根据散点图的特点及经验回归方程可判断ABC选项,根据相关系数的定义可以判断D选项. 【详解】根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误 散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选项错误, 把代入可得,C选项正确; 由于是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的相关系数不一定是,D选项错误 故选:C 2.(2022·全国乙卷·高考真题)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图: 则下列结论中错误的是(    ) A.甲同学周课外体育运动时长的样本中位数为7.4 B.乙同学周课外体育运动时长的样本平均数大于8 C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4 D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6 【答案】C 【难度】0.94 【知识点】由茎叶图计算中位数、由茎叶图计算平均数、计算古典概型问题的概率 【分析】结合茎叶图、中位数、平均数、古典概型等知识确定正确答案. 【详解】对于A选项,甲同学周课外体育运动时长的样本中位数为,A选项结论正确. 对于B选项,乙同学课外体育运动时长的样本平均数为: , B选项结论正确. 对于C选项,甲同学周课外体育运动时长大于的概率的估计值, C选项结论错误. 对于D选项,乙同学周课外体育运动时长大于的概率的估计值, D选项结论正确. 故选:C 3.(2022·全国甲卷·高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图: 则(    ) A.讲座前问卷答题的正确率的中位数小于 B.讲座后问卷答题的正确率的平均数大于 C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差 D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差 【答案】B 【难度】0.94 【知识点】众数、平均数、中位数的比较、计算几个数据的极差、方差、标准差 【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解. 【详解】讲座前中位数为,所以错; 讲座后问卷答题的正确率只有一个是个,剩下全部大于等于,所以讲座后问卷答题的正确率的平均数大于,所以B对; 讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错; 讲座后问卷答题的正确率的极差为, 讲座前问卷答题的正确率的极差为,所以错. 故选:B. 4.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是(    ) A. B. C. D. 【答案】D 【难度】0.94 【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量 【分析】利用频率分布直方图可计算出评分在区间内的影视作品数量. 【详解】由频率分布直方图可知,评分在区间内的影视作品数量为. 故选:D. 5.(2021·全国甲卷·高考真题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图: 根据此频率分布直方图,下面结论中不正确的是(    ) A.该地农户家庭年收入低于4.5万元的农户比率估计为6% B.该地农户家庭年收入不低于10.5万元的农户比率估计为10% C.估计该地农户家庭年收入的平均值不超过6.5万元 D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间 【答案】C 【难度】0.85 【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计平均数 【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C. 【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值. 该地农户家庭年收入低于4.5万元的农户的比率估计值为,故A正确; 该地农户家庭年收入不低于10.5万元的农户比率估计值为,故B正确; 该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为,故D正确; 该地农户家庭年收入的平均值的估计值为(万元),超过6.5万元,故C错误. 综上,给出结论中不正确的是C. 故选:C. 【点睛】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于. 6.(2020·天津·高考真题)从一批零件中抽取80个,测量其直径(单位:),将所得数据分为9组:,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为(    ) A.10 B.18 C.20 D.36 【答案】B 【难度】0.85 【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量 【分析】根据直方图确定直径落在区间之间的零件频率,然后结合样本总数计算其个数即可. 【详解】根据直方图,直径落在区间之间的零件频率为:, 则区间内零件的个数为:. 故选:B. 【点睛】本题主要考查频率分布直方图的计算与实际应用,属于中等题. 7.(2023·新课标Ⅰ卷·高考真题)(多选题)有一组样本数据,其中是最小值,是最大值,则(    ) A.的平均数等于的平均数 B.的中位数等于的中位数 C.的标准差不小于的标准差 D.的极差不大于的极差 【答案】BD 【难度】0.65 【知识点】计算几个数的中位数、计算几个数的平均数、计算几个数据的极差、方差、标准差 【分析】根据题意结合平均数、中位数、标准差以及极差的概念逐项分析判断. 【详解】对于选项A:设的平均数为,的平均数为, 则, 因为没有确定的大小关系,所以无法判断的大小, 例如:,可得; 例如,可得; 例如,可得;故A错误; 对于选项B:不妨设, 可知的中位数等于的中位数均为,故B正确; 对于选项C:举反例说明,例如:,则平均数, 标准差, ,则平均数, 标准差,显然,即, 所以的标准差不小于的标准差,这一论断不成立,故C错误; 对于选项D:不妨设, 则,当且仅当时,等号成立,故D正确; 故选:BD. 8.(2021·新高考全国Ⅰ卷·高考真题)(多选题)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则(    ) A.两组样本数据的样本平均数相同 B.两组样本数据的样本中位数相同 C.两组样本数据的样本标准差相同 D.两组样本数据的样本极差相同 【答案】CD 【难度】0.94 【知识点】众数、平均数、中位数的比较、计算几个数据的极差、方差、标准差 【分析】A、C利用两组数据的线性关系有、,即可判断正误;根据中位数、极差的定义,结合已知线性关系可判断B、D的正误. 【详解】A:且,故平均数不相同,错误; B:若第一组中位数为,则第二组的中位数为,显然不相同,错误; C:,故方差相同,正确; D:由极差的定义知:若第一组的极差为,则第二组的极差为,故极差相同,正确; 故选:CD 9.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下: 试验序号 1 2 3 4 5 6 7 8 9 10 伸缩率 545 533 551 522 575 544 541 568 596 548 伸缩率 536 527 543 530 560 533 522 550 576 536 记,记的样本平均数为,样本方差为. (1)求,; (2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高) 【答案】(1),; (2)认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高. 【难度】0.85 【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差、统计新定义 【分析】(1)直接利用平均数公式即可计算出,再得到所有的值,最后计算出方差即可; (2)根据公式计算出的值,和比较大小即可. 【详解】(1), , , 的值分别为: , 故 (2)由(1)知:,,故有, 所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高. 10.(2023·新课标Ⅱ卷·高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:    利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率. (1)当漏诊率%时,求临界值c和误诊率; (2)设函数,当时,求的解析式,并求在区间的最小值. 【答案】(1),; (2),最小值为. 【难度】0.65 【知识点】频率分布直方图的实际应用、总体百分位数的估计 【分析】(1)根据题意由第一个图可先求出,再根据第二个图求出的矩形面积即可解出; (2)根据题意确定分段点,即可得出的解析式,再根据分段函数的最值求法即可解出. 【详解】(1)依题可知,左边图形第一个小矩形的面积为,所以, 所以,解得:, . (2)当时, ; 当时, , 故, 所以在区间的最小值为. 1 学科网(北京)股份有限公司 $$ 专题9.1 统计 目录 一、考纲要求 1.理解随机抽样、分层抽样的必要性和重要性; 2.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点; 3.理解样本数据标准差的意义和作用,会计算数据标准差; 4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想; 5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题. 二、考点网络 三、考情分析 考点要求 考题统计 考情分析 (1)会用简单随机抽样的方法从总体中抽取样本,了解分层随机抽样. (2)理解统计图表的含义. (3)会用统计图表对总体进行估计,会求n个数据的第p百分位数. (4)能用数字特征估计总体集中趋势和总体离散程度. 2023年上海卷第14题,4分 2023年上海卷第9题,5分 2023年I卷第9题,5分 2022年甲卷(文)第2题,5分 统计学是“大数据”技术的关键,在互联网时代具有强大的社会价值和经济价值,在高考中受重视程度越来越大,未来在考试中的出题角度会更加与实际生活紧密联系,背景新颢、形式多样. 四、考点梳理 知识点一、抽样 1、抽样调查 (1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体. (2)个体:构成总体的每一个元素叫做个体. (3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样本中个体的数目叫做样本容量. 2、简单随机抽样 (1)定义 一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本. (2)两种常用的简单随机抽样方法 ①抽签法:一般地,抽签法就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取次,就得到一个容量为的样本. ②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字,,,…,组成,并且每个数字在表中各个位置出现的机会都是一样的. 注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置. (3)抽签法与随机数法的适用情况 抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况,但是当总体容量很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便. (4)简单随机抽样的特征 ①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析. ②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作. ③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算. ④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平. 只有四个特点都满足的抽样才是简单随机抽样. 3、分层抽样 (1)定义 一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样. 分层抽样适用于已知总体是由差异明显的几部分组成的. (2)分层抽样问题类型及解题思路 ①求某层应抽个体数量:按该层所占总体的比例计算. ②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算. ③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比==” 注意:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取()个个体(其中是层数,是抽取的样本容量,是第层中个体的个数,是总体容量). 知识点二、用样本估计总体 1、频率分布直方图 (1)频率、频数、样本容量的计算方法 ①×组距=频率. ②=频率,=样本容量,样本容量×频率=频数. ③频率分布直方图中各个小方形的面积总和等于. 2、频率分布直方图中数字特征的计算 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积. 3、百分位数 (1)定义 一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值. (2)计算一组个数据的的第百分位数的步骤 ①按从小到大排列原始数据. ②计算. ③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数. (3)四分位数 我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数. 4、样本的数字特征 (1)众数、中位数、平均数 ①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平. ②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平. ③平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:. 5、标准差和方差 (1)定义 ①标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差. ②方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差. (2)数据特征 标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小. (3)平均数、方差的性质 如果数据的平均数为,方差为,那么 ①一组新数据的平均数为,方差是. ②一组新数据的平均数为,方差是. ③一组新数据的平均数为,方差是. 重难点题型(一) 随机抽样、分层抽样 例1.(24-25高三下·辽宁·阶段练习)某工厂生产了类、类、类三种产品各1080件、900件、360件,用分层随机抽样的方法从中抽取130件产品进行质量检测,则类与类产品共抽取的件数为(    ) A.110 B.90 C.60 D.50 例2.(2024·江西宜春·模拟预测)(多选题)某学校高三年级共有900人,其中男生500人,现采用按性别比例分配的分层抽样抽取了容量为90的样本.  经计算得男生的身高均值为170,方差为19,女生样本的身高均值为161,方差为19,则下列说法中正确的是(    ) A.女生的样本容量为40 B.女生甲被抽到的概率为 C.估计该校高三年级学生身高的均值为166 D.估计该校高三年级学生身高的方差大于19 【变式训练1】.(2025·江西萍乡·一模)某中学有初中生600名,高中生200名,为保障学生的身心健康,学校举办“校园安全知识”了竞赛.现按比例分配的分层随机抽样的方法,分别抽取初中生名,高中生名,经统计:名学生的平均成饽为74分,其中名初中生的平均成绩为72分,名高中生的平均成绩为分,则(    ) A.74 B.76 C.78 D.80 【变式训练2】.总体由编号为的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始从左到右依次选取两个数字,则选出来的第5个个体的编号为 . 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 重难点题型(二) 统计图表 例3.(2024·山西·模拟预测)某商场为了了解顾客的停车时长(单位:分钟),现随机抽取了100辆该商场到访顾客的车辆进行停车时长调查,将数据整理得到如下频率分布直方图:        则样本中停车时长在区间上的车辆数为 辆. 例4.(2025·陕西西安·一模)某校组织1000名学生参加“新中国成立75周年”知识竞赛,经统计这1000名学生的成绩都在区间内,按分数分成5组:,,,,,得到如图所示的频率分布直方图,根据图中数据,下列结论正确的是(   ) A.1000名学生成绩的平均数是77 B.成绩不低于80分的学生所占比例为40% C.用分层抽样从该校学生中抽取容量为100的样本,则应在内抽取30人 D.这1000名学生成绩的第50百分位数是80 【变式训练3】.(2025·贵州遵义·模拟预测)遵义羊肉粉是黔北民众最喜爱的小吃之一.2024年12月16日,遵义市第七届羊肉粉节在凤凰山文化广场盛大开幕,某商家为了调研顾客对本店就餐的满意度,从用过餐的顾客中随机抽取100名进行评分.整理评分数据,将收集到的顾客满意度分值数据(满分100分)分成六段:,,…,,得到如图所示的频率分布直方图,则下列选项正确的是(   ) A.这100名顾客评分的极差介于40分至50分之间 B.这100名顾客评分的中位数小于80分 C. D.这100名顾客评分的平均值介于60分到70分之间 【变式训练4】.(2025·辽宁·模拟预测)(多选题)某寄宿制学校为调查该校学生一天内在食堂的消费情况,随机抽取了名学生的消费金额作为样本,得到如图所示的频率分布直方图,则下列说法正确的是(    ) A. B.这名学生消费金额的众数为 C.这名学生消费金额的平均数为 D.为了解学生消费金额较低的原因,从消费金额低于元的学生中用分层随机抽样的方法随机抽取人座谈,则应抽取消费金额在区间内的学生人 重难点题型(三) 频率分布直方图 例5.(2024·四川绵阳·模拟预测)某教育机构为调查中小学生每日完成作业的时间,收集了某位学生100天每天完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了下列结论,其中正确的是(    )    A.估计该学生每日完成作业的时间在2小时至2.5小时的有50天 B.估计该学生每日完成作业时间超过3小时的概率为0.3 C.估计该学生每日完成作业时间的中位数为2.625小时 D.估计该学生每日完成作业时间的众数为2.3小时 例6.(2025·广东广州·模拟预测)(多选题)某校高三年级在一次考试后,为分析学生的学习情况,从中随机抽取了200名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析学生的成绩分布情况,经计算得到这200名学生中,成绩位于的学生成绩方差为13.75,成绩位于的学生成绩方差为7.75.则(   )    A. B.估计该年级学生成绩的中位数约为76.14 C.估计该年级在80分及以上的学生成绩的平均数为87.50 D.估计该年级在80分及以上的学生成绩的方差为31 【变式训练5】.(2024·甘肃张掖·一模)(多选题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图. 根据此频率分布直方图,下面结论中正确的有(   ) A.该地家庭年收入低于5.5万元的农户所占比例估计为 B.估计该地农户家庭年收入的分位数为9万元 C.估计该地农户家庭年收入的平均值不超过6.5万元 D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间 【变式训练6】、(2024·四川·模拟预测)某市教育主管部门为了解高三年级学生学业达成的情况,对高三年级学生进行抽样调查,随机抽取了1000名学生,他们的学业达成情况按照从高到低都分布在五个层次内,分男、女生统计得到以下样本分布统计图,则下列叙述正确的是(    ) A.样本中层次的女生比相应层次的男生人数多 B.估计样本中男生学业达成的中位数比女生学业达成的中位数小 C.层次的女生和层次的男生在整个样本中频率相等 D.样本中层次的学生数和层次的学生数一样多 重难点题型(四) 百分位数 例7.(2024·天津·二模)为深入贯彻落实习近平总书记对天津工作“三个着力”重要要求,天津持续深化改革,创建全国文明城区,城市文明程度显著提升,人民群众的梦想不断实现.在创建文明城区的过程中,中央文明办对某小区居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了50名居民的问卷结果,统计其得分数据,将所得50份数据的得分结果分为6组:,并整理得到如下的频率分布直方图,则该小区居民得分的第70百分位数为(    )    A.89.09 B.86.52 C.84.55 D.81.32 例8.(22-23高三下·河南安阳·阶段练习)《中国居民膳食指南(2022)》数据显示,岁至岁儿童青少年超重肥胖率高达为了解某地中学生的体重情况,某机构从该地中学生中随机抽取名学生,测量他们的体重单位:千克,根据测量数据,按,,,,,分成六组,得到的频率分布直方图如图所示,根据调查的数据,估计该地中学生体重的分位数是 . 【变式训练7】.(2024·安徽芜湖·二模)从某工厂生产的零件中随机抽取11个,其尺寸值为43,45,45,45,49,50,50,51,51,53,57(单位:mm),现从这11个零件中任取3个,则3个零件的尺寸刚好为这11个零件尺寸的平均数、第六十百分位数、众数的概率为 . 【变式训练8】.(2023·天津河西·一模)某市为了解全市12000名高一学生的体能素质情况,在全市高一学生中随机抽取了1000名学生进行体能测试,并将这1000名的体能测试成绩整理成如下频率分布直方图.根据此频率分布直方图,下列结论中正确的是(    ) A.图中的值为0.020; B.同一组中的数据用该组区间的中点值做代表,则这1000名学生的平均成绩约为80.5; C.估计样本数据的75%分位数为88; D.由样本数据可估计全市高一学生体测成绩优异(80分及以上)的人数约为5000人. 重难点题型(五) 样本的数字特征 例9.(2025·湖北·模拟预测)甲、乙、丙、丁对某组数据(该组数据由5个整数组成)进行分析,得到以下数字特征,则不能判断这组数据一定都小于12的是(   ) A.甲:中位数为9,众数为11 B.乙:中位数为9,极差为3 C.丙:平均数为8,极差为4 D.丁:平均数为8,方差为3 例10.(2024·山东·二模)甲乙两名歌手参加选拔赛,5位评委评分情况如下:甲:;乙:,记甲、乙两人的平均得分分别为,则下列判断正确的是(    ) A.,甲比乙成绩稳定 B.,乙比甲成绩稳定 C.,甲比乙成绩稳定 D.,乙比甲成绩稳定 【变式训练9】.(2024·山东济南·模拟预测)|(多选题)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这100名学生中,成绩位于内的学生成绩方差为12,成绩位于内的同学成绩方差为10.则(    ) A. B.估计该年级学生成绩的中位数约为77.14 C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50 D.估计该年级成绩在80分及以上的学生成绩的方差为30.25 【变式训练10】.(2025·湖北·一模)(多选题)天道酬勤,主动学习方能追求卓越.高三年级的小艾同学决定对函数、三角、数列、立几这四个内容的复习效果进行一次自我检测,每个内容各准备了10道典型题目.做完后对照答案记录每道题的失分(均为非负整数)情况,若某内容每道题失分都不超过7分,则认定该内容为“复习效果达标内容”,已知四个内容失分情况的相关数据信息如下,则一定为“复习效果达标内容”的是(   ) A.函数内容的10道题失分记录的中位数为3,极差为4 B.三角内容的10道题失分记录的平均数为2,众数为2 C.数列内容的10道题失分记录的平均数为3,方差为2.4 D.立几内容的10道题失分记录的平均数为3,第65百分位数为6 重难点题型(六) 分层方差问题 例11.(2024·安徽·模拟预测)某小学对四年级的某个班进行数学测试,男生的平均分和方差分别为91和11,女生的平均分和方差分别为86和8,已知该班男生有30人,女生有20人,则该班本次数学测试的总体方差为 . 例12.(22-23高三下·安徽亳州·开学考试)现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为(    ) A. B. C. D. 【变式训练11】.(2023·吉林·一模)吉林市一中学有男生900人,女生600人.在“书香校园”活动中,为了解全校学生的读书时间,按性别比例分层随机抽样的方法抽取100名学生,其中男生、女生每天读书时间的平均值分别为60分钟和80分钟,方差分别为10和15.结合上述数据估计该校学生每天读书时间的平均值为 分钟,方差为 . 【变式训练12】.已知一组数据,,,…,的平均数为,方差为.若,,,…,的平均数比方差大4,则的最大值为 . 重难点题型(七) 综合应用 例13.(24-25高三上·广西柳州·阶段练习)在全球抗击新冠肺炎疫情期间,我国医疗物资生产企业加班加点生产口罩、防护服、消毒水等防疫物品,保障抗疫一线医疗物资供应,在国际社会上赢得一片赞誉.我国某口罩生产厂商在加大生产的同时,狠抓质量管理,不定时抽查口罩质量、该厂质检人员从某日生产的口罩中随机抽取了100个,将其质量指标值分成以下五组:,得到如下频率分布直方图.规定:口罩的质量指标值越高,说明该口罩质量越好,其中质量指标值低于130的为二级口罩,质量指标值不低于130的为一级口罩. (1)求该厂商生产口罩质量指标值的平均数和第60百分位数; (2)现从样本口罩中利用分层抽样的方法随机抽取8个口罩,再从中抽取3个,记其中一级口罩个数为,求的分布列及方差; (3)在2024年“五一”劳动节前,甲、乙两人计划同时在该型号口罩的某网络购物平台上分别参加两店各一个订单“秒杀”抢购,其中每个订单由个该型号口罩构成.假定甲、乙两人在两店订单“秒杀”成功的概率分别为,记甲、乙两人抢购成功的口罩总数量为,求当的数学期望取最大值时正整数的值. 例14.(2024·河南驻马店·二模)某汽车销售公司为了提升公司的业绩,现将最近300个工作日每日的汽车销售情况进行统计,如图所示.    (1)求的值以及该公司这300个工作日每日汽车销售量的平均数(同一组中的数据用该组区间的中点值作代表); (2)以频率估计概率,若在所有工作日中随机选择4天,记汽车销售量在区间内的天数为,求的分布列及数学期望; (3)为增加销售量,公司规定顾客每购买一辆汽车可以进行一次抽奖活动,规则如下:抽奖区有两个盒子,其中盒中放有9张金卡、1张银卡,盒中放有2张金卡、8张银卡,顾客在不知情的情况下随机选择其中一个盒子进行抽奖,直到抽到金卡则抽奖结束(每次抽出一张卡,然后放回原来的盒中,再进行下次抽奖,中途可更换盒子),卡片结果的排列对应相应的礼品.已知顾客小明每次抽奖选择两个盒子的概率相同,求小明在首次抽奖抽出银卡的条件下,第二次从另外一个盒子中抽奖抽出金卡的概率. 【变式训练13】.(2024·全国·模拟预测)某地脐橙,因“果皮中厚、脆而易剥,肉质细嫩化渣、无核少络,酸甜适度,汁多爽口,余味清香”而闻名.为了防止返贫,巩固脱贫攻坚成果,各职能部门对脐橙种植、销售、运输、改良等各方面给予大力支持.已知脐橙分类标准:果径为一级果,果径为二级果,果径或以上为三级果.某农产品研究所从种植园采摘的大量该地脐橙中随机抽取1000个,测量这些脐橙的果径(单位:),得到如图所示的频率分布直方图. (1)试估计这1000个脐橙的果径的中位数; (2)在这1000个脐橙中,按分层抽样的方法在果径中抽出9个脐橙,为进一步测量其他指标,在抽取的9个脐橙中再抽出3个,求抽到的一级果个数的分布列和数学期望; (3)以样本估计总体,用频率代替概率,某顾客从种植园的这批脐橙中随机购买100个,其中一级果的个数为,记一级果的个数为的概率为,写出的表达式,并求出当为何值时,最大? 【变式训练14】.(2023·福建莆田·二模)互花米草是禾本科草本植物,其根系发达,具有极高的繁殖系数,对近海生态具有较大的危害.为尽快消除互花米草危害,2022年10月24日,市政府印发了《莆田市互花米草除治攻坚实施方案》,对全市除治攻坚行动做了具体部署.某研究小组为了解甲、乙两镇的互花米草根系分布深度情况,采用按比例分层抽样的方法抽取样本.已知甲镇的样本容量,样本平均数,样本方差;乙镇的样本容量,样本平均数,样本方差. (1)求由两镇样本组成的总样本的平均数及其方差; (2)为营造“广泛发动、全民参与”的浓厚氛围,甲、乙两镇决定进行一次“互花米草除治大练兵”比赛,两镇各派一支代表队参加,经抽签确定第一场在甲镇举行.比赛规则: 每场比赛直至分出胜负为止,胜方得1分,负方得0分,下一场在负方举行,先得2分的代表队获胜,比赛结束. 当比赛在甲镇举行时,甲镇代表队获胜的概率为,当比赛在乙镇举行时,甲镇代表队获胜的概率为.假设每场比赛结果相互独立.甲镇代表队的最终得分记为X,求. 参考数据:. 1.(2023·天津·高考真题)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰:“鸢飞戾天,鱼跃余渊”. 鸢尾花因花瓣形如鸢尾而得名,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制散点图如图所示,计算得样本相关系数为,利用最小二乘法求得相应的经验回归方程为,根据以上信息,如下判断正确的为(    ) A.花瓣长度和花萼长度不存在相关关系 B.花瓣长度和花萼长度负相关 C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值为 D.若从样本中抽取一部分,则这部分的相关系数一定是 2.(2022·全国乙卷·高考真题)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图: 则下列结论中错误的是(    ) A.甲同学周课外体育运动时长的样本中位数为7.4 B.乙同学周课外体育运动时长的样本平均数大于8 C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4 D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6 3.(2022·全国甲卷·高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图: 则(    ) A.讲座前问卷答题的正确率的中位数小于 B.讲座后问卷答题的正确率的平均数大于 C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差 D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差 4.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是(    ) A. B. C. D. 5.(2021·全国甲卷·高考真题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图: 根据此频率分布直方图,下面结论中不正确的是(    ) A.该地农户家庭年收入低于4.5万元的农户比率估计为6% B.该地农户家庭年收入不低于10.5万元的农户比率估计为10% C.估计该地农户家庭年收入的平均值不超过6.5万元 D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间 6.(2020·天津·高考真题)从一批零件中抽取80个,测量其直径(单位:),将所得数据分为9组:,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为(    ) A.10 B.18 C.20 D.36 7.(2023·新课标Ⅰ卷·高考真题)(多选题)有一组样本数据,其中是最小值,是最大值,则(    ) A.的平均数等于的平均数 B.的中位数等于的中位数 C.的标准差不小于的标准差 D.的极差不大于的极差 8.(2021·新高考全国Ⅰ卷·高考真题)(多选题)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则(    ) A.两组样本数据的样本平均数相同 B.两组样本数据的样本中位数相同 C.两组样本数据的样本标准差相同 D.两组样本数据的样本极差相同 9.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下: 试验序号 1 2 3 4 5 6 7 8 9 10 伸缩率 545 533 551 522 575 544 541 568 596 548 伸缩率 536 527 543 530 560 533 522 550 576 536 记,记的样本平均数为,样本方差为. (1)求,; (2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高) 10.(2023·新课标Ⅱ卷·高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:    利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率. (1)当漏诊率%时,求临界值c和误诊率; (2)设函数,当时,求的解析式,并求在区间的最小值. 1 学科网(北京)股份有限公司 $$

资源预览图

专题9.1 统计(七大重难点题型精讲)-备战2025年高考数学一轮复习题型精讲与精练(新高考通用)
1
专题9.1 统计(七大重难点题型精讲)-备战2025年高考数学一轮复习题型精讲与精练(新高考通用)
2
专题9.1 统计(七大重难点题型精讲)-备战2025年高考数学一轮复习题型精讲与精练(新高考通用)
3
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。