专题4 第3讲统计与成对数据的统计分析(Word教参)-【精讲精练】2026年高考数学二轮专题辅导与训练

2026-02-10

| 14页

| 20人阅读

| 2人下载

教辅

山东育博苑文化传媒有限公司

进店逛逛

资源信息

学段	高中
学科	数学
教材版本	-
年级	高三
章节	-
类型	教案-讲义
知识点	统计
使用场景	高考复习-二轮专题
学年	2026-2027
地区（省份）	全国
地区（市）	-
地区（区县）	-
文件格式	DOCX
文件大小	597 KB
发布时间	2026-02-10
更新时间	2026-02-10
作者	山东育博苑文化传媒有限公司
品牌系列	精讲精练·二轮专题辅导与训练
审核时间	2025-12-11
下载链接	https://m.zxxk.com/soft/55372063.html
价格	3.00储值（1储值=1元）
来源	学科网

摘要：

该高中数学高考复习讲义聚焦统计与成对数据的统计分析，系统整合用样本估计总体、回归分析（线性与非线性）、独立性检验三大核心考点，按命题点分层构建知识体系，通过考点梳理、典例精讲、真题演练、分层练习的教学流程，帮助学生突破统计量计算、模型选择、数据推断等难点，体现复习的系统性和针对性。资料突出数学核心素养培养，如通过散点图观察数据分布特征培养数学眼光，将非线性回归转化为线性回归发展数学思维，结合真题与预测练强化数据观念。设置“模型选择—参数计算—实际应用”三步教学活动，助力教师精准把控复习节奏，有效提升学生的数据分析和问题解决能力。

内容正文：

第三讲　统计与成对数据的统计分析 [对应学生用书P55] 命题点1　用样本估计总体 [例1]　(1)(多选)(2025·湖北武汉二模)随着Deepseek的流行，各种AI大模型层出不穷，现有甲、乙两个AI大模型，在对甲、乙两个大模型进行深度体验后，6位评委分别对甲、乙进行打分(满分10分)，得到如图所示的统计表格，则下列结论中正确的是(　　) 评委编号 1 2 3 4 5 6 模型甲 7.0 9.3 8.3 9.2 8.9 8.9 模型乙 8.1 9.1 8.5 8.6 8.7 8.6 A．甲得分的平均数大于乙得分的平均数 B．甲得分的众数大于乙得分的众数 C．甲得分的中位数大于乙得分的中位数 D．甲得分的方差大于乙得分的方差 (2)(2025·山东泰安二模)某学校为提高学生学习英语的积极性，举办了英语知识竞赛，把2000名学生的竞赛成绩(满分100分，成绩取整数)按[60，70)，[70，80)，[80，90)，[90，100]分成四组，并整理成如图所示的频率分布直方图，则下列说法正确的为(　　) A．a的值为0.015 B．估计成绩低于80分的有50人 C．估计这组数据的众数为80 D．估计这组数据的第60百分位数为87 [解析]　(1)甲、乙的得分从小到大排列如下：甲：7.0，8.3，8.9，8.9，9.2，9.3，乙：8.1，8.5，8.6，8.6，8.7，9.1，甲得分的中位数为8.9，乙得分的中位数为8.6，甲得分的中位数大于乙得分的中位数，故C正确；甲得分的众数为8.9，乙得分的众数为8.6，甲得分的众数大于乙得分的众数，故B正确；甲得分的平均数为＝8.6，乙得分的平均数为＝8.6，所以甲得分的平均数等于乙得分的平均数，故A错误；甲的方差s＝ ≈0.613 3，乙的方差s＝ ≈0.086 7，故甲得分的方差大于乙得分的方差，故D正确．故选BCD. (2)易知10a＋0.020×10＋0.050×10＋0.025×10＝1，解得a＝0.005，所以A错误；成绩低于80分的频率为0.005×10＋0.020×10＝0.25，所以估计总体有2000×0.25＝500人，所以B错误；由频率分布直方图可知众数落在[80，90)区间，用区间中点表示众数即85，所以C错误；由频率分布直方图可知前两组频率之和为0.005×10＋0.020×10＝0.25，前三组频率之和为0.005×10＋0.020×10＋0.050×10＝0.75，故第60百分位数落在区间[80，90)，设第60百分位数为x，则0.25＋(x－80)×0.050＝0.60，解得x＝87，故D正确．故选D. [答案]　(1)BCD　(2)D 解题的关键是理解统计图表的含义，从中提取数字信息，平均数、众数、中位数描述数据的集中趋势，方差与标准差描述数据的波动大小，标准差、方差越小，数据的离散程度越小，越稳定． [预测练1] 1．(多选)(2025·辽宁大连二模)已知10个样本数据，若去掉其中最大和最小的数据，设剩下的8个样本数据的方差为s，平均数为1；最大和最小两个数据的方差为s，平均数为2；原样本数据的方差为s2，平均数为.若1＝2，则(　　) A．剩下的8个样本数据与原样本数据的中位数不变 B．＝1 C．剩下8个数据的下四分位数大于原样本数据的下四分位数 D．s2＝s＋s 解析　设10个样本数据从小到大排列分别为x1，x2，x3，…，x10，则剩下的8个样本数据为x2，x3，…，x9. 对于A，原样本数据的中位数为，剩下的8个样本数据的中位数为，故A正确；对于B，由题意，1＝，2＝，＝. 因为1＝2，所以1＝＝，即x2＋x3＋…＋x9＝81， x1＋x10＝21，故x1＋x2＋x3＋…＋x9＋x10＝101，故(x1＋x2＋x3＋…＋x9＋x10)＝1，故＝1，故B正确；对于C，因为8×＝2，故剩下8个数据的下四分位数为，又 10×＝2.5，故原样本数据的下四分位数为x3，又x4≥x3，故≥x3，故C错误；对于D，因为＝1＝2，所以s＝(x＋x＋…＋x)－2，s＝－2，s2＝(x＋x＋…＋x)－2. 故x＋x＋…＋x＝8s＋82， x＋x＝2s＋22，故s2＝－2＝s＋s，故D正确．故选ABD. 答案　ABD 2．(2025·四川绵阳三模)某家电公司生产了A，B两种不同型号的空调，公司统计了某地区2024年的前6个月这两种型号空调的销售情况，得到销售量的折线统计图如图所示，分析这6个月的销售数据，下列说法不正确的是(　　) A.A型号空调月销售量的极差比B型号空调月销售量的极差大 B．A型号空调月平均销售量比B型号空调月平均销售量大 C．A型号空调月销售量的上四分位数比B型号空调销售量的上四分位数大 D．A型号空调月销售量的方差比B型号空调月销售量的方差小解析　由图可知，A型号空调月销售量的极差为50－25＝25， B型号空调月销售量的极差为45－22＝23，故A正确； A型号空调月平均销售量为(25＋28＋27＋42＋38＋50)＝35， B型号空调月平均销售量为(22＋25＋30＋37＋40＋45)≈33，故B正确；将A型号空调月销售量数据从小到大排列为：25，27，28，38，42，50，由6×75%＝4.5，则A型号空调月销售量的上四分位数为42，将B型号空调月销售量数据从小到大排列为22，25，30，37，40，45，由6×75%＝4.5，则B型号空调月销售量的上四分位数为40，故C正确； A型号空调月销售量的方差为 [(25－35)2＋(28－35)2＋(27－35)2＋(42－35)2＋(38－35)2＋(50－35)2]≈83， B型号空调月销售量的方差为[(22－33)2＋(25－33)2＋(30－33)2＋(37－33)2＋(40－33)2＋(45－33)2]≈67，故D错误．故选D. 答案　D 命题点2　回归分析考向1　线性回归分析 [例2]　某民营学校为增强实力与影响力，大力招揽名师、建设校园硬件设施，近5年该校招生人数的数据如下表．年份序号x 1 2 3 4 5 招生人数y/千人 0.8 1 1.3 1.7 2.2 (1)由表中数据可看出，可用线性回归模型拟合y与x的关系，请用相关系数加以证明； (2)求y关于x的经验回归方程，并预测当年份序号为7时该校的招生人数．参考数据：xiyi＝24.5， (yi－)2＝1.26，≈3.55. 参考公式：相关系数r＝，经验回归方程＝x＋中斜率和截距的最小二乘估计公式分别为＝，＝－. [解析]　(1)由题意知＝(1＋2＋3＋4＋5)＝3，＝(0.8＋1＋1.3＋1.7＋2.2)＝1.4， (xi－)2＝4＋1＋0＋1＋4＝10，所以r＝＝＝≈≈0.986，因为r与1非常接近，故可用线性回归模型拟合y与x的关系． (2)＝＝＝0.35，＝－＝1.4－0.35×3＝0.35，所以y关于x的经验回归方程为＝0.35x＋0.35. 当x＝7时，＝0.35×7＋0.35＝2.8，由此预测当年份序号为7时该校的招生人数为2.8千人. 考向2　非线性回归分析 [例3]　(2025·四川成都模拟)当前，全球贸易格局发生重大变化，随着中美贸易战的不断升级，让越来越多的中国科技企业开始意识到自主创新的重要性，大大加强科技研发投入力度，形成掌控高新尖端核心技术及其市场的能力．某企业为确定下一年对某产品进行科技升级的研发费用，需了解该产品年研发费用x(单位：千万元)对年销售量y(单位：千万件)的影响，根据市场调研与模拟，对收集的数据(xi，yi)(i＝1，2，3，…，10)进行初步处理，得到散点图及一些统计量的值如下： uivi ui vi u 30.5 15 15 46.5 表中ui＝ln xi，vi＝ln yi. (1)根据散点图判断，y＝a＋bx与y＝cxd哪一个更适合作为年销售量y关于年研发费用x的回归方程类型(给出判断即可，不必说明理由)，并根据判断结果及表中数据，建立y关于x的回归方程；附：对于一组数据(ui，vi)(i＝1，2，3，…，n)，其回归直线＝βu＋α的斜率和截距的最小二乘估计分别为β＝＝，α＝－β . (2)科技升级后，该产品的效率X大幅提高，经试验统计得X大致服从正态分布N(0.52，0.012).企业对科技升级团队的奖励方案如下：若X不超过50%，不予奖励；若X超过50%，但不超过53%，每件产品奖励2元；若X超过53%，每件产品奖励4元，记Y为每件产品获得的奖励，求E(Y)(精确到0.01). 附：若随机变量X～N(μ，σ2) (σ>0)，则P(μ－σ<X≤μ＋σ)＝0.682 7，P(μ－2σ<X≤μ＋2σ)＝0.954 5. [解析]　(1)根据散点图可判断，y＝cxd更适合作为y关于x的回归方程类型．对y＝cxd两边取对数，得ln y＝ln c＋d ln x，即v＝ln c＋du，由表中数据得：＝＝1.5，d＝＝＝， ln c＝－d＝1.5－×1.5＝1，所以c＝e，所以y关于x的回归方程为y＝ex. (2)因为μ－2σ＝0.5，μ＋σ＝0.53，所以P(0.50<X≤0.53)＝P(μ－2σ<X≤μ＋σ) ＝P(μ－2σ<X≤μ－σ)＋P(μ－σ<X≤μ＋σ) ＝＋0.682 7＝0.818 6， P(X>0.53)＝P(X>μ＋σ)＝， E(Y)＝0＋2×0.818 6＋4×＝2.271 8≈2.27(元). 回归分析通常用来判断两组数据之间的关系，解此类题时要清楚： (1)若两个变量呈现线性相关关系，可直接通过计算公式求回归方程； (2)若两个变量呈现非线性相关关系，解题时可利用化归与转化思想，通过恰当的变换，将其转化为线性相关关系，再求回归方程； (3)利用回归方程可以进行预测与估计，但要注意回归方程表示的是两组数据之间的相关关系，并不是函数关系，所以利用该方程求出的值是估计值，而不是一个确定的值． [预测练2] 1．(2025·沈阳高三调研)调查某种群花萼长度和花瓣长度，所得数据如图所示．其中相关系数r＝0.824 5，下列说法正确的是(　　) A．花瓣长度和花萼长度没有相关性 B．花瓣长度和花萼长度呈负相关 C．花瓣长度和花萼长度呈正相关 D．若从样本中抽取一部分，则这部分的相关系数一定是0.824 5 解析　因为相关系数r＝0.824 5>0.75，所以花瓣长度和花萼长度的相关性较强，并且呈正相关，所以选项A，B错误，选项C正确；因为相关系数与样本的数据有关，所以当样本发生变化时，相关系数也会发生变化，所以选项D错误．故选C. 答案　C 2．当前，新一轮科技革命和产业变革蓬勃兴起，以区块链为代表的新一代信息技术迅猛发展，现收集某地近6年区块链企业总数量相关数据，如表：年份 2020 2021 2022 2023 2024 2025 编号x 1 2 3 4 5 6 企业总数量y/百个 50 78 124 121 137 352 (1)若用模型y＝aebx拟合y与x的关系，根据提供的数据，求出y与x的经验回归方程； (2)为了促进公司间的合作与发展，区块链联合总部决定进行一次信息化技术比赛，邀请甲、乙、丙三家区块链公司参赛．比赛规则如下：①每场比赛有两个公司参加，并决出胜负；②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛；③在比赛中，若有一个公司首先获胜两场，则本次比赛结束，该公司获得此次信息化技术比赛的“优胜公司”称号．已知在每场比赛中，甲胜乙的概率为，甲胜丙的概率为，乙胜丙的概率为，若首场由甲、乙比赛，求甲公司获得“优胜公司”称号的概率．参考数据：ui＝28.5，xiui＝106.05，其中，ui＝ln yi. 参考公式：对于一组数据(xi，yi)(i＝1，2，3，…，n)，其经验回归方程＝x＋的斜率和截距的最小二乘估计分别为＝，＝－. 解析　(1)令＝ln ＝ln (ex)＝x＋ln ，＝＝3.5，＝＝4.75，则＝＝＝0.36， ln ＝4.75－0.36×3.5＝3.49，所以＝e3.49，所以＝e3.49·e0.36x＝e0.36x+3.49. (2)设甲公司获得“优胜公司”称号为事件A，则P(A)＝×＋×××＋×××＝，所以甲公司获得“优胜公司”称号的概率为. 命题点3　独立性检测 [例4]　(2025·全国一卷)为研究某疾病与超声波检查结果的关系，从做过超声波检查的人群中随机调查了1000人，得到如下列联表：组别超声波检查结果合计正常不正常患该疾病 20 180 200 未患该疾病 780 20 800 合计 800 200 1000 (1)记超声波检查结果不正常者患该疾病的概率为p，求p的估计值； (2)根据小概率值α＝0.001的独立性检验，分析超声波检查结果是否与患该疾病有关．附χ2＝. α 0.050 0.010 0.001 xα 3.841 6.635 10.828 [解析]　(1)由题表可知，检查结果不正常者有200人，检查结果不正常者中患有该疾病的有180人，所以由样本估计总体得p＝＝0.9. (2)零假设H0：超声波检查结果与是否患该疾病无关． χ2＝＝765.625>10.828，所以依据小概率值α＝0.001的独立性检验，我们推断H0不成立，即认为超声波检查结果与是否患该疾病有关．解决独立性检验问题的关键三关 (1)假设关：假设两个分类变量无关． (2)公式关：把相关数据代入独立性检验公式求χ2的观测值． (3)对比关：将求出的χ2的观测值与临界值比对，进行准确判断． [预测练3] (2025·广东湛江二模)为了研究观众对某档节目的喜爱情况与性别的关联性，分别调查了该档节目男、女观众各100人，发现共有70名观众喜爱该档节目，且不喜爱该档节目的女性观众数是喜爱该档节目的男性观众数的2倍． (1)根据题中信息，完成下面列联表；单位：人性别喜爱情况合计喜爱不喜爱男女合计 (2)根据(1)中的列联表，依据α＝0.1的独立性检验，能否认为观众对该档节目的喜爱情况与性别有关？附：χ2＝，n＝a＋b＋c＋d. α 0.1 0.05 0.01 xα 2.706 3.841 6.635 解析　(1)设喜爱该档节目的男性观众数为x，则喜爱该档节目的女性观众数为70－x，不喜爱该档节目的女性观众数为2x，则70－x＋2x＝100，得x＝30.故列联表完成如下．单位：人性别喜爱情况合计喜爱不喜爱男 30 70 100 女 40 60 100 合计 70 130 200 (2)零假设为H0：观众对该档节目的喜爱情况与性别无关．根据(1)中列联表的数据，计算得到χ2＝＝≈2.198<2.706＝x0.1. 根据α＝0.1的独立性检验，没有充分证据推断H0不成立，因此可以认为H0成立，即认为观众对该档节目的喜爱情况与性别无关． [对应学生用书P59] 1．(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻，得到各块稻田的亩产量(单位：kg)并整理得下表：亩产量 [900，950) [950，1000) [1000，1050) 频数 6 12 18 亩产量 [1050，1100) [1100，1150) [1150，1200) 频数 30 24 10 根据表中数据，下列结论中正确的是(　　) A．100块稻田亩产量的中位数小于1050 kg B．100块稻田中亩产量低于1100 kg的稻田所占比例超过80% C．100块稻田亩产量的极差介于200 kg至300 kg之间 D．100块稻田亩产量的平均值介于900 kg至1000 kg之间解析　对于A，因为前3组的频率之和0.06＋0.12＋0.18＝0.36<0.5，前4组的频率之和0.36＋0.30＝0.66>0.5，所以100块稻田亩产量的中位数所在的区间为[1050，1100)，故A不正确；对于B，100块稻田中亩产量低于1100 kg的稻田所占比例为×100%＝66%，故B不正确；对于C，因为1200－900＝300，1150－950＝200，所以100块稻田亩产量的极差介于200 kg至300 kg之间，故C正确；对于D，100块稻田亩产量的平均值为×(925×6＋975×12＋1025×18＋1075×30＋1125×24＋1175×10)＝1067(kg)，故D不正确．故选C. 答案　C 2．(多选)(2023·新课标Ⅰ卷)有一组样本数据x1，x2，…，x6，其中x1是最小值，x6是最大值，则(　　) A．x2，x3，x4，x5的平均数等于x1，x2，…，x6的平均数 B．x2，x3，x4，x5的中位数等于x1，x2，…，x6的中位数 C．x2，x3，x4，x5的标准差不小于x1，x2，…，x6的标准差 D．x2，x3，x4，x5的极差不大于x1，x2，…，x6的极差解析　对于选项A：设x2，x3，x4，x5的平均数为m，x1，x2，…，x6的平均数为n，则n－m＝－＝，因为没有确定2，x2＋x3＋x4＋x5的大小关系，所以无法判断m，n的大小，例如：1，2，3，4，5，6，可得m＝n＝3.5；例如1，1，1，1，1，7，可得m＝1，n＝2；例如1，2，2，2，2，2，可得m＝2，n＝；故A错误；对于选项B：不妨设x1≤x2≤x3≤x4≤x5≤x6，可知x2，x3，x4，x5的中位数等于x1，x2，…，x6的中位数均为，故B正确；对于选项C：因为x1是最小值，x6是最大值，则x2，x3，x4，x5的波动性不大于x1，x2，…，x6的波动性，即x2，x3，x4，x5的标准差不大于x1，x2，…，x6的标准差，例如：2，4，6，8，10，12，则平均数n＝(2＋4＋6＋8＋10＋12)＝7，标准差s1＝＝， 4，6，8，10，则平均数m＝＝7，标准差s2＝＝，显然>，即s1>s2；故C错误；对于选项D：不妨设x1≤x2≤x3≤x4≤x5≤x6，则x6－x1≥x5－x2，当且仅当x1＝x2，x5＝x6时，等号成立，故D正确．故选BD. 答案　BD 3．(多选)(2021·新高考Ⅱ卷)下列统计量中，能度量样本x1，x2，…，xn的离散程度的是(　　) A．样本x1，x2，…，xn的标准差 B．样本x1，x2，…，xn的中位数 C．样本x1，x2，…，xn的极差 D．样本x1，x2，…，xn的平均数解析　由标准差的定义可知，标准差考查的是数据的离散程度；由中位数的定义可知，中位数考查的是数据的集中趋势；由极差的定义可知，极差考查的是数据的离散程度；由平均数的定义可知，平均数考查的是数据的集中趋势；故选AC. 答案　AC 4．(2024·全国甲卷)某工厂进行生产线智能化升级改造．升级改造后，从该工厂甲、乙两个车间的产品中随机抽取150件进行检验，数据如下：优级品合格品不合格品总计甲车间 26 24 0 50 乙车间 70 28 2 100 总计 96 52 2 150 (1)填写如下列联表：优级品非优级品甲车间乙车间能否有95%的把握认为甲、乙两车间产品的优级品率存在差异？能否有99%的把握认为甲、乙两车间产品的优级品率存在差异？ (2)已知升级改造前该工厂产品的优级品率p＝0.5.设为升级改造后抽取的n件产品的优级品率．如果>p＋1.65，则认为该工厂产品的优级品率提高了．根据抽取的150件产品的数据，能否认为生产线智能化升级改造后，该工厂产品的优级品率提高了？(≈12.247) 附：χ2＝，n＝a＋b＋c＋d. α 0.050 0.010 0.001 xα 3.841 6.635 10.828 解析　(1)填写列联表如下：优级品非优级品甲车间 26 24 乙车间 70 30 则完整的2×2列联表如下：优级品非优级品总计甲车间 26 24 50 乙车间 70 30 100 总计 96 54 150 χ2＝＝4.687 5. 因为χ2＝4.687 5>3.841，所以有95%的把握认为甲、乙两车间产品的优级品率存在差异；因为χ2＝4.687 5<6.635，所以没有99%的把握认为甲、乙两车间产品的优级品率存在差异． (2)由题意可知＝＝0.64，又p＋1.65＝0.5＋1.65× ≈0.5＋1.65×≈0.57，所以>p＋1.65，所以能认为生产线智能化升级改造后，该工厂产品的优级品率提高了．学科网（北京）股份有限公司 $

资源预览图

专题4 第3讲统计与成对数据的统计分析(Word教参)-【精讲精练】2026年高考数学二轮专题辅导与训练

所属专辑

教辅

（配套教参）【精讲精练】2026年高考数学二轮专题辅导与训练

高三数学第三方合辑 42 份文档

415人已阅读

专题4 第3讲 统计与成对数据的统计分析(Word教参)-【精讲精练】2026年高考数学二轮专题辅导与训练

资源信息

摘要：

内容正文：

资源预览图

专题4 第3讲统计与成对数据的统计分析(Word教参)-【精讲精练】2026年高考数学二轮专题辅导与训练