专题4 第3讲 统计与成对数据的统计分析(Word教参)-【精讲精练】2026年高考数学二轮专题辅导与训练

2026-02-10
| 14页
| 20人阅读
| 2人下载
教辅
山东育博苑文化传媒有限公司
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 -
年级 高三
章节 -
类型 教案-讲义
知识点 统计
使用场景 高考复习-二轮专题
学年 2026-2027
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 DOCX
文件大小 597 KB
发布时间 2026-02-10
更新时间 2026-02-10
作者 山东育博苑文化传媒有限公司
品牌系列 精讲精练·二轮专题辅导与训练
审核时间 2025-12-11
下载链接 https://m.zxxk.com/soft/55372063.html
价格 3.00储值(1储值=1元)
来源 学科网

摘要:

该高中数学高考复习讲义聚焦统计与成对数据的统计分析,系统整合用样本估计总体、回归分析(线性与非线性)、独立性检验三大核心考点,按命题点分层构建知识体系,通过考点梳理、典例精讲、真题演练、分层练习的教学流程,帮助学生突破统计量计算、模型选择、数据推断等难点,体现复习的系统性和针对性。 资料突出数学核心素养培养,如通过散点图观察数据分布特征培养数学眼光,将非线性回归转化为线性回归发展数学思维,结合真题与预测练强化数据观念。设置“模型选择—参数计算—实际应用”三步教学活动,助力教师精准把控复习节奏,有效提升学生的数据分析和问题解决能力。

内容正文:

第三讲 统计与成对数据的统计分析 [对应学生用书P55] 命题点1 用样本估计总体 [例1] (1)(多选)(2025·湖北武汉二模)随着Deepseek的流行,各种AI大模型层出不穷,现有甲、乙两个AI大模型,在对甲、乙两个大模型进行深度体验后,6位评委分别对甲、乙进行打分(满分10分),得到如图所示的统计表格,则下列结论中正确的是(  ) 评委编号 1 2 3 4 5 6 模型甲 7.0 9.3 8.3 9.2 8.9 8.9 模型乙 8.1 9.1 8.5 8.6 8.7 8.6 A.甲得分的平均数大于乙得分的平均数 B.甲得分的众数大于乙得分的众数 C.甲得分的中位数大于乙得分的中位数 D.甲得分的方差大于乙得分的方差 (2)(2025·山东泰安二模)某学校为提高学生学习英语的积极性,举办了英语知识竞赛,把2000名学生的竞赛成绩(满分100分,成绩取整数)按[60,70),[70,80),[80,90),[90,100]分成四组,并整理成如图所示的频率分布直方图,则下列说法正确的为(  ) A.a的值为0.015 B.估计成绩低于80分的有50人 C.估计这组数据的众数为80 D.估计这组数据的第60百分位数为87 [解析] (1)甲、乙的得分从小到大排列如下: 甲:7.0,8.3,8.9,8.9,9.2,9.3, 乙:8.1,8.5,8.6,8.6,8.7,9.1, 甲得分的中位数为8.9,乙得分的中位数为8.6,甲得分的中位数大于乙得分的中位数,故C正确; 甲得分的众数为8.9,乙得分的众数为8.6,甲得分的众数大于乙得分的众数,故B正确; 甲得分的平均数为=8.6, 乙得分的平均数为=8.6,所以甲得分的平均数等于乙得分的平均数,故A错误; 甲的方差s= ≈0.613 3, 乙的方差s= ≈0.086 7, 故甲得分的方差大于乙得分的方差,故D正确.故选BCD. (2)易知10a+0.020×10+0.050×10+0.025×10=1,解得a=0.005,所以A错误; 成绩低于80分的频率为0.005×10+0.020×10=0.25,所以估计总体有2000×0.25=500人,所以B错误; 由频率分布直方图可知众数落在[80,90)区间,用区间中点表示众数即85,所以C错误; 由频率分布直方图可知前两组频率之和为0.005×10+0.020×10=0.25, 前三组频率之和为0.005×10+0.020×10+0.050×10=0.75,故第60百分位数落在区间[80,90),设第60百分位数为x,则0.25+(x-80)×0.050=0.60,解得x=87,故D正确. 故选D. [答案] (1)BCD (2)D 解题的关键是理解统计图表的含义,从中提取数字信息,平均数、众数、中位数描述数据的集中趋势,方差与标准差描述数据的波动大小,标准差、方差越小,数据的离散程度越小,越稳定. [预测练1] 1.(多选)(2025·辽宁大连二模)已知10个样本数据,若去掉其中最大和最小的数据,设剩下的8个样本数据的方差为s,平均数为1;最大和最小两个数据的方差为s,平均数为2;原样本数据的方差为s2,平均数为.若1=2,则(  ) A.剩下的8个样本数据与原样本数据的中位数不变 B.=1 C.剩下8个数据的下四分位数大于原样本数据的下四分位数 D.s2=s+s 解析 设10个样本数据从小到大排列分别为x1,x2,x3,…,x10,则剩下的8个样本数据为x2,x3,…,x9. 对于A,原样本数据的中位数为,剩下的8个样本数据的中位数为,故A正确; 对于B,由题意,1=,2=,=. 因为1=2,所以1==,即x2+x3+…+x9=81, x1+x10=21, 故x1+x2+x3+…+x9+x10=101,故(x1+x2+x3+…+x9+x10)=1,故=1,故B正确; 对于C,因为8×=2,故剩下8个数据的下四分位数为, 又 10×=2.5,故原样本数据的下四分位数为x3,又x4≥x3,故≥x3,故C错误; 对于D,因为=1=2,所以s=(x+x+…+x)-2,s=-2,s2=(x+x+…+x)-2. 故x+x+…+x=8s+82, x+x=2s+22, 故s2=-2=s+s,故D正确.故选ABD. 答案 ABD 2.(2025·四川绵阳三模)某家电公司生产了A,B两种不同型号的空调,公司统计了某地区2024年的前6个月这两种型号空调的销售情况,得到销售量的折线统计图如图所示,分析这6个月的销售数据,下列说法不正确的是(  ) A.A型号空调月销售量的极差比B型号空调月销售量的极差大 B.A型号空调月平均销售量比B型号空调月平均销售量大 C.A型号空调月销售量的上四分位数比B型号空调销售量的上四分位数大 D.A型号空调月销售量的方差比B型号空调月销售量的方差小 解析 由图可知,A型号空调月销售量的极差为50-25=25, B型号空调月销售量的极差为45-22=23,故A正确; A型号空调月平均销售量为(25+28+27+42+38+50)=35, B型号空调月平均销售量为(22+25+30+37+40+45)≈33,故B正确; 将A型号空调月销售量数据从小到大排列为:25,27,28,38,42,50, 由6×75%=4.5,则A型号空调月销售量的上四分位数为42, 将B型号空调月销售量数据从小到大排列为22,25,30,37,40,45, 由6×75%=4.5,则B型号空调月销售量的上四分位数为40,故C正确; A型号空调月销售量的方差为 [(25-35)2+(28-35)2+(27-35)2+(42-35)2+(38-35)2+(50-35)2]≈83, B型号空调月销售量的方差为[(22-33)2+(25-33)2+(30-33)2+(37-33)2+(40-33)2+(45-33)2]≈67, 故D错误.故选D. 答案 D 命题点2 回归分析 考向1 线性回归分析 [例2] 某民营学校为增强实力与影响力,大力招揽名师、建设校园硬件设施,近5年该校招生人数的数据如下表. 年份序号x 1 2 3 4 5 招生人数y/千人 0.8 1 1.3 1.7 2.2 (1)由表中数据可看出,可用线性回归模型拟合y与x的关系,请用相关系数加以证明; (2)求y关于x的经验回归方程,并预测当年份序号为7时该校的招生人数. 参考数据:xiyi=24.5, (yi-)2=1.26,≈3.55. 参考公式:相关系数r=, 经验回归方程=x+中斜率和截距的最小二乘估计公式分别为 =,=-. [解析] (1)由题意知=(1+2+3+4+5)=3, =(0.8+1+1.3+1.7+2.2)=1.4, (xi-)2=4+1+0+1+4=10, 所以r= ==≈≈0.986, 因为r与1非常接近,故可用线性回归模型拟合y与x的关系. (2)===0.35, =-=1.4-0.35×3=0.35, 所以y关于x的经验回归方程为=0.35x+0.35. 当x=7时,=0.35×7+0.35=2.8, 由此预测当年份序号为7时该校的招生人数为2.8千人. 考向2 非线性回归分析 [例3] (2025·四川成都模拟)当前,全球贸易格局发生重大变化,随着中美贸易战的不断升级,让越来越多的中国科技企业开始意识到自主创新的重要性,大大加强科技研发投入力度,形成掌控高新尖端核心技术及其市场的能力.某企业为确定下一年对某产品进行科技升级的研发费用,需了解该产品年研发费用x(单位:千万元)对年销售量y(单位:千万件)的影响,根据市场调研与模拟,对收集的数据(xi,yi)(i=1,2,3,…,10)进行初步处理,得到散点图及一些统计量的值如下: uivi ui vi u 30.5 15 15 46.5 表中ui=ln xi,vi=ln yi. (1)根据散点图判断,y=a+bx与y=cxd哪一个更适合作为年销售量y关于年研发费用x的回归方程类型(给出判断即可,不必说明理由),并根据判断结果及表中数据,建立y关于x的回归方程; 附:对于一组数据(ui,vi)(i=1,2,3,…,n),其回归直线=βu+α的斜率和截距的最小二乘估计分别为β==,α=-β . (2)科技升级后,该产品的效率X大幅提高,经试验统计得X大致服从正态分布N(0.52,0.012).企业对科技升级团队的奖励方案如下:若X不超过50%,不予奖励;若X超过50%,但不超过53%,每件产品奖励2元;若X超过53%,每件产品奖励4元,记Y为每件产品获得的奖励,求E(Y)(精确到0.01). 附:若随机变量X~N(μ,σ2) (σ>0),则P(μ-σ<X≤μ+σ)=0.682 7,P(μ-2σ<X≤μ+2σ)=0.954 5. [解析] (1)根据散点图可判断,y=cxd更适合作为y关于x的回归方程类型. 对y=cxd两边取对数,得ln y=ln c+d ln x, 即v=ln c+du, 由表中数据得:==1.5,d===, ln c=-d=1.5-×1.5=1,所以c=e, 所以y关于x的回归方程为y=ex. (2)因为μ-2σ=0.5,μ+σ=0.53, 所以P(0.50<X≤0.53)=P(μ-2σ<X≤μ+σ) =P(μ-2σ<X≤μ-σ)+P(μ-σ<X≤μ+σ) =+0.682 7=0.818 6, P(X>0.53)=P(X>μ+σ)=, E(Y)=0+2×0.818 6+4×=2.271 8≈2.27(元). 回归分析通常用来判断两组数据之间的关系,解此类题时要清楚: (1)若两个变量呈现线性相关关系,可直接通过计算公式求回归方程; (2)若两个变量呈现非线性相关关系,解题时可利用化归与转化思想,通过恰当的变换,将其转化为线性相关关系,再求回归方程; (3)利用回归方程可以进行预测与估计,但要注意回归方程表示的是两组数据之间的相关关系,并不是函数关系,所以利用该方程求出的值是估计值,而不是一个确定的值. [预测练2] 1.(2025·沈阳高三调研)调查某种群花萼长度和花瓣长度,所得数据如图所示.其中相关系数r=0.824 5,下列说法正确的是(  ) A.花瓣长度和花萼长度没有相关性 B.花瓣长度和花萼长度呈负相关 C.花瓣长度和花萼长度呈正相关 D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5 解析 因为相关系数r=0.824 5>0.75,所以花瓣长度和花萼长度的相关性较强,并且呈正相关,所以选项A,B错误,选项C正确;因为相关系数与样本的数据有关,所以当样本发生变化时,相关系数也会发生变化,所以选项D错误.故选C. 答案 C 2.当前,新一轮科技革命和产业变革蓬勃兴起,以区块链为代表的新一代信息技术迅猛发展,现收集某地近6年区块链企业总数量相关数据,如表: 年份 2020 2021 2022 2023 2024 2025 编号x 1 2 3 4 5 6 企业总数量y/百个 50 78 124 121 137 352 (1)若用模型y=aebx拟合y与x的关系,根据提供的数据,求出y与x的经验回归方程; (2)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛.比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司获得此次信息化技术比赛的“优胜公司”称号.已知在每场比赛中,甲胜乙的概率为,甲胜丙的概率为,乙胜丙的概率为,若首场由甲、乙比赛,求甲公司获得“优胜公司”称号的概率. 参考数据:ui=28.5,xiui=106.05,其中,ui=ln yi. 参考公式:对于一组数据(xi,yi)(i=1,2,3,…,n),其经验回归方程=x+的斜率和截距的最小二乘估计分别为=,=-. 解析 (1)令=ln =ln (ex)=x+ln , ==3.5,==4.75, 则= ==0.36, ln =4.75-0.36×3.5=3.49,所以=e3.49, 所以=e3.49·e0.36x=e0.36x+3.49. (2)设甲公司获得“优胜公司”称号为事件A, 则P(A)=×+×××+×××=, 所以甲公司获得“优胜公司”称号的概率为. 命题点3 独立性检测 [例4] (2025·全国一卷)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1000人,得到如下列联表: 组别 超声波检查结果 合计 正常 不正常 患该疾病 20 180 200 未患该疾病 780 20 800 合计 800 200 1000 (1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值; (2)根据小概率值α=0.001的独立性检验,分析超声波检查结果是否与患该疾病有关. 附χ2=. α 0.050 0.010 0.001 xα 3.841 6.635 10.828 [解析] (1)由题表可知,检查结果不正常者有200人,检查结果不正常者中患有该疾病的有180人, 所以由样本估计总体得p==0.9. (2)零假设H0:超声波检查结果与是否患该疾病无关. χ2==765.625>10.828, 所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为超声波检查结果与是否患该疾病有关. 解决独立性检验问题的关键三关 (1)假设关:假设两个分类变量无关. (2)公式关:把相关数据代入独立性检验公式求χ2的观测值. (3)对比关:将求出的χ2的观测值与临界值比对,进行准确判断. [预测练3] (2025·广东湛江二模)为了研究观众对某档节目的喜爱情况与性别的关联性,分别调查了该档节目男、女观众各100人,发现共有70名观众喜爱该档节目,且不喜爱该档节目的女性观众数是喜爱该档节目的男性观众数的2倍. (1)根据题中信息,完成下面列联表; 单位:人 性别 喜爱情况 合计 喜爱 不喜爱 男 女 合计 (2)根据(1)中的列联表,依据α=0.1的独立性检验,能否认为观众对该档节目的喜爱情况与性别有关? 附:χ2=,n=a+b+c+d. α 0.1 0.05 0.01 xα 2.706 3.841 6.635 解析 (1)设喜爱该档节目的男性观众数为x,则喜爱该档节目的女性观众数为70-x,不喜爱该档节目的女性观众数为2x,则70-x+2x=100,得x=30.故列联表完成如下. 单位:人 性别 喜爱情况 合计 喜爱 不喜爱 男 30 70 100 女 40 60 100 合计 70 130 200 (2)零假设为H0:观众对该档节目的喜爱情况与性别无关. 根据(1)中列联表的数据,计算得到χ2==≈2.198<2.706=x0.1. 根据α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为观众对该档节目的喜爱情况与性别无关. [对应学生用书P59] 1.(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表: 亩产量 [900,950) [950,1000) [1000,1050) 频数 6 12 18 亩产量 [1050,1100) [1100,1150) [1150,1200) 频数 30 24 10 根据表中数据,下列结论中正确的是(  ) A.100块稻田亩产量的中位数小于1050 kg B.100块稻田中亩产量低于1100 kg的稻田所占比例超过80% C.100块稻田亩产量的极差介于200 kg至300 kg之间 D.100块稻田亩产量的平均值介于900 kg至1000 kg之间 解析 对于A,因为前3组的频率之和0.06+0.12+0.18=0.36<0.5,前4组的频率之和0.36+0.30=0.66>0.5,所以100块稻田亩产量的中位数所在的区间为[1050,1100),故A不正确;对于B,100块稻田中亩产量低于1100 kg的稻田所占比例为×100%=66%,故B不正确;对于C,因为1200-900=300,1150-950=200,所以100块稻田亩产量的极差介于200 kg至300 kg之间,故C正确;对于D,100块稻田亩产量的平均值为×(925×6+975×12+1025×18+1075×30+1125×24+1175×10)=1067(kg),故D不正确.故选C. 答案 C 2.(多选)(2023·新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则(  ) A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数 B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数 C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差 D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差 解析 对于选项A:设x2,x3,x4,x5的平均数为m,x1,x2,…,x6的平均数为n, 则n-m=-=, 因为没有确定2,x2+x3+x4+x5的大小关系,所以无法判断m,n的大小, 例如:1,2,3,4,5,6,可得m=n=3.5; 例如1,1,1,1,1,7,可得m=1,n=2; 例如1,2,2,2,2,2,可得m=2,n=;故A错误; 对于选项B:不妨设x1≤x2≤x3≤x4≤x5≤x6, 可知x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数均为,故B正确; 对于选项C:因为x1是最小值,x6是最大值, 则x2,x3,x4,x5的波动性不大于x1,x2,…,x6的波动性,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标准差, 例如:2,4,6,8,10,12,则平均数n=(2+4+6+8+10+12)=7, 标准差s1= =, 4,6,8,10,则平均数m==7, 标准差s2==,显然>,即s1>s2;故C错误; 对于选项D:不妨设x1≤x2≤x3≤x4≤x5≤x6, 则x6-x1≥x5-x2,当且仅当x1=x2,x5=x6时,等号成立,故D正确.故选BD. 答案 BD 3.(多选)(2021·新高考Ⅱ卷)下列统计量中,能度量样本x1,x2,…,xn的离散程度的是(  ) A.样本x1,x2,…,xn的标准差 B.样本x1,x2,…,xn的中位数 C.样本x1,x2,…,xn的极差 D.样本x1,x2,…,xn的平均数 解析 由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选AC. 答案 AC 4.(2024·全国甲卷)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下: 优级品 合格品 不合格品 总计 甲车间 26 24 0 50 乙车间 70 28 2 100 总计 96 52 2 150 (1)填写如下列联表: 优级品 非优级品 甲车间 乙车间 能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异? (2)已知升级改造前该工厂产品的优级品率p=0.5.设为升级改造后抽取的n件产品的优级品率.如果>p+1.65,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(≈12.247) 附:χ2=,n=a+b+c+d. α 0.050 0.010 0.001 xα 3.841 6.635 10.828 解析 (1)填写列联表如下: 优级品 非优级品 甲车间 26 24 乙车间 70 30 则完整的2×2列联表如下: 优级品 非优级品 总计 甲车间 26 24 50 乙车间 70 30 100 总计 96 54 150 χ2==4.687 5. 因为χ2=4.687 5>3.841,所以有95%的把握认为甲、乙两车间产品的优级品率存在差异; 因为χ2=4.687 5<6.635,所以没有99%的把握认为甲、乙两车间产品的优级品率存在差异. (2)由题意可知==0.64, 又p+1.65=0.5+1.65× ≈0.5+1.65×≈0.57, 所以>p+1.65,所以能认为生产线智能化升级改造后,该工厂产品的优级品率提高了. 学科网(北京)股份有限公司 $

资源预览图

专题4 第3讲 统计与成对数据的统计分析(Word教参)-【精讲精练】2026年高考数学二轮专题辅导与训练
1
专题4 第3讲 统计与成对数据的统计分析(Word教参)-【精讲精练】2026年高考数学二轮专题辅导与训练
2
专题4 第3讲 统计与成对数据的统计分析(Word教参)-【精讲精练】2026年高考数学二轮专题辅导与训练
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。