专题4 第3讲 统计与成对数据的统计分析(Word教参)-【精讲精练】2026年高考数学二轮专题辅导与训练
2026-02-10
|
14页
|
20人阅读
|
2人下载
教辅
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | - |
| 年级 | 高三 |
| 章节 | - |
| 类型 | 教案-讲义 |
| 知识点 | 统计 |
| 使用场景 | 高考复习-二轮专题 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | DOCX |
| 文件大小 | 597 KB |
| 发布时间 | 2026-02-10 |
| 更新时间 | 2026-02-10 |
| 作者 | 山东育博苑文化传媒有限公司 |
| 品牌系列 | 精讲精练·二轮专题辅导与训练 |
| 审核时间 | 2025-12-11 |
| 下载链接 | https://m.zxxk.com/soft/55372063.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
该高中数学高考复习讲义聚焦统计与成对数据的统计分析,系统整合用样本估计总体、回归分析(线性与非线性)、独立性检验三大核心考点,按命题点分层构建知识体系,通过考点梳理、典例精讲、真题演练、分层练习的教学流程,帮助学生突破统计量计算、模型选择、数据推断等难点,体现复习的系统性和针对性。
资料突出数学核心素养培养,如通过散点图观察数据分布特征培养数学眼光,将非线性回归转化为线性回归发展数学思维,结合真题与预测练强化数据观念。设置“模型选择—参数计算—实际应用”三步教学活动,助力教师精准把控复习节奏,有效提升学生的数据分析和问题解决能力。
内容正文:
第三讲 统计与成对数据的统计分析
[对应学生用书P55]
命题点1 用样本估计总体
[例1] (1)(多选)(2025·湖北武汉二模)随着Deepseek的流行,各种AI大模型层出不穷,现有甲、乙两个AI大模型,在对甲、乙两个大模型进行深度体验后,6位评委分别对甲、乙进行打分(满分10分),得到如图所示的统计表格,则下列结论中正确的是( )
评委编号
1
2
3
4
5
6
模型甲
7.0
9.3
8.3
9.2
8.9
8.9
模型乙
8.1
9.1
8.5
8.6
8.7
8.6
A.甲得分的平均数大于乙得分的平均数
B.甲得分的众数大于乙得分的众数
C.甲得分的中位数大于乙得分的中位数
D.甲得分的方差大于乙得分的方差
(2)(2025·山东泰安二模)某学校为提高学生学习英语的积极性,举办了英语知识竞赛,把2000名学生的竞赛成绩(满分100分,成绩取整数)按[60,70),[70,80),[80,90),[90,100]分成四组,并整理成如图所示的频率分布直方图,则下列说法正确的为( )
A.a的值为0.015
B.估计成绩低于80分的有50人
C.估计这组数据的众数为80
D.估计这组数据的第60百分位数为87
[解析] (1)甲、乙的得分从小到大排列如下:
甲:7.0,8.3,8.9,8.9,9.2,9.3,
乙:8.1,8.5,8.6,8.6,8.7,9.1,
甲得分的中位数为8.9,乙得分的中位数为8.6,甲得分的中位数大于乙得分的中位数,故C正确;
甲得分的众数为8.9,乙得分的众数为8.6,甲得分的众数大于乙得分的众数,故B正确;
甲得分的平均数为=8.6,
乙得分的平均数为=8.6,所以甲得分的平均数等于乙得分的平均数,故A错误;
甲的方差s=
≈0.613 3,
乙的方差s=
≈0.086 7,
故甲得分的方差大于乙得分的方差,故D正确.故选BCD.
(2)易知10a+0.020×10+0.050×10+0.025×10=1,解得a=0.005,所以A错误;
成绩低于80分的频率为0.005×10+0.020×10=0.25,所以估计总体有2000×0.25=500人,所以B错误;
由频率分布直方图可知众数落在[80,90)区间,用区间中点表示众数即85,所以C错误;
由频率分布直方图可知前两组频率之和为0.005×10+0.020×10=0.25,
前三组频率之和为0.005×10+0.020×10+0.050×10=0.75,故第60百分位数落在区间[80,90),设第60百分位数为x,则0.25+(x-80)×0.050=0.60,解得x=87,故D正确.
故选D.
[答案] (1)BCD (2)D
解题的关键是理解统计图表的含义,从中提取数字信息,平均数、众数、中位数描述数据的集中趋势,方差与标准差描述数据的波动大小,标准差、方差越小,数据的离散程度越小,越稳定.
[预测练1]
1.(多选)(2025·辽宁大连二模)已知10个样本数据,若去掉其中最大和最小的数据,设剩下的8个样本数据的方差为s,平均数为1;最大和最小两个数据的方差为s,平均数为2;原样本数据的方差为s2,平均数为.若1=2,则( )
A.剩下的8个样本数据与原样本数据的中位数不变
B.=1
C.剩下8个数据的下四分位数大于原样本数据的下四分位数
D.s2=s+s
解析 设10个样本数据从小到大排列分别为x1,x2,x3,…,x10,则剩下的8个样本数据为x2,x3,…,x9.
对于A,原样本数据的中位数为,剩下的8个样本数据的中位数为,故A正确;
对于B,由题意,1=,2=,=.
因为1=2,所以1==,即x2+x3+…+x9=81,
x1+x10=21,
故x1+x2+x3+…+x9+x10=101,故(x1+x2+x3+…+x9+x10)=1,故=1,故B正确;
对于C,因为8×=2,故剩下8个数据的下四分位数为,
又 10×=2.5,故原样本数据的下四分位数为x3,又x4≥x3,故≥x3,故C错误;
对于D,因为=1=2,所以s=(x+x+…+x)-2,s=-2,s2=(x+x+…+x)-2.
故x+x+…+x=8s+82,
x+x=2s+22,
故s2=-2=s+s,故D正确.故选ABD.
答案 ABD
2.(2025·四川绵阳三模)某家电公司生产了A,B两种不同型号的空调,公司统计了某地区2024年的前6个月这两种型号空调的销售情况,得到销售量的折线统计图如图所示,分析这6个月的销售数据,下列说法不正确的是( )
A.A型号空调月销售量的极差比B型号空调月销售量的极差大
B.A型号空调月平均销售量比B型号空调月平均销售量大
C.A型号空调月销售量的上四分位数比B型号空调销售量的上四分位数大
D.A型号空调月销售量的方差比B型号空调月销售量的方差小
解析 由图可知,A型号空调月销售量的极差为50-25=25,
B型号空调月销售量的极差为45-22=23,故A正确;
A型号空调月平均销售量为(25+28+27+42+38+50)=35,
B型号空调月平均销售量为(22+25+30+37+40+45)≈33,故B正确;
将A型号空调月销售量数据从小到大排列为:25,27,28,38,42,50,
由6×75%=4.5,则A型号空调月销售量的上四分位数为42,
将B型号空调月销售量数据从小到大排列为22,25,30,37,40,45,
由6×75%=4.5,则B型号空调月销售量的上四分位数为40,故C正确;
A型号空调月销售量的方差为
[(25-35)2+(28-35)2+(27-35)2+(42-35)2+(38-35)2+(50-35)2]≈83,
B型号空调月销售量的方差为[(22-33)2+(25-33)2+(30-33)2+(37-33)2+(40-33)2+(45-33)2]≈67,
故D错误.故选D.
答案 D
命题点2 回归分析
考向1 线性回归分析
[例2] 某民营学校为增强实力与影响力,大力招揽名师、建设校园硬件设施,近5年该校招生人数的数据如下表.
年份序号x
1
2
3
4
5
招生人数y/千人
0.8
1
1.3
1.7
2.2
(1)由表中数据可看出,可用线性回归模型拟合y与x的关系,请用相关系数加以证明;
(2)求y关于x的经验回归方程,并预测当年份序号为7时该校的招生人数.
参考数据:xiyi=24.5, (yi-)2=1.26,≈3.55.
参考公式:相关系数r=,
经验回归方程=x+中斜率和截距的最小二乘估计公式分别为
=,=-.
[解析] (1)由题意知=(1+2+3+4+5)=3,
=(0.8+1+1.3+1.7+2.2)=1.4,
(xi-)2=4+1+0+1+4=10,
所以r=
==≈≈0.986,
因为r与1非常接近,故可用线性回归模型拟合y与x的关系.
(2)===0.35,
=-=1.4-0.35×3=0.35,
所以y关于x的经验回归方程为=0.35x+0.35.
当x=7时,=0.35×7+0.35=2.8,
由此预测当年份序号为7时该校的招生人数为2.8千人.
考向2 非线性回归分析
[例3] (2025·四川成都模拟)当前,全球贸易格局发生重大变化,随着中美贸易战的不断升级,让越来越多的中国科技企业开始意识到自主创新的重要性,大大加强科技研发投入力度,形成掌控高新尖端核心技术及其市场的能力.某企业为确定下一年对某产品进行科技升级的研发费用,需了解该产品年研发费用x(单位:千万元)对年销售量y(单位:千万件)的影响,根据市场调研与模拟,对收集的数据(xi,yi)(i=1,2,3,…,10)进行初步处理,得到散点图及一些统计量的值如下:
uivi
ui
vi
u
30.5
15
15
46.5
表中ui=ln xi,vi=ln yi.
(1)根据散点图判断,y=a+bx与y=cxd哪一个更适合作为年销售量y关于年研发费用x的回归方程类型(给出判断即可,不必说明理由),并根据判断结果及表中数据,建立y关于x的回归方程;
附:对于一组数据(ui,vi)(i=1,2,3,…,n),其回归直线=βu+α的斜率和截距的最小二乘估计分别为β==,α=-β .
(2)科技升级后,该产品的效率X大幅提高,经试验统计得X大致服从正态分布N(0.52,0.012).企业对科技升级团队的奖励方案如下:若X不超过50%,不予奖励;若X超过50%,但不超过53%,每件产品奖励2元;若X超过53%,每件产品奖励4元,记Y为每件产品获得的奖励,求E(Y)(精确到0.01).
附:若随机变量X~N(μ,σ2) (σ>0),则P(μ-σ<X≤μ+σ)=0.682 7,P(μ-2σ<X≤μ+2σ)=0.954 5.
[解析] (1)根据散点图可判断,y=cxd更适合作为y关于x的回归方程类型.
对y=cxd两边取对数,得ln y=ln c+d ln x,
即v=ln c+du,
由表中数据得:==1.5,d===,
ln c=-d=1.5-×1.5=1,所以c=e,
所以y关于x的回归方程为y=ex.
(2)因为μ-2σ=0.5,μ+σ=0.53,
所以P(0.50<X≤0.53)=P(μ-2σ<X≤μ+σ)
=P(μ-2σ<X≤μ-σ)+P(μ-σ<X≤μ+σ)
=+0.682 7=0.818 6,
P(X>0.53)=P(X>μ+σ)=,
E(Y)=0+2×0.818 6+4×=2.271 8≈2.27(元).
回归分析通常用来判断两组数据之间的关系,解此类题时要清楚:
(1)若两个变量呈现线性相关关系,可直接通过计算公式求回归方程;
(2)若两个变量呈现非线性相关关系,解题时可利用化归与转化思想,通过恰当的变换,将其转化为线性相关关系,再求回归方程;
(3)利用回归方程可以进行预测与估计,但要注意回归方程表示的是两组数据之间的相关关系,并不是函数关系,所以利用该方程求出的值是估计值,而不是一个确定的值.
[预测练2]
1.(2025·沈阳高三调研)调查某种群花萼长度和花瓣长度,所得数据如图所示.其中相关系数r=0.824 5,下列说法正确的是( )
A.花瓣长度和花萼长度没有相关性
B.花瓣长度和花萼长度呈负相关
C.花瓣长度和花萼长度呈正相关
D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5
解析 因为相关系数r=0.824 5>0.75,所以花瓣长度和花萼长度的相关性较强,并且呈正相关,所以选项A,B错误,选项C正确;因为相关系数与样本的数据有关,所以当样本发生变化时,相关系数也会发生变化,所以选项D错误.故选C.
答案 C
2.当前,新一轮科技革命和产业变革蓬勃兴起,以区块链为代表的新一代信息技术迅猛发展,现收集某地近6年区块链企业总数量相关数据,如表:
年份
2020
2021
2022
2023
2024
2025
编号x
1
2
3
4
5
6
企业总数量y/百个
50
78
124
121
137
352
(1)若用模型y=aebx拟合y与x的关系,根据提供的数据,求出y与x的经验回归方程;
(2)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛.比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司获得此次信息化技术比赛的“优胜公司”称号.已知在每场比赛中,甲胜乙的概率为,甲胜丙的概率为,乙胜丙的概率为,若首场由甲、乙比赛,求甲公司获得“优胜公司”称号的概率.
参考数据:ui=28.5,xiui=106.05,其中,ui=ln yi.
参考公式:对于一组数据(xi,yi)(i=1,2,3,…,n),其经验回归方程=x+的斜率和截距的最小二乘估计分别为=,=-.
解析 (1)令=ln =ln (ex)=x+ln ,
==3.5,==4.75,
则=
==0.36,
ln =4.75-0.36×3.5=3.49,所以=e3.49,
所以=e3.49·e0.36x=e0.36x+3.49.
(2)设甲公司获得“优胜公司”称号为事件A,
则P(A)=×+×××+×××=,
所以甲公司获得“优胜公司”称号的概率为.
命题点3 独立性检测
[例4] (2025·全国一卷)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1000人,得到如下列联表:
组别
超声波检查结果
合计
正常
不正常
患该疾病
20
180
200
未患该疾病
780
20
800
合计
800
200
1000
(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;
(2)根据小概率值α=0.001的独立性检验,分析超声波检查结果是否与患该疾病有关.
附χ2=.
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
[解析] (1)由题表可知,检查结果不正常者有200人,检查结果不正常者中患有该疾病的有180人,
所以由样本估计总体得p==0.9.
(2)零假设H0:超声波检查结果与是否患该疾病无关.
χ2==765.625>10.828,
所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为超声波检查结果与是否患该疾病有关.
解决独立性检验问题的关键三关
(1)假设关:假设两个分类变量无关.
(2)公式关:把相关数据代入独立性检验公式求χ2的观测值.
(3)对比关:将求出的χ2的观测值与临界值比对,进行准确判断.
[预测练3]
(2025·广东湛江二模)为了研究观众对某档节目的喜爱情况与性别的关联性,分别调查了该档节目男、女观众各100人,发现共有70名观众喜爱该档节目,且不喜爱该档节目的女性观众数是喜爱该档节目的男性观众数的2倍.
(1)根据题中信息,完成下面列联表;
单位:人
性别
喜爱情况
合计
喜爱
不喜爱
男
女
合计
(2)根据(1)中的列联表,依据α=0.1的独立性检验,能否认为观众对该档节目的喜爱情况与性别有关?
附:χ2=,n=a+b+c+d.
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
解析 (1)设喜爱该档节目的男性观众数为x,则喜爱该档节目的女性观众数为70-x,不喜爱该档节目的女性观众数为2x,则70-x+2x=100,得x=30.故列联表完成如下.
单位:人
性别
喜爱情况
合计
喜爱
不喜爱
男
30
70
100
女
40
60
100
合计
70
130
200
(2)零假设为H0:观众对该档节目的喜爱情况与性别无关.
根据(1)中列联表的数据,计算得到χ2==≈2.198<2.706=x0.1.
根据α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为观众对该档节目的喜爱情况与性别无关.
[对应学生用书P59]
1.(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:
亩产量
[900,950)
[950,1000)
[1000,1050)
频数
6
12
18
亩产量
[1050,1100)
[1100,1150)
[1150,1200)
频数
30
24
10
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050 kg
B.100块稻田中亩产量低于1100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg之间
D.100块稻田亩产量的平均值介于900 kg至1000 kg之间
解析 对于A,因为前3组的频率之和0.06+0.12+0.18=0.36<0.5,前4组的频率之和0.36+0.30=0.66>0.5,所以100块稻田亩产量的中位数所在的区间为[1050,1100),故A不正确;对于B,100块稻田中亩产量低于1100 kg的稻田所占比例为×100%=66%,故B不正确;对于C,因为1200-900=300,1150-950=200,所以100块稻田亩产量的极差介于200 kg至300 kg之间,故C正确;对于D,100块稻田亩产量的平均值为×(925×6+975×12+1025×18+1075×30+1125×24+1175×10)=1067(kg),故D不正确.故选C.
答案 C
2.(多选)(2023·新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
解析 对于选项A:设x2,x3,x4,x5的平均数为m,x1,x2,…,x6的平均数为n,
则n-m=-=,
因为没有确定2,x2+x3+x4+x5的大小关系,所以无法判断m,n的大小,
例如:1,2,3,4,5,6,可得m=n=3.5;
例如1,1,1,1,1,7,可得m=1,n=2;
例如1,2,2,2,2,2,可得m=2,n=;故A错误;
对于选项B:不妨设x1≤x2≤x3≤x4≤x5≤x6,
可知x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数均为,故B正确;
对于选项C:因为x1是最小值,x6是最大值,
则x2,x3,x4,x5的波动性不大于x1,x2,…,x6的波动性,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标准差,
例如:2,4,6,8,10,12,则平均数n=(2+4+6+8+10+12)=7,
标准差s1=
=,
4,6,8,10,则平均数m==7,
标准差s2==,显然>,即s1>s2;故C错误;
对于选项D:不妨设x1≤x2≤x3≤x4≤x5≤x6,
则x6-x1≥x5-x2,当且仅当x1=x2,x5=x6时,等号成立,故D正确.故选BD.
答案 BD
3.(多选)(2021·新高考Ⅱ卷)下列统计量中,能度量样本x1,x2,…,xn的离散程度的是( )
A.样本x1,x2,…,xn的标准差
B.样本x1,x2,…,xn的中位数
C.样本x1,x2,…,xn的极差
D.样本x1,x2,…,xn的平均数
解析 由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选AC.
答案 AC
4.(2024·全国甲卷)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品
合格品
不合格品
总计
甲车间
26
24
0
50
乙车间
70
28
2
100
总计
96
52
2
150
(1)填写如下列联表:
优级品
非优级品
甲车间
乙车间
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率p=0.5.设为升级改造后抽取的n件产品的优级品率.如果>p+1.65,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(≈12.247)
附:χ2=,n=a+b+c+d.
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
解析 (1)填写列联表如下:
优级品
非优级品
甲车间
26
24
乙车间
70
30
则完整的2×2列联表如下:
优级品
非优级品
总计
甲车间
26
24
50
乙车间
70
30
100
总计
96
54
150
χ2==4.687 5.
因为χ2=4.687 5>3.841,所以有95%的把握认为甲、乙两车间产品的优级品率存在差异;
因为χ2=4.687 5<6.635,所以没有99%的把握认为甲、乙两车间产品的优级品率存在差异.
(2)由题意可知==0.64,
又p+1.65=0.5+1.65× ≈0.5+1.65×≈0.57,
所以>p+1.65,所以能认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。