第八章 重点突破5 成对数据统计分析中的综合问题-【金版新学案】2025-2026学年高中数学选择性必修第三册同步课堂高效讲义配套课件PPT(人教A版)
2026-03-25
|
90页
|
38人阅读
|
3人下载
教辅
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 小结 |
| 类型 | 课件 |
| 知识点 | - |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | PPTX |
| 文件大小 | 8.10 MB |
| 发布时间 | 2026-03-25 |
| 更新时间 | 2026-03-25 |
| 作者 | 山东正禾大教育科技有限公司 |
| 品牌系列 | 金版新学案·高中同步导学 |
| 审核时间 | 2026-02-15 |
| 下载链接 | https://m.zxxk.com/soft/56471695.html |
| 价格 | 4.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
该高中数学课件聚焦成对数据统计分析综合问题,涵盖回归分析、独立性检验与概率统计的交汇应用。通过宠物经济、新能源汽车销售等真实案例导入,衔接回归方程、相关系数、卡方检验等基础知识点,构建从单一方法到综合应用的学习支架。
其亮点在于以真实情境案例为载体,培养数据分析、数学运算等核心素养,如通过微短剧市场规模预测体现回归分析与统计的结合。采用“典例解析-规律总结-对点练习”教学模式,课堂小结明确方法与易错点,助力学生提升综合解题能力,也为教师提供系统的分层教学资源。
内容正文:
重点突破5 成对数据统计分析中的综合问题
第八章 成对数据的统计分析
学习目标
1.进一步理解回归分析、独立性检验的相关知识.
2.会用概率、统计的相关知识解决成对数据的统计分析.
3.通过回归分析、独立性检验与概率、统计的交汇,培养数学
抽象、数据分析、直观想象、数学运算的核心素养.
题型一 回归分析与独立性检验交汇
1
题型二 回归分析与概率、统计交汇
2
题型三 独立性检验与概率、统计交汇
3
课时分层评价
5
内容索引
随堂评价
4
题型一 回归分析与独立性检验交汇
返回
近年来,养宠物的人越来越多,在供需端及资本的共同推动下中国宠物经济产业迅速增长,数据显示,目前中国养宠户数在全国户数中占比为.
(1)随机抽取200名成年人,并调查这200名成年人养宠物的情况,统计后得到如下列联表:
依据小概率值α=0.01的独立性检验,判断能否认为养宠物与性别有关.
典例
1
成年男性 成年女性 合计
养宠物 38 60 98
不养宠物 62 40 102
合计 100 100 200
解:零假设为H0:认为养宠物与性别无关.
根据列联表中的数据,经计算得到χ2=≈9.684>6.635=x0.01,
根据小概率值α=0.01的独立性检验,推断H0不成立,可以认为养宠物与性别有关,此判断犯错误的概率不大于0.01.
成年男性 成年女性 合计
养宠物 38 60 98
不养宠物 62 40 102
合计 100 100 200
(2)记2019-2024年的年份代码x依次为1,2,3,4,5,6,中国宠物经济产业年规模为y(单位:亿元),由这6年中国宠物经济产业年规模数据求得y关于x的回归方程为y=0.86x+0.63,且≈3.61. 求相关系数r并判断该回归方程是否有价值.
参考公式及数据:χ2=,其中n=a+b+c+d.
α 0.10 0.05 0.01
xα 2.706 3.841 6.635
回归方程=x+,其中=,=-,相关系数r=;若≥0.75, 则认为y与x有较强的相关性. 其中 ≈4.18.
α 0.10 0.05 0.01
xα 2.706 3.841 6.635
解:由x的取值依次为1,2,3,4,5,6,得=3.5,(xi-)2=17.5,
因为回归方程为y=0.86x+0.63,
所以===0.86,
α 0.10 0.05 0.01
xα 2.706 3.841 6.635
所以(xi-)(yi-)=15.05.
所以r=≈≈0.997,
因为r=0.997>0.75,所以y与x有较强的相关性,该回归方程有价值.
α 0.10 0.05 0.01
xα 2.706 3.841 6.635
规律方法
此类题型只需遵循回归分析的步骤,运用独立性检验的原理,掌握好计算公式、表格的整理与读取即可.
对点练1.随着互联网的高速发展和新媒体形式的不断丰富,微短剧作为一种新兴的文化载体,正逐渐成为拓展文化消费空间的重要途径.某媒体为了了解微短剧消费者的年龄分布,随机调查了200名消费者,得到如下列联表:
(1)根据小概率值α=0.05的独立性检验,能否认为“是微短剧消费者”与“年龄不超过40岁”有关联?
年龄不超过40岁 年龄超过40岁 合计
是微短剧消费者 30 45
不是微短剧消费者
合计 100 200
解:2×2列联表如下:
零假设为H0:“是微短剧消费者”与“年龄不超过40岁”无关联.
根据列联表中的数据,经计算得到,χ2=≈6.452>3.841=x0.05,
根据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为“是微短剧消费者”与“年龄不超过40岁”有关联,此推断犯错误的概率不超过0.05.
年龄不超过40岁 年龄超过40岁 合计
是微短剧消费者 30 15 45
不是微短剧消费者 70 85 155
合计 100 100 200
根据上表数据求得y与x的相关系数r=0.95,请完善y关于x的经验回归方程=x-192.89并预测2026年的市场规模.
年份代码x 1 2 3 4 5
市场规模y 9.4 36.8 101.7 h m
参考公式:χ2=,其中n=a+b+c+d,x0.05=3.841.
=442.07,相关系数r=,≈3.16.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解:由x的取值依次为1,2,3,4,5,得=3,(xi-)2=10,≈3.16.
因为r=≈=0.95,
所以(xi-)(yi-)≈1327.1,
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
所以=≈=132.71,
所以经验回归方程为=132.71x-192.89,
依题意,2026年的年份代码为6,代入=132.71x-192.89,得y=603.37.
返回
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
题型二 回归分析与概率、统计交汇
返回
汽车尾气排放超标是导致全球变暖、海平面上升的重要因素.我国近几年着重强调可持续发展,加大新能源项目的支持力度,积极推动新能源汽车产业迅速发展.某汽车制造企业对某地区新能源汽车的销售情况进行调查,得到下面的统计表:
(1)计算销量y关于年份代码x的线性相关系数r,并判断是否可以认为y与x有较强的线性相关关系(若|r|≥0.75,则认为有较强的线性相关关系).若是,求出y关于x的线性回归方程;若不是,说明理由;
典例
2
年份t 2015 2016 2017 2018 2019
年份代码x(x=t-2014) 1 2 3 4 5
销量y(万辆) 10 12 17 20 26
解:依题意,得=(1+2+3+4+5)=3, =(10+12+17+20+26)=17,
xiyi=295,=55,(yi-)2=164.
所以r===>≈0.976>0.75,
年份t 2015 2016 2017 2018 2019
年份代码x(x=t-2014) 1 2 3 4 5
销量y(万辆) 10 12 17 20 26
因此,销量y与年份代码x有较强的线性相关关系.
所以===4,=-=17-4×3=5,
y关于x的线性回归方程为=4x+5.
年份t 2015 2016 2017 2018 2019
年份代码x(x=t-2014) 1 2 3 4 5
销量y(万辆) 10 12 17 20 26
(2)为了解购车车主的性别与购车种类(分为新能源汽车与传统燃油汽车)的情况,该企业又随机调查了该地区100位购车车主的购车情况,假设一位车主只购一辆车.男性车主中购置传统燃油汽车的有40名,购置新能源汽车的有30名:女性车主中有一半购置新能源汽车.将频率视为概率,已知一位车主购得新能源汽车,请问这位车主是女性的概率.
附:若(x1,y1),(x2,y2),…为样本点,
年份t 2015 2016 2017 2018 2019
年份代码x(x=t-2014) 1 2 3 4 5
销量y(万辆) 10 12 17 20 26
相关系数公式:r==;=x+为回归方程,则==,=-.
年份t 2015 2016 2017 2018 2019
年份代码x(x=t-2014) 1 2 3 4 5
销量y(万辆) 10 12 17 20 26
解:依题意知,该地区100名购车车主中,男性车主有70名,女性车主有30名,购置新能源汽车的男性车主有30名,购置新能源汽车的女性车主有15名.
“一位车主购得新能源汽车”记作事件A,“车主是女性”记作事件B,
一位车主购得新能源汽车,这位车主是女性的概率为P(B|A)===.
年份t 2015 2016 2017 2018 2019
年份代码x(x=t-2014) 1 2 3 4 5
销量y(万辆) 10 12 17 20 26
规律方法
此类题型重点考查经验回归方程以及相关系数的求解,注意如果是非线性回归问题,要转化为线性回归问题,常与概率、统计知识结合考查.
对点练2.某公司是无人机特种装备的研发、制造与技术服务的综合型科技创新企业,产品无人机主要应用于森林消防、物流运输、航空测绘、军事侦察等领域,该公司生产的A、B两种类型无人运输机性能都比较出色.该公司分别收集了A、B两种类型无人运输机在5个不同的地点测试的某项指标数xi,yi(i=1,2,3,4,5),数据如下表所示:
附:相关公式及数据:
r=,≈0.95.
(1)试求y与x间的相关系数r,并利用r说明y与x是否具有较强的线性相关关系;(若|r|>0.75,则线性相关程度很高)
地点1 地点2 地点3 地点4 地点5
A型无人运输机指标数xi 2 4 5 6 8
B型无人运输机指标数yi 3 4 4 4 5
解:依题意,得=(2+4+5+6+8)=5,=(3+4+4+4+5)=4,
(xi-)(yi-)=(2-5)×(3-4)+(4-5)×0+(5-5)×0+(6-5)×0+(8-5)×(5-4)=6,
(xi-)2=(2-5)2+(4-5)2+(5-5)2+(6-5)2+(8-5)2=20,
地点1 地点2 地点3 地点4 地点5
A型无人运输机指标数xi 2 4 5 6 8
B型无人运输机指标数yi 3 4 4 4 5
(yi-)2=(3-4)2+0+0+0+(5-4)2=2.
所以r===≈0.95,
因为r>0.75,所以y与x具有较强的线性相关关系.
地点1 地点2 地点3 地点4 地点5
A型无人运输机指标数xi 2 4 5 6 8
B型无人运输机指标数yi 3 4 4 4 5
(2)从这5个地点中任抽2个地点,求抽到的这2个地点,A型无人运输机指标数均高于B型无人运输机指标数的概率.
解:将地点1,2,3,4,5分别记为a,b,C,D,E,
任抽2个地点的可能情况有ab,aC,aD,aE,bC,bD,bE,CD,CE,DE共10种情况,其中在地点3,4,5,A型无人运输机指标数均高于B型无人运输机指标数,
记A型无人运输机指标数均高于B型无人运输机指标数为事件M,
则M包含的基本事件为CD,CE,DE共3个,
所以P(M)=.
返回
地点1 地点2 地点3 地点4 地点5
A型无人运输机指标数xi 2 4 5 6 8
B型无人运输机指标数yi 3 4 4 4 5
题型三 独立性检验与概率、统计交汇
返回
《黑神话:悟空》是由游戏科学公司制作的动作角色扮演游戏,为了调查玩家喜欢该款游戏是否与性别有关,特选取了100名玩家进行了问卷调查,得到如下的2×2列联表.
在100名玩家中随机抽取1人,若抽到不喜欢该游戏的概率为0.2.
(1)依据小概率值α=0.05的独立性检验,分析男、女玩家对该款游戏的喜爱是否有差异.
典例
3
男性 女性 合计
喜欢 20
不喜欢 8
合计
解:依题意,不喜欢该游戏的人数为0.2×100=20,从而可得2×2列
联表:
零假设为H0:男、女玩家对该款游戏的喜爱没有差异.
根据列联表中的数据,经计算得到,
χ2==≈9.007>3.841.
依据小概率值α=0.05的独立性检验,认为玩家的性别对该款游戏的喜爱有差异.
男性 女性 合计
喜欢 60 20 80
不喜欢 8 12 20
合计 68 32 100
(2)从喜欢该游戏的玩家中用分层抽样的方法抽取8名玩家,再在这8名玩家中抽取3人调查其喜欢的游戏,用X表示3人中女生的人数,求X的分布及均值.
男性 女性 合计
喜欢 20
不喜欢 8
合计
解:若从喜欢该游戏的玩家中用分层抽样的方法抽取8名玩家,其中男性有6人,女性有2人,若从抽取的8名玩家中抽取3人调查,
设所抽取的女性玩家的人数为X,则X的可能取值为0,1,2.
因为P(X=0)==,P(X=1)==,P(X=2)==.
所以X的分布列为
所以E(X)=0×+1×+2×=.
X 0 1 2
P
规律方法
此类题型以2×2列联表为载体,考查独立性检验与概率中的古典概型、二项分布、超几何分布以及正态分布的交汇知识,是高考的常考知识点.
对点练3.某学生兴趣小组在研究所在学校的学生性别与身高(身高分为低于
170 cm和不低于170 cm)的相关关系时,记事件A=“学生身高不低于170 cm”,事件B=“学生为女生”.据该校以往的统计结果显示,P(A)=,P(B)=,P(A|B)=.
(1)求P(AB),P(A|);
解:易知P(AB)=P(A|B)P(B)=×=.
又P(B)=⇒P()=,
由全概率公式可得P(A)=P(B)·P(A|B)+P()·P(A|)=+P(A|)=,
解得P(A|)=.
(2)若从该校的其中一个班随机抽取36名学生,依据该校以往的统计结果,完成下列列联表,并依据小概率值α=0.005的独立性检验.分析学生的性别与身高是否不低于170 cm有关.
性别 身高 合计
低于170 cm 不低于170 cm
女
男
合计
参考公式及数据:χ2=,n=a+b+c+d.
α 0.01 0.005 0.001
xα 6.635 7.879 10.828
解:由题意知女生抽取24人,不低于170cm的4人;男生抽取12人,不低于170cm的有8人,完成列联表如下:
零假设为H0:学生的性别与身高是否不低于170 cm无关.
根据列联表中的数据,经计算得到χ2==9>7.879=x0.005.
根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为学生的性别与身高是否不低于170 cm有关,此推断犯错误的概率不大于0.005.
性别 身高 合计
低于170 cm 不低于170 cm
女 20 4 24
男 4 8 12
合计 24 12 36
返回
课堂小结
任务再现 1.回归分析与独立性检验的交汇.2.回归分析与统计、概率的交汇.3.独立性检验与统计、概率的交汇
方法提炼 公式法、数形结合思想、转化与化归思想
易错警示 公式记混或计算错误、独立性检验与回归分析混淆
随堂评价
返回
1.下列说法正确的是
A.残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高
B.样本相关系数r越大,成对样本数据的线性相关性越强;反之,线性相关性越弱
C.回归直线就是散点图中经过样本数据点最多的那条直线
D.甲、乙两个模型的决定系数R2分别约为0.88和0.80,则模型甲的拟合效果更好
√
对于A,残差图中残差点所在的水平带状区域越窄,则回归方程的预报精确度越高,故A错误;对于B,样本相关系数r的绝对值越大,成对样本数据的线性相关性越强;反之,线性相关性越弱,故B错误;对于C,回归直线就是散点图中,从整体上看散点大致分布在一条直线附近的那条直线,并不一定是经过数据点最多的直线,故C错误;对于D,决定系数R2越大则拟合效果越好,由于0.88>0.80,则模型甲的拟合效果更好,故D正确.故选D.
2.(多选)已知两个统计案例如下:
①某机构调查了100位社区网络员手机即时通讯软件的使用情况,结果如下表:
②为了解某地母亲身高与女儿身高的关系,随机测得10对母女的身高数据
如下表:
则对这些数据的处理所采用的统计方法正确的是
A.①回归分析 B.①独立性检验
C.②回归分析 D.②独立性检验
√
√
35岁及以上 35岁以下 总计
微信 45 20 65
QQ 13 22 35
总计 58 42 100
母亲身高/cm 159 160 160 163 159 154 159 158 159 157
女儿身高/cm 158 159 160 161 161 155 162 157 162 156
独立性检验是判断两个分类变量是否有关联的一种方法,而回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,①中的两个变量为分类变量,采用的统计方法为独立性检验,②中的两个变量是具有相关关系的,采用的统计方法为回归分析.故选BC.
35岁及以上 35岁以下 总计
微信 45 20 65
QQ 13 22 35
总计 58 42 100
3.(双空题)为研究交通事故中摩托车骑乘人员致死是否与不戴头盔有关,现对发生交通事故的摩托车骑乘人员进行相关调查,制成如下2×2列联表(单位:人).
现从交通事故致死的摩托车骑乘人员中按照分层随机抽样的方法抽取5人,再从这5人中抽取2人进行调查,这2人都是不戴头盔致死的概率为____,依据小概率α=0.01的独立性检验,认为交通事故中摩托车骑乘人员致死与不戴头盔____关(填“有”或“无”).
交通事故后果
戴头盔情况 致死 不致死 合计
不戴头盔 80 20 100
戴头盔 20 80 100
合计 100 100 200
有
在交通事故致死的摩托车骑乘人员中,不戴头盔与戴头盔的人数比例是80∶20=4∶1,所以按照分层随机抽样的方法抽取的5人中,不戴头盔的有5× =4(人),戴头盔的有5× =1(人),从5人中随机抽取2人,共有种可能的结果,而这2人都是不戴头盔的有种可能的结果,所以这2人都是不戴头盔致死的概率P= = ;
交通事故后果
戴头盔情况 致死 不致死 合计
不戴头盔 80 20 100
戴头盔 20 80 100
合计 100 100 200
由题表计算可得,χ2= =72>6.635,依据小概率α=0.01的独立性检验,认为交通事故中摩托车骑乘人员致死与不戴头盔有关.
交通事故后果
戴头盔情况 致死 不致死 合计
不戴头盔 80 20 100
戴头盔 20 80 100
合计 100 100 200
4.某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到的样本数据(xi,yi)(i=1,2,…,15),其中xi和yi分别表示第i个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到xi=15,yi=750,(xi-)2=0.82,(yi-)2=1 670,(xi-)(yi-)=35.3.
(1)试估计该地被调查村的村户年平均收入;
解:该地被调查村的村户年平均收入的估计值为xi=×15=
1(万元).
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投入的相关系数;(精确到0.01)
解:样本(xi,yi)(i=1,2,…,15)的相关系数为
r===≈≈0.95.
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.
解:采用分层抽样,理由如下:
由(2)知被调查村的村户年平均收入与该村的产业资金投入有很强的正相
关性,
由于各被调查村产业资金投入差异很大,因此被调查村的村户年平均收入差异也很大,
所以采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地更准确的验收估计.
返回
课时分层评价
返回
1.设两个变量x和y之间具有线性相关关系,它们的相关系数为r,y关于x的回归直线方程为=kx+b,则
A.k与r的符号相反 B.b与r的符号相同
C.k与r的符号相同 D.b与r的符号相反
由线性相关关系可知:若k>0,等价于两个变量正相关,等价于r>0;若k<0,等价于两个变量负相关,等价于r<0;所以k与r的符号相同,故A错误,C正确;又因为b与r的符号没有关系,故B、D错误.故选C.
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
2.如图是学校高二1、2班期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
√
题图是学校高二1、2班期中考试数学成绩优秀率的等高堆积条形图,从两个班随机抽取的6名学生的期中考试数学成绩优秀率无法确定哪个班的比较高,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
班6名学生数学成绩不优秀的和优秀的人数也不能确定,故A正确,B,C错误;两个班期中考试数学成绩的优秀率均在0.5左右,并不能直接确定“两班学生的数学成绩优秀率存在差异”,故D错误.故选A.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
3.设某制造公司进行技术升级后的第x个月(x=1,2,3,4,5)的利润为y(单位:百万元),根据统计数据,求得y关于x的经验回归方程为=6x+3,若x=1时的观测值y=10,则x=1时的残差为
A.-1 B.1
C.3 D.6
√
因为x=1时的预测值为=6×1+3=9,所以残差为10-9=1.故选B.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
4.手机给人们的生活带来便捷,但同时也对中学生的生活和学习造成了一定的影响.某校几个学生成立研究性学习小组,就使用手机对学习成绩的影响随机抽取了该校100名学生的期末考试成绩并制成如下列联表,则下列说法正确的是
√
手机使用情况 成绩 总计
成绩优秀 成绩不优秀
不用手机 40 10 50
使用手机 5 45 50
总计 45 55 100
(参考公式:χ2= ,其中n=a+b+c+d)
A.在犯错误的概率不超过0.01的前提下认为使用手机与学习成绩无关
B.在犯错误的概率不超过0.1的前提下认为使用手机与学习成绩无关
C.依据小概率α=0.01的独立性检验,认为使用手机对学习成绩有影响
D.依据小概率α=0.01的独立性检验,认为使用手机对学习成绩没有影响
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
由列联表中的数据,计算χ2= ≈49.49>6.635,依据小概率α=0.01的独立性检验,认为使用手机对学习成绩有影响,且此结论犯错误的概率不超过0.01,故A、B、D错误,C正确.故选C.
手机使用情况 成绩 总计
成绩优秀 成绩不优秀
不用手机 40 10 50
使用手机 5 45 50
总计 45 55 100
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
5.云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续增长.已知某科技公司2021年至2025年云计算市场规模数据,且市场规模y与年份代码x的关系可以用模型y=c1(其中e为自然对数的底数)拟合,设z=ln y,得到数据统计表如下:
由上表可得经验回归方程z=0.52x+a,则2028年该科技公司云计算市场规模y的估计值为
A.e5.08 B.e5.6 C.e6.12 D.e6.5
√
年份 2021年 2022年 2023年 2024年 2025年
年份代码x 1 2 3 4 5
云计算市场规模y/千万元 7.4 11 20 36.6 56.7
z=ln y 2 2.4 3 3.6 4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
因为=3,=3,所以a=-0.52=3-3×0.52=1.44,即经验回归方程z=0.52x+1.44,当x=8时,z=0.52×8+1.44=5.6,所以y=ez=e5.6,即2028年该科技公司云计算市场规模y的估计值为e5.6.故选B.
年份 2021年 2022年 2023年 2024年 2025年
年份代码x 1 2 3 4 5
云计算市场规模y/千万元 7.4 11 20 36.6 56.7
z=ln y 2 2.4 3 3.6 4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
6.(多选)下列说法错误的是
A.当样本相关系数r满足|r|=1时,成对样本数据的两个变量之间满足一种线性关系
B.残差等于预测值减去观测值
C.决定系数R2越大,模型拟合效果越差
D.在独立性检验中,当χ2≥xα(xα为α的临界值)时,推断零假设H0不成立
√
√
当样本相关系数r=±1,即|r|=1时,成对样本数据的两个变量之间满足一种线性关系,故A正确;残差等于观测值减去预测值,故B错误;决定系数R2越大,模型拟合效果越好,故C错误;根据独立性检验的规则,当χ2≥xα时,推断零假设H0不成立,故D正确.故选BC.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
7.新能源汽车的核心部件是动力电池,电池占了整车成本的很大一部分,而其中的原材料碳酸锂又是电池的主要成分.从2020年底开始,碳酸锂的价格不断升高,下表是2022年某企业的前5个月碳酸锂的价格y(单位:万元/千克)与月份x的统计数据.
根据表中数据,得出y关于x的经验回归方程为=0.28x+,根据数据计算出在样本点(5,1.5)处的残差为-0.06,则表中m=____.
月份代码x 1 2 3 4 5
碳酸锂价格y/(万元/千克) 0.5 0.6 1 m 1.5
1.4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
由题可知,当x=5时,有1.5-=1.5-(0.28×5+)=-0.06,解得=0.16.又==3,==,且经验回归直线过样本点的中心(,),所以0.28×3+0.16=,解得m=1.4.
月份代码x 1 2 3 4 5
碳酸锂价格y/(万元/千克) 0.5 0.6 1 m 1.5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
8.为了了解运动和寿命是否相关,先作了一次抽样调查,被调查的经常锻炼与不经常锻炼的人均为12t,统计得到以下列联表,经计算,依据小概率α=0.05的独立性检验,认为经常锻炼和长寿相关,但依据小概率α=0.01的独立性检验,认为经常锻炼和长寿无关,则调查人数中经常锻炼的人至少有_____人.
锻炼 寿命 合计
长寿 不长寿
经常 8t 4t 12t
不经常 5t 7t 12t
合计 13t 11t 24t
36
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
根据列联表中的数据,经计算得到χ2==t,依题意知3.841≤t<6.635,即得2.543≤t<4.393.又t∈N,则t=3或4,则调查人数中经常锻炼的人至少有12×3=36人.
锻炼 寿命 合计
长寿 不长寿
经常 8t 4t 12t
不经常 5t 7t 12t
合计 13t 11t 24t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
9.根据下面的数据:
求得y关于x的回归直线方程为=20x+12,则这组数据相对于所求的回归直线方程的4个残差的方差为_______.
x 1 2 3 4
y 31.6 52.5 72 91.9
0.105
根据=20x+12,分别将x=1,2,3,4代入求得分别为32,52,72,92,则4个残差为-0.4,0.5,0,-0.1,残差的平均数为0,故残差的方差为s2= [(-0.4-0)2+(0.5-0)2+(0-0)2+(-0.1-0)2]=0.105.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
10.(13分)为了解某一地区电动汽车销售情况,某部门根据统计数据,用最小二乘法得到电动汽车销量y(单位:万台)关于x(年份)的线性回归方程为y=3x+800,且销量y的方差=,年份x的方差=5.
(1)求y与x的相关系数r,并据此判断电动汽车销量y与年份x的相关性强弱;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解:相关系数为r= =·
=·=·=3×==0.937 5>0.9.
(由y关于x的线性回归方程为y=3x+800可知:=3,且=5,=)
故y与x线性相关较强.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(2)该部门还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
依据小概率α=0.05的独立性检验,分析购买电动汽车与车主性别是否
有关.
α 0.10 0.05 0.010 0.001
xα 2.706 3.841 6.635 10.828
参考公式:(ⅰ)线性回归方程:=x+,其中=,=-;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(ⅱ)相关系数:r=,若r>0.9,则可判断y与x线性相关较强;
(ⅲ)χ2=,其中n=a+b+c+d.附表:
α 0.10 0.05 0.010 0.001
xα 2.706 3.841 6.635 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解:依题意,
零假设为H0:购买电动汽车与车
主性别无关.
根据列联表中的数据,经计算得到
χ2=
==≈5.031>3.841.
依据小概率α=0.05的独立性检验,我们推断H0不成立,即购买电动汽车与车主性别有关联,此推断犯错误的概率不大于0.05.
性别 购买非电动汽车 购买电动汽车 总计
男性 39 6 45
女性 30 15 45
总计 69 21 90
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
11.某中学课外活动小组为了研究经济走势,根据该市1999-2021年的GDP(国内生产总值)数据绘制出下面的散点图,该小组选择了如下2个模型来拟合GDP值y随年份x的变化情况,模型一:y=kx+b(k>0,x>0);模型二:y=kex+b(k>0,x>0),下列说法正确的是
A.变量y与x负相关
B.根据散点图的特征,模型一能
更好地拟合GDP值随年份的变化情况
C.变量y与x有较强的线性相关性
D.若选择模型二,y=kex+b的图象不
一定经过点(,)
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
对于A,由散点图可知y随年份x的增大而增大,所以变量y与x正相关,故A错误;对于BC,由散点图可知变量y与x的变化趋向于一条曲线,所以模型二能更好地拟合GDP值随年份的变化情况,故B错误,C错误;对于D,若选择模型二:y=kex+b(k>0,x>0),令t=ex,则y=kt+b的图象一定过点(,),不一定过点(,),故D正确.故选D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
12.(多选)“一粥一饭,当思来之不易”,道理虽简单,但每年我国还是有2 000多亿元的餐桌浪费,被倒掉的食物相当于2亿多人一年的口粮.为营造“节约光荣,浪费可耻”的氛围,某市发起了“光盘行动”.某机构为调研民众对“光盘行动”的认可情况,在某大型餐厅中随机调查了90位来店就餐的客人,制成如下所示的列联表,通过计算得到χ2的观测值为9.
已知P(χ2≥6.635)=0.010,P(χ2≥10.828)=0.001,则下列判断正确的是
A.在该餐厅用餐的客人中大约有66.7%的客人认可“光盘行动”
B.在该餐厅用餐的客人中大约有99%的客人认可“光盘行动”
C.根据小概率值α=0.01的独立性检验,认为“光盘行动”的认可情况与年龄有关
D.根据小概率值α=0.001的独立性检验,认为“光盘行动”的认可情况与年龄有关
√
√
认可 不认可
40岁以下 20 20
40岁以上(含40岁) 40 10
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
根据题目提供的数据,计算出χ2的观测值,结合选项进行判断.因为χ2的观测值为9,且P(χ2≥6.635)=0.010,P(χ2≥10.828)=0.001,又因为9>6.635,但9<10.828,所以根据小概率值α=0.01的独立性检验,认为“光盘行动”的认可情况与年龄有关,故C正确,D错误;由表可知认可“光盘行动”的人数为60人,所以在该餐厅用餐的客人中认可“光盘行动”的比例为 ×100%≈66.7%,故A正确,B错误.故选AC.
认可 不认可
40岁以下 20 20
40岁以上(含40岁) 40 10
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
13.汽车轮胎凹槽深度是影响汽车刹车的因素,汽车行驶会导致轮胎面磨损.某实验室通过实验测得行驶里程与某品牌轮胎凹槽深度的数据,建立了如下回归模型y=c1·,通过实验数据分析与计算得到如下结论:①c2=-0.18;②=10,令u=ln y,=0.35,则回归方程应为__________.
y=e2.15-0.18x
因为回归模型为y=c1·,因为c2=-0.18,可得y=c1·e-0.18x,两边同时取对数,可得ln y=ln(c1·e-0.18x)=ln c1-0.18x,令u=ln y,此时u=ln c1-0.18x,又因为=10,=0.35,所以ln c1=0.35+0.18×10=2.15,即c1=e2.15,所以y=e2.15·e-0.18x=e2.15-0.18x.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
14.(15分)为选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,教育部出台并制定“强基计划”,由试点高校自主命题,校考过程中通过笔试后才能进入面试环节.
(1)为了更好地服务于高三学生,某研究机构对随机抽取的5名高三学生的记忆力x和判断力y进行统计分析,得到下表数据:
请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合,并求y关于x的线性回归方程y=x+(精确到0.01);
x 6 8 9 10 12
y 2 3 4 5 6
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解:根据表格中的数据,可得
==9,==4,
xiyi=12+24+36+50+72=194,
=36+64+81+100+144=425,
=4+9+16+25+36=90.
x 6 8 9 10 12
y 2 3 4 5 6
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
可得相关系数r==≈0.99>0.95.
故y与x之间的关系可用线性回归模型进行拟合.
又由===0.7,
可得=4-9×0.7=-2.3.
综上回归直线方程y=0.7x-2.3.
x 6 8 9 10 12
y 2 3 4 5 6
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(2)现有甲、乙两所大学的笔试环节都设有三门考试科目且每门科目是否通过相互独立,若某考生报考甲大学,每门笔试科目通过的概率均为,该考生报考乙大学,每门笔试科目通过的概率依次为m、、,其中0<m<1,根据规定每名考生只能报考强基计划的一所试点高校,若以笔试过程中通过科目数的期望为依据作出决策,求该考生更希望通过乙大学笔试时m的取值范围.
x 6 8 9 10 12
y 2 3 4 5 6
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解:通过甲大学的考试科目数X~B(3,),
则E(X)=3×=.
设通过乙大学的考试科目数为Y,则Y可能的取值为0,1,2,3.
所以P(Y=0)=(1-m)(1-)(1-)=(1-m),P(Y=1)=m(1-)(1-)+(1-m)××(1-)+(1-m)×(1-)×=-m,
P(Y=2)=m××(1-)+m×(1-)×+(1-m)××=+m,
x 6 8 9 10 12
y 2 3 4 5 6
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
P(Y=3)=m××=m.
所以E(Y)=-m+2(+m)+3×m=+m.
因为该考生更希望通过乙大学的笔试考试,
所以E(Y)>E(X),即+m>,
又由0<m<1,解得<m<1,
即该考生更希望通过乙大学的笔试时m的范围为(,1).
x 6 8 9 10 12
y 2 3 4 5 6
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
15.(5分)已知随机变量X与Y的4组样本数据(记为(x1,y1),(x2,y2),(x3,y3),(x4,y4))如下表:
已知上表数据中=2.5.若某同学对m赋了三个值分别为1.5,2,2.5,得到三条回归直线分别为Y=X+,Y=X+,Y=X+,对应的相关系数分别为r1,r2,r3,下列结论中错误的是
参考公式:=,=-,r=
A.三条回归直线有共同交点 B.三个相关系数中,r2最大
C. > D. >
X 1 2 3 4
Y 1 m n 4
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
依题意,1+m+n+4=10,即m+n=5.若m=1.5,则n=3.5,此时= =2.5,=2.5,则= = =1.1,=-=2.5-1.1×2.5=-0.25,r1= ≈ ;若m=2,则n=3,此时=2.5,=2.5,同理得=1,=0,r2=1;
X 1 2 3 4
Y 1 m n 4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
若m=2.5,则n=2.5,此时=2.5,=2.5,同理得=0.9,=0.25,r3=.三条回归直线均经过点(2.5,2.5),故A正确;由以上,三个相关系数中,r2最大,>,<,故B、C正确,D错误.故选D.
X 1 2 3 4
Y 1 m n 4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
16. (17分)2024年6月25日14时07分,嫦娥六号返回器准确着陆于内蒙古自治区四子王旗预定区域,工作正常,标志着探月工程嫦娥六号任务取得圆满成功,实现了世界首次月球背面采样返回.某学校为了了解学生对探月工程的关注情况,随机从该校学生中抽取了一个容量为90的样本进行调查,调查结果如下表:
(1)完成上述列联表,依据该统计数据,依据小概率值α=0.01的独立性检验,分析该校学生对探月工程的关注与性别是否有关.
关注 不关注 合计
男生 55 60
女生
合计 75
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解:2×2列联表如下:
零假设为H0:该校学生对探月工程的关注与性别无关.
根据列联表中的数据,经计算得到χ2==9>6.635,
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为该校学生对探月工程的关注与性别有关联,此推断犯错误的概率不大于0.01.
关注 不关注 合计
男生 55 5 60
女生 20 10 30
合计 75 15 90
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
(2)为了激发同学们对探月工程的关注,该校举办了一次探月知识闯关比赛,比赛有两个答题方案可供选择:
方案一:回答4个问题,至少答对3个问题才能晋级;
方案二:在4个问题中随机选择2个问题作答,都答对才能晋级.
已知振华同学答对这4个问题的概率分别为,,,,振华同学回答这4个问题正确与否相互独立,则振华选择哪种方案晋级的可能性更大?
附:χ2=
α 0.1 0.05 0.025 0.01 0.001
xα 2.706 3.841 5.024 6.635 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
解:记这4个问题为a,b,c,d,记振华答对a,b,c,d的事件分别为A,B,C,D,
分别记按方案一、二晋级的概率为P1,P2,
则P1=P(ABC)+P(ABD)+P(ACD)+P(BCD)+P(ABCD)
=()3××2+()2×××3=,
返回
α 0.1 0.05 0.025 0.01 0.001
xα 2.706 3.841 5.024 6.635 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
P2=P(AB)+P(AC)+P(AD)+P(BC)+P(BD)+P(CD)
=[()2×3+××3]=,
因为>,振华选择方案一晋级的可能性更大.
返回
α 0.1 0.05 0.025 0.01 0.001
xα 2.706 3.841 5.024 6.635 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
谢 谢 观 看 !
第
八
章
成
对
数
据
的
统
计
分
析
返回
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。