专题07 回归方程与独立性检验(四大常规题型,18道强化练习题)-2023-2024学年高二数学下学期期末考点大串讲(苏教版2019选择性必修第二册)
2024-06-05
|
2份
|
30页
|
1088人阅读
|
33人下载
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学苏教版选择性必修 第二册 |
| 年级 | 高二 |
| 章节 | 9.1 线性回归分析,9.2 独立性检验 |
| 类型 | 题集-专项训练 |
| 知识点 | - |
| 使用场景 | 同步教学-期末 |
| 学年 | 2024-2025 |
| 地区(省份) | 江苏省 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 1.60 MB |
| 发布时间 | 2024-06-05 |
| 更新时间 | 2024-06-05 |
| 作者 | 数学—Mr Lee |
| 品牌系列 | 上好课·考点大串讲 |
| 审核时间 | 2024-06-05 |
| 下载链接 | https://m.zxxk.com/soft/45599631.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
专题07 回归方程与独立性检验
题型01 相关系数与相关性
题型02 线性回归方程
题型03 非线性回归方程
题型04 独立性检验
题型01 相关系数与相关性
一、单选题
1.(23-24高二下·辽宁·期中)下列变量之间的关系不是相关关系的是( )
A.光照时间与大棚内蔬菜的产量 B.举重运动员所能举起的最大重量与他的体重
C.某正方形的边长与此正方形的面积 D.人的身高与体重
2.(23-24高二下·辽宁沈阳·阶段练习)已知5个成对数据的散点图如下、若去掉点,则下列说法错误的是( )
A.变量x与变量y呈负相关 B.变量x与变量y的相关性变强
C.残差平方和变小 D.样本相关系数r变大
3.(2024高二下·全国·专题练习)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( ).
A. B.
C. D.
二、解答题
4.(2024高二下·全国·专题练习)某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面(单位:亩)与相应的管理时间(单位:月)的关系如表所示:
土地使用面积(单位:亩)
1
2
3
4
5
管理时间(单位:月)
8
11
14
24
23
作出散点图,判断管理时间与土地使用面积是否线性相关,并根据相关系数说明相关关系的强弱.(若,认为两个变量有较强的线性相关性,的值精确到0.001)
注:亩,我国市制土地面积单位,1亩≈666.7平方米.
参考公式:.
参考数据:,,.
题型02 线性回归方程
一、单选题
1.(23-24高二下·吉林长春·期中)以下有关直线拟合效果的说法错误的是( )
A.通过最小二乘法得到的线性回归直线经过样本点的中心
B.相关系数r越小,表明两个变量相关性越弱
C.最小二乘法求回归直线方程,是求使最小的a,b的值
D.决定系数R2越接近1,表明直线拟合效果越好
2.(23-24高二下·江西景德镇·期中)给定两个随机变量和的5组数据如下表所示,利用最小二乘法得到关于的线性回归方程为,则表中值为( )
1
2
3
4
5
2
4
7
8
A.3 B.4 C.5 D.6
3.(2024·四川广安·二模)某公司收集了某商品销售收入(万元)与相应的广告支出(万元)共10组数据(),绘制出如下散点图,并利用线性回归模型进行拟合.
若将图中10个点中去掉点后再重新进行线性回归分析,则下列说法正确的是( )
A.决定系数变小 B.残差平方和变小
C.相关系数的值变小 D.解释变量与预报变量相关性变弱
二、解答题
4.(2024·青海西宁·二模)只要骑车,都应该戴头盔.骑行头盔是骑行中生命坚实的保护屏障.骑行过程中的摔倒会对头部造成很大的损害,即使骑行者是以较低的车速沿着坡度平稳的自行车道骑行,也同样不可忽视安全问题.佩戴头盔的原因很简单也很重要——保护头部,减少伤害.相关数据表明,在每年超过500例的骑车死亡事故中,有75%的死亡原因是头部受到致命伤害造成的,医学研究发现,骑车佩戴头盔可防止85%的头部受伤,并且大大减小了损伤程度和事故死亡率.
某市对此不断进行安全教育,下表是该市某主干路口连续5年监控设备抓拍到通过该路口的骑电动车不戴头盔的人数的统计数据:
年份
2019
2020
2021
2022
2023
年份序号
1
2
3
4
5
不戴头盔人数
1450
1300
1200
1100
950
(1)求不戴头盔人数与年份序号之间的线性回归方程;
(2)预测该路口2024年不戴头盔的人数.
参考公式:回归方程中斜率和截距的最小二乘法估计公式分别为.
5.(23-24高三上·黑龙江鸡西·期末)直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司2023年前5个月的带货金额:
月份
1
2
3
4
5
带货金额万元
350
440
580
700
880
(1)计算变量的相关系数(结果精确到0.01).
(2)求变量之间的线性回归方程,并据此预测2023年6月份该公司的直播带货金额.
参考数据:,
参考公式:相关系数,线性回归方程的斜率,截距.
题型03 非线性回归方程
一、解答题
1.(23-24高二下·江西景德镇·期中)近年来,共享单车进驻城市,绿色出行引领时尚.某公司计划对未开通共享单车的A县城进行车辆投放,为了确定车辆投放量,对过去在其他县城的投放量情况以及年使用人次进行了统计,得到了投放量x(单位;千辆)与年使用人次y(单位:千次)的数据如下表所示,根据数据绘制投放量x与年使用人次y的散点图如图所示.
x
1
2
3
4
5
6
7
y
5
16
28
38
64
108
196
拟用模型① 或模型② 对两个变量的关系进行拟合,令,可得
,,,,,变量y与t的标准差分别为,.
(1)根据所给的统计量,求模型② 中y关于x的回归方程;(结果保留小数点后两位)
(2)计算并比较两种模型的相关系数r(结果保留小数点后三位),求哪种模型预测值精度更高、更可靠;
(3)已知每辆单车的购入成本为200元,年调度费以及维修等的使用成本为每人次0.2元,按用户每使用一次,收费1元计算,若投入8000辆单车,利用(2)中更可靠的模型,预测几年后开始实现盈利.(结果保留整数)
附,样本点的线性回归方程最小二乘估计公式为,,相关系数
参考数据:.
2.(2024·陕西安康·模拟预测)随着移动互联网和直播带货技术的发展,直播带货已经成为一种热门的销售方式,特别是商家通过展示产品,使顾客对商品有更全面的了解.下面统计了某新手开启直播带货后从6月份到10月份每个月的销售量(万件)的数据,得到如图所示的散点图.其中6月份至10月份相应的代码为,如:表示6月份.
(1)根据散点图判断,模型①与模型②哪一个更适宜作为月销售量关于月份代码的回归方程?(给出判断即可,不必说明理由)
(2)(i)根据(1)的判断结果,建立关于的回归方程;(计算结果精确到0.01)
(ⅱ)根据结果预测12月份的销售量大约是多少万件?
参考公式与数据:, ,,其中.
3.(2024·上海·一模)为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:克每立方米)与样本对原点的距离(单位:米)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中).
6
97.90
0.21
240
0.14
14.12
26.13
(1)利用相关系数的知识,判断与哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型;
(2)根据(1)的结果建立关于的回归方程,并估计样本对原点的距离米时,平均金属含量是多少?
题型04 独立性检验
一、单选题
1.(23-24高二下·黑龙江牡丹江·期中)下列说法错误的是( )
A.在残差图中,残差点比较均匀地落在水平带状区域中,说明选用的模型比较合适,带状区域越窄,说明回归方程的预报精度越高
B.在独立性检验时,两个变量的列联表中,对角线上数据的乘积相差越大,说明“这两个变量没有关系”成立的可能性就越大
C.在回归直线方程中,当解释变量每增加一个单位时,预报变量就增加0.2个单位
D.越大,意味着残差平方和越小,即模型的拟合效果越好
2.(22-23高二下·山西大同·阶段练习)有关独立性检验的四个命题,其中不正确的是( ).
A.两个变量的2×2列联表中,对角线上数据的乘积之差的绝对值越大,说明两个变量有关系成立的可能性就越大
B.对分类变量X与Y的随机变量来说,越小,认为“X与Y有关系”的犯错误的概率越大
C.由独立性检验可知:在犯错误的概率不超过5%的前提下,认为秃顶与患心脏病有关,我们说某人秃顶,那么他有95%的可能患有心脏病
D.依据小概率值的独立性检验,认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%的前提下认为吸烟与患肺癌有关
二、解答题
3.(23-24高二下·河南·阶段练习)近年来,我国青少年近视问题呈现高发性、低龄化、重度化趋势. 已知某校有学生200人,其中40人每天体育运动时长小于1小时,160人每天体育运动时长大于或等于1小时,为研究体育运动时长与青少年近视的相关性,研究人员采用分层随机抽样的方法从学生中抽取50人进行调查,得到以下数据:
体育运动时长小于1小时
体育运动时长大于或等于1小时
合计
近视
4
无近视
2
合计
(1)请完成上表,并依据小概率值的独立性检验,能否认为学生是否近视与体育运动时长有关?
(2)为进一步了解近视学生的具体情况,现从调查的近视学生中随机抽取3人进行进一步的检测,设随机变量为体育运动时长小于1小时的人数,求的分布列和数学期望.
附:
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参考公式:,其中.
4.(23-24高二下·吉林长春·阶段练习)2024年1月4日,教育部在京召开全国“双减”工作视频调度会,会议要求进一步提高双减政治站位,将“双减”工作作为重中之重,坚定不移推进,成为受老师和家长关注的重要话题.某学校为了解家长对双减工作的满意程度进行问卷调查(评价结果仅有“满意”、“不满意”),从所有参与评价的对象中随机抽取120人进行调查,部分数据如表所示(单位:人):
满意
不满意
合计
男性
10
50
女性
60
合计
120
(1)请将列联表补充完整,试根据小概率值的独立性检验,能否认为“对双减工作满意程度的评价与性别有关”?
(2)若将频率视为概率,从所有给出“满意”的家长中随机抽取3人,用随机变量表示被抽到的男性家长的人数,求的分布列;
(3)在抽出的120人中,从给出“满意”的家长中利用分层抽样的方法抽取10人,从给出“不满意”的对象中抽取人.现从这人中,随机抽出2人,用随机变量表示被抽到的给出“满意”的女性家长的人数.若随机变量的数学期望不小于1,求的最大值.
参考公式:,其中.
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
5.(2024·全国·模拟预测)软笔书法又称中国书法,是我国的国粹之一,琴棋书画中的“书”指的正是书法.作为我国的独有艺术,书法不仅能够陶冶情操,培养孩子对艺术的审美,还能开发孩子的智力,拓展孩子的思维与手的灵活性,对孩子的身心健康发展起着重要的作用.近年来越来越多的家长开始注重孩子的书法教育.某书法培训机构统计了学习软笔书法的学生人数(每人只学习一种书体),得到相关数据统计表如下:
书体
楷书
行书
草书
隶书
篆书
人数
24
16
10
20
10
(1)该培训机构统计了某周软笔书法学生的作业完成情况,得到以下不完整的统计表,请补充完整统计表并判断是否有90%的把握认为是否认真完成作业与性别有关;
认真完成
不认真完成
总计
男生
7
35
女生
总计
70
(2)现从学习楷书与行书的学生中用分层抽样的方法抽取5人,再从这5人中随机抽取2人,求抽取的2人中学习楷书和学习行书各有1人的概率.
参考公式及数据:,.
0.10
0.05
0.01
k
2.706
3.841
6.635
6.(23-24高二下·江苏·期中)某学校号召学生参加“每天锻炼1小时”活动,为了解学生参加活动的情况,统计了全校所有学生在假期每周锻炼的时间,现随机抽取了60名同学在某一周参加锻炼的数据,整理如下列联表:
性别
不经常锻炼
经常锻炼
合计
男生
7
女生
16
30
合计
21
注:将一周参加锻炼时间不小于3小时的称为“经常锻炼”,其余的称为“不经常锻炼”.
(1)请完成上面列联表,并依据小概率值的独立性检验,能否认为性别因素与学生锻炼的经常性有关系;
(2)将一周参加锻炼为0小时的称为“极度缺乏锻炼”.在抽取的60名同学中有5人“极度缺乏锻炼”.以样本频率估计概率.若在全校抽取20名同学,设“极度缺乏锻炼”的人数为X,求X的数学期望和方差;
(3)将一周参加锻炼6小时以上的同学称为“运动爱好者”.在抽取的60名同学中有10名“运动爱好者”,其中有7名男生,3名女生.为进一步了解他们的生活习惯,在10名“运动爱好者”中,随机抽取3人进行访谈,设抽取的3人中男生人数为Y,求Y的分布列和数学期望.
附:,
0.1
0.05
0.01
2.706
3.841
6.635
原创精品资源学科网独家享有版权,侵权必究!学科网(北京)股份有限公司2
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$
专题07 回归方程与独立性检验
题型01 相关系数与相关性
题型02 线性回归方程
题型03 非线性回归方程
题型04 独立性检验
题型01 相关系数与相关性
一、单选题
1.(23-24高二下·辽宁·期中)下列变量之间的关系不是相关关系的是( )
A.光照时间与大棚内蔬菜的产量 B.举重运动员所能举起的最大重量与他的体重
C.某正方形的边长与此正方形的面积 D.人的身高与体重
【答案】C
【分析】根据变量间的相关关系和函数关系判断即可.
【详解】C中的两个变量之间是确定的函数关系,A,B,D中的两个变量之间的关系都是相关关系.
故选:C
2.(23-24高二下·辽宁沈阳·阶段练习)已知5个成对数据的散点图如下、若去掉点,则下列说法错误的是( )
A.变量x与变量y呈负相关 B.变量x与变量y的相关性变强
C.残差平方和变小 D.样本相关系数r变大
【答案】D
【分析】根据已知条件,结合变量间的相关关系,结合图象分析判断即可.
【详解】由散点图可知,去掉点D后,与的线性相关加强,且为负相关,所以AB正确,
由于与的线性相关加强,所以残差平方和变小,所以C正确,
由于与的线性相关加强,且为负相关,所以相关系数的绝对值变大,而相关系数为负的,所以样本相关系数r变小,所以D错误,
故选:D.
3.(2024高二下·全国·专题练习)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( ).
A. B.
C. D.
【答案】A
【分析】根据散点图中点的分布的特征,结合线性相关定义可得答案.
【详解】由给出的散点图可以看出,题图①和题图③是正相关,相关系数大于0,
题图②和题图④是负相关,相关系数小于0.
题图①和题图②的点相对更加集中,所以相关性更强,所以接近于1,接近于,
由此可得.
故选:A.
二、解答题
4.(2024高二下·全国·专题练习)某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面(单位:亩)与相应的管理时间(单位:月)的关系如表所示:
土地使用面积(单位:亩)
1
2
3
4
5
管理时间(单位:月)
8
11
14
24
23
作出散点图,判断管理时间与土地使用面积是否线性相关,并根据相关系数说明相关关系的强弱.(若,认为两个变量有较强的线性相关性,的值精确到0.001)
注:亩,我国市制土地面积单位,1亩≈666.7平方米.
参考公式:.
参考数据:,,.
【答案】散点图见解析,管理时间与土地使用面积线性相关,因为,所以管理时间与土地使用面积线性相关性较强.
【分析】根据表格数据画出散点图,即可判断线性相关性,再根据所给公式计算出相关系数即可.
【详解】根据表格数据可得散点图如图所示.
由散点图可知,管理时间与土地使用面积线性相关.
依题意,,又,
,
,
,
则.
因为,所以管理时间与土地使用面积线性相关性较强.
题型02 线性回归方程
一、单选题
1.(23-24高二下·吉林长春·期中)以下有关直线拟合效果的说法错误的是( )
A.通过最小二乘法得到的线性回归直线经过样本点的中心
B.相关系数r越小,表明两个变量相关性越弱
C.最小二乘法求回归直线方程,是求使最小的a,b的值
D.决定系数R2越接近1,表明直线拟合效果越好
【答案】B
【分析】根据线性回归直线的定义,相关指数,相关系数的定义判断.
【详解】线性回归直线一定经过样本的中心,A正确;
相关系数r的绝对值越小,表明两个变量相关性越弱,越接近于1,相关性越强,B错;
最小二乘法求回归直线方程,就是求使最小的a,b的值,C正确;
越接近1,表明回归的效果越好,越接近于0,效果越差,D正确.
故选:B.
2.(23-24高二下·江西景德镇·期中)给定两个随机变量和的5组数据如下表所示,利用最小二乘法得到关于的线性回归方程为,则表中值为( )
1
2
3
4
5
2
4
7
8
A.3 B.4 C.5 D.6
【答案】B
【分析】求变量的平均值,结合回归方程的性质可得.
【详解】由已知,,
因为点在回归直线上,
所以,所以,
故选:B.
3.(2024·四川广安·二模)某公司收集了某商品销售收入(万元)与相应的广告支出(万元)共10组数据(),绘制出如下散点图,并利用线性回归模型进行拟合.
若将图中10个点中去掉点后再重新进行线性回归分析,则下列说法正确的是( )
A.决定系数变小 B.残差平方和变小
C.相关系数的值变小 D.解释变量与预报变量相关性变弱
【答案】B
【分析】从图中分析得到去掉点后,回归效果更好,再由决定系数,残差平方和,相关系数和相关性的概念和性质作出判断.
【详解】从图中可以看出点较其他点,偏离直线远,故去掉点后,回归效果更好,
故决定系数会变大,更接近于1,残差平方和变小,
相关系数的绝对值,即会更接近于1,由图可得与正相关,故会更接近于1,
即相关系数的值变大,解释变量与预报变量相关性变强,
故A、C、D错误,B正确.
故选:B.
二、解答题
4.(2024·青海西宁·二模)只要骑车,都应该戴头盔.骑行头盔是骑行中生命坚实的保护屏障.骑行过程中的摔倒会对头部造成很大的损害,即使骑行者是以较低的车速沿着坡度平稳的自行车道骑行,也同样不可忽视安全问题.佩戴头盔的原因很简单也很重要——保护头部,减少伤害.相关数据表明,在每年超过500例的骑车死亡事故中,有75%的死亡原因是头部受到致命伤害造成的,医学研究发现,骑车佩戴头盔可防止85%的头部受伤,并且大大减小了损伤程度和事故死亡率.
某市对此不断进行安全教育,下表是该市某主干路口连续5年监控设备抓拍到通过该路口的骑电动车不戴头盔的人数的统计数据:
年份
2019
2020
2021
2022
2023
年份序号
1
2
3
4
5
不戴头盔人数
1450
1300
1200
1100
950
(1)求不戴头盔人数与年份序号之间的线性回归方程;
(2)预测该路口2024年不戴头盔的人数.
参考公式:回归方程中斜率和截距的最小二乘法估计公式分别为.
【答案】(1);(2).
【详解】(1)由题意知,,
所以,
,
所以,
所以,
所以不戴头盔人数与年份序号之间的线性回归方程为.
(2)当时,,
即预测该路口2024年不戴头盔的人数为.
5.(23-24高三上·黑龙江鸡西·期末)直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司2023年前5个月的带货金额:
月份
1
2
3
4
5
带货金额万元
350
440
580
700
880
(1)计算变量的相关系数(结果精确到0.01).
(2)求变量之间的线性回归方程,并据此预测2023年6月份该公司的直播带货金额.
参考数据:,
参考公式:相关系数,线性回归方程的斜率,截距.
【答案】(1)0.99(2),986万元.
【分析】(1)直接代入相关系数方程即可.
(2)求出线性回归方程,再代入即可.
【详解】(1)
(2)因为,
所以,
所以变量之间的线性回归方程为,
当时,(万元).
所以预测2023年6月份该公司的直播带货金额为986万元.
题型03 非线性回归方程
一、解答题
1.(23-24高二下·江西景德镇·期中)近年来,共享单车进驻城市,绿色出行引领时尚.某公司计划对未开通共享单车的A县城进行车辆投放,为了确定车辆投放量,对过去在其他县城的投放量情况以及年使用人次进行了统计,得到了投放量x(单位;千辆)与年使用人次y(单位:千次)的数据如下表所示,根据数据绘制投放量x与年使用人次y的散点图如图所示.
x
1
2
3
4
5
6
7
y
5
16
28
38
64
108
196
拟用模型① 或模型② 对两个变量的关系进行拟合,令,可得
,,,,,变量y与t的标准差分别为,.
(1)根据所给的统计量,求模型② 中y关于x的回归方程;(结果保留小数点后两位)
(2)计算并比较两种模型的相关系数r(结果保留小数点后三位),求哪种模型预测值精度更高、更可靠;
(3)已知每辆单车的购入成本为200元,年调度费以及维修等的使用成本为每人次0.2元,按用户每使用一次,收费1元计算,若投入8000辆单车,利用(2)中更可靠的模型,预测几年后开始实现盈利.(结果保留整数)
附,样本点的线性回归方程最小二乘估计公式为,,相关系数
参考数据:.
【答案】(1)(2)0.910;0.972;模型②预测值精度更高、更可靠;(3)6年.
【详解】(1)据题意可知,
,,
,,
故:模型②中y关于x的回归方程为;
(2)因为且,
所以模型①的相关系数 ,
模型②的相关系数,
因此,模型②预测值精度更高、更可靠;
(3)设预计n年后开始盈利,
将代入中,得,
n年后的利润为,
要使,只需,且故:预测6年后开始实现盈利.
2.(2024·陕西安康·模拟预测)随着移动互联网和直播带货技术的发展,直播带货已经成为一种热门的销售方式,特别是商家通过展示产品,使顾客对商品有更全面的了解.下面统计了某新手开启直播带货后从6月份到10月份每个月的销售量(万件)的数据,得到如图所示的散点图.其中6月份至10月份相应的代码为,如:表示6月份.
(1)根据散点图判断,模型①与模型②哪一个更适宜作为月销售量关于月份代码的回归方程?(给出判断即可,不必说明理由)
(2)(i)根据(1)的判断结果,建立关于的回归方程;(计算结果精确到0.01)
(ⅱ)根据结果预测12月份的销售量大约是多少万件?
参考公式与数据:, ,,其中.
【答案】(1)模型②
(2)(i);(ⅱ)预测12月份的销售量大约是13.9万件
【分析】(1)根据散点图结合一次函数以及二次函数图象特征分析判断;
(2)(i)令,根据题中数据和公式求回归方程;
(ⅱ)令,代入回归方程运算求解即可.
【详解】(1)由散点图可知增加幅度不一致,且散点图接近于曲线,非线性,
结合图象故选模型②.
(2)(i)令,则,
可得,,
则,,
所以关于的回归方程为,
即关于的回归方程;
(ⅱ)令,可得,
预测12月份的销售量大约是13.9万件.
3.(2024·上海·一模)为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:克每立方米)与样本对原点的距离(单位:米)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中).
6
97.90
0.21
240
0.14
14.12
26.13
(1)利用相关系数的知识,判断与哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型;
(2)根据(1)的结果建立关于的回归方程,并估计样本对原点的距离米时,平均金属含量是多少?
【答案】(1)更适宜作为回归方程类型;(2),.
【分析】(1)根据题意,分别求得相关系数的值,结合和,结合,即可得到结论.
(2)(i)根据最小二乘法,求得回归系数,进而求得回归方程;(ii)当时,结合回归方程,即可求得预报值.
【详解】(1)因为的线性相关系数,
的线性相关系数,
因为,
所以更适宜作为平均金属含量关于样本对原点的距离的回归方程类型.
(2)依题意,,
则,于是,
所以关于的回归方程为.
当时,金属含量的预报值为.
题型04 独立性检验
一、单选题
1.(23-24高二下·黑龙江牡丹江·期中)下列说法错误的是( )
A.在残差图中,残差点比较均匀地落在水平带状区域中,说明选用的模型比较合适,带状区域越窄,说明回归方程的预报精度越高
B.在独立性检验时,两个变量的列联表中,对角线上数据的乘积相差越大,说明“这两个变量没有关系”成立的可能性就越大
C.在回归直线方程中,当解释变量每增加一个单位时,预报变量就增加0.2个单位
D.越大,意味着残差平方和越小,即模型的拟合效果越好
【答案】B
【分析】AD选项,根据残差分析可得AD正确;B选项,由卡方的定义可知B错误;C选项,由一元线性回归方程可知,故C正确.
【详解】A选项,在残差图中,残差点比较均匀地落在水平带状区域中,说明选用的模型比较合适,带状区域越窄,说明回归方程的预报精度越高,A正确;
B选项,在独立性检验时,两个变量的列联表中,对角线上数据的乘积相差越大,说明“这两个变量没有关系”成立的可能性就越小,B错误;
C选项,由于,故在回归直线方程中,当解释变量每增加一个单位时,预报变量就增加0.2个单位,C正确;
D选项,越大,意味着残差平方和越小,即模型的拟合效果越好,D正确.
故选:B
2.(22-23高二下·山西大同·阶段练习)有关独立性检验的四个命题,其中不正确的是( ).
A.两个变量的2×2列联表中,对角线上数据的乘积之差的绝对值越大,说明两个变量有关系成立的可能性就越大
B.对分类变量X与Y的随机变量来说,越小,认为“X与Y有关系”的犯错误的概率越大
C.由独立性检验可知:在犯错误的概率不超过5%的前提下,认为秃顶与患心脏病有关,我们说某人秃顶,那么他有95%的可能患有心脏病
D.依据小概率值的独立性检验,认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%的前提下认为吸烟与患肺癌有关
【答案】C
【分析】根据列联表、独立性检验等知识对选项进行分析,从而确定正确答案.
【详解】A选项,根据列联表的知识可知,对角线上数据的乘积之差的绝对值越大,
说明两个变量有关系成立的可能性就越大,A选项正确.
B选项,根据的知识可知,越小,认为“X与Y有关系”的犯错误的概率越大,B选项正确.
C选项,由独立性检验可知,有的把握认为秃顶与患心脏病有关,
并不是秃顶的人患心脏病的概率,所以C选项错误.
D选项,由独立性检验可知,的独立性检验,认为吸烟与患肺癌有关,
是指在犯错误的概率不超过1%的前提下认为吸烟与患肺癌有关,所以D选项正确.
故选:C
二、解答题
3.(23-24高二下·河南·阶段练习)近年来,我国青少年近视问题呈现高发性、低龄化、重度化趋势. 已知某校有学生200人,其中40人每天体育运动时长小于1小时,160人每天体育运动时长大于或等于1小时,为研究体育运动时长与青少年近视的相关性,研究人员采用分层随机抽样的方法从学生中抽取50人进行调查,得到以下数据:
体育运动时长小于1小时
体育运动时长大于或等于1小时
合计
近视
4
无近视
2
合计
(1)请完成上表,并依据小概率值的独立性检验,能否认为学生是否近视与体育运动时长有关?
(2)为进一步了解近视学生的具体情况,现从调查的近视学生中随机抽取3人进行进一步的检测,设随机变量为体育运动时长小于1小时的人数,求的分布列和数学期望.
附:
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参考公式:,其中.
【答案】(1)可以认为学生是否近视与体育运动时长有关
(2)分布列见详解,
【分析】(1)根据题意结合分层抽样完善列联表,求,并与临界值对比分析;
(2)由题意可知:的可能取值为0,1,2,3,结合超几何分布求分布列和期望.
【详解】(1)由题意可知:抽取50人中体育运动时长小于1小时的人数为,
据此可得列联表:
体育运动时长小于1小时
体育运动时长大于或等于1小时
合计
近视
8
4
12
无近视
2
36
38
合计
10
40
50
零假设:学生是否近视与体育运动时长无关,
可得,
根据小概率值的独立性检验,没有充分证据推断出成立,
因此可以认为不成立,即认为学生是否近视与体育运动时长有关.
(2)由题意可知:的可能取值为0,1,2,3,
,,
,,
所以的分布列为
0
1
2
3
的期望.
4.(23-24高二下·吉林长春·阶段练习)2024年1月4日,教育部在京召开全国“双减”工作视频调度会,会议要求进一步提高双减政治站位,将“双减”工作作为重中之重,坚定不移推进,成为受老师和家长关注的重要话题.某学校为了解家长对双减工作的满意程度进行问卷调查(评价结果仅有“满意”、“不满意”),从所有参与评价的对象中随机抽取120人进行调查,部分数据如表所示(单位:人):
满意
不满意
合计
男性
10
50
女性
60
合计
120
(1)请将列联表补充完整,试根据小概率值的独立性检验,能否认为“对双减工作满意程度的评价与性别有关”?
(2)若将频率视为概率,从所有给出“满意”的家长中随机抽取3人,用随机变量表示被抽到的男性家长的人数,求的分布列;
(3)在抽出的120人中,从给出“满意”的家长中利用分层抽样的方法抽取10人,从给出“不满意”的对象中抽取人.现从这人中,随机抽出2人,用随机变量表示被抽到的给出“满意”的女性家长的人数.若随机变量的数学期望不小于1,求的最大值.
参考公式:,其中.
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)列联表见解析,无关(2)分布列见解析;(3)2
【详解】(1)解:根据题意,得到列联表如下:
满意
不满意
合计
男性
40
10
50
女性
60
10
70
合计
100
20
120
零假设:“对双减工作满意程度的评价与性别无关”,所以没有充分证据证明零假设不成立,所以没有90%的把握认为“对双减工作满意程度的评价与性别有关”.
(2)解:从所有给出“满意”的家长中随机抽取1人为男性的概率为,
且各次抽取之间相互独立,所以随机变量,
所以,,
故随机变量的分布列为:
0
1
2
3
(3)解:从给出“满意”的观众中利用分层抽样的方法抽取10人,
其中男性有人,女性有人,所以随机变量的取值为,
可得,
则随机变量的数学期望,
则,解得,又因为,故的最大值为2.
5.(2024·全国·模拟预测)软笔书法又称中国书法,是我国的国粹之一,琴棋书画中的“书”指的正是书法.作为我国的独有艺术,书法不仅能够陶冶情操,培养孩子对艺术的审美,还能开发孩子的智力,拓展孩子的思维与手的灵活性,对孩子的身心健康发展起着重要的作用.近年来越来越多的家长开始注重孩子的书法教育.某书法培训机构统计了学习软笔书法的学生人数(每人只学习一种书体),得到相关数据统计表如下:
书体
楷书
行书
草书
隶书
篆书
人数
24
16
10
20
10
(1)该培训机构统计了某周软笔书法学生的作业完成情况,得到以下不完整的统计表,请补充完整统计表并判断是否有90%的把握认为是否认真完成作业与性别有关;
认真完成
不认真完成
总计
男生
7
35
女生
总计
70
(2)现从学习楷书与行书的学生中用分层抽样的方法抽取5人,再从这5人中随机抽取2人,求抽取的2人中学习楷书和学习行书各有1人的概率.
参考公式及数据:,.
0.10
0.05
0.01
k
2.706
3.841
6.635
【答案】(1)列联表见解析,有(2)
【分析】(1)分析题意利用概率与统计进行解答,首先列出联列表,算出再比较即可.
(2)进行下一步分析,再列出从这5人中随机抽取2人的所有情况,找出符合的特殊情况,算出概率即可.
【详解】(1)根据题意,完成列联表如下:
认真完成
不认真完成
总计
男生
28
7
35
女生
42
3
45
总计
70
10
80
由题意可得,
所以有90%的把握认为是否认真完成作业与性别有关.
(2)因为学习楷书与行书的人数之比为,
所以抽取的5人中,学习楷书的有3人,学习行书的有2人.
设学习楷书的3人分别为,,,学习行书的2人分别为,,
从这5人中随机抽取2人的所有情况有,,,,,,,,,,共10种,
记“抽取的2人中学习楷书和学习行书各有1人”为事件M,则事件M包含的事件有,,,,,,共6种,
所以所求概率.
6.(23-24高二下·江苏·期中)某学校号召学生参加“每天锻炼1小时”活动,为了解学生参加活动的情况,统计了全校所有学生在假期每周锻炼的时间,现随机抽取了60名同学在某一周参加锻炼的数据,整理如下列联表:
性别
不经常锻炼
经常锻炼
合计
男生
7
女生
16
30
合计
21
注:将一周参加锻炼时间不小于3小时的称为“经常锻炼”,其余的称为“不经常锻炼”.
(1)请完成上面列联表,并依据小概率值的独立性检验,能否认为性别因素与学生锻炼的经常性有关系;
(2)将一周参加锻炼为0小时的称为“极度缺乏锻炼”.在抽取的60名同学中有5人“极度缺乏锻炼”.以样本频率估计概率.若在全校抽取20名同学,设“极度缺乏锻炼”的人数为X,求X的数学期望和方差;
(3)将一周参加锻炼6小时以上的同学称为“运动爱好者”.在抽取的60名同学中有10名“运动爱好者”,其中有7名男生,3名女生.为进一步了解他们的生活习惯,在10名“运动爱好者”中,随机抽取3人进行访谈,设抽取的3人中男生人数为Y,求Y的分布列和数学期望.
附:,
0.1
0.05
0.01
2.706
3.841
6.635
【答案】(1)表格见解析,性别因素与学生体育锻炼的经常性有关系
(2),
(3)分布列见解析,
【分析】(1)先根据题意完成列联表,代入公式可得,即可得到结论;
(2)依题意可得X近似服从二项分布,先求出随机抽取一人为“极度缺乏锻炼”者的概率为,从而可得,即可求得和;
(3)依题意可得Y的所有可能取值为0,1,2,3,利用超几何分布公式求得概率,进而即可得到Y的分布列和期望值.
【详解】(1)根据题意可得列联表如下;
性别
不经常锻炼
经常锻炼
合计
男生
7
23
30
女生
14
16
30
合计
21
39
60
零假设为:性别与锻炼情况独立,即性别因素与学生体育锻炼的经常性无关;
根据列联表的数据计算可得,
根据小概率值的独立性检验,推断不成立,
即性别因素与学生体育锻炼的经常性有关系,此推断犯错误的概率不超过0.1.
(2)因学校总学生数远大于所抽取的学生数,故X近似服从二项分布,
易知随机抽取一人为“极度缺乏锻炼”者的概率,即可得,
故,.
(3)易知10名“运动爱好者”有7名男生,3名女生,
所以Y的所有可能取值为0,1,2,3,
且Y服从超几何分布:
,
,
,
故所求分布列为
Y
0
1
2
3
P
可得
原创精品资源学科网独家享有版权,侵权必究!1
学科网(北京)股份有限公司
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。