线性回归分析 期末专题复习讲义-2023-2024学年高二下学期数学人教A版(2019)选择性必修第三册
2024-05-30
|
2份
|
42页
|
613人阅读
|
15人下载
普通
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 8.2 一元线性回归模型及其应用 |
| 类型 | 教案-讲义 |
| 知识点 | 回归分析 |
| 使用场景 | 同步教学-期末 |
| 学年 | 2024-2025 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 1.36 MB |
| 发布时间 | 2024-05-30 |
| 更新时间 | 2024-06-01 |
| 作者 | 灬随遇而安灬 |
| 品牌系列 | - |
| 审核时间 | 2024-05-30 |
| 下载链接 | https://m.zxxk.com/soft/45463655.html |
| 价格 | 1.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
高二下期期末热点线性回归分析专题
热点解读
用样本估计总体,古典概型,离散型随机变量的分布列、期望、方差是高考重点,考查的能力是应用回归分析与独立性检验思想方法解决简单实际问题的能力。本专题题目多以生产生活中的实际问题为背景,阅读量大,首先根据文宇信息、图表信息了解考查的知识点,再结合考查目标,理解图文的内在含义,最后整合有效信息,明确数据关系。应用题的考查,加大了对考生阅读能力的要求,对题目的准确理解,找到数学模型,是解答题目的关键.考生应该把近几年各地高考及模拟题归类分析,强化训练
知识导图
解题妙计
1、相关关系与函数关系的异同
(1)相同点:两者均是指两个变量之间的关系;
(2)不同点:①函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系;相关关系是一种不确定的关系,如一块农田的水稻产量与施肥量之间的关系;事实上,函数是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系;②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系
2、线性关系的判断
通过散点图可以观察两个变量的分布是否存在一定的规律,直观地进行判断。如果发现点的分布从整体上大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响。其中呈从左下向右上方向发展趋势的为正相关,呈左上向右下方向发展趋势的为负相关
3、相关系数的计算与应用
(1)两组数据和的线性相关系数是度量两个变量x与y之间线性相关程度的统计量,其计算公式为,其中,,,它们分别是这两组数据的算术平均数.
(2)相关系数r的性质
①;
②时,与呈正相关关系;时,与呈负相关关系
③越接近1,与的相关程度越强;越接近0,与的相关程度越弱.
通常情况下,时,认为线性相关关系显著;当时,认为几乎没有线性相关关系
4、样本中心点在回归方程上
5、线性回归模型中,的求法
称为线性回归模型,,,的估计值为,,则
其中,
6、常见的非线性函数转换方法
1、幂型函数y=axm(a为正数,x,y取正值):对y=axm两边取常用对数,有lg y=lg a+mlg x,令u=lg y,v=lg x,则原式可变为u=mv+lg a,其中m,lg a为常数,该式表示u,v的线性函数.
2、指数型函数y=c·ax(a,c>0,且a≠1):对y=cax两边取常用对数,则有lg y=lg c+xlg a,令u=lg y,则原式可变为u=xlg a+lg c,其中lg a和lg c为常数,该式表示u,x的线性函数.与幂函数不同的是x保持不变,用y的对数lg y代替了y.
3、反比例函数y= (k>0):令u=,则y=ku,该式表示y,u的线性函数.
4、二次函数y=ax2+c:令u=x2,则原函数可变为y=au+c,该式表示y,u的线性函数.
5、对数型函数y=clogax:令x=au,则原函数可变为y=cu,该式表示y,u的线性函数
7、独立性检验
1、独立性检验是研究两个分类变量是否有关的统计方法,在独立性检验的概念中药准确分析两个分类变量;在学习中药注意其与相关关系概念的区别。
2、临界值的定义:对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,概率值越小,临界值越大.
3、独立性检验:,通常称为零假设或原假设.
基于小概率值的检验规则是:
当时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过;
当时,我们没有充分证据推断不成立,可以认为和独立
4、独立性检验的一般方法
(1)根据题目信息,完善列联表;
(2)提出零假设:假设两个变量相互独立,并给出在问题中的解释。
(3)根据列联表中的数据及计算公式求出的值;
(4)当时,我们就推断不成立,即两个变量不独立,该推断犯错误的概率不超过;
当时,我们没有充分证据推断不成立,可以认为两个变量相互独立。
模拟预测
一、单选题
1、(22-23高二下·江苏扬州·期末)某小吃店的日盈利(单位:百元)与当天平均气温(单位:)之间有如下数据:
0
1
2
百元
5
4
2
1
经分析知,与之间有较强的线性关系,其线性回归直线方程为,则( )
A.3 B.2.8 C.2 D.1
2、(22-23高二下·江苏连云港·期末)某杂交水稻研究小组先培育出第一代杂交水稻,再由第一代培育出第二代,第二代培育出第三代,以此类推,且亲代与子代的每穗总粒数之间的关系如下表所示:
代数代码
1
2
3
4
总粒数
197
193
201
209
通过上面四组数据得到了与之间的线性回归方程是,预测第十代杂交水稻每穗的总粒数为( )
A.233 B.234 C.235 D.236
3、(22-23高二下·江苏宿迁·期末)下列图中,能反映出相应两个变量之间具有线性相关关系的是( )
A.B.C.D.
4、(2023·山东威海·二模)云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续增长.已知某科技公司2018年至2022年云计算市场规模数据,且市场规模y(单位:千万元)与年份代码x的关系可以用模型(其中e=2.71828…)拟合,设,得到数据统计如下表:
年份
2018年
2019年
2020年
2021年
2022年
x
1
2
3
4
5
y
m
11
20
36.6
54.6
z
n
2.4
3
3.6
4
由上表可得回归方程,则m的值约为( )
A.2 B.7.4 C.1.96 D.6.9
5、(22-23高二下·江苏泰州·期末)已知x,y的取值如下表所示,从散点图分析可知y与x线性相关,如果线性回归方程为,则下列说法不正确的是( )
A.m的值为6.2
B.回归直线必过点(2,4.4)
C.样本点(4,m)处的残差为0.1
D.将此图表中的点(2,4.4)去掉后,样本相关系数r不变
6、(20-21高二·全国·课后作业)某化工厂产生的废气经过过滤后排放,以模型去拟合过滤过程中废气的污染物浓度与时间之间的一组数据,为了求出线性回归方程,设,其变换后得到线性回归方程为,则当经过后,预报废气的污染物浓度为( )
A. B. C. D.
二、填空题
7、(22-23高二下·江苏盐城·期末)已知、的取值如下表所示,从散点图分析可知与线性相关,如果线性回归方程为,那么表格中的数据的值为 .
8、(22-23高二下·江苏连云港·期末)为了考查某流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:
疫苗使
用情况
感染情况
感染
未感染
总计
注射
10
40
50
未注射
20
30
50
总计
30
70
100
参照附表,在犯错误的概率最多不超过 的前提下,可认为“注射疫苗”与“感染某流感”有关系.
参考公式:.
9、(22-23高二下·江苏扬州·期末)现调查某地区某种野生动物的数量,将该地区分成面积相近的200个地块,从这些地块中简单随机抽样的方法抽取20个作为样本,调查得到样本数据,其中分别表示第个样本的植物覆盖面积(单位:公顷)和这种野生动物的数量,构造向量,,其中,,并计算得,,,,,由选择性必修二教材中的知识,我们知道对数据的相关系数,则上述数据的相关系数 .
三、解答题
10、(22-23高二下·江苏盐城·期末)某中学对50名学生的性别与主动预习的情况进行调查,得到的统计数据如表所示:
主动预习
不太主动预习
总计
男
女
总计
(1)判断是否有的把握认为“主动预习”与性别有关?
(2)现从抽取的“主动预习”的学生中,按性别采用分层抽样的方法抽取4人参加奥数闯关比赛,已知其中男、女学生独立闯关成功的概率分别为,在恰有两人闯关成功的条件下,求有女生闯关成功的概率.
参考数据与公式:
,其中.
11、(22-23高二下·江苏扬州·期末)某电影平台为了解观众对某影片的感受,已知所有参评的观众中男、女之比为2:1,现从中随机抽取120名男性和60名女性进行调查,抽取的男观众中有80人给了“点赞”的评价,女观众中有45人给了“一般”的评价.
(1)把下面列联表补充完整,并判断是否有99.9%的把握认为对该影片的评价与性别有关?
性别
评价结果
合计
点赞
一般
男
80
女
45
合计
180
(2)用频率估计概率,在所有参评的观众中按“男”和“女”进行分层抽样,随机抽取6名参评观众.
①若再从这6名参评观众中随机抽取1人进行访谈,求这名观众给出“点赞”评价的概率;
②若再从这6名参评观众中随机抽取2人进行访谈,求在抽取的2人均给出“点赞”的条件下,这2人是1名男性和1名女性的概率.
参考公式:,其中.
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
12、(22-23高二下·江苏淮安·期末)淮安西游乐园推出的西游主题毛绒公仔,具有造型逼真可爱、触感柔软等特点,深受学生喜爱.某调查机构在参观西游乐园的游客中随机抽取了200名学生,对是否有购买西游主题毛绒公仔的意愿进行调查,得到以下的列联表:
有购买意愿
没有购买意愿
合计
男
40
女
60
合计
50
(1)完成上述列联表,根据以上数据,判断是否有99%的把握认为购买西游主题毛绒公仔与学生的性别有关?
(2)某文创商店为了宣传推广西游主题毛绒公仔产品,设计了一个游戏:在三个外观大小都一样的袋子中,分别放大小相同的1个红球和3个蓝球,2个红球和2个蓝球,以及3个红球和1个蓝球.游客可以从三个袋子中任选一个,再从中任取2个球,若取出2个红球,则可以获赠一套西游主题毛绒公仔.现有3名同学参加该游戏,表示3名同学中获赠一套毛绒公仔的人数,求随机变量的概率分布及数学期望.
附:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
13、(22-23高二下·江苏淮安·期末)某乡政府为提高当地农民收入,指导农民种植药材,取得较好的效果.以下是某农户近5年种植药材的平均收入的统计数据:
年份
2018
2019
2020
2021
2022
年份代码
1
2
3
4
5
平均收入(千元)
59
61
64
68
73
(1)根据表中数据,现有与两种模型可以拟合与之间的关系,请分别求出两种模型的回归方程;(结果保留一位小数)
(2)统计学中常通过比较残差的平方和来比较两个模型的拟合效果,请根据残差平方和说明上述两个方程哪一个拟合效果更好,并据此预测2023年该农户种植药材的平均收入.
参考数据及公式:,,其中.,.
14、(22-23高二下·江苏南通·期末)“使用动物做医学实验是正确的,这样做能够挽救人的生命”.一机构为了解成年人对这种说法的态度(态度分为同意和不同意),在某市随机调查了200位成年人,得到如下数据:
男性
女性
合计
同意
70
50
120
不同意
30
50
80
合计
100
100
200
(1)能否有99%的把握认为成年人对该说法的态度与性别有关?
(2)将频率视为概率,用样本估计总体.若从该市成年人中,随机抽取3人了解其对该说法的态度,记抽取的3人中持同意的人数为X,求X的分布列和数学期望.
附:,
0.025
0.010
0.005
5.024
6.635
7.879
15、(22-23高二下·江苏徐州·期末)为了研究学生是否喜欢篮球运动与性别的关系,某校高二年级随机对该年级50名学生进行了跟踪调查,其中喜欢篮球运动的学生有30人,在余下的学生中,女生占,根据数据制成列联表如下:
男生
女生
合计
喜欢
20
30
不喜欢
20
合计
50
(1)根据题意,完成上述列联表,并判断是否有的把握认为喜欢篮球运动和性别有关?
(2)在不喜欢篮球运动的20人中随机抽取2人继续跟踪调查,其中男生人数记为随机变量,求的分布列和数学期望.
附:,其中.
0.05
0.025
0.010
0.005
0.001
3.841
5.024
6.635
7.879
10.828
16、(22-23高二下·江苏徐州·期末)已知一组数据的散点图如下:
(1)根据散点图计算,的相关系数,并据此判断是否可用线性回归模型拟合与的关系?(若,则线性相关程度很高,可用线性回归模型拟合)
(2)若可用线性回归模型拟合与的关系,请建立关于的线性回归方程,并预测时的值.
附:相关公式及参考数据:,.
回归方程中,,.
17、(22-23高二下·江苏宿迁·期末)据文化和旅游部数据中心测算,2023年“五一”假期,全国国内旅游出游合计2.74亿人次,同比增长.为迎接暑期旅游高峰的到来,某旅游公司对今年年初推出一项新的旅游产品1~5月份的营业收入(万元)进行统计,统计数据如表所示:
月份x
1
2
3
4
5
月收入y(万元)
94
98
105
115
123
(1)依据表中给出的数据,建立该项旅游产品月收入y万元关于月份x的线性回归方程,并预测该项旅游产品今年7月份的营业收入是多少万元?
(2)观察表中数据可以看出该产品很受游客欢迎,为了进一步了解喜爱该旅游产品是否与性别有关,工作人员随机调查了100名游客,被调查的女性游客人数占,其中喜爱的人数为25人,调查到的男性游客中喜爱的人数占.
①根据调查情况填写列联表;
②根据列联表中数据能否有的把握认为“游客喜爱该旅游产品与性别有关”?
喜爱
不喜爱
总计
女性人数
男性人数
总计
参考公式及数据: .
,其中.
0.10
0.050
0.010
0.001
2.706
3.841
6.635
10.828
18、(22-23高二下·江苏苏州·期末)已知某校高一有450名学生(其中男生250名,女生200名).为了给学生提供更为丰富的校园文化生活,学校增设了两门全新的校本课程A,B,学生根据自己的兴趣爱好在这两门课程中任选一门进行学习.学校统计了学生的选课情况,得到如下的列联表.
选择课程A
选择课程B
总计
男生
150
女生
50
总计
(1)请将列联表补充完整,并判断是否有的把握认为选择课程与性别有关?说明你的理由;
(2)从所有男生中按列联表中的选课情况进行分层抽样,抽出10名男生,再从这10名男生中抽取3人做问卷调查,设这3人中选择课程A的人数为X,求X的分布列及数学期望.
附:,.
0.01
0.005
0.001
6.635
7.879
10.828
19、(22-23高二下·江苏泰州·期末)某软件科技公司近8年的年利润y与投入的年研发经费x(单位:千万元)如下表所示.
x
3
4
5
6
6
7
8
9
y
(1)根据散点图可以认为x与y之间存在线性相关关系,且相关系数,请用最小二乘法求出线性回归方程(,用分数表示);
(2)某配件加工厂加工的单个零件尺寸与标准件尺寸的误差,其中c为单个零件的加工成本(单位:元),且.引进该公司最新研发的某工业软件后,加工的单个零件尺寸与标准件尺寸的误差.若保持零件加工质量不变(即误差的概率分布不变),则单个零件加工的成本下降了多少元?
附:(1)参考数据:,.
(2)参考公式:,,.
(3)若随机变量服从正态分布,则,.
学科网(北京)股份有限公司
$$
高二下期期末热点线性回归分析专题
热点解读
用样本估计总体,古典概型,离散型随机变量的分布列、期望、方差是高考重点,考查的能力是应用回归分析与独立性检验思想方法解决简单实际问题的能力。本专题题目多以生产生活中的实际问题为背景,阅读量大,首先根据文宇信息、图表信息了解考查的知识点,再结合考查目标,理解图文的内在含义,最后整合有效信息,明确数据关系。应用题的考查,加大了对考生阅读能力的要求,对题目的准确理解,找到数学模型,是解答题目的关键.考生应该把近几年各地高考及模拟题归类分析,强化训练
知识导图
解题妙计
1、相关关系与函数关系的异同
(1)相同点:两者均是指两个变量之间的关系;
(2)不同点:①函数关系是一种确定的关系,如匀速直线运动中时间t与路程s的关系;相关关系是一种不确定的关系,如一块农田的水稻产量与施肥量之间的关系;事实上,函数是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系;②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系
2、线性关系的判断
通过散点图可以观察两个变量的分布是否存在一定的规律,直观地进行判断。如果发现点的分布从整体上大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响。其中呈从左下向右上方向发展趋势的为正相关,呈左上向右下方向发展趋势的为负相关
3、相关系数的计算与应用
(1)两组数据和的线性相关系数是度量两个变量x与y之间线性相关程度的统计量,其计算公式为,其中,,,它们分别是这两组数据的算术平均数.
(2)相关系数r的性质
①;
②时,与呈正相关关系;时,与呈负相关关系
③越接近1,与的相关程度越强;越接近0,与的相关程度越弱.
通常情况下,时,认为线性相关关系显著;当时,认为几乎没有线性相关关系
4、样本中心点在回归方程上
5、线性回归模型中,的求法
称为线性回归模型,,,的估计值为,,则
其中,
6、常见的非线性函数转换方法
1、幂型函数y=axm(a为正数,x,y取正值):对y=axm两边取常用对数,有lg y=lg a+mlg x,令u=lg y,v=lg x,则原式可变为u=mv+lg a,其中m,lg a为常数,该式表示u,v的线性函数.
2、指数型函数y=c·ax(a,c>0,且a≠1):对y=cax两边取常用对数,则有lg y=lg c+xlg a,令u=lg y,则原式可变为u=xlg a+lg c,其中lg a和lg c为常数,该式表示u,x的线性函数.与幂函数不同的是x保持不变,用y的对数lg y代替了y.
3、反比例函数y= (k>0):令u=,则y=ku,该式表示y,u的线性函数.
4、二次函数y=ax2+c:令u=x2,则原函数可变为y=au+c,该式表示y,u的线性函数.
5、对数型函数y=clogax:令x=au,则原函数可变为y=cu,该式表示y,u的线性函数
7、独立性检验
1、独立性检验是研究两个分类变量是否有关的统计方法,在独立性检验的概念中药准确分析两个分类变量;在学习中药注意其与相关关系概念的区别。
2、临界值的定义:对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,概率值越小,临界值越大.
3、独立性检验:,通常称为零假设或原假设.
基于小概率值的检验规则是:
当时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过;
当时,我们没有充分证据推断不成立,可以认为和独立
4、独立性检验的一般方法
(1)根据题目信息,完善列联表;
(2)提出零假设:假设两个变量相互独立,并给出在问题中的解释。
(3)根据列联表中的数据及计算公式求出的值;
(4)当时,我们就推断不成立,即两个变量不独立,该推断犯错误的概率不超过;
当时,我们没有充分证据推断不成立,可以认为两个变量相互独立。
模拟预测
一、单选题
1、(22-23高二下·江苏扬州·期末)某小吃店的日盈利(单位:百元)与当天平均气温(单位:)之间有如下数据:
0
1
2
百元
5
4
2
1
经分析知,与之间有较强的线性关系,其线性回归直线方程为,则( )
A.3 B.2.8 C.2 D.1
【答案】C
【分析】求出,,根据回归直线方程必过样本中心点,代入计算即可.
【详解】依题意,,
又回归直线方程必过样本中心点,
所以,解得.
故选:C
2、(22-23高二下·江苏连云港·期末)某杂交水稻研究小组先培育出第一代杂交水稻,再由第一代培育出第二代,第二代培育出第三代,以此类推,且亲代与子代的每穗总粒数之间的关系如下表所示:
代数代码
1
2
3
4
总粒数
197
193
201
209
通过上面四组数据得到了与之间的线性回归方程是,预测第十代杂交水稻每穗的总粒数为( )
A.233 B.234 C.235 D.236
【答案】A
【分析】求出样本中心,然后确定回归直线方程,即可求解预测当时,的估计值.
【详解】由题意可知:,.
因为回归直线方程经过样本中心,所以,解得,
回归直线方程为:,
当时,的估计值为:.
故选:A.
3、(22-23高二下·江苏宿迁·期末)下列图中,能反映出相应两个变量之间具有线性相关关系的是( )
A.B.C.D.
【答案】B
【分析】对于A ,两个变量是确定的函数关系,不正确;对于B,散点呈带状分布,正确;对于CD,散点不呈带状分布,不正确.
【详解】对于A ,由图象可知,两个变量是确定的函数关系,不是相关关系,故A 不正确;
对于B,由散点图可知,散点呈带状分布,所以两个变量具有线性相关关系,故B正确;
对于CD,由散点图可知,散点不呈带状分布,所以两个变量不具有线性相关关系,故CD不正确;
故选:B
4、(2023·山东威海·二模)云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续增长.已知某科技公司2018年至2022年云计算市场规模数据,且市场规模y(单位:千万元)与年份代码x的关系可以用模型(其中e=2.71828…)拟合,设,得到数据统计如下表:
年份
2018年
2019年
2020年
2021年
2022年
x
1
2
3
4
5
y
m
11
20
36.6
54.6
z
n
2.4
3
3.6
4
由上表可得回归方程,则m的值约为( )
A.2 B.7.4 C.1.96 D.6.9
【答案】B
【分析】根据题意,由回归方程过点,可得,再由即可求得.
【详解】由题意可得,,将代入可得,且,所以,
又因为,即,所以.
故选:B
5、(22-23高二下·江苏泰州·期末)已知x,y的取值如下表所示,从散点图分析可知y与x线性相关,如果线性回归方程为,则下列说法不正确的是( )
A.m的值为6.2
B.回归直线必过点(2,4.4)
C.样本点(4,m)处的残差为0.1
D.将此图表中的点(2,4.4)去掉后,样本相关系数r不变
【答案】C
【分析】根据平均数的定义及样本中心在经验回归直线方程上,利用残差的定义及样本相关系数的公式即可求解.
【详解】由题意可知,
所以样本中心为,
将点代入,可得,解得,故A正确;
由,得样本中心为,所以回归直线必过点(2,4.4),故B正确;
当时,,
由,得样本点处的残差为,故C错误;
因为样本中心为,
所以
由相关系数公式知, ,将此图表中的点(2,4.4)去掉后,样本相关系数r不变,故D正确;
故选:C.
6、(20-21高二·全国·课后作业)某化工厂产生的废气经过过滤后排放,以模型去拟合过滤过程中废气的污染物浓度与时间之间的一组数据,为了求出线性回归方程,设,其变换后得到线性回归方程为,则当经过后,预报废气的污染物浓度为( )
A. B. C. D.
【答案】D
【分析】把代入中求出的值,再将的值代入中可求出的值.
【详解】当时, ,
所以.
故选:D.
二、填空题
7、(22-23高二下·江苏盐城·期末)已知、的取值如下表所示,从散点图分析可知与线性相关,如果线性回归方程为,那么表格中的数据的值为 .
【答案】
【分析】求出样本中心点的坐标,将样本中心点的坐标代入回归直线方程,可求得实数的值.
【详解】由表格中的数据可得,,
将点的坐标代入回归直线方程可得,解得.
故答案为:.
8、(22-23高二下·江苏连云港·期末)为了考查某流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:
疫苗使
用情况
感染情况
感染
未感染
总计
注射
10
40
50
未注射
20
30
50
总计
30
70
100
参照附表,在犯错误的概率最多不超过 的前提下,可认为“注射疫苗”与“感染某流感”有关系.
参考公式:.
【答案】0.05
【分析】根据给定的数表,求出的观测值,再与临界值表比对作答.
【详解】由列联表中数据,计算得,
所以在犯错误的概率最多不超过0.05的前提下,认为“注射疫苗”与“感染某流感”有关系.
故答案为:0.05
9、(22-23高二下·江苏扬州·期末)现调查某地区某种野生动物的数量,将该地区分成面积相近的200个地块,从这些地块中简单随机抽样的方法抽取20个作为样本,调查得到样本数据,其中分别表示第个样本的植物覆盖面积(单位:公顷)和这种野生动物的数量,构造向量,,其中,,并计算得,,,,,由选择性必修二教材中的知识,我们知道对数据的相关系数,则上述数据的相关系数 .
【答案】
【分析】根据题干中相关系数的定义进行计算.
【详解】由题干数据,,可得,
根据夹角公式的定义,,而,
根据
,
于是.
故答案为:
三、解答题
10、(22-23高二下·江苏盐城·期末)某中学对50名学生的性别与主动预习的情况进行调查,得到的统计数据如表所示:
主动预习
不太主动预习
总计
男
女
总计
(1)判断是否有的把握认为“主动预习”与性别有关?
(2)现从抽取的“主动预习”的学生中,按性别采用分层抽样的方法抽取4人参加奥数闯关比赛,已知其中男、女学生独立闯关成功的概率分别为,在恰有两人闯关成功的条件下,求有女生闯关成功的概率.
参考数据与公式:
,其中.
【答案】(1)是
(2)
【分析】(1)利用列联表中的数据,求得的值,再与临界值表对照下结论;
(2)根据分层抽样,得到抽取4人中,有男生3人,女生1人,设“恰有两人闯关成功”为事件A,“有女生闯关成功”为事件B,分别求得其概率,再利用条件概率求解.
【详解】(1)解:因为,
所以有的把握认为“主动预习”与性别有关;
(2)根据分层抽样,抽取4人中,有男生3人,女生1人,
设“恰有两人闯关成功”为事件A,“有女生闯关成功”为事件B,
因为参加奥数闯关比赛,已知其中男、女学生独立闯关成功的概率分别为,
所以,
,
所以.
11、(22-23高二下·江苏扬州·期末)某电影平台为了解观众对某影片的感受,已知所有参评的观众中男、女之比为2:1,现从中随机抽取120名男性和60名女性进行调查,抽取的男观众中有80人给了“点赞”的评价,女观众中有45人给了“一般”的评价.
(1)把下面列联表补充完整,并判断是否有99.9%的把握认为对该影片的评价与性别有关?
性别
评价结果
合计
点赞
一般
男
80
女
45
合计
180
(2)用频率估计概率,在所有参评的观众中按“男”和“女”进行分层抽样,随机抽取6名参评观众.
①若再从这6名参评观众中随机抽取1人进行访谈,求这名观众给出“点赞”评价的概率;
②若再从这6名参评观众中随机抽取2人进行访谈,求在抽取的2人均给出“点赞”的条件下,这2人是1名男性和1名女性的概率.
参考公式:,其中.
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)列联表见解析,有的把握认为对该影片的评价与性别有关
(2)①②
【分析】(1)由卡方的计算即可求解,
(2)由分层抽样确定人数,即可由全概率公式以及贝叶斯公式进行求解.
【详解】(1)填写列联表如下:
性别
评价结果
合计
点赞
一般
男
80
40
120
女
15
45
60
合计
95
85
180
假设:对该影片的评价与性别无关.
根据列联表中的数据可以求得
由于,且当成立时,,所以有的把握认为对该影片的评价与性别有关.
(2)①由分层抽样知,随机抽取的6名参评观众中,男性有4人,女性有2人.
根据频率估计概率知,男性观众给出“点赞”评价的概率为,给出“一般”评价的概率为;
女性观众给出“点赞”评价的概率为,给出“一般”评价的概率为.
从这6名参评观众中随机抽取1人进行访谈,记“这名学生给出“点赞”评价”为事件,“这名观众是男性观众”为事件,“这名观众是女性观众”为事件.
则,
所以
②从这6名参评观众中随机抽取2人进行访谈,记“抽取的2人均给出“点赞’的评价”为事件,“这两名观众均是男性”为事件,“这两名观众均是女性”为事件,“这两名观众是1名男性和1名女性”为事件.
则,
.
所以
,
所以
12、(22-23高二下·江苏淮安·期末)淮安西游乐园推出的西游主题毛绒公仔,具有造型逼真可爱、触感柔软等特点,深受学生喜爱.某调查机构在参观西游乐园的游客中随机抽取了200名学生,对是否有购买西游主题毛绒公仔的意愿进行调查,得到以下的列联表:
有购买意愿
没有购买意愿
合计
男
40
女
60
合计
50
(1)完成上述列联表,根据以上数据,判断是否有99%的把握认为购买西游主题毛绒公仔与学生的性别有关?
(2)某文创商店为了宣传推广西游主题毛绒公仔产品,设计了一个游戏:在三个外观大小都一样的袋子中,分别放大小相同的1个红球和3个蓝球,2个红球和2个蓝球,以及3个红球和1个蓝球.游客可以从三个袋子中任选一个,再从中任取2个球,若取出2个红球,则可以获赠一套西游主题毛绒公仔.现有3名同学参加该游戏,表示3名同学中获赠一套毛绒公仔的人数,求随机变量的概率分布及数学期望.
附:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)列联表见解析,没有99%的把握认为购买西游主题毛绒公仔与学生的性别有关;
(2)分布列见解析,数学期望为.
【分析】(1)由题可得列联表,进而可得并结合条件即得;
(2)先求出一次游戏中取出2个红球的概率,然后利用二项分布概率公式可得概率,进而可得分布列及期望.
【详解】(1)由题可得列联表如下:
有购买意愿
没有购买意愿
合计
男
90
40
130
女
60
10
70
合计
150
50
200
提出假设:购买西游主题毛绒公仔与学生的性别无关,根据列联表中的数据,可以求得
,
因为当成立时,的概率大于1%,所以没有99%的把握认为购买西游主题毛绒公仔与学生的性别有关.
(2)一次游戏中取出2个红球的概率,
由题可知,1,2,3,则,
所以,,
,,
所以随机变量的概率分布为
0
1
2
3
所以.
13、(22-23高二下·江苏淮安·期末)某乡政府为提高当地农民收入,指导农民种植药材,取得较好的效果.以下是某农户近5年种植药材的平均收入的统计数据:
年份
2018
2019
2020
2021
2022
年份代码
1
2
3
4
5
平均收入(千元)
59
61
64
68
73
(1)根据表中数据,现有与两种模型可以拟合与之间的关系,请分别求出两种模型的回归方程;(结果保留一位小数)
(2)统计学中常通过比较残差的平方和来比较两个模型的拟合效果,请根据残差平方和说明上述两个方程哪一个拟合效果更好,并据此预测2023年该农户种植药材的平均收入.
参考数据及公式:,,其中.,.
【答案】(1),;
(2)回归方程拟合效果更好,预测2023年该农户种植药材的平均收入为8万元.
【分析】(1)根据最小二乘法结合条件可得回归方程;
(2)根据回归方程分别计算残差平方和,进而可得拟合效果更好,然后根据回归方程结合条件即得.
【详解】(1)根据农户近5年种植药材的平均收入情况的统计数据可得:
,,
所以,,
则,.
设,则,所以,
则,.
所以,两种模型的回归方程分别为,.
(2)回归方程为时,将值代入可得估计值分别为58,61.5,65,68.5,72,则残差平方和为.
回归方程为时,将值代入可得估计值分别为59,60.8,63.8,68,73.4,
则残差平方和为.
因为,所以回归方程拟合效果更好,应选择该方程进行拟合.
当时,,
故预测2023年该农户种植药材的平均收入为80千元,即8万元.
14、(22-23高二下·江苏南通·期末)“使用动物做医学实验是正确的,这样做能够挽救人的生命”.一机构为了解成年人对这种说法的态度(态度分为同意和不同意),在某市随机调查了200位成年人,得到如下数据:
男性
女性
合计
同意
70
50
120
不同意
30
50
80
合计
100
100
200
(1)能否有99%的把握认为成年人对该说法的态度与性别有关?
(2)将频率视为概率,用样本估计总体.若从该市成年人中,随机抽取3人了解其对该说法的态度,记抽取的3人中持同意的人数为X,求X的分布列和数学期望.
附:,
0.025
0.010
0.005
5.024
6.635
7.879
【答案】(1)有99%的把握认为成年人对该说法的态度与性别有关
(2)分布列见解析;期望为
【分析】(1)由卡方的计算,与临界值比较即可作出判断,
(2)由二项分布的概率公式即可求解分布列,由期望的计算公式即可求解期望.
【详解】(1)提出假设:成年人对该问题的态度与性别无关.
根据列联表中的数据可以求得
.
因为当成立时,的概率约为0.01,
这里,
所以我们有99%的把握认为,对该问题的态度与性别有关.
(2)从该市成年人中随机抽取1人持同意态度的概率为,
由题意,,
,
,
,
,
0
1
2
3
因此,随机变量的数学期望为
解法一:.
解法二:.
15、(22-23高二下·江苏徐州·期末)为了研究学生是否喜欢篮球运动与性别的关系,某校高二年级随机对该年级50名学生进行了跟踪调查,其中喜欢篮球运动的学生有30人,在余下的学生中,女生占,根据数据制成列联表如下:
男生
女生
合计
喜欢
20
30
不喜欢
20
合计
50
(1)根据题意,完成上述列联表,并判断是否有的把握认为喜欢篮球运动和性别有关?
(2)在不喜欢篮球运动的20人中随机抽取2人继续跟踪调查,其中男生人数记为随机变量,求的分布列和数学期望.
附:,其中.
0.05
0.025
0.010
0.005
0.001
3.841
5.024
6.635
7.879
10.828
【答案】(1)表格见解析,有的把握认为喜欢篮球运动和性别有关
(2)分布列见解析,.
【分析】(1)根据条件补充表格,并利用卡方公式计算即可判定;
(2)根据离散型随机变量的取值计算其对应概率得出分布列,再由期望公式计算即可.
【详解】(1)由题意,列联表如下:
男生
女生
合计
喜欢
20
10
30
不喜欢
5
15
20
合计
25
25
50
提出假设:性别与是否喜欢篮球运动无关.
根据列联表中的数据可以求得,
因为当成立时,的概率约为0.005,
所以有的把握认为喜欢篮球运动和性别有关.
(2)的所有可能取值为0,1,2,
,,,
故随机变量的分布列为
0
1
2
数学期望.
16、(22-23高二下·江苏徐州·期末)已知一组数据的散点图如下:
(1)根据散点图计算,的相关系数,并据此判断是否可用线性回归模型拟合与的关系?(若,则线性相关程度很高,可用线性回归模型拟合)
(2)若可用线性回归模型拟合与的关系,请建立关于的线性回归方程,并预测时的值.
附:相关公式及参考数据:,.
回归方程中,,.
【答案】(1)0.897,可用线性回归模型拟合与的关系
(2),38
【分析】(1)根据相关公式计算相关系数判定即可;
(2)根据相关公式计算,可得回归方程,代入即可预测结果.
【详解】(1),,
因为,,,
所以,
所以可用线性回归模型拟合与的关系.
(2)因为,,,
所以,所以关于的线性回归方程为.
将代入线性回归方程可得,.
17、(22-23高二下·江苏宿迁·期末)据文化和旅游部数据中心测算,2023年“五一”假期,全国国内旅游出游合计2.74亿人次,同比增长.为迎接暑期旅游高峰的到来,某旅游公司对今年年初推出一项新的旅游产品1~5月份的营业收入(万元)进行统计,统计数据如表所示:
月份x
1
2
3
4
5
月收入y(万元)
94
98
105
115
123
(1)依据表中给出的数据,建立该项旅游产品月收入y万元关于月份x的线性回归方程,并预测该项旅游产品今年7月份的营业收入是多少万元?
(2)观察表中数据可以看出该产品很受游客欢迎,为了进一步了解喜爱该旅游产品是否与性别有关,工作人员随机调查了100名游客,被调查的女性游客人数占,其中喜爱的人数为25人,调查到的男性游客中喜爱的人数占.
①根据调查情况填写列联表;
②根据列联表中数据能否有的把握认为“游客喜爱该旅游产品与性别有关”?
喜爱
不喜爱
总计
女性人数
男性人数
总计
参考公式及数据: .
,其中.
0.10
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1),137万元
(2)①表格见解析;②没有
【分析】(1)根据公式求出y关于x的线性回归方程,再代入x值求出y.
(2)根据男女以及喜欢的比例列表,再由公式解出,得出结论.
【详解】(1)设y关于x的线性回归方程,易求得,,
,
则,
, 所以,
当x=7时,y=137,
所以y关于x的线性回归方程为,
预测该项旅游产品今年7月份的营业收入是137万元.
(2)①调查情况2×2列联表为:
喜爱
不喜爱
总计
女性人数
25
15
40
男性人数
45
15
60
总计
70
30
100
②提出假设:喜爱该旅游产品与性别没有关系,
根据表中数据可以求得
因此根据表中数据没有把握认为“喜爱该旅游产品与性别有关”.
18、(22-23高二下·江苏苏州·期末)已知某校高一有450名学生(其中男生250名,女生200名).为了给学生提供更为丰富的校园文化生活,学校增设了两门全新的校本课程A,B,学生根据自己的兴趣爱好在这两门课程中任选一门进行学习.学校统计了学生的选课情况,得到如下的列联表.
选择课程A
选择课程B
总计
男生
150
女生
50
总计
(1)请将列联表补充完整,并判断是否有的把握认为选择课程与性别有关?说明你的理由;
(2)从所有男生中按列联表中的选课情况进行分层抽样,抽出10名男生,再从这10名男生中抽取3人做问卷调查,设这3人中选择课程A的人数为X,求X的分布列及数学期望.
附:,.
0.01
0.005
0.001
6.635
7.879
10.828
【答案】(1)列联表见解析,有的把握认为选择课程与性别有关;
(2)分布列见解析,
【分析】(1)根据男生和女生人数,结合表中数据,将列联表补充完整,利用公式求得,与临界值比较,即可得到结论;
(2)按分层抽样计算抽取10名男生中选择课程A的人数,列出X的所有可能取值,求出相应的概率,即可求X的分布列和数学期望.
【详解】(1)由男生250名,女生200名,结合表中数据,列联表如图所示,
选择课程A
选择课程B
总计
男生
100
150
250
女生
50
150
200
总计
150
300
450
,
所以有的把握认为选择课程与性别有关.
(2)按分层抽样计算抽取10名男生中,选择课程A的人数为,
则X的所有可能取值为0,1,2,3,
,,
,,
则X的分布列为
X
0
1
2
3
P
.
19、(22-23高二下·江苏泰州·期末)某软件科技公司近8年的年利润y与投入的年研发经费x(单位:千万元)如下表所示.
x
3
4
5
6
6
7
8
9
y
(1)根据散点图可以认为x与y之间存在线性相关关系,且相关系数,请用最小二乘法求出线性回归方程(,用分数表示);
(2)某配件加工厂加工的单个零件尺寸与标准件尺寸的误差,其中c为单个零件的加工成本(单位:元),且.引进该公司最新研发的某工业软件后,加工的单个零件尺寸与标准件尺寸的误差.若保持零件加工质量不变(即误差的概率分布不变),则单个零件加工的成本下降了多少元?
附:(1)参考数据:,.
(2)参考公式:,,.
(3)若随机变量服从正态分布,则,.
【答案】(1)
(2)8元
【分析】(1)由,可求出,然后求出,然后利用相关系数求出可求出,再由求出,从而可求出线性回归方程;
(2)未引进新的工业软件前,由,得,,再由可得,从而可求出,同理引进新的工业软件后,可求出其对应的,从而可进行判断.
【详解】(1)由,得,
即,由,得(负舍).
因为,
所以,
所以,
所以,所以,所以,
所以,y关于x的线性回归方程为.
(2)未引进新的工业软件前,,所以,
又,即,
所以,所以(元).
引进新的工业软件后,,所以,,
若保持零件加工质量不变,则,所以(元),
因为(元),
所以单个零件加工的成本下降了8元.
学科网(北京)股份有限公司
$$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。