专题08 成对数据的统计分析9大题型(期末复习专项训练)高二数学下学期沪教版
2026-05-26
|
2份
|
54页
|
105人阅读
|
5人下载
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学沪教版选择性必修第二册 |
| 年级 | 高二 |
| 章节 | 第8章 成对数据的统计分析 |
| 类型 | 题集-专项训练 |
| 知识点 | 统计案例 |
| 使用场景 | 同步教学-期末 |
| 学年 | 2026-2027 |
| 地区(省份) | 上海市 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 2.13 MB |
| 发布时间 | 2026-05-26 |
| 更新时间 | 2026-05-26 |
| 作者 | 小尧老师 |
| 品牌系列 | 上好课·考点大串讲 |
| 审核时间 | 2026-05-26 |
| 下载链接 | https://m.zxxk.com/soft/58059028.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
**基本信息**
聚焦成对数据统计分析全流程,以题型为载体构建“数据可视化-相关性判断-回归分析-独立性检验”完整知识链,渗透数据意识与模型观念。
**专项设计**
|模块|题量/典例|题型特征|知识逻辑|
|----|-----------|----------|----------|
|散点图判断线性相关|3题|图形识别与模型选择|从数据直观到定量分析基础|
|相关系数意义及辨析|9题|概念理解与性质应用|连接定性判断与定量刻画|
|正/负相关判断|3题|趋势分析与关系描述|相关性方向的直观识别|
|回归方程估计与求解|9题|方程应用与参数计算|从数据规律到预测模型构建|
|卡方计算与独立性检验|11题|公式应用与实际推断|分类变量关系的统计推断|
内容正文:
专题08 成对数据的统计分析
题型1 根据散点图判断是否线性相关(重点)
题型6 根据回归方程求原数据中的值
题型2 相关系数的意义及辨析
题型7 求回归直线方程(常考点)
题型3 判断正、负相关(重点)
题型8 卡方的计算
题型4相关系数的意义及辨析
题型9 独立性检验解决实际问题(难点)
题型5 用回归直线方程对总体进行估计(常考点)
题型一、根据散点图判断是否线性相关(共3小题)
1.(2024高二下·上海·专题练习)如图给出了某种豆类生长枝数y(枝)与时间t(月)的散点图,那么此种豆类生长枝数与时间的关系用下列函数模型近似刻画最好的是( )
A. B. C. D.
【答案】D
【知识点】根据散点图判断是否线性相关
【分析】根据散点图确定正确答案.
【详解】从所给的散点图可以看出图象大约过和,
把这两个点代入所给的四个解析式发现只有最合适,
另外,根据图象可知,图象呈指数增长的形式,也可在最合适.
故选:D.
2.(24-25高二下·上海徐汇·阶段检测)下列关于散点图的说法中,正确的是( )
A.任意给定统计数据,都可以绘制散点图 B.从散点图中可以看出两个量是否具有一定的关系
C.从散点图中可以看出两个量的因果关系 D.从散点图中无法看出数据的分布情况
【答案】B
【知识点】根据散点图判断是否线性相关
【分析】根据散点图的概念判断即可.
【详解】散点图不适合用于展示百分比占比的数据,另外数据量较少的数据也不适合用散点图表示,故A错误;
散点图能看出两个量是否具有一定关系,但是并一定是因果关系,故B正确,C错误;
散点图中能看出数据的分布情况,故D错误.
故选:B
3.(24-25高二下·上海黄埔·月考)经观测,某种昆虫的产卵数y与温度x有关,现将收集到的温度和产卵数()的10组观测数据作了初步处理,得到如下图的散点图及一些统计量表.
275
731.1
21.7
150
2368.36
30
表中,.
(1)根据散点图判断,,与哪一个适宜作为y与x之间的回归方程模型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,试求y关于x的回归方程.
【答案】(1)
(2)
【知识点】根据散点图判断是否线性相关、非线性回归
【分析】(1)根据散点图判断,看出样本点分布在一条指数函数的周围,结合给定的回归方程模型的特征即可判断;
(2)对变换得:,变换后得样本点分布在一条直线附近,即可用线性回归方程来拟合,即可求出关于回归方程.
【详解】(1)适宜作为y与x之间的回归方程模型;
理由如下:
回归方程模型适用于散点图呈直线型;
回归方程模型适用于散点图上升,且上升趋势越来越慢;
回归方程模型适用于散点图上升,且上升趋势越来越快,呈指数型变化;
根据散点图判断,看出样本点分布在一条指数函数的周围,所以适宜作为y与x之间的回归方程模型.
(2)令,则,
由表中数据可得,;
,∴;
∴y关于x的回归方程为.
题型二、相关系数的意义及辨析(共3小题)
4.(24-25高二下·上海长宁·月考)对两组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
【答案】D
【知识点】判断正、负相关、相关系数的意义及辨析
【分析】根据散点图及相关系数的概念判断即可.
【详解】由散点图可知,图(1)中两个变量成正相关,且散点图近似在一条直线上,所以且;
图(2)中两个变量成负相关,且散点图比较分散,所以且;
所以.
故选:D
5.(24-25高二下·上海黄浦·期末)如果两种证券在一段时间内收益数据的相关系数为0.8,那么表明( )
A.两种证券的收益有反向变动的倾向
B.两种证券的收益有同向变动的倾向
C.两种证券的收益之间存在完全反向的联动关系,即涨或跌是相反的
D.两种证券的收益之间存在完全同向的联动关系,即同时涨或同时跌
【答案】B
【知识点】相关系数的意义及辨析
【分析】根据正相关的定义可得出结论.
【详解】因为两种证券在一段时间内收益数据的相关系数为,所以两种证券是正相关,
那么表明两种证券的收益有同向变动的倾向,B正确,ACD错误.
故选:B.
6.(25-26高二下·上海·期中)下列说法正确的是( ).
A.如果随机事件与可以同时发生,则事件与不独立
B.若成对样本数据的线性相关程度越强,则样本相关系数越接近1
C.若随机变量满足,则
D.对于随机事件与,若,,则事件与相互独立
【答案】D
【知识点】相关系数的意义及辨析、独立事件的判断、独立事件的乘法公式、方差的性质
【详解】事件与是否独立,取决于是否满足,而与它们是否可以同时发生没有必然联系,
例如,投掷一枚均匀硬币两次,设事件为“第一次出现正面”,事件为“第二次出现正面”,
与可以同时发生(两次都正面),但与相互独立,因此,可以同时发生的事件也可能独立,所以选项错误;
若成对样本数据的线性相关程度越强,则样本相关系数的绝对值越接近,所以B错误;
若,则,所以若,则,所以C错误;
因为,所以,,所以,所以事件与相互独立,所以D正确.
题型三、判断正、负相关(共3小题)
7.(25-26高二下·上海·期中)某校随机抽取50名学生的身高与体重的散点图如下所示,则下列说法错误的是( )
A.身高越高,体重越重;
B.身高与体重同向变动的倾向;
C.身高与体重之间有明显的相关性;
D.身高与体重成正相关
【答案】A
【知识点】判断两个变量是否有相关关系、判断正、负相关、根据散点图判断是否线性相关
【详解】对于A,由于身高比较高的人,其体重可能大,也可能小,则选项A不正确;
对于B,由散点图知,身高增加时,体重也呈现增加的趋势,有同向变动的倾向,B正确;
对于C,身高和体重有明显的相关性,C正确;
对于D,身高增加时,体重也呈现增加的趋势,所以身高与体重呈正相关,D正确.
8.(25-26高二下·上海杨浦·期末)对变量、有观测数据,得散点图1;对变量、有观测数据,得散点图2.分别用、表示变量与、与之间的线性相关系数,则下列说法正确的是( ).
A.变量与呈现正相关,且
B.变量与呈现负相关,且
C.变量与呈现正相关,且
D.变量与呈现负相关,且
【答案】D
【知识点】判断正、负相关、根据散点图判断是否线性相关
【分析】根据散点图的分布的趋势和集中程度可得正确的选项.
【详解】对于图1,散点总体斜向上分布,故变量与呈现正相关,故排除B;
对于图2,散点总体斜向上分布,故变量与呈现负相关,故排除C;
图1中散点图分布较为集中,图2中的散点图分布较为分散,故,
故选:D.
9.(24-25高二下·上海虹口·期末)上海百联集团对旗下若干门店的营业额与三个影响因素分别作了相关性分析,绘制了如下的散点图,则下述大小关系正确的为( ).
A. B. C. D.
【答案】C
【知识点】判断正、负相关、根据散点图判断是否线性相关、相关系数的意义及辨析
【分析】根据散点图判断两变量的线性相关性,再根据线性相关性与相关系数的关系判断即可.
【详解】由散点图可知,图一两个变量成正相关,且线性相关性较强,故,
图二、图三两个变量都成负相关,且图二的线性相关性更强,
故,,,故,所以.
故选:C.
题型四、相关系数的意义及辨析(共6小题)
10.(24-25高二下·上海浦东新·期末)通过随机抽样,收集了若干朵鸢尾花的花萼长度和花瓣长度(单位:cm),绘制散点图如图所示,计算得样本相关系数为,利用最小二乘法求得相应的回归方程为,根据以上信息,下列命题正确的是( )
A.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值为5.8612cm
B.若从样本中抽取一部分,则这部分的相关系数一定是0.8642
C.花瓣长度和花萼长度负相关
D.花瓣长度和花萼长度存在一次函数关系
【答案】A
【知识点】相关关系与函数关系的概念及辨析、判断正、负相关、相关系数的意义及辨析、根据回归方程进行数据估计
【分析】根据散点图的特点及回归方程可判断ACD选项,根据相关系数的定义可以判断B选项.
【详解】当时,,故A正确,
部分数据的相关系数未必和总体相同,故B错误;
从散点图可以看出花瓣长度和花萼长度正相关,故C错误;
花瓣长度和花萼长度之间不存在函数关系,为相关关系,只是用一次函数近似拟合它们的关系,
故D错误.
故选:A.
11.(24-25高二下·上海·期末)下列关于统计概率知识的判断,则下列结论正确的是( )
①若样本数据,,…,的方差为4,则数据,,…,的标准差为4;
②在研究成对数据的相关关系时,相关关系越强,相关系数越接近于1;
③若事件,满足,则事件与事件相互独立;
④某医院住院的位新冠患者的潜伏天数分别为,则该样本数据的第百分位数为.
A.只有一个正确 B.只有两个正确
C.只有一个错误 D.四个题是错误的
【答案】B
【知识点】相关系数的意义及辨析、计算条件概率、独立事件的判断、总体百分位数的估计
【分析】利用方差的运算性质得①正确,利用相关系数的性质得②错误,利用条件概率公式和相互独立事件的判断方法可得③错误,利用百分位数的求法可得④错误,即可求解.
【详解】对于命题①,因为样本数据,,…,的方差为4,则数据,,…,的方差为,
标准差为,所以命题①正确,
对于命题②,相关关系越强,相关系数越接近于1,所以命题②错误,
对于命题③,因为,得到,
则事件与事件相互独立,所以命题③正确,
对于命题④,将数据从小排到大得到,
又,所以该样本数据的第百分位数为,故命题④错误,
故选:B.
12.(24-25高二下·上海浦东新·期末)某兴趣小组研究光照时长和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,如下表所示.若去掉最后一组数据后,下列说法正确的是( )
光照时长
1
2
3
8
10
种子发芽数量y(颗)
4
6
5
11
2
A.相关系数r的绝对值变小 B.相关变量具有负相关关系
C.拟合误差变大 D.解释变量与响应变量的相关性变强
【答案】D
【知识点】相关系数的意义及辨析、残差的计算
【分析】观察图象,较其他的点偏离回归直线最大,去掉后,回归效果更好,结合相关系数、正负相关性、残差平方和以及相关性逐项分析判断.
【详解】观察图象知:较其他的点偏离回归直线最大,因此去掉后,回归效果更好,
对于A,相关系数越接近于1,线性相关性越强,
因此去掉后,相关系数的绝对值变大,A错误;
对于B,由表格数据可知越大,越大,所以相关变量具有正相关关系,B错误;
对于C,因为残差平方和越大,拟合效果越差,因此去掉后,残差平方和变小,拟合误差变小,C错误;
对于D,由选项A知,去掉后,相关系数的绝对值变大,
因此解释变量与响应变量的相关性变强,D正确.
故选:D
13.(2024·上海·高考真题)已知气候温度和海水表层温度相关,且相关系数为正数,对此描述正确的是( )
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度呈下降趋势
【答案】C
【知识点】相关系数的意义及辨析
【分析】根据相关系数的性质可得正确的选项.
【详解】对于AB,当气候温度高,海水表层温度变高变低不确定,故AB错误.
对于CD,因为相关系数为正,故随着气候温度由低到高时,海水表层温度呈上升趋势,
故C正确,D错误.
故选:C.
14.(24-25高二下·上海浦东新·期末)已知线性相关系数r是描述成对数据线性相关程度的统计量,也称为皮尔逊相关系数;一元线性回归分析是基于拟合误差Q取最小值的假设进行的,最终可得回归方程(回归直线).现有5个数据点,小明对它们进行了一元线性回归分析,得到线性相关系数和回归方程,随后发现自己漏掉了一个数据点且恰好.重新计算6个数据点得到线性相关系数和回归方程,对于下面两个说法:
①一定小于 ②与一定重合
则( )
A.①正确②错误 B.①正确②正确 C.①错误②正确 D.①错误②错误
【答案】C
【知识点】解释回归直线方程的意义、相关系数的意义及辨析
【分析】根据相关系数的定义,以及得到回归直线方程的过程,即可判断选项.
【详解】当增加一个与回归直线完全拟合的数据点后,这个点没有产生新的拟合误差,整体数据点与回归直线的拟合程度变得更好,所以,不一定,故①错误;
回归方程是基于5个数据点通过最小二乘法(使拟合误差取最小值)得到的,当加入新的数据点,因为它在回归直线上,它不会改变原来使取得最小的直线的位置,所以与一定重合,故②正确.
故选:C
15.(24-25高二下·上海·月考)某芯片研究团队为制定下一年的研发投入计划,需要了解年研发资金投入量x(单位:亿元)对年销售额(单位:亿元)的影响,结合近12年的年研发资金投入量和年销售额的数据,该团队建立了两个模型:①;②,其中,,,均为常数,为自然对数的底数.经对历史数据的初步处理,得到右侧散点图,如图.令,,计算得如下数据:
20
66
770
200
14
460
4.20
3125000
0.308
21500
(1)设和的相关系数为,和的相关系数为,请从相关系数的角度,选择一个拟合程度更好的模型:
(2)(i)根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);
(ii)若下一年销售额y需达到80亿元,预测下一年的研发资金投入量x是多少亿元?(结果精确到0.01)
附:对于一组数据,样本相关系数
回归直线的斜率和截距的最小二乘估计分别为:
,.
【答案】(1)模型②;
(2)(i)(ⅱ)27.1亿元
【知识点】求回归直线方程、非线性回归、相关系数的意义及辨析、相关系数的计算
【分析】(1)计算相关系数,根据相关系数的绝对值大小得出结论;
(2)(i)两边取自然对数,转化为线性回归方程求解,再转化为指数式即可;
(ii)根据(i)的结论预测销售额y达到80亿元时研发投入即可得解.
【详解】(1)由题意表格数据得,
同理,
∵0.86<0.91,即,
则从相关系数的角度,选择模型②的拟合程度会更好.
(2)(i)由(1)得,模型②,可建立关于x的线性回归方程,
则,又,
∴,∴,
∴,即.
(ii)由(i)得,
要使下一年销售额达到80亿元,即,,
∴,解得,
故下一年销售额达到80亿元,预测下一年的研发资金投入量是27.1亿元.
题型五、用回归直线方程对总体进行估计(共3小题)
16.(24-25高二下·上海长宁·期末)某单位为了解用电量y度与气温x℃之间的关系,随机统计了某4天的用电量与气温.由表中数据所得回归直线方程为,据此预测当气温为5℃时,用电量的度数约为______度.
气温(℃)
14
12
8
6
用电量(度)
22
26
34
38
【答案】40
【知识点】用回归直线方程对总体进行估计、计算样本的中心点、根据回归方程进行数据估计、根据样本中心点求参数
【分析】先求解,代入方程求得,然后可得气温为时用电量的度数.
【详解】,
,
所以,所以当时,.
故答案为:40.
17.(24-25高二下·上海·期中)某公司为了解用电量(单位:)与气温(单位:)之间的关系,随机统计了天的用电量与当天气温,并制作了如下对照表:
气温
用电量
由表中数据可得回归方程中.试预测当气温为时,用电量约为 __.
【答案】
【知识点】用回归直线方程对总体进行估计、根据样本中心点求参数
【分析】根据样本中心在回归直线上可得回归直线方程,进而可得估计值.
【详解】,,
样本点的中心为,
代入,
,
则线性回归方程为,
取,得,
故答案为:.
18.(24-25高二下·上海·期中)《中华人民共和国道路交通安全法》第条的相关规定:机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让斑马线”,其中第条规定:对不礼让行人的驾驶员处以扣分,罚款元的处罚.下表是某市一主干路口监控设备所抓拍的个月内驾驶员不“礼让斑马线”行为统计数据:
月份
违章驾驶员人数
参考公式:,
(1)请利用所给数据求违章人数与月份之间的回归直线方程;
(2)预测该路口月份的不“礼让斑马线”违章驾驶员人数.
【答案】(1)
(2)人
【知识点】用回归直线方程对总体进行估计、求回归直线方程
【分析】(1)求出、的值,将表格中的数据代入最小二乘法公式,求出、的值,可得出回归直线方程;
(2)将代入回归直线方程,即可得解.
【详解】(1)解:由表格中的数据可得,
,
所以,,
,
所以,,,
所以,违章人数与月份之间的回归直线方程为.
(2)解:当时,,
因此,预测该路口月份的不“礼让斑马线”违章驾驶员人数为人.
题型六、根据回归方程求原数据中的值(共3小题)
19.(24-25高二下·上海·期末)一车间为规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验,测得的数据如下,根据表格可得回归方程,则实数的值为__________.
零件数x(个)
2
3
4
5
加工时间y(分钟)
30
a
40
50
【答案】36
【知识点】根据回归方程求原数据中的值
【分析】根据回归方程经过样本中心点,代入即可求得的值.
【详解】根据表中数据可知,,
因为回归方程经过样本中心点,
代入回归直线方程可得,解得,
故答案为:36.
20.(24-25高二下·上海闵行·期末)下表提供了某工厂节能降耗技术改造后,一种产品的产量(单位:吨)与相应的生产能耗(单位:吨)的几组对应数据:
3
4
5
6
2.5
t
4
4.5
根据上表提供的数据,求得关于的线性回归方程为,那么表格中的值为______.
【答案】3
【知识点】根据回归方程求原数据中的值、根据样本中心点求参数
【分析】先求出,然后根据回归直线过样本中心点,将其代入回归方程可求出t的值.
【详解】.
因为回归直线过样本中心点,
所以,解得.
故答案为:
21.(24-25高二下·上海·期末)某游乐园的活动项目共有三类,分别是“过山车”等10个体验类项目、“海豚之舞”等4个表演类项目、“智力闯关”等3个互动类项目.因设备维护需要,项目并非每日都全部开放.以下数据是项目开放的数量(个)和游客平均等待时间(分钟/个)的关系:
项目类别
体验类
演出类
互动类
开放数量(个)
4
5
6
7
8
2
4
2
3
平均等待时间(分钟/个)
76
73
67
60
53
30
46
30
(1)体验类项目中,若关于的回归方程为,请计算的值,并依据该模型预测所有体验类项目均开放时的平均等待时间(精确到整数);
(2)小王游玩当日,体验类、演出类、互动类项目分别开放了8个、4个、3个,他计划随机游玩其中的3个项目,已知他选择的项目中至少包含1个互动类项目,求他的等待总时间恰为120分钟的概率;
(3)为提高游客的参与度,园方在互动类项目“智力闯关”中设计了两关.通过第一关的游客奖励20个游园币,游客可以选择结束或继续闯关.若继续闯关,则必须完成第二关的所有题目.第二关包含2道相互独立的选择题,每答对1题可再奖励20个游园币,每答错1题则要扣除10个游园币.每个游园币可兑换园区内任意一个项目的1分钟等待时间.小王已通过第一关,假设他在第二关中每道题答对的概率均为,为了获得更多项目等待时间的兑换奖励,小王是否应该继续闯关?请你帮他做出决策.
【答案】(1),51分钟;
(2);
(3)答案见解析.
【知识点】根据回归方程求原数据中的值、计算条件概率、求离散型随机变量的均值、根据回归方程进行数据估计
【分析】(1)根据表中数据分别求出,代入回归方程即可求出,将代入回归方程可求出平均等待时间;
(2)利用条件概率公式,结合分步计数乘法原理和分类计数加法原理以及组合数,计算即可求得概率;
(3)通过计算得到小王参加第二关获得的游园币数的期望,根据每道题答对的概率的取值分类讨论,做出相关决策.
【详解】(1),
代入回归方程,得,解得.
当时,,即开放所有体验类项目时的平均等待时间约为51分钟.
(2)记事件“等待总时间恰为120分钟”,事件“选择的3个项目中至少包含1个互动类项目”,
因为全部的项目数为15个,其中互动类项目有3个,则事件共包含了种;
在事件的条件下,等待总时间恰为120分钟,此时的可能情况有:
①一个互动类项目,一个体验类项目,一个演出类项目,此时共有种情况;
②两个互动类项目,一个体验类项目,此时共有种情况.
由条件概率公式得.
(3)设小王参加第二关获得的游园币数为随机变量,则所有可能取值为,
则
所以.
所以,当时,,不建议小王继续闯关;
当时,,小王可根据自己的情况随机选择;
当时,,建议小王继续闯关.
题型七、求回归直线方程(共3小题)
22.(25-26高二下·上海·期中)已知变量和之间的一组相关数据如下表所示,设变量和满足回归方程,则下列说法错误的是( )
5
6
9
12
8
7
5
2.4
A. B.
C.变量和具有很强的线性相关性 D.该回归直线过点
【答案】D
【知识点】求回归直线方程、相关系数的意义及辨析、计算样本的中心点、根据样本中心点求参数
【详解】样本均值:,;
回归系数:,其中;;;;
;;;
.
分子和为:;分母和为.所以.
回归系数:.
回归直线方程为:.
相关系数:,
选项A:,正确;
选项B:,正确;
选项C:,接近1,具有很强的线性相关性,正确;
选项D:回归直线必过点,不过点,错误.
23.(24-25高二下·上海·期末)为了研究关于的线性相关关系,收集了5组样本数据(见下表).若已求得一元线性回归方程,则下列选项中正确的是( )
1
2
3
4
5
0.5
0.9
1
1.1
1.5
A. B.与的样本是负相关
C.当时,的预估值为2.2 D.去掉样本点后,与的样本相关系数不会改变
【答案】D
【知识点】求回归直线方程、相关系数的意义及辨析、根据样本中心点求参数
【分析】由表格数据求出样本点的中心坐标,代入可得的值由此即可判断A;由的正负即可判断B;.根据回归方程代入计算即可判断C,由相关系数公式即可判断D.
【详解】,所以样本点的中心坐标为,
将它代入得,解得,故A错误;
因为,所以与的样本是正相关,故B错误;
当时,的预估值为,故C错误;
由相关系数公式可知,去掉样本点后,与的样本相关系数不会改变,故D正确.
故选:D.
24.(24-25高二下·上海浦东新·期末)由表格数据得到的线性回归方程为,则此回归方程在样本点处的离差是_______
x
3
4
5
6
y
2.5
4
4.5
【答案】/
【知识点】求回归直线方程、残差的计算
【分析】先计算出样本的中心点坐标,将其代入中可求得m的值,再结合离差的定义求解即可.
【详解】因为,,且线性回归方程恒过,
所以,解得,
将代入回归方程得,
所以此回归方程在样本点处的离差是.
故答案为:
题型八、卡方的计算(共7小题)
25.(24-25高二下·上海松江·月考)某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生至少有________人.
参考数据:,
【答案】45
【知识点】卡方的计算、独立性检验解决实际问题
【分析】设被调查的男女生为人,写出列联表,应用卡方公式求卡方值,结合求参数范围,进而确定被调查的男生为,即可答案.
【详解】设被调查的男女生为人,则男生喜欢抖音有人,女生喜欢抖音有人,
所以列联表如下:
喜欢抖音
不喜欢抖音
总计
男生
女生
总计
则,解得,
因此被调查的男生为,又,则人数是5的正整数倍,
所以大于等于45的5的整数倍都符合题意,调查人数中男生至少有人.
故答案为:
26.(24-25高二下·上海·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有________人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
参考公式:,其中.
【答案】
【知识点】卡方的计算、独立性检验解决实际问题
【分析】设男生人数为,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论.
【详解】因为抽取个学生,女生人数是男生人数的,
所以抽取个男生,个女生,为了便于计算,我们令,
设男生人数为,依题意可得列联表如下:
喜欢追星
不喜欢追星
总计
男生
女生
总计
根据小概率值的独立性检验,判断中学生追星与性别有关,
则,由,解得,
由题知应为6的整数倍,
而根据小概率值的独立性检验,判断中学生追星与性别有关,
则男生至少有30人,
故答案为:30.
27.(24-25高二下·上海·期末)某学生兴趣小组从一年365天中随机调查了100天中每天的空气质量等级和当天到莘庄公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次空气质量等级
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)一年365天中到莘庄公园锻炼的人次大于400人的约有多少天(精确到1天);
(2)估计一天中到莘庄公园锻炼的平均人次;
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.判断是否有95%的把握认为一天中到莘庄公园锻炼的人次不超过400人与当天的空气质量有关?()
【答案】(1)天
(2)天
(3)有把握,理由见解析
【知识点】抽样比、样本总量、各层总数、总体容量的计算、计算几个数的平均数、完善列联表、独立性检验解决实际问题
【分析】(1)算出天中到莘庄公园锻炼的人次大于400人的天数后可求365天中到莘庄公园锻炼的人次大于400人的天数;
(2)写出各锻炼人次区间对应的频数,利用中间值作代表,利用公式求解即可;
(3)先根据题目中给的数据补充列联表,利用公式求出,再与临界值比较即可.
【详解】(1)由题设可得天中到莘庄公园锻炼的人次大于400人的约有天,
故天中到莘庄公园锻炼的人次大于400人的约有天.
(2)锻炼人次为的有天,
锻炼人次为的有天,
锻炼人次为有天,
利用中间值作代表,一天中到该莘庄公园锻炼的平均人次的估计值为:
.
(3)根据所给数据,可得列联表:
人次≤400
人次>400
合计
空气质量好
33
37
70
空气质量不好
22
8
30
合计
55
45
100
设一天中到该公园锻炼的人次与该市当天的空气质量无关,
根据列联表得,
因为,,由小概率事件原理否定,
故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
28.(24-25高二下·上海奉贤·期末)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到下表(单位:人)
经常网购
偶尔或不用网购
合计
男性
50
100
女性
70
100
合计
(1)完成上表,并根据以上数据判断是否有99%的把握认为我市市民网购与性别有关?
(2)现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;
参考公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)表格见解析;有
(2)
【知识点】完善列联表、卡方的计算、计算古典概型问题的概率
【分析】(1)完成列联表,由列联表,得,然后根据独立性检验判断即可;
(2)由题知抽取10人中,经常网购的有人,偶尔或不用网购的有人,由可计算选取的3人中至少有2人经常网购的概率.
【详解】(1)完成列联表:
经常网购
偶尔或不用网购
合计
男性
50
50
100
女性
70
30
100
合计
120
80
200
由列联表得,,
有99%的把握认为我市市民网购与性别有关.
(2)由题知女市民中利用分层抽样的方法抽取10人中,
经常网购的有人,偶尔或不用网购的有人,
选取的3人中至少有2人经常网购的概率,
所以所求概率为.
29.(25-26高二下·上海·阶段检测)为了研究高三学生每天整理数学错题的情况,某校数学建模兴趣小组的同学在本校高三年级学生中采用随机抽样的方法抽取了40名学生,调查他们平时的数学成绩和整理数学错题的情况,现统计得部分数据如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
不是每天都整理数学错题人数
15
20
合计
40
(1)完成上述样本数据的列联表,并计算:每天都整理数学错题且数学成绩总评优秀的经验概率;
(2)是否有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”?
(3)从不是每天都整理数学错题的学生中随机抽取3名学生做进一步访谈,设恰好抽取到数学成绩总评优秀的人数为,求的分布列和期望.
附:;
0.10
0.01
0.001
2.706
6.635
10.828
【答案】(1)列联表如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
6
20
不是每天都整理数学错题人数
5
15
20
合计
19
21
40
每天都整理数学错题且数学成绩总评优秀的经验概率为0.35.
(2)有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”.
(3)的分布列如下表:
0
1
2
3
期望为.
【知识点】完善列联表、卡方的计算、写出简单离散型随机变量分布列、求离散型随机变量的均值
【分析】(1)完善列联表,求出经验概率;
(2)求出的观测值,与临界值比对得解;
(3)求出的可能值及对应概率,列出分布列并求出期望.
【详解】(1)完善列联表如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
6
20
不是每天都整理数学错题人数
5
15
20
合计
19
21
40
每天都整理数学错题且成绩优秀的人数为14,总样本数为40,因此经验概率为.
(2)由(1)得 ,
所以有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”.
(3)不是每天都整理数学错题的学生有20人,其中数学成绩总评优秀人数为5,
的所有可能值为0,1,2,3,
,
,
所以的分布列如下表:
0
1
2
3
期望.
30.(25-26高二下·上海·期中)机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让行人”.
(1)现用线性回归模型拟合违章人次与月份之间的关系,设随波动的回归方程为,已知监测月份的均值,违章人次的均值,,求的值,并预测该路口7月份不“礼让行人”违规驾驶人次;
(2)交警从监测的5个月内通过该路口的驾驶员中随机抽查90人,调查驾驶员“礼让行人”行为与驾龄的关系,得到下面的列联表.
不礼让行人
礼让行人
驾龄不超过2年
①
16
驾龄2年以上
26
②
已知不“礼让行人”违规驾驶共计50人,请补充填写上面的2×2列联表(在答题纸上的相应位置填空),并判断能否认为“礼让行人”行为与驾龄有关?附:,.
【答案】(1),人次
(2)
不礼让行人
礼让行人
驾龄不超过2年
24
16
驾龄2年以上
26
24
不能认为“礼让行人”行为与驾龄有关
【知识点】卡方的计算、独立性检验解决实际问题、根据回归方程进行数据估计、根据样本中心点求参数
【分析】(1)代入样本中心点求出的值,进而得到线性回归方程并进行预测;(2)根据已知条件补全列联表后计算的观测值,并与临界值比较得出结论.
【详解】(1)由题意可得,线性回归方程必过样本中心点,
代入可得,,
所以线性回归方程.
当时,,
预测该路口7月份不“礼让行人”违规驾驶人次为人次.
(2)已知不“礼让行人”违规驾驶的共计50人次,所以①,
抽查总人数为人,所以“礼让行人”的总人数为人,
②.
补充完整列联表如下:
不礼让行人
礼让行人
驾龄不超过2年
24
16
驾龄2年以上
26
24
根据列联表数据,计算的观测值
,
因为,
所以不能认为“礼让行人”行为与驾龄有关.
31.(24-25高二下·上海·期末)某汽车生产企业对其生产的四款新能源汽车进行市场调研,从购买者中选取50名车主对车辆进行性能评分,每款车都有、、、、、5分五个等级,各评分的相应人数统计结果如下表所示.
性能评分汽车款式
基础版
基础版1
2
2
3
1
0
基础版2
4
4
5
3
1
豪华版
豪华版1
1
3
5
4
1
豪华版2
0
0
3
5
3
(1)约定当得分为或时,认为该款车型性能优秀,否则认为性能一般,根据上述样本数据,完成以下列联表,取显著性水平,能否认为汽车的性能与款式有关?说明理由.
汽车性能
汽车款式
合计
基础版
豪华版
一般
20
优秀
13
合计
(2)为进一步提升产品品质,现从样本评分为的6位基础版车主中,有放回地随机抽取2人征求意见,并做进一步打分.若基础版1的车主会打1分,而基础版2的车主会打4分,设随机变量为总得分,求的方差.
附:;,
,,.
【答案】(1)列联表见解析,汽车的性能与款式有关,理由见解析
(2)
【知识点】卡方的计算、独立性检验解决实际问题、写出简单离散型随机变量分布列、离散型随机变量的方差与标准差
【分析】(1)由题意根据数据关系写出列联表,再提出原假设,确定显著性水平,计算值,做出统计决断;
(2)用,分别表示在第次抽取中,企业获得的得分,则,故,再求的分布列,由方程公式求,再求,可得结论.
从而求解分布列和期望.
【详解】(1)由题意,列联表如下:
汽车性能
汽车款式
合计
基础版
豪华版
一般
20
12
32
优秀
5
13
18
合计
25
25
50
(1)提出原假设:两种款式的汽车的性能没有显著差异,
(2)确定显著性水平,
(3)计算,
(4)统计决断:由于,而,的值超过了所确定的界限,从而否定原假设,即认为汽车的性能与款式有关;
(2)评分为的位基础版车主中,基础版的车主有位,基础版的车主有位,
用,分别表示在第次抽取中,企业获得的得分,
则,且相互独立,则,
又随机变量的取值有,
,,
所以的分布列为,
所以,,
随机变量的取值有,
,,
所以的分布列为,
所以,,
所以
题型九、独立性检验解决实际问题(共4小题)
32.(24-25高二下·上海黄浦·期末)已知,.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到,则根据小概率值的独立性检验,分析喜欢该体育运动与性别________(选填“有关”或“无关”).
【答案】有关
【知识点】独立性检验的基本思想、独立性检验解决实际问题
【分析】根据题中所给数据,结合独立性检验的基本思想即可求解.
【详解】∵,∴根据小概率值的独立性检验,喜欢该体育运动与性别有关.
故答案为:有关.
33.(24-25高二下·上海松江·月考)某研究小组为了研究中学生的身体发育情况,在某学校随机抽取20名15至16周岁的男生,将他们的身高和体重制成的列联表,根据列联表的数据,至少有______的把握认为该学校15至16周岁的男生的身高与体重之间有关系.
身高
体重
超重
不超重
总计
偏高
4
1
5
不偏高
3
12
15
总计
7
13
20
附表:
0.1
0.05
0.01
2.706
3.841
6.635
【答案】95%
【知识点】独立性检验解决实际问题
【分析】先计算卡方,对照参考表即可求解.
【详解】由题意有,
所以至少有95%的把握认为该学校15至16周岁的男生的身高与体重之间有关系,
故答案为:95%.
34.(24-25高二下·上海·期末)盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某销售网点为了调查是否购买该款盲盒与性别的关系,得到如下列联表:
女生
男生
总计
购买
40
20
60
未购买
70
70
140
总计
110
90
200
则认为______(填有或没有)的把握认为改款盲盒与性别有关.()
【答案】有
【知识点】卡方的计算、独立性检验的基本思想、独立性检验解决实际问题
【分析】根据列联表数据和的计算公式求出即可根据小概率值的独立性检验得到结论.
【详解】零假设为改款盲盒与性别无关联.
由列联表数据计算得,
所以根据小概率值的独立性检验,推断不成立,故有的把握认为改款盲盒与性别有关.
故答案为:有.
35.(25-26高二下·上海·阶段检测)中国民间传统文化丰富多彩,涵盖了生活的方方面面,从节庆习俗、民间艺术、传统技艺到宗教信仰和民间文学等.某文化公司在某地开展中国民间传统文化宣传活动,活动期间调查了参加活动的市民对中国民间传统文化的了解程度,前5天调查情况数据如下:
宣传天数
1
2
3
4
5
不了解的人数
108
100
92
80
70
(1)若对中国民间传统文化不了解的人数与宣传天数之间满足线性回归关系,求变量关于变量的回归方程;
(2)从前5天的调查表中随机抽取100份调查表,整理得如下列联表:
性别
对中国民间传统文化了解的程度
合计
了解
不了解
老年
40
10
50
青年
30
20
50
合计
70
30
100
(i)依据显著性水平进行独立性检验,能否认为是否了解中国民间传统文化与年龄有关?
(ii)按分层随机抽样的方式,在上述“了解”的调查表中,随机抽取7份调查表,再从这7份调查表中任意抽取3份,记为抽到的调查表来自青年调查表的份数,求的分布及期望.
附:回归方程中斜率和截距的最小二乘法公式分别为,,
独立性检验常用小概率值和相应的临界值:,
0.05
0.01
0.005
3.841
6.635
7.879
【答案】(1);
(2)(i)是否了解中国民间传统文化与年龄有关;
(ii)
0
1
2
3
.
【知识点】求回归直线方程、独立性检验解决实际问题、写出简单离散型随机变量分布列、求离散型随机变量的均值
【分析】(1)结合题干和最小二乘法求解回归方程即可;
(2)(i)计算独立性检验的统计量,对比题干显著水平做出判断;
(ii)根据分层抽样确定来自青年调查表的份数,列举随机变量的可能取值,求解对应概率,进而列出分布列并求解期望.
【详解】(1)根据题干可知,
,,,
,
,
,
,
所以关于的回归方程为:
(2)(i)假设:是否了解中国民间传统文化与年龄无关;
由题知显著性水平:,即;
统计量:
,
因为,故拒绝原假设,即是否了解中国民间传统文化与年龄有关;
(ii)按分层抽样抽取老年调查表4份,青年调查表3份,
,
.
所以的分布列为:
0
1
2
3
期望:
36.(24-25高二下·上海·阶段检测)已知某区组建了一支人的志愿者队伍,并由其中人组成“志愿模范队”.经过一年的实践,全队共有人的周平均服务时长超过2小时,其中有人来自“志愿模范队”,如下表所示.
是“志愿模范队”成员
不是“志愿模范队”成员
总计
周平均服务时长超过2小时
周平均服务时长不超过2小时
总计
(1)已知一名志愿者是“志愿模范队”成员,求其周平均服务时长超过2小时的概率.
(2)请完成列联表,并根据表中数据回答:是否有的把握认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关系?
附录:,其中.
【答案】(1)
(2)答案见解析.
【知识点】完善列联表、独立性检验解决实际问题、计算古典概型问题的概率、计算条件概率
【分析】(1)根据等可能性事件的概率和条件概率公式直接可得.
(2)根据独立性检验直接可得.
【详解】(1)设事件表示志愿者是“志愿模范队”成员的事件,事件表示志愿者周平均服务时长超过2小时的事件.
由题可知,,,因为每个志愿者被抽到的可能性相等,
根据古典概型的概率公式得,,.
由条件概率公式可得,则.
故一名志愿者是“志愿模范队”成员的条件下其周平均服务时长超过2小时的概率为.
(2)由题可得如下列联表:
是“志愿模范队”成员
不是“志愿模范队”成员
总计
周平均服务时长超过2小时
周平均服务时长不超过2小时
总计
提出零假设:是否‘志愿模范队’成员”与“周平均服务时长超过2小时”无关,确定显著性水平.
可得,由于,拒绝零假设,
故有的把握认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关.
2 / 36
1 / 36
学科网(北京)股份有限公司
$
专题08 成对数据的统计分析
题型1 根据散点图判断是否线性相关(重点)
题型6 根据回归方程求原数据中的值
题型2 相关系数的意义及辨析
题型7 求回归直线方程(常考点)
题型3 判断正、负相关(重点)
题型8 卡方的计算
题型4相关系数的意义及辨析
题型9 独立性检验解决实际问题(难点)
题型5 用回归直线方程对总体进行估计(常考点)
题型一、根据散点图判断是否线性相关(共3小题)
1.(2024高二下·上海·专题练习)如图给出了某种豆类生长枝数y(枝)与时间t(月)的散点图,那么此种豆类生长枝数与时间的关系用下列函数模型近似刻画最好的是( )
A. B. C. D.
2.(24-25高二下·上海徐汇·阶段检测)下列关于散点图的说法中,正确的是( )
A.任意给定统计数据,都可以绘制散点图 B.从散点图中可以看出两个量是否具有一定的关系
C.从散点图中可以看出两个量的因果关系 D.从散点图中无法看出数据的分布情况
3.(24-25高二下·上海黄埔·月考)经观测,某种昆虫的产卵数y与温度x有关,现将收集到的温度和产卵数()的10组观测数据作了初步处理,得到如下图的散点图及一些统计量表.
275
731.1
21.7
150
2368.36
30
表中,.
(1)根据散点图判断,,与哪一个适宜作为y与x之间的回归方程模型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,试求y关于x的回归方程.
题型二、相关系数的意义及辨析(共3小题)
4.(24-25高二下·上海长宁·月考)对两组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
5.(24-25高二下·上海黄浦·期末)如果两种证券在一段时间内收益数据的相关系数为0.8,那么表明( )
A.两种证券的收益有反向变动的倾向
B.两种证券的收益有同向变动的倾向
C.两种证券的收益之间存在完全反向的联动关系,即涨或跌是相反的
D.两种证券的收益之间存在完全同向的联动关系,即同时涨或同时跌
6.(25-26高二下·上海·期中)下列说法正确的是( ).
A.如果随机事件与可以同时发生,则事件与不独立
B.若成对样本数据的线性相关程度越强,则样本相关系数越接近1
C.若随机变量满足,则
D.对于随机事件与,若,,则事件与相互独立
题型三、判断正、负相关(共3小题)
7.(25-26高二下·上海·期中)某校随机抽取50名学生的身高与体重的散点图如下所示,则下列说法错误的是( )
A.身高越高,体重越重;
B.身高与体重同向变动的倾向;
C.身高与体重之间有明显的相关性;
D.身高与体重成正相关
8.(25-26高二下·上海杨浦·期末)对变量、有观测数据,得散点图1;对变量、有观测数据,得散点图2.分别用、表示变量与、与之间的线性相关系数,则下列说法正确的是( ).
A.变量与呈现正相关,且
B.变量与呈现负相关,且
C.变量与呈现正相关,且
D.变量与呈现负相关,且
9.(24-25高二下·上海虹口·期末)上海百联集团对旗下若干门店的营业额与三个影响因素分别作了相关性分析,绘制了如下的散点图,则下述大小关系正确的为( ).
A. B. C. D.
题型四、相关系数的意义及辨析(共6小题)
10.(24-25高二下·上海浦东新·期末)通过随机抽样,收集了若干朵鸢尾花的花萼长度和花瓣长度(单位:cm),绘制散点图如图所示,计算得样本相关系数为,利用最小二乘法求得相应的回归方程为,根据以上信息,下列命题正确的是( )
A.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值为5.8612cm
B.若从样本中抽取一部分,则这部分的相关系数一定是0.8642
C.花瓣长度和花萼长度负相关
D.花瓣长度和花萼长度存在一次函数关系
11.(24-25高二下·上海·期末)下列关于统计概率知识的判断,则下列结论正确的是( )
①若样本数据,,…,的方差为4,则数据,,…,的标准差为4;
②在研究成对数据的相关关系时,相关关系越强,相关系数越接近于1;
③若事件,满足,则事件与事件相互独立;
④某医院住院的位新冠患者的潜伏天数分别为,则该样本数据的第百分位数为.
A.只有一个正确 B.只有两个正确
C.只有一个错误 D.四个题是错误的
12.(24-25高二下·上海浦东新·期末)某兴趣小组研究光照时长和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,如下表所示.若去掉最后一组数据后,下列说法正确的是( )
光照时长
1
2
3
8
10
种子发芽数量y(颗)
4
6
5
11
2
A.相关系数r的绝对值变小 B.相关变量具有负相关关系
C.拟合误差变大 D.解释变量与响应变量的相关性变强
13.(2024·上海·高考真题)已知气候温度和海水表层温度相关,且相关系数为正数,对此描述正确的是( )
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度呈下降趋势
14.(24-25高二下·上海浦东新·期末)已知线性相关系数r是描述成对数据线性相关程度的统计量,也称为皮尔逊相关系数;一元线性回归分析是基于拟合误差Q取最小值的假设进行的,最终可得回归方程(回归直线).现有5个数据点,小明对它们进行了一元线性回归分析,得到线性相关系数和回归方程,随后发现自己漏掉了一个数据点且恰好.重新计算6个数据点得到线性相关系数和回归方程,对于下面两个说法:
①一定小于 ②与一定重合
则( )
A.①正确②错误 B.①正确②正确 C.①错误②正确 D.①错误②错误
15.(24-25高二下·上海·月考)某芯片研究团队为制定下一年的研发投入计划,需要了解年研发资金投入量x(单位:亿元)对年销售额(单位:亿元)的影响,结合近12年的年研发资金投入量和年销售额的数据,该团队建立了两个模型:①;②,其中,,,均为常数,为自然对数的底数.经对历史数据的初步处理,得到右侧散点图,如图.令,,计算得如下数据:
20
66
770
200
14
460
4.20
3125000
0.308
21500
(1)设和的相关系数为,和的相关系数为,请从相关系数的角度,选择一个拟合程度更好的模型:
(2)(i)根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);
(ii)若下一年销售额y需达到80亿元,预测下一年的研发资金投入量x是多少亿元?(结果精确到0.01)
附:对于一组数据,样本相关系数
回归直线的斜率和截距的最小二乘估计分别为:
,.
题型五、用回归直线方程对总体进行估计(共3小题)
16.(24-25高二下·上海长宁·期末)某单位为了解用电量y度与气温x℃之间的关系,随机统计了某4天的用电量与气温.由表中数据所得回归直线方程为,据此预测当气温为5℃时,用电量的度数约为______度.
气温(℃)
14
12
8
6
用电量(度)
22
26
34
38
17.(24-25高二下·上海·期中)某公司为了解用电量(单位:)与气温(单位:)之间的关系,随机统计了天的用电量与当天气温,并制作了如下对照表:
气温
用电量
由表中数据可得回归方程中.试预测当气温为时,用电量约为_________.
18.(24-25高二下·上海·期中)《中华人民共和国道路交通安全法》第条的相关规定:机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让斑马线”,其中第条规定:对不礼让行人的驾驶员处以扣分,罚款元的处罚.下表是某市一主干路口监控设备所抓拍的个月内驾驶员不“礼让斑马线”行为统计数据:
月份
违章驾驶员人数
参考公式:,
(1)请利用所给数据求违章人数与月份之间的回归直线方程;
(2)预测该路口月份的不“礼让斑马线”违章驾驶员人数.
题型六、根据回归方程求原数据中的值(共3小题)
19.(24-25高二下·上海·期末)一车间为规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验,测得的数据如下,根据表格可得回归方程,则实数的值为__________.
零件数x(个)
2
3
4
5
加工时间y(分钟)
30
a
40
50
20.(24-25高二下·上海闵行·期末)下表提供了某工厂节能降耗技术改造后,一种产品的产量(单位:吨)与相应的生产能耗(单位:吨)的几组对应数据:
3
4
5
6
2.5
t
4
4.5
根据上表提供的数据,求得关于的线性回归方程为,那么表格中的值为______.
21.(24-25高二下·上海·期末)某游乐园的活动项目共有三类,分别是“过山车”等10个体验类项目、“海豚之舞”等4个表演类项目、“智力闯关”等3个互动类项目.因设备维护需要,项目并非每日都全部开放.以下数据是项目开放的数量(个)和游客平均等待时间(分钟/个)的关系:
项目类别
体验类
演出类
互动类
开放数量(个)
4
5
6
7
8
2
4
2
3
平均等待时间(分钟/个)
76
73
67
60
53
30
46
30
(1)体验类项目中,若关于的回归方程为,请计算的值,并依据该模型预测所有体验类项目均开放时的平均等待时间(精确到整数);
(2)小王游玩当日,体验类、演出类、互动类项目分别开放了8个、4个、3个,他计划随机游玩其中的3个项目,已知他选择的项目中至少包含1个互动类项目,求他的等待总时间恰为120分钟的概率;
(3)为提高游客的参与度,园方在互动类项目“智力闯关”中设计了两关.通过第一关的游客奖励20个游园币,游客可以选择结束或继续闯关.若继续闯关,则必须完成第二关的所有题目.第二关包含2道相互独立的选择题,每答对1题可再奖励20个游园币,每答错1题则要扣除10个游园币.每个游园币可兑换园区内任意一个项目的1分钟等待时间.小王已通过第一关,假设他在第二关中每道题答对的概率均为,为了获得更多项目等待时间的兑换奖励,小王是否应该继续闯关?请你帮他做出决策.
题型七、求回归直线方程(共3小题)
22.(25-26高二下·上海·期中)已知变量和之间的一组相关数据如下表所示,设变量和满足回归方程,则下列说法错误的是( )
5
6
9
12
8
7
5
2.4
A. B.
C.变量和具有很强的线性相关性 D.该回归直线过点
23.(24-25高二下·上海·期末)为了研究关于的线性相关关系,收集了5组样本数据(见下表).若已求得一元线性回归方程,则下列选项中正确的是( )
1
2
3
4
5
0.5
0.9
1
1.1
1.5
A. B.与的样本是负相关
C.当时,的预估值为2.2 D.去掉样本点后,与的样本相关系数不会改变
24.(24-25高二下·上海浦东新·期末)由表格数据得到的线性回归方程为,则此回归方程在样本点处的离差是_______
x
3
4
5
6
y
2.5
4
4.5
题型八、卡方的计算(共7小题)
25.(24-25高二下·上海松江·月考)某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生至少有________人.
参考数据:,
26.(24-25高二下·上海·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有________人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
参考公式:,其中.
27.(24-25高二下·上海·期末)某学生兴趣小组从一年365天中随机调查了100天中每天的空气质量等级和当天到莘庄公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次空气质量等级
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)一年365天中到莘庄公园锻炼的人次大于400人的约有多少天(精确到1天);
(2)估计一天中到莘庄公园锻炼的平均人次;
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.判断是否有95%的把握认为一天中到莘庄公园锻炼的人次不超过400人与当天的空气质量有关?()
28.(24-25高二下·上海奉贤·期末)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到下表(单位:人)
经常网购
偶尔或不用网购
合计
男性
50
100
女性
70
100
合计
(1)完成上表,并根据以上数据判断是否有99%的把握认为我市市民网购与性别有关?
(2)现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;
参考公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
29.(25-26高二下·上海·阶段检测)为了研究高三学生每天整理数学错题的情况,某校数学建模兴趣小组的同学在本校高三年级学生中采用随机抽样的方法抽取了40名学生,调查他们平时的数学成绩和整理数学错题的情况,现统计得部分数据如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
不是每天都整理数学错题人数
15
20
合计
40
(1)完成上述样本数据的列联表,并计算:每天都整理数学错题且数学成绩总评优秀的经验概率;
(2)是否有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”?
(3)从不是每天都整理数学错题的学生中随机抽取3名学生做进一步访谈,设恰好抽取到数学成绩总评优秀的人数为,求的分布列和期望.
附:;
0.10
0.01
0.001
2.706
6.635
10.828
30.(25-26高二下·上海·期中)机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让行人”.
(1)现用线性回归模型拟合违章人次与月份之间的关系,设随波动的回归方程为,已知监测月份的均值,违章人次的均值,,求的值,并预测该路口7月份不“礼让行人”违规驾驶人次;
(2)交警从监测的5个月内通过该路口的驾驶员中随机抽查90人,调查驾驶员“礼让行人”行为与驾龄的关系,得到下面的列联表.
不礼让行人
礼让行人
驾龄不超过2年
①
16
驾龄2年以上
26
②
已知不“礼让行人”违规驾驶共计50人,请补充填写上面的2×2列联表(在答题纸上的相应位置填空),并判断能否认为“礼让行人”行为与驾龄有关?附:,.
31.(24-25高二下·上海·期末)某汽车生产企业对其生产的四款新能源汽车进行市场调研,从购买者中选取50名车主对车辆进行性能评分,每款车都有、、、、、5分五个等级,各评分的相应人数统计结果如下表所示.
性能评分汽车款式
基础版
基础版1
2
2
3
1
0
基础版2
4
4
5
3
1
豪华版
豪华版1
1
3
5
4
1
豪华版2
0
0
3
5
3
(1)约定当得分为或时,认为该款车型性能优秀,否则认为性能一般,根据上述样本数据,完成以下列联表,取显著性水平,能否认为汽车的性能与款式有关?说明理由.
汽车性能
汽车款式
合计
基础版
豪华版
一般
20
优秀
13
合计
(2)为进一步提升产品品质,现从样本评分为的6位基础版车主中,有放回地随机抽取2人征求意见,并做进一步打分.若基础版1的车主会打1分,而基础版2的车主会打4分,设随机变量为总得分,求的方差.
附:;,
,,.
题型九、独立性检验解决实际问题(共4小题)
32.(24-25高二下·上海黄浦·期末)已知,.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到,则根据小概率值的独立性检验,分析喜欢该体育运动与性别________(选填“有关”或“无关”).
33.(24-25高二下·上海松江·月考)某研究小组为了研究中学生的身体发育情况,在某学校随机抽取20名15至16周岁的男生,将他们的身高和体重制成的列联表,根据列联表的数据,至少有______的把握认为该学校15至16周岁的男生的身高与体重之间有关系.
身高
体重
超重
不超重
总计
偏高
4
1
5
不偏高
3
12
15
总计
7
13
20
附表:
0.1
0.05
0.01
2.706
3.841
6.635
34.(24-25高二下·上海·期末)盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某销售网点为了调查是否购买该款盲盒与性别的关系,得到如下列联表:
女生
男生
总计
购买
40
20
60
未购买
70
70
140
总计
110
90
200
则认为______(填有或没有)的把握认为改款盲盒与性别有关.()
35.(25-26高二下·上海·阶段检测)中国民间传统文化丰富多彩,涵盖了生活的方方面面,从节庆习俗、民间艺术、传统技艺到宗教信仰和民间文学等.某文化公司在某地开展中国民间传统文化宣传活动,活动期间调查了参加活动的市民对中国民间传统文化的了解程度,前5天调查情况数据如下:
宣传天数
1
2
3
4
5
不了解的人数
108
100
92
80
70
(1)若对中国民间传统文化不了解的人数与宣传天数之间满足线性回归关系,求变量关于变量的回归方程;
(2)从前5天的调查表中随机抽取100份调查表,整理得如下列联表:
性别
对中国民间传统文化了解的程度
合计
了解
不了解
老年
40
10
50
青年
30
20
50
合计
70
30
100
(i)依据显著性水平进行独立性检验,能否认为是否了解中国民间传统文化与年龄有关?
(ii)按分层随机抽样的方式,在上述“了解”的调查表中,随机抽取7份调查表,再从这7份调查表中任意抽取3份,记为抽到的调查表来自青年调查表的份数,求的分布及期望.
附:回归方程中斜率和截距的最小二乘法公式分别为,,
独立性检验常用小概率值和相应的临界值:,
0.05
0.01
0.005
3.841
6.635
7.879
36.(24-25高二下·上海·阶段检测)已知某区组建了一支人的志愿者队伍,并由其中人组成“志愿模范队”.经过一年的实践,全队共有人的周平均服务时长超过2小时,其中有人来自“志愿模范队”,如下表所示.
是“志愿模范队”成员
不是“志愿模范队”成员
总计
周平均服务时长超过2小时
周平均服务时长不超过2小时
总计
(1)已知一名志愿者是“志愿模范队”成员,求其周平均服务时长超过2小时的概率.
(2)请完成列联表,并根据表中数据回答:是否有的把握认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关系?
附录:,其中.
2 / 36
1 / 36
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。