专题07 成对数据的统计分析大考点(期末真题汇编,广东专用)高二数学下学期人教A版
2026-05-28
|
2份
|
73页
|
52人阅读
|
1人下载
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 小结 |
| 类型 | 题集-试题汇编 |
| 知识点 | 统计案例 |
| 使用场景 | 同步教学-期末 |
| 学年 | 2026-2027 |
| 地区(省份) | 广东省 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 4.88 MB |
| 发布时间 | 2026-05-28 |
| 更新时间 | 2026-05-28 |
| 作者 | 晨星高中数学启迪园 |
| 品牌系列 | 好题汇编·期末真题分类汇编 |
| 审核时间 | 2026-05-28 |
| 下载链接 | https://m.zxxk.com/soft/58086332.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
**基本信息**
聚焦成对数据统计分析,整合10个核心考点,精选广东各地期末真题,通过新能源汽车、夜间经济等真实情境,实现基础巩固与综合应用的梯度训练。
**题型特征**
|题型|题量/分值|知识覆盖|命题特色|
|----|-----------|----------|----------|
|选择/填空|约40题|变量相关关系、样本相关系数、线性/非线性回归方程、独立性检验|以“名师出高徒”等生活案例辨析相关关系,结合科研经费与市场规模数据考查回归估计|
|解答题|约20题|残差分析、决定系数、卡方计算|设计“教育级别与收入”“性别与购车种类”等情境,融合回归方程建立与独立性检验,体现统计应用价值|
内容正文:
专题07 成对数据的统计分析
高频考点概览
考点 01 变量的相关关系
考点 02 样本相关系数
考点 03 样本中心的应用
考点 04 用回归方程估计总体数据
考点 05 残差分析
考点 06 决定系数
考点 07 线性回归方程
考点 08 非线性回归方程
考点 09 独立性检验概念辨析
考点 10 卡方计算
考点01
变量的相关关系
1.(2021春•揭阳期末)下列反映两个变量的相关关系中,不同于其它三个的是( )
A.名师出高徒 B.水涨船高 C.月明星稀 D.登高望远
2.(2021春•中山市期末)甲、乙、丙、丁四位同学各自对、两变量的线性相关性作试验,并用回归分析方法分别求得相关系数与残差平方和如表:
甲
乙
丙
丁
0.82
0.78
0.69
0.85
106
115
124
103
则哪位同学的试验结果体现、两变量有更强的线性相关性?( )
A.甲 B.乙 C.丙 D.丁
3.(2024春•清远期末)通过计算样本相关系数可以反映两个随机变量之间的线性相关程度,以下四个选项中分别计算出四个样本的相关系数,则反映样本数据成正相关,并且线性相关程度最强的是( )
考点02
样本相关系数
A. B. C. D.
4.(2023春•中山市期末)要判断成对数据的线性相关程度的强弱,可以通过比较它们的样本相关系数的大小,以下是四组数据的相关系数的值,则线性相关最强的是( )
A. B. C. D.
5.(2023春•佛山期末)已知成对样本数据,,,,,,中,,,不全相等,且所有样本点,,2,,都在直线上,则这组成对样本数据的样本相关系数 .
考点03
样本中心的应用
6.(2025春•茂名期末)已知与之间的一组数据:
1
2
3
4
5.5
4
3.5
3
若与满足回归方程,则( )
A. B. C. D.
7.(2025春•云浮期末)已知一组样本点,,2,3,,组成一个样本,得到的经验回归方程为,且其平均数,若增加两个样本点和,得到新样本的经验回归方程为,则( )
A.0.25 B. C.0.5 D.
8.(2024春•江门期末)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了6次试验,收集数据如下表所示,建立加工时间关于零件数的一元线性回归模型,则回归直线必过点( )
零件数个
50
60
70
80
90
100
加工时间
88
95
102
108
115
122
A. B. C. D.
9.(2024春•东莞市期末)两个相关变量,满足如下关系:
2
3
4
5
6
25
●
46
58
65
根据表格已得经验回归方程为.若表格中有一数据模糊不清,则推算该数据是( )
A.35.5 B.36 C.36.5 D.37
10.(2023秋•梅县区校级期末)已知,之间的一组数据如下表:
1
2
3
4
5
4.3
5.4
6.1
6.7
7.5
则回归直线必过的一个定点坐标是 ;已知线性回归方程中,每增加1个单位时平均的增加0.77,则当时, .
11.(2023春•揭阳期末)已知变量,的一组相关数据如下表:
1
2
3
4
5
2.1
9
10.9
若,具有较强的线性相关关系,其经验回归方程为,则实数( )
A.4.9 B.5 C.5.1 D.5.2
考点04
用回归方程估计总体数据
12.(2025春•梅州期末)我国新能源汽车的卓越性能赢得全球人民的信赖,某品牌新能源汽车凭借科研创新、广告宣传和可靠的售后保障,在全球赢得了很好的营销局面,如表为该品牌新能源汽车的科研经费投入和全球市场规模统计.
科研经费(单位:百亿元)
2
4
6
12
16
市场规模(单位:百万辆)
1
1.5
2
3
3.5
如此得到关于的经验回归方程:,估计当该品牌新能源汽车的科研经费投入20(百亿元)时,全球市场规模将达到 百万辆.
A.4 B.4.14 C.4.36 D.4.58
13.(2024春•东莞市期末)随着“一带一路”经贸合作持续深化,西安某地对外贸易近几年持续繁荣,2023年6月18日,该地很多商场都在搞“618”促销活动.市物价局派人对某商品同一天的销售量及其价格进行调查,得到该商品的售价(单位:元)和销售量(单位:百件)之间的一组数据(如表所示),用最小二乘法求得关于的线性回归方程是,预测当售价为45元时,销售量件数大约为 (单位:百件)
20
25
30
35
40
5
7
8
9
11
A.12 B.12.5 C.13 D.11.75
14.(2024春•中山市期末)设某商场今年上半年月销售额(万元)关于月份,2,,的经验回归方程为,已知上半年的总销售额为120万元,则该商场12月份销售额预计为( )
A.24 B.27.8 C.30.2 D.32
15.(2024春•潮州期末)近年来、潮州以其品种繁多的美味小吃、独特的文化魅力和民俗风情吸引八方游客.据统计,潮州古城区2019年至2023年(用,2,3,4,5表示年份)接待的游客人数(十万人)的数据如下表:
1
2
3
4
5
12
15
19
24
30
由此得到关于的回归直线方程为,则可以预测潮州古城区2024年接待的游客人数约为 十万人.
A.36.5 B.37 C.35.2 D.35.6
16.(2024春•清远期末)生活经验告诉我们,儿子身高与父亲身高是线性相关的.有人调查了5位学生的身高和其父亲的身高,得到的数据如表:
父亲身高
166
169
170
172
173
儿子身高
168
170
171
175
176
并利用相关知识得到儿子身高关于父亲身高的经验回归方程为.根据该经验回归方程,已知某父亲身高为,预测其儿子身高为( )
A. B. C. D.
17.(2024春•佛山期末)若将文盲定义为0,半文盲定义为1,小学定义为2,初中定义为3,职中定义为4,高中定义为5,大专定义为6,大学本科定义为7,硕士及以上学历定义为8,根据调查,某发达地区教育级别与月均纯收入(单位:万元)的关系如下表:
学历
初中
职中
高中
大专
本科
教育级别
3
4
5
6
7
月均纯收入
0.40
0.55
0.70
1.15
1.20
由回归分析,回归直线方程的斜率,可预测该地区具有硕士及以上学历的月平均纯收入为( )
A.1.40万元 B.1.42万元 C.1.44万元 D.1.46万元
18.(2023春•东莞市期末)如表是某企业在2023年1月—5月的5个月内购买某品牌碳酸锂价格(单位:千元)与月份代码的统计数据.由表中数据计算得到经验回归方程为,则预测2023年8月购买该品牌碳酸锂价格约为( )
月份代码
1
2
3
4
5
碳酸锂价格
0.5
0.7
1
1.2
1.6
A.2.41千元 B.2.38千元 C.2.35千元 D.2.32千元
19.(2023春•越秀区期末)某外贸工厂今年的月份与订单(单位:万元)的几组对应数据如下:
月份
1
2
3
4
5
订单
20
24
36
43
52
变量,具有线性相关关系,其经验回归方程为:,则估计10月份该厂的订单数为( )
参考数据:,,
参考公式:
A.93.1 B.89.9 C.83.1 D.59.9
考点05
残差分析
20.(2025春•深圳期末)已知变量和的统计数据如表,若由表中数据得到回归直线方程为,则时的残差为( )
4
4.5
5
5.5
6
7
6
4
2
1
A.0.2 B. C.0.4 D.
21.(2024春•汕头期末)根据变量和的成对样本数据,用一元线性回归模型得到经验回归模型,对应的残差如图所示,模型误差( )
A.满足一元线性回归模型的所有假设
B.不满足一元线性回归模型的(e)的假设
C.不满足一元线性回归模型的(e)假设
D.不满足一元线性回归模型的(e)和(e)的假设
22.(2024春•赤坎区校级期末)已知一系列样本点,,2,3,的一个经验回归方程为,若样本点的残差为1,则( )
A. B.6 C. D.8
23.(2025春•罗湖区期末)已知根据如下数据,可得到关于的经验回归方程为,则3号观测的残差(精确到为( )
编号
1
2
3
4
5
6
7
8
9
10
11
12
18.1
20.1
22.2
24.4
26.0
28.3
29.6
32.4
33.7
35.7
38.3
40.2
18.8
19.2
21.0
21.0
22.1
22.1
22.4
22.6
23.0
24.3
23.9
24.7
A.0.5 B. C.0.6 D.
24.(2025春•深圳校级期末)某智能机器人公司从某年起7年的利润情况如表所示,关于的回归直线方程是,则该智能机器人公司第4年利润的残差是( )
第年
1
2
3
4
5
6
7
利润亿元
2.9
3.3
3.6
4.8
5.2
5.9
A.0.1亿元 B.0.2亿元 C.亿元 D.亿元
25.(2025春•广州期末)为了研究广告支出与销售额的关系,现随机抽取5家超市作为样本,得到其广告支出(单位:万元)与销售额(单位:万元)数据如下:
超市
广告支出
1
2
3
4
5
销售额
4
9
14
18
(1)当时,根据表中样本数据,计算相关系数,并推断它们的相关程度(保留两位小数);
(2)根据表中样本数据,用最小二乘法得到销售额关于广告支出的回归直线方程为,销售额的方差为52.4,求的值,并计算广告支出为5(万元)时销售额的残差;
(3)收集更多变量和的成对样本数据,由一元线性回归模型得到经验回归模型,对应的残差如图所示,则模型误差是否满足一元线性回归模型的(e)与(e)的假设(直接写出结果).
附:相关系数,回归系数,参考数据:.
26.(2022春•东莞市期末)成对样本数据和的一元线性回归模型是,则下列四幅残差图满足一元线性回归模型中对随机误差的假定的是( )
A.
B.
C.
D.
考点06
决定系数
27.(2025春•广东期末)(多选)两个具有相关关系的变量,的一组数据为,,,,,,,其经验回归方程为,记,决定系数为;若将数据调整为,,,,,,,其经验回归方程为,记,决定系数为,则
附:
A. B. C. D.
28.(2025春•东莞市期末)在科技日新月异的今天,无人驾驶网约车正逐渐成为出行领域的新宠,根据统计数据显示,某区域过去5天的订单数如下:
日期(天
1
2
3
4
5
订单数(件
13
21
45
55
66
为了进一步了解订单数的变化情况,甲乙两个数学学习小组分别进行了研究,
(1)甲小组决定用线性回归模型进行拟合,求此时关于的经验回归方程;
(2)乙小组采用非线性回归模型进行拟合,求得关于的经验回归方程为,并计算出决定系数,
①根据回归模型的决定系数,说明哪个小组的模型拟合效果更好;
②用①中选择的模型预测该区域第10天的订单数(结果保留整数).附:;决定系数.
参考数据:
29.(2024春•东莞市期末)(多选)变量与的成对数据的散点图如图所示,由最小二乘法计算得到经验回归直线的方程为,相关系数为,决定系数为;经过残差分析确定第二个点为离群点(对应残差过大),把点对应的数据去掉后,用剩下的7组数据计算得到经验回归直线的方程为,相关系数为,决定系数为,则以下结论正确的是
A. B. C. D.
30.(2023春•东莞市期末)(多选)对两组线性相关成对数据进行回归分析,得到不同的统计结果,第一组成对数据的样本相关系数、残差平方和、决定系数分别为,,,第二组成对数据的样本相关系数、残差平方和、决定系数分别为,,,则
A.若,则第一组成对数据的线性相关关系比第二组的强
B.若,则第一组成对数据的线性相关关系比第二组的强
C.若,则第二组成对数据的经验回归模型拟合效果比第一组的好
D.若,则第二组成对数据的经验回归模型拟合效果比第一组的好
考点07
线性回归方程
31.(2025春•广东期末)已知变量与变量线性相关,与的样本相关系数为,且由观测数据算得样本平均数,,则由该观测数据算得经验回归方程可能是( )
A. B. C. D.
32.(2024秋•潮州期末)“潮州柑”是一种象征吉祥的果子,因比桔大,故俗称“大吉”,而桔与吉同音,用谐音会意法,就成了大吉.春节时候,潮州人有带“大吉”拜年的习俗,互换“大吉”,愿彼此“大吉大利”.春节将至,某水果店对“潮州柑”进行试销,得到一组销售数据,如下表所示:
试销单价(元
3
4
5
6
7
产品销量件
20
16
15
12
6
(1)经计算相关系数,变量,线性相关程度很高,求关于的经验回归方程;
(2)用(1)中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对值大于1.2时,称该对数据为一个“次数据”,现从这5个成对数据中任取3个做残差分析,求取到的数据中“次数据”个数的分布列和数学期望.
参考公式:线性回归方程中,的最小二乘法估计分别为,.
参考数据:.
33.(2024春•梅州期末)某网上购物平台为了提高某商品的的销售业绩,对该商品近5个月的月销售单价(单位:元)与月销量(单位:个)之间的数据进行了统计,得到如下表数据:
单价元
180
190
200
210
220
月销量个
57
52
42
32
27
(1)根据以往经验,与具有线性相关关系,求关于的线性回归方程;
(2)若该商品的成本为140元个,根据(1)中回归方程,求该商品月利润最大时的单价为多少元.(结果精确到1元)
参考公式:,.参考数据;,.
34.(2025春•顺德区校级期末)某制药公司研发一种新药,需要研究某种药物成分的含量(单位:与药效指标值(单位:之间的关系,该公司研发部门进行了20次试验,统计得到一组数据,,2,,,其中,分别表示第次试验中这种药物成分的含量和相应的药效指标值,已知该组数据中与之间具有线性相关关系,且,,,,.
(1)求关于的经验回归方程;
(2)该公司要用与两套设备同时生产该种新药,已知设备的生产效率是设备的2倍,设备生产药品的不合格率为0.009,设备生产药品的不合格率为0.006,且设备与生产的药品是否合格相互独立.
①从该公司生产的新药中随机抽取一件,求所抽药品为不合格品的概率;
②在该新药产品检验中发现有三件不合格品,求其中至少有两件是设备生产的概率.
参考公式:,.
考点08
非线性回归方程
35.(2025春•广州期末)(多选)用模型去拟合一组数据,设,将其变换后得到线性回归方程,则
A. B. C. D.
36.(2024春•肇庆期末)用模型拟合一组数据,令,将模型转化为经验回归方程,则 .
37.(2024春•广州期末)近年来中国各地政府对夜间经济的扶持力度加大,夜间经济的市场发展规模稳定增长,有关部门整理了年中国夜间经济的数据,把市场发展规模记为(单位:万亿元),并把年对应的年份代码依次记为,经分析,判断可用函数模型拟合与的关系,为参数).令,计算得,,由最小二乘法得经验回归方程为,则的值为 .为判断拟合效果,通过经验回归方程求得预测值,2,,,若残差平方和,则决定系数 .
(参考公式,决定系数,参考数据:
38.(2024春•东莞市期末)某企业生产一种热销产品,产品日产量为吨,日销售额为万元(每日生产的产品当日可销售完毕),且产品价格随着产量变化而有所变化.经过一段时间的产销,随机收集了某5天的日产量,2,,(单位:吨)和日销售额,2,,(单位:万元)的统计数据,并对这5组数据做了初步处理,得到统计数据如下表:
15
73
4.8
10
161.2
1.6
39
15.9
其中,分别为数据,,,2,,的平均数.
(1)请从样本相关系数的角度,判断与哪一个模型更适合刻画日销售额关于日产量的关系?
(2)根据(1)的结果解决下列问题:
建立关于的经验回归方程(斜率的结果四舍五入保留整数);
如果日产量(单位:吨)与日生产总成本(单位:万元)满足关系,根据中建立的经验回归方程估计日产量为何值时,日利润最大?
附:①相关系数;
②经验回归方程的斜率和截距的最小二乘法公式分别为:;
③参考数据:.
39.(2023春•肇庆期末)为进一步加强城市建设和产业集聚效应,某市通过“两化”中的信息化和工业化之间的完美交融结合,达到了经济效益的“倍增式”发展.该市某高科技企业对某核心技术加大研发投资力度,持续构建面向未来的竞争力.现得到一组在该技术研发投入(单位:亿元)与收益(单位:亿元)的数据如表所示:
研发投入
3
6
8
10
14
17
22
32
收益
43
52
60
71
74
81
89
98
(1)已知可用一元线性回归模型模型拟合与的关系,求此经验回归方程;(附:对于一组数据,,,,,,,其经验回归直线的斜率和截距的最小二乘法估计公式分别为,,,,结果保留两位小数)
(2)该企业主要生产、类产品,现随机抽取类产品2件、类产品1件进行质量检验,已知类、类产品独立检验为合格品的概率分别为,,求在恰有2件产品为合格品的条件下,类产品为合格品的概率.
40.(2024春•肇庆校级期末)广东省深圳市是全国七大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示:
令,2,,,数据经过初步处理得:
44
4.8
10
40.3
1.612
19.5
8.06
现有①和②两种方案作为年销售量关于年广告费的回归分析模型,其中,,,均为常数.
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(不能整除的相关系数保留2位小数)
(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出关于的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少?
附:①相关系数,回归直线中公式分别为,
②参考数据:,,,.
41.(2023春•深圳校级期末)放行准点率是衡量机场运行效率和服务质量的重要指标之一.某机场自2012年起采取相关策略优化各个服务环节,运行效率不断提升.以下是根据近10年年份数与该机场飞往地航班放行准点率,2,,(单位:百分比)的统计数据所作的散点图及经过初步处理后得到的一些统计量的值.
2017.5
80.4
1.5
40703145.0
1621254.2
27.7
1226.8
其中,
(1)根据散点图判断,与哪一个适宜作为该机场飞往地航班放行准点率关于年份数的经验回归方程类型(给出判断即可,不必说明理由),并根据表中数据建立经验回归方程,由此预测2023年该机场飞往地的航班放行准点率.
(2)已知2023年该机场飞往地、地和其他地区的航班比例分别为0.2、0.2和0.6.若以(1)中的预测值作为2023年该机场飞往地航班放行准点率的估计值,且2023年该机场飞往地及其他地区(不包含、两地)航班放行准点率的估计值分别为和,试解决以下问题:
现从2023年在该机场起飞的航班中随机抽取一个,求该航班准点放行的概率;
若2023年某航班在该机场准点放行,判断该航班飞往地、地、其他地区等三种情况中的哪种情况的可能性最大,说明你的理由.
附:(1)对于一组数据,,,,,,,其回归直线的斜率和截距的最小二乘估计分别为,
参考数据:,,.
考点09
独立性检验概念辨析
42.(2025春•湛江期末)某机构为研究高血压与高盐饮食是否有关系进行了一次调查,根据独立性检验的原理,有的把握但没有的把握认为高血压与高盐饮食有关,则的观测值不可能为( )
附:,,.
A.3.622 B.4.502 C.5.921 D.6.634
43.(2025春•深圳期末)某工厂为研究新、旧两条产线与产品质量的关系,随机抽取200件产品进行检验,得到如下列联表,则下列说法正确的是( )
优质品
非优质品
合计
新产线
75
25
100
旧产线
60
40
100
合计
135
65
200
附:
0.050
0.010
0.001
3.841
6.635
10.828
A.有的把握认为新、旧两条产线的产品质量有差异
B.有的把握认为新、旧两条产线的产品质量有差异
C.根据小概率值的独立性检验,我们认为新、旧两条产线的产品质量没有差异
D.根据小概率值的独立性检验,我们认为新、旧两条产线的产品质量有差异,该推断犯错误的概率不超过0.001
44.(2025春•广州期末)根据分类变量与的成对样本数据,计算得到.已知,依据的独立性检验,结论为( )
A.变量与独立
B.变量与独立,这个结论犯错误的概率不超过0.005
C.变量与不独立
D.变量与不独立,这个结论犯错误的概率不超过0.005
45.(2025春•广州期末)为了解性别(变量与体育锻炼(变量是否有关,采取简单随机抽样的方法抽取50名学生,得到成对样本观测数据的分类统计结果,如表所示(单位:人),根据数据计算,并依据小概率值的独立性检验,附:,,下列结论不正确的是( )
锻炼
合计
不经常
经常
女生
15
5
20
男生
10
合计
25
25
50
A.
B.若从这50人中随机抽取1人,则经常锻炼的概率为
C.变量与变量独立,此推断犯错误的概率不超过0.005
D.变量与变量不独立,此推断犯错误的概率不超过0.005
46.(2024春•汕头期末)通过随机询问某中学110名学生是否爱好跳绳,得到如下列联表.已知,,根据小概率值的独立性检验,以下结论正确的是( )
跳绳
性别
合计
男
女
爱好
40
20
60
不爱好
20
30
50
合计
60
50
110
A.爱好跳绳与性别有关
B.爱好跳绳与性别有关,这个结论犯错误的概率不超过0.001
C.爱好跳绳与性别无关
D.爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001
47.(2024春•湛江期末)某学校对本校学生的课外阅读进行抽样调查,抽取25名女生,25名男生调查,结果形成以下列联表,通过数据分析,认为喜欢课外阅读与学生性别之间( )
喜欢课外阅读
不喜欢课外阅读
合计
男生
5
20
25
女生
15
10
25
合计
20
30
50
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
A.不能根据小概率的的独立性检验认为两者有关
B.根据小概率的的独立性检验认为两者有关
C.根据小概率的的独立性检验认为两者有关
D.根据小概率的的独立性检验认为两者无关
48.(2023春•中山市期末)某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用列联表进行独立性检验.经计算,则所得到的统计学结论是:有 的把握认为“学生性别与支持该活动有系”
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
A. B. C. D.
49.(2023春•天河区期末)某校高二年级羽毛球社团为了解喜欢羽毛球运动是否与性别有关,随机在高二年级抽取了若干人进行调查.已知抽取的女生人数是男生人数的3倍,其中女生喜爱羽毛球运动的人数占女生人数的,男生喜爱羽毛球运动的人数占男生人数的.若本次调查得出“在犯错误的概率不超过0.05的前提下,认为喜爱羽毛球运动与性别有关”的结论,则被调查的男生至少有( )
参考公式及数据:
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.35人 B.32人 C.31人 D.30人
考点10
卡方计算
50.(2024春•中山市期末)为了解某一地区新能源电动汽车销售情况,一机构根据统计数据,用最小二乘法得到电动汽车销量(单位:万台)关于(年份)的线性回归方程,且销量的方差为,年份的方差为.
(1)求与的相关系数,并据此判断电动汽车销量与年份的线性相关性的强弱.
(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
性别
购买非电动汽车
购买电动汽车
总计
男性
39
6
45
女性
30
15
45
总计
69
21
90
依据小概率值的独立性检验,能否认为购买电动汽车与车主性别有关?
①参考数据:.
②参考公式:线性回归方程为,其中,;相关系数,若,则可判断与线性相关较强;,其中.附表:
0.10
0.05
0.010
0.001
2.706
3.841
6.635
10.828
51.(2025春•清远期末)在研究某类杨树的树高与胸径(树的主干在地面以上处的直径)之间的关系时,某研究员收集的一些数据如表1所示.
(1)由表1数据,求胸径与树高的平均值;(胸径精确到,树高精确到
(2)根据这些数据,可建立该类杨树树高(单位:关于胸径(单位:的一元线性回归模型为,用(1)中结果求的值并估计胸径为的该类杨树的树高;(精确到
(3)若这12棵杨树树龄相同,分别种植于南坡和北坡,且成材情况如表2所示,根据的独立性检验,能否认为树龄相同的这类杨树是否成材与种植位置有关联?
编号
1
2
3
4
5
6
胸径
18.1
20.1
22.2
24.4
26.0
28.3
树高
18.8
19.2
21.0
21.0
22.1
22.1
编号
7
8
9
10
11
12
胸径
29.6
32.4
33.7
35.7
38.3
40.2
树高
22.4
22.6
23.0
24.3
23.9
24.7
表1
种植位置
成材情况
合计
成材
未成材
南坡
5
1
6
北坡
2
4
6
合计
7
5
12
表2
参考公式及数据:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
52.(2025春•广东校级期末)民航招飞是指普通高校飞行技术专业通过高考招收飞行学生.对某校高三在校学生进行统计,得到如下列联表:
有报名意向
没有报名意向
合计
男学生
70
150
女学生
80
100
180
合计
250
400
(1)求,;
(2)记该校高三女学生有报名意向的概率为,求出值;
(3)是否有的把握认为该校高三在校学生是否有报名意向与性别有关?
附:,其中.
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
53.(2025春•云浮期末)某工厂生产了两批次某种产品,现从这两批次产品中共抽取800件进行检测,其中第一批次的产品占了检测数据如下,第一批次的次品件数与第二批次的次品件数相同,在合格品中,第二批次的合格品占了.
(1)根据题中信息,完成下面列联表;
单位:件
生产批次
产品检测结果
合计
次品
合格品
第一批次
第二批次
合计
800
(2)根据小概率值的独立性检验,能否认为产品检测结果与生产批次有关联?
附:.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
54.(2025春•龙岗区校级期末)某学习小组为了研究性别与近视之间是否有关联,在年级随机选取了30人,得到如下列联表:
性别
近视
合计
不近视
近视
男
5
17
22
女
2
6
8
合计
7
23
30
(1)在样本中的8名女生中随机选取2人,求这2人中至少有1人是近视的概率;
(2)小组成员甲通过计算发现女生的近视率为小于男生的近视率,所以甲认为男生更容易近视.请根据小概率值的独立性检验,分析甲的说法是否正确?
0.1
0.05
0.01
2.706
3.841
6.635
55.(2025春•新会区校级期末)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表.
机床
品级
合计
一级品
二级品
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)依据小概率值的独立性检验,分析甲机床的产品质量是否与乙机床的产品质量有差异.
附:.
0.050
0.010
0.001
3.841
6.635
10.828
56.(2025春•江门校级期末)某工厂进行生产线智能化升级改造,对甲、乙两个车间升级改造后,(1)从该工厂甲、乙两个车间的产品中各随机抽取50件进行检验,其中甲车间优等品占,乙车间优等品占,请填写如下列联表:
优等品
非优等品
总计
甲车间
乙车间
总计
依据小概率值的独立性检验,能否认为车间与优等品有关联?(结果精确到,其中.
下表是独立性检验中几个常用的小概率值和相应的临界值.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
(2)调查了近10个月的产量(单位:万个)和月销售额(单位:万元),得到以下数据:,根据散点图认为关于的经验回归方程为,试求经验回归方程.
参考公式:,其中
57.(2022春•广州期末)在“双减”政策背景之下,某校就推进学校、家庭、社会体育教育的“一体化”,实现“教会、勤练、常赛”的核心任务.学校组织人员对在校学生“是否喜爱运动”做了一次随机调查.共随机调查了18名男生和12名女生,调查发现,男、女生中分别有12人和6人喜爱运动,其余不喜爱.
(1)根据以上数据完成以下列联表:
喜欢运动
不喜欢运动
总计
男
女
总计
根据小概率值的独立性检验,能否据此推断性别与喜爱运动有关?
(2)从被调查的女生中抽取3人,若其中喜爱运动的人数为,求的分布列.
附参考公式及参考数据:,其中.
0.40
0.25
0.10
0.010
0.708
1.323
2.706
6.635
58.(2024春•广州期末)某单位拟实行新的员工考勤管理方案.方案起草后,为了解员工对新方案是否满意,随机选取150名男员工和150名女员工进行问卷调查,结果如下:300名员工中有15名员工对新考勤管理方案不满意,其中男3人,女12人.
(1)完成如下列联表:
单位:人
性别
满意
合计
是
否
男
女
合计
根据的独立性检验,能否认为性别与对新考勤管理方案满意有关联?
(2)为了得到被调查者对所提问题的诚实回答,消除被调查者对于敏感问题的顾虑,决定调整调查方案.新的调查方案中使用两个问题:
①你公历生日是奇数吗?
②你对新考勤管理方案是否满意?
先让被调查者从装有4个红球,6个黑球(除颜色外,完全相同)的袋子中随机摸取两个球(摸出的球再放回袋中).摸到两球同色的员工如实回答第一个问题,摸到两球异色的员工如实回答第二个问题.问卷上没有问题,答题者只需选择“是”或者“否”.由于回答的是哪个问题是别人不知道的,因此被调查者可以毫无顾虑的诚实回答.
根据以上调查方案,求某个被调查者回答第一个问题的概率;
如果300人中共有206人回答“是”,请估计对新考勤管理方案满意的员工所占的百分比.(每个员工公历生日是奇数的概率取为
0.05
0.025
0.005
3.841
5.024
7.879
附:.
59.(2024春•东莞市期末)某社区以网上调查问卷形式对辖区内部分居民做了体育锻炼的宣传和调查.调查数据如下:共100份有效问卷,50名男性中有5名不经常体育锻炼,50名女性中有10名不经常体育锻炼.
(1)根据所给数据,完成下面的列联表:根据小概率值的独立性检验,分析性别因素是否会影响经常体育锻炼?
性别
经常体育锻炼与否
合计
经常体育锻炼
不经常体育锻炼
男
女
合计
(2)从不经常体育锻炼的15份调查问卷中得到不经常锻炼的原因:有3份身体原因;有2份不想锻炼;有4份没有时间;有6份没有运动伙伴.求从这15份问卷中随机选出2份,在已知其中一份是“没有时间”的条件下,另一份是“没有运动伙伴”的概率.
附:①,其中.
②临界值表
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
60.(2024春•佛山期末)高考招生制度改革后,我省实行“”模式,“3”为语文、数学、外语3门统一科目,“1”为考生在物理、历史两门科目中选择1门作为首选科目,“2”为考生在思想政治、地理、化学、生物学4门科目中选择2门作为再选科目.有人认为高考选考科目的确定与性别有关,为此,某教育机构随机调查了一所学校的名学生,其中男生占调查人数的,已知男生有的人选了物理,而女生有的人选物理.
(1)完成下列列联表:
物理
历史
总计
男生
女生
总计
(2)若在犯错误的概率不超过0.01的前提下,可认为“性别与选科有关”,那么本次被调查的人数至少有多少?
(3)从物理类考生和历史类考生中各抽取1人,若抽取的2人性别恰好相同,求这2人是女生的概率.
附:
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
1 / 8
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
专题07 成对数据的统计分析
高频考点概览
考点 01 变量的相关关系
考点 02 样本相关系数
考点 03 样本中心的应用
考点 04 用回归方程估计总体数据
考点 05 残差分析
考点 06 决定系数
考点 07 线性回归方程
考点 08 非线性回归方程
考点 09 独立性检验概念辨析
考点 10 卡方计算
(
考点01
变量的相关关系
)
1.(2021春•揭阳期末)下列反映两个变量的相关关系中,不同于其它三个的是( )
A.名师出高徒 B.水涨船高 C.月明星稀 D.登高望远
【解答】解:由题意,,,具有因果关系,没有因果关系,是感觉的
故选:.
2.(2021春•中山市期末)甲、乙、丙、丁四位同学各自对、两变量的线性相关性作试验,并用回归分析方法分别求得相关系数与残差平方和如表:
甲
乙
丙
丁
0.82
0.78
0.69
0.85
106
115
124
103
则哪位同学的试验结果体现、两变量有更强的线性相关性?( )
A.甲 B.乙 C.丙 D.丁
【解答】解:在验证两个变量之间的线性相关关系中,相关系数的绝对值越接近于1,相关性越强,
在四个选项中只有丁的相关系数最大,
残差平方和越小,相关性越强,
只有丁的残差平方和最小,
综上可知丁的试验结果体现、两变量有更强的线性相关性,
故选:.
(
考点02
样本相关系数
)
3.(2024春•清远期末)通过计算样本相关系数可以反映两个随机变量之间的线性相关程度,以下四个选项中分别计算出四个样本的相关系数,则反映样本数据成正相关,并且线性相关程度最强的是( )
A. B. C. D.
【解答】解:由相关系数的性质可知,当时,样本数据成正相关,
当的值越接近于1,线性相关程度越强,
故4个选项中,反映样本数据成正相关,并且线性相关程度最强.
故选:.
4.(2023春•中山市期末)要判断成对数据的线性相关程度的强弱,可以通过比较它们的样本相关系数的大小,以下是四组数据的相关系数的值,则线性相关最强的是( )
A. B. C. D.
【解答】解:当时,表明两个变量正相关;当时,表明两个变量负相关;,且越接近于1,相关程度越大;越接近于0,相关程度越小,因此线性相关最强的是.
故选:.
5.(2023春•佛山期末)已知成对样本数据,,,,,,中,,,不全相等,且所有样本点,,2,,都在直线上,则这组成对样本数据的样本相关系数 .
【解答】解:由题设知,所有样本点,,2,,都在直线上,
这组样本数据完全负相关,故其相关系数为.
故答案为:.
(
考点0
3
样本中心的应用
)
6.(2025春•茂名期末)已知与之间的一组数据:
1
2
3
4
5.5
4
3.5
3
若与满足回归方程,则( )
A. B. C. D.
【解答】解:,,
根据线性回归方程的性质可知,线性回归方程过样本中心点,则,解得.
故选:.
7.(2025春•云浮期末)已知一组样本点,,2,3,,组成一个样本,得到的经验回归方程为,且其平均数,若增加两个样本点和,得到新样本的经验回归方程为,则( )
A.0.25 B. C.0.5 D.
【解答】解:因为经验回归方程过样本中心点,,
所以,
则新样本的平均数,,
因为新样本的经验回归方程过新样本中心点,,
所以,
解得.
故选:.
8.(2024春•江门期末)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了6次试验,收集数据如下表所示,建立加工时间关于零件数的一元线性回归模型,则回归直线必过点( )
零件数个
50
60
70
80
90
100
加工时间
88
95
102
108
115
122
A. B. C. D.
【解答】解:由表中数据可知,,
,
故回归直线必过点.
故选:.
9.(2024春•东莞市期末)两个相关变量,满足如下关系:
2
3
4
5
6
25
●
46
58
65
根据表格已得经验回归方程为.若表格中有一数据模糊不清,则推算该数据是( )
A.35.5 B.36 C.36.5 D.37
【解答】解:设模糊的数据为,则,,
可得样本点的中心为,
代入,可得,解得.
故选:.
10.(2023秋•梅县区校级期末)已知,之间的一组数据如下表:
1
2
3
4
5
4.3
5.4
6.1
6.7
7.5
则回归直线必过的一个定点坐标是 ;已知线性回归方程中,每增加1个单位时平均的增加0.77,则当时, .
【解答】解:,,
则回归直线必过的一个定点坐标是,
每增加1个单位,平均地增加0.77,
,即,
,
,
故,
当时,.
故答案为:;8.31.
11.(2023春•揭阳期末)已知变量,的一组相关数据如下表:
1
2
3
4
5
2.1
9
10.9
若,具有较强的线性相关关系,其经验回归方程为,则实数( )
A.4.9 B.5 C.5.1 D.5.2
【解答】解:依题意,
,
显然满足经验回归方程,所以.
故选:.
(
考点0
4
用回归方程估计总体数据
)
12.(2025春•梅州期末)我国新能源汽车的卓越性能赢得全球人民的信赖,某品牌新能源汽车凭借科研创新、广告宣传和可靠的售后保障,在全球赢得了很好的营销局面,如表为该品牌新能源汽车的科研经费投入和全球市场规模统计.
科研经费(单位:百亿元)
2
4
6
12
16
市场规模(单位:百万辆)
1
1.5
2
3
3.5
如此得到关于的经验回归方程:,估计当该品牌新能源汽车的科研经费投入20(百亿元)时,全球市场规模将达到 百万辆.
A.4 B.4.14 C.4.36 D.4.58
【解答】解:根据题意可知,,
故样本中心为,
故,
故当时,.
故选:.
13.(2024春•东莞市期末)随着“一带一路”经贸合作持续深化,西安某地对外贸易近几年持续繁荣,2023年6月18日,该地很多商场都在搞“618”促销活动.市物价局派人对某商品同一天的销售量及其价格进行调查,得到该商品的售价(单位:元)和销售量(单位:百件)之间的一组数据(如表所示),用最小二乘法求得关于的线性回归方程是,预测当售价为45元时,销售量件数大约为 (单位:百件)
20
25
30
35
40
5
7
8
9
11
A.12 B.12.5 C.13 D.11.75
【解答】解:因为,,
所以回归直线过点,
故,
即,
所以,
将代入中,得.
故选:.
14.(2024春•中山市期末)设某商场今年上半年月销售额(万元)关于月份,2,,的经验回归方程为,已知上半年的总销售额为120万元,则该商场12月份销售额预计为( )
A.24 B.27.8 C.30.2 D.32
【解答】解:由已知数据可得,
因为经验回归方程经过样本的中心点,
所以,
解得,
则经验回归方程为,
所以该商场12月份销售额预计为.
故选:.
15.(2024春•潮州期末)近年来、潮州以其品种繁多的美味小吃、独特的文化魅力和民俗风情吸引八方游客.据统计,潮州古城区2019年至2023年(用,2,3,4,5表示年份)接待的游客人数(十万人)的数据如下表:
1
2
3
4
5
12
15
19
24
30
由此得到关于的回归直线方程为,则可以预测潮州古城区2024年接待的游客人数约为 十万人.
A.36.5 B.37 C.35.2 D.35.6
【解答】解:由题意得,,
因为回归直线方程过点,,
所以,解得,
所以关于的回归直线方程为,
当时,.
故选:.
16.(2024春•清远期末)生活经验告诉我们,儿子身高与父亲身高是线性相关的.有人调查了5位学生的身高和其父亲的身高,得到的数据如表:
父亲身高
166
169
170
172
173
儿子身高
168
170
171
175
176
并利用相关知识得到儿子身高关于父亲身高的经验回归方程为.根据该经验回归方程,已知某父亲身高为,预测其儿子身高为( )
A. B. C. D.
【解答】解:因为,,
所以,
解得,
所以,
当时,,
故选:.
17.(2024春•佛山期末)若将文盲定义为0,半文盲定义为1,小学定义为2,初中定义为3,职中定义为4,高中定义为5,大专定义为6,大学本科定义为7,硕士及以上学历定义为8,根据调查,某发达地区教育级别与月均纯收入(单位:万元)的关系如下表:
学历
初中
职中
高中
大专
本科
教育级别
3
4
5
6
7
月均纯收入
0.40
0.55
0.70
1.15
1.20
由回归分析,回归直线方程的斜率,可预测该地区具有硕士及以上学历的月平均纯收入为( )
A.1.40万元 B.1.42万元 C.1.44万元 D.1.46万元
【解答】解:设教育级别为,月均收入为,
由表可知,,,
所以,
所以关于的线性回归方程为,
而硕士及以上学历定义为8,
当时,万元.
故选:.
18.(2023春•东莞市期末)如表是某企业在2023年1月—5月的5个月内购买某品牌碳酸锂价格(单位:千元)与月份代码的统计数据.由表中数据计算得到经验回归方程为,则预测2023年8月购买该品牌碳酸锂价格约为( )
月份代码
1
2
3
4
5
碳酸锂价格
0.5
0.7
1
1.2
1.6
A.2.41千元 B.2.38千元 C.2.35千元 D.2.32千元
【解答】解:由已知得,,
回归方程必过样本中心点为,
,解得,,
则预测2023年8月购买该品牌碳酸锂价格约为千元.
故选:.
19.(2023春•越秀区期末)某外贸工厂今年的月份与订单(单位:万元)的几组对应数据如下:
月份
1
2
3
4
5
订单
20
24
36
43
52
变量,具有线性相关关系,其经验回归方程为:,则估计10月份该厂的订单数为( )
参考数据:,,
参考公式:
A.93.1 B.89.9 C.83.1 D.59.9
【解答】解:,,
,,
,
.
关于的线性回归方程为,
取,可得.
故选:.
(
考点0
5
残差分析
)
20.(2025春•深圳期末)已知变量和的统计数据如表,若由表中数据得到回归直线方程为,则时的残差为( )
4
4.5
5
5.5
6
7
6
4
2
1
A.0.2 B. C.0.4 D.
【解答】解:因为,,
则样本中心点为,
代入,可得,
所以回归直线方程为,
当时,,
所以时的残差为.
故选:.
21.(2024春•汕头期末)根据变量和的成对样本数据,用一元线性回归模型得到经验回归模型,对应的残差如图所示,模型误差( )
A.满足一元线性回归模型的所有假设
B.不满足一元线性回归模型的(e)的假设
C.不满足一元线性回归模型的(e)假设
D.不满足一元线性回归模型的(e)和(e)的假设
【解答】解:用一元线性回归模型得到经验回归模型,
根据对应的残差图,残差的均值(e)可能成立,
但明显残差的轴上方的数据更分散,(e)不满足一元线性回归模型,正确的只有.
故选:.
22.(2024春•赤坎区校级期末)已知一系列样本点,,2,3,的一个经验回归方程为,若样本点的残差为1,则( )
A. B.6 C. D.8
【解答】解:样本点的观测值为,预测值为,
则残差为,解得.
故选:.
23.(2025春•罗湖区期末)已知根据如下数据,可得到关于的经验回归方程为,则3号观测的残差(精确到为( )
编号
1
2
3
4
5
6
7
8
9
10
11
12
18.1
20.1
22.2
24.4
26.0
28.3
29.6
32.4
33.7
35.7
38.3
40.2
18.8
19.2
21.0
21.0
22.1
22.1
22.4
22.6
23.0
24.3
23.9
24.7
A.0.5 B. C.0.6 D.
【解答】解:在经验回归方程为中,取,
得,
.
号观测的残差为0.6.
故选:.
24.(2025春•深圳校级期末)某智能机器人公司从某年起7年的利润情况如表所示,关于的回归直线方程是,则该智能机器人公司第4年利润的残差是( )
第年
1
2
3
4
5
6
7
利润亿元
2.9
3.3
3.6
4.8
5.2
5.9
A.0.1亿元 B.0.2亿元 C.亿元 D.亿元
【解答】解:根据题意,,,
又关于的回归直线方程是,即,则,
当时,,
则该智能机器人公司第4年利润的残差为亿元.
故选:.
25.(2025春•广州期末)为了研究广告支出与销售额的关系,现随机抽取5家超市作为样本,得到其广告支出(单位:万元)与销售额(单位:万元)数据如下:
超市
广告支出
1
2
3
4
5
销售额
4
9
14
18
(1)当时,根据表中样本数据,计算相关系数,并推断它们的相关程度(保留两位小数);
(2)根据表中样本数据,用最小二乘法得到销售额关于广告支出的回归直线方程为,销售额的方差为52.4,求的值,并计算广告支出为5(万元)时销售额的残差;
(3)收集更多变量和的成对样本数据,由一元线性回归模型得到经验回归模型,对应的残差如图所示,则模型误差是否满足一元线性回归模型的(e)与(e)的假设(直接写出结果).
附:相关系数,回归系数,参考数据:.
【解答】解:(1),
0
1
2
1
5
7
,
,
,
相关系数,
接近于1,可以推断两个变量正线性相关,且相关性很强;
(2)因为销售额的方差52.4,
即,
因此,
化为,
解得,(舍去),
因此,
因为回归直线方程为经过样本中心点,
把代入得,
销售量关于广告支出的回归直线方程为,
当时,代入得预测值,
而观测值,因此广告支出为5(万元)时销售额度的残差:(万元);
(3)由残差图,模型误差满足一元线性回归模型的(e)的假设,
不满足一元线性回归模型的(e)的假设.
26.(2022春•东莞市期末)成对样本数据和的一元线性回归模型是,则下列四幅残差图满足一元线性回归模型中对随机误差的假定的是( )
A.
B.
C.
D.
【解答】解:根据一元线性回归模型中对随机误差的假定,残差应是均值为0,方差为的随机变量的观测值.
对于选项,残差的方差不是一个常数,随着观测时间变大而变大,故错;
对于选项,残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,故正确.
对于选项,残差与观测时间有线性关系,故错;
对于选项,残差与观测时间有非线性关系,故错;
故选:.
(
考点0
6
决定系数
)
27.(2025春•广东期末)(多选)两个具有相关关系的变量,的一组数据为,,,,,,,其经验回归方程为,记,决定系数为;若将数据调整为,,,,,,,其经验回归方程为,记,决定系数为,则
附:
A. B. C. D.
【解答】解:选项,根据题意可知,,故选项错误;
选项,的计算中,数据不变,也不变,所以不变,故选项正确;
选项,,故选项正确;
选项,由于,变成了,,
,从而,都不变,所以,故选项错误.
故选:.
28.(2025春•东莞市期末)在科技日新月异的今天,无人驾驶网约车正逐渐成为出行领域的新宠,根据统计数据显示,某区域过去5天的订单数如下:
日期(天
1
2
3
4
5
订单数(件
13
21
45
55
66
为了进一步了解订单数的变化情况,甲乙两个数学学习小组分别进行了研究,
(1)甲小组决定用线性回归模型进行拟合,求此时关于的经验回归方程;
(2)乙小组采用非线性回归模型进行拟合,求得关于的经验回归方程为,并计算出决定系数,
①根据回归模型的决定系数,说明哪个小组的模型拟合效果更好;
②用①中选择的模型预测该区域第10天的订单数(结果保留整数).附:;决定系数.
参考数据:
【解答】解:(1)由题可得,
,
所以,
,
所以关于的经验回归方程为.
(2)①由(1)知,从而有:
1
2
3
4
5
12
26
40
54
68
,
,
,
因为,从来看甲小组的线性回归模型拟合效果更好.
②当时,,
所以预测第10天的订单数为138件.
29.(2024春•东莞市期末)(多选)变量与的成对数据的散点图如图所示,由最小二乘法计算得到经验回归直线的方程为,相关系数为,决定系数为;经过残差分析确定第二个点为离群点(对应残差过大),把点对应的数据去掉后,用剩下的7组数据计算得到经验回归直线的方程为,相关系数为,决定系数为,则以下结论正确的是
A. B. C. D.
【解答】解:因为共8个点,离群点的横坐标较小,而纵坐标相对过大,
去掉离群点后回归方程的斜率更大,而截距变小,故正确,错误;
去掉离群点后相关性更强,拟合效果也更好,且还是正相关,
所以,,故正确,错误.
故选:.
30.(2023春•东莞市期末)(多选)对两组线性相关成对数据进行回归分析,得到不同的统计结果,第一组成对数据的样本相关系数、残差平方和、决定系数分别为,,,第二组成对数据的样本相关系数、残差平方和、决定系数分别为,,,则
A.若,则第一组成对数据的线性相关关系比第二组的强
B.若,则第一组成对数据的线性相关关系比第二组的强
C.若,则第二组成对数据的经验回归模型拟合效果比第一组的好
D.若,则第二组成对数据的经验回归模型拟合效果比第一组的好
【解答】解:根据题意,依次分析选项:
对于中,当,时,满足,但,则第二组成对数据的线性相关关系比第一组的强,所以错误;
对于中,若,可得,则第一组成对数据的线性相关关系比第二组的强,所以正确;
对于中,若,则第二组成对数据的经验回归模型拟合效果比第一组的好,所以正确;
对于中,若,则第一组成对数据的经验回归模型拟合效果比第二组的好,所以错误.
故选:.
(
考点0
7
线性回归方程
)
31.(2025春•广东期末)已知变量与变量线性相关,与的样本相关系数为,且由观测数据算得样本平均数,,则由该观测数据算得经验回归方程可能是( )
A. B. C. D.
【解答】解:与的样本相关系数为,
则变量与变量负相关,故错误;
选项,不经过样本中心点,故错误;
选项,经过样本中中心点,故正确.
故选:.
32.(2024秋•潮州期末)“潮州柑”是一种象征吉祥的果子,因比桔大,故俗称“大吉”,而桔与吉同音,用谐音会意法,就成了大吉.春节时候,潮州人有带“大吉”拜年的习俗,互换“大吉”,愿彼此“大吉大利”.春节将至,某水果店对“潮州柑”进行试销,得到一组销售数据,如下表所示:
试销单价(元
3
4
5
6
7
产品销量件
20
16
15
12
6
(1)经计算相关系数,变量,线性相关程度很高,求关于的经验回归方程;
(2)用(1)中所求的经验回归方程来拟合这组成对数据,当样本数据的残差的绝对值大于1.2时,称该对数据为一个“次数据”,现从这5个成对数据中任取3个做残差分析,求取到的数据中“次数据”个数的分布列和数学期望.
参考公式:线性回归方程中,的最小二乘法估计分别为,.
参考数据:.
【解答】解:(1)由已知,得,
,
,,
则,
所以,所以.
(2)当时,,当时,,
当时,;当时,;当时,,
因此该样本的残差的绝对值依次为0.2,1,1.2,1.4,1.4,
所以“次数据”有2个,所以“次数据”个数的可能取值为0,1,2.
,,
.所以的分布列为:
0
1
2
则数学期望.
33.(2024春•梅州期末)某网上购物平台为了提高某商品的的销售业绩,对该商品近5个月的月销售单价(单位:元)与月销量(单位:个)之间的数据进行了统计,得到如下表数据:
单价元
180
190
200
210
220
月销量个
57
52
42
32
27
(1)根据以往经验,与具有线性相关关系,求关于的线性回归方程;
(2)若该商品的成本为140元个,根据(1)中回归方程,求该商品月利润最大时的单价为多少元.(结果精确到1元)
参考公式:,.参考数据;,.
【解答】解:(1)由表中数据求得:,,
则,
,
故关于的回归直线方程为;
(2)设每月的总利润,
因为抛物线的对称轴方程为,
所以该商品月利润最大时的单价为196元.
34.(2025春•顺德区校级期末)某制药公司研发一种新药,需要研究某种药物成分的含量(单位:与药效指标值(单位:之间的关系,该公司研发部门进行了20次试验,统计得到一组数据,,2,,,其中,分别表示第次试验中这种药物成分的含量和相应的药效指标值,已知该组数据中与之间具有线性相关关系,且,,,,.
(1)求关于的经验回归方程;
(2)该公司要用与两套设备同时生产该种新药,已知设备的生产效率是设备的2倍,设备生产药品的不合格率为0.009,设备生产药品的不合格率为0.006,且设备与生产的药品是否合格相互独立.
①从该公司生产的新药中随机抽取一件,求所抽药品为不合格品的概率;
②在该新药产品检验中发现有三件不合格品,求其中至少有两件是设备生产的概率.
参考公式:,.
【解答】解:(1),,
所以,,所以关于的经验回归方程为.
(2)设事件表示“随机取一件药品来自设备生产”,事件表示“随机取一件药品来自设备生产”,事件表示“所抽药品为不合格品”,
①因为设备的生产效率是设备的2倍,所以,,,,
所以(C)(A)(B),
②,
所以三件不合格品中至少有两件是设备生产的概率为.
(
考点0
8
非线性回归方程
)
35.(2025春•广州期末)(多选)用模型去拟合一组数据,设,将其变换后得到线性回归方程,则
A. B. C. D.
【解答】解:已知,对其两边取自然对数,
,
又因为设,变换后得到线性回归方程,那么对比与,可得,,
由,根据对数与指数的关系等价于,可得.
故选:.
36.(2024春•肇庆期末)用模型拟合一组数据,令,将模型转化为经验回归方程,则 .
【解答】解:,
则,
令,将模型转化为经验回归方程,
则,,即,
故.
故答案为:.
37.(2024春•广州期末)近年来中国各地政府对夜间经济的扶持力度加大,夜间经济的市场发展规模稳定增长,有关部门整理了年中国夜间经济的数据,把市场发展规模记为(单位:万亿元),并把年对应的年份代码依次记为,经分析,判断可用函数模型拟合与的关系,为参数).令,计算得,,由最小二乘法得经验回归方程为,则的值为 .为判断拟合效果,通过经验回归方程求得预测值,2,,,若残差平方和,则决定系数 .
(参考公式,决定系数,参考数据:
【解答】解:,
则两边同时取对数可得,,
令,
最小二乘法得经验回归方程为,
则的值为0.159,
,
故.
故答案为:0.159;0.995.
38.(2024春•东莞市期末)某企业生产一种热销产品,产品日产量为吨,日销售额为万元(每日生产的产品当日可销售完毕),且产品价格随着产量变化而有所变化.经过一段时间的产销,随机收集了某5天的日产量,2,,(单位:吨)和日销售额,2,,(单位:万元)的统计数据,并对这5组数据做了初步处理,得到统计数据如下表:
15
73
4.8
10
161.2
1.6
39
15.9
其中,分别为数据,,,2,,的平均数.
(1)请从样本相关系数的角度,判断与哪一个模型更适合刻画日销售额关于日产量的关系?
(2)根据(1)的结果解决下列问题:
建立关于的经验回归方程(斜率的结果四舍五入保留整数);
如果日产量(单位:吨)与日生产总成本(单位:万元)满足关系,根据中建立的经验回归方程估计日产量为何值时,日利润最大?
附:①相关系数;
②经验回归方程的斜率和截距的最小二乘法公式分别为:;
③参考数据:.
【解答】解:(1)设与这两个模型对应的相关系数分别为,,
则,
,
所以,
故更适合刻画日销售额关于日产量的关系.
(2)设,则,
由表中数据知,,,
所以,,
所以,
故关于的经验回归方程为.
日利润,
所以,
当时,,单调递增;
当时,,单调递减,
所以是函数在定义域内的唯一极大值点,也是最大值点,
故估计日产量吨时,日利润最大.
39.(2023春•肇庆期末)为进一步加强城市建设和产业集聚效应,某市通过“两化”中的信息化和工业化之间的完美交融结合,达到了经济效益的“倍增式”发展.该市某高科技企业对某核心技术加大研发投资力度,持续构建面向未来的竞争力.现得到一组在该技术研发投入(单位:亿元)与收益(单位:亿元)的数据如表所示:
研发投入
3
6
8
10
14
17
22
32
收益
43
52
60
71
74
81
89
98
(1)已知可用一元线性回归模型模型拟合与的关系,求此经验回归方程;(附:对于一组数据,,,,,,,其经验回归直线的斜率和截距的最小二乘法估计公式分别为,,,,结果保留两位小数)
(2)该企业主要生产、类产品,现随机抽取类产品2件、类产品1件进行质量检验,已知类、类产品独立检验为合格品的概率分别为,,求在恰有2件产品为合格品的条件下,类产品为合格品的概率.
【解答】解:(1),
,
,
,
所以关于的经验回归方程为.
(2)记“恰有2件产品为合格品”为事件,“类产品为合格品”为事件,
则,
,
由条件概率的计算公式得,
故在恰有2件产品为合格品的条件下,类产品为合格品的概率为.
40.(2024春•肇庆校级期末)广东省深圳市是全国七大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示:
令,2,,,数据经过初步处理得:
44
4.8
10
40.3
1.612
19.5
8.06
现有①和②两种方案作为年销售量关于年广告费的回归分析模型,其中,,,均为常数.
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(不能整除的相关系数保留2位小数)
(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出关于的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少?
附:①相关系数,回归直线中公式分别为,
②参考数据:,,,.
【解答】解:(1)令,则,
设模型①和②的相关系数分别为,.
由题意可得:,
,
所以,由相关系数的相关性质可得,模型②的拟合程度更好;
(2)由条件得:,
又由,,
得,
所以,即回归方程为,
当时,,
因此当年广告费为6(百万元)时,产品的销售量大概是13(百万辆).
41.(2023春•深圳校级期末)放行准点率是衡量机场运行效率和服务质量的重要指标之一.某机场自2012年起采取相关策略优化各个服务环节,运行效率不断提升.以下是根据近10年年份数与该机场飞往地航班放行准点率,2,,(单位:百分比)的统计数据所作的散点图及经过初步处理后得到的一些统计量的值.
2017.5
80.4
1.5
40703145.0
1621254.2
27.7
1226.8
其中,
(1)根据散点图判断,与哪一个适宜作为该机场飞往地航班放行准点率关于年份数的经验回归方程类型(给出判断即可,不必说明理由),并根据表中数据建立经验回归方程,由此预测2023年该机场飞往地的航班放行准点率.
(2)已知2023年该机场飞往地、地和其他地区的航班比例分别为0.2、0.2和0.6.若以(1)中的预测值作为2023年该机场飞往地航班放行准点率的估计值,且2023年该机场飞往地及其他地区(不包含、两地)航班放行准点率的估计值分别为和,试解决以下问题:
现从2023年在该机场起飞的航班中随机抽取一个,求该航班准点放行的概率;
若2023年某航班在该机场准点放行,判断该航班飞往地、地、其他地区等三种情况中的哪种情况的可能性最大,说明你的理由.
附:(1)对于一组数据,,,,,,,其回归直线的斜率和截距的最小二乘估计分别为,
参考数据:,,.
【解答】解:(1)由散点图判断适宜作为该机场飞往地航班放行准点率关于年份数的经验回归方程类型.
令,先建立关于的线性回归方程.
由于,,
该机场飞往地航班放行准点率关于的线性回归方程为,
因此关于年份数的回归方程为
所以当时,该机场飞往地航班放行准点率的预报值为.
所以2023年该机场飞往地航班放行准点率的预报值为.
(2)设 “该航班飞往地”, “该航班飞往地”, “该航班飞往其他地区”, “该航班准点放行”,
则,,,,,.
由全概率公式得,(C),
所以该航班准点放行的概率为0.778.
,,,
因为,
所以可判断该航班飞往其他地区的可能性最大.
(
考点0
9
独立性检验概念辨析
)
42.(2025春•湛江期末)某机构为研究高血压与高盐饮食是否有关系进行了一次调查,根据独立性检验的原理,有的把握但没有的把握认为高血压与高盐饮食有关,则的观测值不可能为( )
附:,,.
A.3.622 B.4.502 C.5.921 D.6.634
【解答】解:因为有的把握但没有的把握认为高血压与高盐饮食有关,
所以,
所以的观测值不可能3.622.
故选:.
43.(2025春•深圳期末)某工厂为研究新、旧两条产线与产品质量的关系,随机抽取200件产品进行检验,得到如下列联表,则下列说法正确的是( )
优质品
非优质品
合计
新产线
75
25
100
旧产线
60
40
100
合计
135
65
200
附:
0.050
0.010
0.001
3.841
6.635
10.828
A.有的把握认为新、旧两条产线的产品质量有差异
B.有的把握认为新、旧两条产线的产品质量有差异
C.根据小概率值的独立性检验,我们认为新、旧两条产线的产品质量没有差异
D.根据小概率值的独立性检验,我们认为新、旧两条产线的产品质量有差异,该推断犯错误的概率不超过0.001
【解答】解:根据题意,设新、旧两条产线的产品质量没有差异,
由题意可得,
则有的把握认为新、旧两条产线的产品质量有差异.
故选:.
44.(2025春•广州期末)根据分类变量与的成对样本数据,计算得到.已知,依据的独立性检验,结论为( )
A.变量与独立
B.变量与独立,这个结论犯错误的概率不超过0.005
C.变量与不独立
D.变量与不独立,这个结论犯错误的概率不超过0.005
【解答】解:,因此“认为与独立”的结论犯错误的概率不超过0.005.
故选:.
45.(2025春•广州期末)为了解性别(变量与体育锻炼(变量是否有关,采取简单随机抽样的方法抽取50名学生,得到成对样本观测数据的分类统计结果,如表所示(单位:人),根据数据计算,并依据小概率值的独立性检验,附:,,下列结论不正确的是( )
锻炼
合计
不经常
经常
女生
15
5
20
男生
10
合计
25
25
50
A.
B.若从这50人中随机抽取1人,则经常锻炼的概率为
C.变量与变量独立,此推断犯错误的概率不超过0.005
D.变量与变量不独立,此推断犯错误的概率不超过0.005
【解答】解:对于选项,,正确;
对于选项,若从这50人中随机抽取1人,则经常锻炼的概率为,正确;
对于选项,,,
故变量与变量不独立,此推断犯错误的概率不超过0.005,错误,正确.
故选:.
46.(2024春•汕头期末)通过随机询问某中学110名学生是否爱好跳绳,得到如下列联表.已知,,根据小概率值的独立性检验,以下结论正确的是( )
跳绳
性别
合计
男
女
爱好
40
20
60
不爱好
20
30
50
合计
60
50
110
A.爱好跳绳与性别有关
B.爱好跳绳与性别有关,这个结论犯错误的概率不超过0.001
C.爱好跳绳与性别无关
D.爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001
【解答】解:由列联表中数据可得,
故爱好跳绳与性别无关.
故选:.
47.(2024春•湛江期末)某学校对本校学生的课外阅读进行抽样调查,抽取25名女生,25名男生调查,结果形成以下列联表,通过数据分析,认为喜欢课外阅读与学生性别之间( )
喜欢课外阅读
不喜欢课外阅读
合计
男生
5
20
25
女生
15
10
25
合计
20
30
50
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
A.不能根据小概率的的独立性检验认为两者有关
B.根据小概率的的独立性检验认为两者有关
C.根据小概率的的独立性检验认为两者有关
D.根据小概率的的独立性检验认为两者无关
【解答】解:由数表知,,
而,
所以根据小概率值的独立性检验认为两者有关.
故选:.
48.(2023春•中山市期末)某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用列联表进行独立性检验.经计算,则所得到的统计学结论是:有 的把握认为“学生性别与支持该活动有系”
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
A. B. C. D.
【解答】解:因为,
对照表格:,
因为,
所以有把握认为“学生性别与是否支持该活动有关系”.
故选:.
49.(2023春•天河区期末)某校高二年级羽毛球社团为了解喜欢羽毛球运动是否与性别有关,随机在高二年级抽取了若干人进行调查.已知抽取的女生人数是男生人数的3倍,其中女生喜爱羽毛球运动的人数占女生人数的,男生喜爱羽毛球运动的人数占男生人数的.若本次调查得出“在犯错误的概率不超过0.05的前提下,认为喜爱羽毛球运动与性别有关”的结论,则被调查的男生至少有( )
参考公式及数据:
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.35人 B.32人 C.31人 D.30人
【解答】解:设抽取的男生人数为,由题意可得列联表如下表:
男性
女性
合计
喜爱羽毛球
不喜爱羽毛球
合计
,
因为本次调查得出“在犯错误的概率不超过0.05的前提下认为喜爱足球与性别有关”的结论,
所以有,即,解得,
又因为上述列联表中的所有数字均为整数,最小为35.
故选:.
(
考点
10
卡方计算
)
50.(2024春•中山市期末)为了解某一地区新能源电动汽车销售情况,一机构根据统计数据,用最小二乘法得到电动汽车销量(单位:万台)关于(年份)的线性回归方程,且销量的方差为,年份的方差为.
(1)求与的相关系数,并据此判断电动汽车销量与年份的线性相关性的强弱.
(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
性别
购买非电动汽车
购买电动汽车
总计
男性
39
6
45
女性
30
15
45
总计
69
21
90
依据小概率值的独立性检验,能否认为购买电动汽车与车主性别有关?
①参考数据:.
②参考公式:线性回归方程为,其中,;相关系数,若,则可判断与线性相关较强;,其中.附表:
0.10
0.05
0.010
0.001
2.706
3.841
6.635
10.828
【解答】解:(1)由,得,
由,得,
因为线性回归方程,所以,
即,
因此相关系数
,
所以电动汽车销量与年份的线性相关性的较强.
(2)零假设:购买电动汽车与车主性别无关,由表中数据得:,
依据小概率值的独立性检验,推断不成立,即认为购买电动汽车与车主性别有关,此推断犯错误的概率不大于0.05.
51.(2025春•清远期末)在研究某类杨树的树高与胸径(树的主干在地面以上处的直径)之间的关系时,某研究员收集的一些数据如表1所示.
(1)由表1数据,求胸径与树高的平均值;(胸径精确到,树高精确到
(2)根据这些数据,可建立该类杨树树高(单位:关于胸径(单位:的一元线性回归模型为,用(1)中结果求的值并估计胸径为的该类杨树的树高;(精确到
(3)若这12棵杨树树龄相同,分别种植于南坡和北坡,且成材情况如表2所示,根据的独立性检验,能否认为树龄相同的这类杨树是否成材与种植位置有关联?
编号
1
2
3
4
5
6
胸径
18.1
20.1
22.2
24.4
26.0
28.3
树高
18.8
19.2
21.0
21.0
22.1
22.1
编号
7
8
9
10
11
12
胸径
29.6
32.4
33.7
35.7
38.3
40.2
树高
22.4
22.6
23.0
24.3
23.9
24.7
表1
种植位置
成材情况
合计
成材
未成材
南坡
5
1
6
北坡
2
4
6
合计
7
5
12
表2
参考公式及数据:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
【解答】解:(1)根据题意可知,研究某类杨树的树高与胸径之间的关系时,
,
;
(2),
,
,
当时,,
即估计胸径为的该类杨树的树高为;
(3)零假设为:树龄相同的这类杨树是否成材与种植位置无关联,
根据列联表中的数据,则,
根据的独立性检验,我们推断不成立,
即认为树龄相同的这类杨树是否成材与种植位置有关联,此推断错误的概率不大于0.1.
52.(2025春•广东校级期末)民航招飞是指普通高校飞行技术专业通过高考招收飞行学生.对某校高三在校学生进行统计,得到如下列联表:
有报名意向
没有报名意向
合计
男学生
70
150
女学生
80
100
180
合计
250
400
(1)求,;
(2)记该校高三女学生有报名意向的概率为,求出值;
(3)是否有的把握认为该校高三在校学生是否有报名意向与性别有关?
附:,其中.
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【解答】解:(1)由列联表知:,;
(2)由列联表知:女学生共计180人,其中有报名意向的有80人,所以
该校高三女学生有报名意向的概率为;
(3)由列联表知:,
所以有的把握认为该校高三在校学生是否有报名意向与性别有关.
53.(2025春•云浮期末)某工厂生产了两批次某种产品,现从这两批次产品中共抽取800件进行检测,其中第一批次的产品占了检测数据如下,第一批次的次品件数与第二批次的次品件数相同,在合格品中,第二批次的合格品占了.
(1)根据题中信息,完成下面列联表;
单位:件
生产批次
产品检测结果
合计
次品
合格品
第一批次
第二批次
合计
800
(2)根据小概率值的独立性检验,能否认为产品检测结果与生产批次有关联?
附:.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
【解答】解:(1)由题意可知,从第一批次的产品中抽取了件,
从第二批次的产品中抽取了件,
设第二批次的合格品有件,则第一批次的合格品有件,
故,
解得,
即第二批次的合格品有400件,第一批次的合格品有240件,
补全列联表如下:
生产批次
产品检测结果
合计
次品
合格品
第一批次
80
240
320
第二批次
80
400
480
合计
160
640
800
(2)零假设:产品检测结果与生产批次没有关联,
由,
根据小概率值的独立性检验,我们推断不成立,
即产品检测结果与生产批次有关联,此推断犯错误的概率不大于0.005.
54.(2025春•龙岗区校级期末)某学习小组为了研究性别与近视之间是否有关联,在年级随机选取了30人,得到如下列联表:
性别
近视
合计
不近视
近视
男
5
17
22
女
2
6
8
合计
7
23
30
(1)在样本中的8名女生中随机选取2人,求这2人中至少有1人是近视的概率;
(2)小组成员甲通过计算发现女生的近视率为小于男生的近视率,所以甲认为男生更容易近视.请根据小概率值的独立性检验,分析甲的说法是否正确?
0.1
0.05
0.01
2.706
3.841
6.635
【解答】解:(1)根据题意可知,8名女生中,有6名近视,2名不近视,设为近视的人数,
则,
所以这2人中至少一个是近视的概率为;
(2)零假设:性别与是否近视无关,
根据列联表数据,计算得,
根据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为性别与是否近视无关,甲同学的说法不正确.
55.(2025春•新会区校级期末)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表.
机床
品级
合计
一级品
二级品
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)依据小概率值的独立性检验,分析甲机床的产品质量是否与乙机床的产品质量有差异.
附:.
0.050
0.010
0.001
3.841
6.635
10.828
【解答】解:(1)甲机床生产的产品中一级品的频率为;
乙机床生产的产品中一级品的频率为.
(2)设:甲机床的产品质量与乙机床的产品质量无差异,
因为,
所以依据小概率值的独立性检验可得不成立,
即甲机床的产品质量与乙机床的产品质量有差异.
56.(2025春•江门校级期末)某工厂进行生产线智能化升级改造,对甲、乙两个车间升级改造后,(1)从该工厂甲、乙两个车间的产品中各随机抽取50件进行检验,其中甲车间优等品占,乙车间优等品占,请填写如下列联表:
优等品
非优等品
总计
甲车间
乙车间
总计
依据小概率值的独立性检验,能否认为车间与优等品有关联?(结果精确到,其中.
下表是独立性检验中几个常用的小概率值和相应的临界值.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
(2)调查了近10个月的产量(单位:万个)和月销售额(单位:万元),得到以下数据:,根据散点图认为关于的经验回归方程为,试求经验回归方程.
参考公式:,其中
【解答】解:(1)根据题意:从该工厂甲、乙两个车间的产品中各随机抽取50件进行检验,共抽取100件产品,
而甲车间优等品占,乙车间优等品占,可得列联表如下:
优等品
非优等品
总计
甲车间
40
10
50
乙车间
30
20
50
总计
70
30
100
设:车间与优等品无关,
则,
根据小概率值的独立性检验,能在犯错误的概率不超过0.05的情况下,认为两车间的优等品有差异.
(2)根据题意,,,
又因为,,
故,
所以经验回归方程为.
57.(2022春•广州期末)在“双减”政策背景之下,某校就推进学校、家庭、社会体育教育的“一体化”,实现“教会、勤练、常赛”的核心任务.学校组织人员对在校学生“是否喜爱运动”做了一次随机调查.共随机调查了18名男生和12名女生,调查发现,男、女生中分别有12人和6人喜爱运动,其余不喜爱.
(1)根据以上数据完成以下列联表:
喜欢运动
不喜欢运动
总计
男
女
总计
根据小概率值的独立性检验,能否据此推断性别与喜爱运动有关?
(2)从被调查的女生中抽取3人,若其中喜爱运动的人数为,求的分布列.
附参考公式及参考数据:,其中.
0.40
0.25
0.10
0.010
0.708
1.323
2.706
6.635
【解答】解:(1)根据题意,补全列联表如下:
喜欢运动
不喜欢运动
总计
男
12
6
18
女
6
6
12
总计
18
12
30
:假设是否喜爱运算与性别无关,
,
根据小概率值的独立性检验,没有充分的把握判断喜爱运动与性别有关.
(2)由题意可知,的所有可能取值为0,1,2,3,
,,,,
的分布列为:
0
1
2
3
58.(2024春•广州期末)某单位拟实行新的员工考勤管理方案.方案起草后,为了解员工对新方案是否满意,随机选取150名男员工和150名女员工进行问卷调查,结果如下:300名员工中有15名员工对新考勤管理方案不满意,其中男3人,女12人.
(1)完成如下列联表:
单位:人
性别
满意
合计
是
否
男
女
合计
根据的独立性检验,能否认为性别与对新考勤管理方案满意有关联?
(2)为了得到被调查者对所提问题的诚实回答,消除被调查者对于敏感问题的顾虑,决定调整调查方案.新的调查方案中使用两个问题:
①你公历生日是奇数吗?
②你对新考勤管理方案是否满意?
先让被调查者从装有4个红球,6个黑球(除颜色外,完全相同)的袋子中随机摸取两个球(摸出的球再放回袋中).摸到两球同色的员工如实回答第一个问题,摸到两球异色的员工如实回答第二个问题.问卷上没有问题,答题者只需选择“是”或者“否”.由于回答的是哪个问题是别人不知道的,因此被调查者可以毫无顾虑的诚实回答.
根据以上调查方案,求某个被调查者回答第一个问题的概率;
如果300人中共有206人回答“是”,请估计对新考勤管理方案满意的员工所占的百分比.(每个员工公历生日是奇数的概率取为
0.05
0.025
0.005
3.841
5.024
7.879
附:.
【解答】解:(1)列联表如下:
性别
满意
合计
是
否
男
147
3
150
女
138
12
150
合计
285
15
300
零假设为:性别与对新方案满意度独立,
根据列联表中数据经计算得,
根据小概率值的独立性检验,我们推断不成立,
即认为性别与新考勤管理方案满意有关联,此推断犯错误的概率不大于0.025.
(2)设某个被调查者回答第一个问题为事件,即被调查者摸到两个球的颜色相同,
由题意得,
所以某个被调查者回答第一个问题的概率为.
回答第一个问题约有人,则回答第二个问题约有人,
由题意可知公历生日是奇数的概率是,
所以回答第一个问题,选择“是”的员工人数约为人,
则回答第二个问题,选择“是”的员工人数约为人,
因为,
所以对新考勤管理方案满意的员工所占百分比大约为.
59.(2024春•东莞市期末)某社区以网上调查问卷形式对辖区内部分居民做了体育锻炼的宣传和调查.调查数据如下:共100份有效问卷,50名男性中有5名不经常体育锻炼,50名女性中有10名不经常体育锻炼.
(1)根据所给数据,完成下面的列联表:根据小概率值的独立性检验,分析性别因素是否会影响经常体育锻炼?
性别
经常体育锻炼与否
合计
经常体育锻炼
不经常体育锻炼
男
女
合计
(2)从不经常体育锻炼的15份调查问卷中得到不经常锻炼的原因:有3份身体原因;有2份不想锻炼;有4份没有时间;有6份没有运动伙伴.求从这15份问卷中随机选出2份,在已知其中一份是“没有时间”的条件下,另一份是“没有运动伙伴”的概率.
附:①,其中.
②临界值表
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【解答】解:(1)由题可得,50名男性中有5名不经常体育锻炼,45名经常体育锻炼,
50名女性中有10名不经常体育锻炼,40名经常体育锻炼,
列联表如下:
性别
经常体育锻炼与否
合计
经常体育锻炼
不经常体育锻炼
男
45
5
50
女
40
10
50
合计
85
15
100
零假设:性别因素不会影响经常体育锻炼,
所以,
因为,
根据小概率值的独立性检验,我们推断成立,即没有充分证据推断性别因素会影响经常体育锻炼;
(2)设事件为其中一份是“没有时间”, 事件为另一份是“没有运动伙伴”,
则,,
所以.
60.(2024春•佛山期末)高考招生制度改革后,我省实行“”模式,“3”为语文、数学、外语3门统一科目,“1”为考生在物理、历史两门科目中选择1门作为首选科目,“2”为考生在思想政治、地理、化学、生物学4门科目中选择2门作为再选科目.有人认为高考选考科目的确定与性别有关,为此,某教育机构随机调查了一所学校的名学生,其中男生占调查人数的,已知男生有的人选了物理,而女生有的人选物理.
(1)完成下列列联表:
物理
历史
总计
男生
女生
总计
(2)若在犯错误的概率不超过0.01的前提下,可认为“性别与选科有关”,那么本次被调查的人数至少有多少?
(3)从物理类考生和历史类考生中各抽取1人,若抽取的2人性别恰好相同,求这2人是女生的概率.
附:
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
【解答】解:(1)依题意得,被调查的男生人数为,其中有的男生选物理;
被调查的女生人数为,其中有的女生选物理;
则列联表如下:
物理
历史
总计
男生
女生
总计
(2)由列联表数据,得,
要使在犯错误的概率不超过0.01的前提下,可认为“性别与选科有关”,
则,解得,
且,所以,
即本次被调查的人数至少是120.
(3)设事件表示“2人性别恰好相同”,
事件表示“2人性别相同且是女生”,
事件包含的基本事件数为,
事件含的基本事件数为,
所求的条件概率为.
1 / 8
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。