第八章 成对数据的统计分析全章综合测试卷-2024-2025学年高二数学春季讲义(人教A版2019选择性必修第二、三册)
2025-04-24
|
2份
|
27页
|
243人阅读
|
16人下载
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 小结 |
| 类型 | 作业-单元卷 |
| 知识点 | 统计案例 |
| 使用场景 | 同步教学-单元练习 |
| 学年 | 2025-2026 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 1.07 MB |
| 发布时间 | 2025-04-24 |
| 更新时间 | 2025-04-24 |
| 作者 | 吴老师工作室 |
| 品牌系列 | - |
| 审核时间 | 2025-04-24 |
| 下载链接 | https://m.zxxk.com/soft/51790501.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
第八章 成对数据的统计分析全章综合测试卷
【人教A版2019】
考试时间:120分钟;满分:150分
姓名:___________班级:___________考号:___________
考卷信息:
本卷试题共19题,单选8题,多选3题,填空3题,解答5题,满分150分,限时120分钟,本卷题型针对性
较高,覆盖面广,选题有深度,可衡量学生掌握本章内容的具体情况!
第I卷(选择题)
一、单项选择题:本题共8小题,每小题5分,共40分,在每小题给出的四个选项中,只有一项是符合要求的。
1.(5分)(24-25高二下·辽宁辽阳·阶段练习)下列说法中,正确的个数是( )
①回归直线至少经过一个样本点;
②可以用相关系数刻画两个变量的相关程度强弱,值越大两个变量的相关程度越强;
③残差图中,残差点所在的水平带状区域越窄,则回归方程的预报精确度越高;
④根据分类变量X与Y的成对样本数据,计算得到,根据小概率值的独立性检验(),可判断X与Y有关联,此推断犯错误的概率不超过.
A.1 B.2 C.3 D.4
2.(5分)(24-25高二下·江西上饶·阶段练习)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
3.(5分)(24-25高二下·河南驻马店·阶段练习)已知随机变量X,Y的组样本观测值都落在经验回归直线上,则随机变量X,Y的样本相关系数为( )
A. B. C.1 D.
4.(5分)(24-25高二下·江苏·课后作业)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
5.(5分)(2025·上海浦东新·二模)研究变量,得到一组成对数据,先进行一次线性回归分析,接着增加一个数据,其中,,再重新进行一次线性回归分析,则下列说法正确的是( )
A.变量与变量的相关性变强 B.相关系数的绝对值变小
C.线性回归方程不变 D.拟合误差变大
6.(5分)(24-25高二下·河南驻马店·阶段练习)某网店经销某商品,为了解该商品的月销量(单位:千件)与售价(单位:元/件)之间的关系,收集5组数据进行了初步处理,得到如下数表:
根据表中的数据可得回归直线方程,以下说法正确的是( )
A.,具有负相关关系,相关系数
B.每增加一个单位,平均减少个单位
C.第二个样本点对应的残差
D.第三个样本点对应的残差
7.(5分)(24-25高二下·全国·课后作业)为了更好地开展多媒体化教学,杭州市某小学对“文理学科教师与喜欢用平板教学”是否有关做了一次研究调查,其中被调查的文科、理科教师人数相同,理科教师喜欢用平板教学的人数占理科教师总人数的80%,文科教师喜欢用平板教学的人数占文科教师总人数的40%,若有95%的把握认为是否喜欢用平板教学和文理学科有关,则调查人数中理科教师人数最少可能是( )
附:,其中.
0.05
0.010
3.841
6.635
A.8 B.12 C.15 D.20
8.(5分)(23-24高二下·江苏南京·阶段练习)为了研究关于的线性相关关系,收集了组样本数据(见下表):
若已求得一元线性回归方程为,则下列选项中正确的是( )
(其中相关系数)
A.
B.当时,的预测值为
C.样本数据的第40百分位数为
D.去掉样本点后,与的样本相关系数不会改变
二、多项选择题:本题共3小题,每小题6分,共18分,在每小题给出的四个选项中,有多项符合题目的要求,全部选对的得6分,部分选对的得部分分,有选错的得0分。
9.(6分)(24-25高二下·全国·课后作业)记变量与相对应的一组数据的样本相关系数为,变量与相对应的一组数据的样本相关系数为,则( )
A.当与不相关
B.当与呈函数关系
C.当与的相关性强于与的相关性
D.当与的相关性强弱等于与的相关性
10.(6分)(24-25高二下·辽宁丹东·期中)为了解产假时长对生育意愿的影响,某调查机构随机抽取了一批有生育二胎能力的适龄家庭进行问卷调查,得到如下数据:
产假时长周
14
15
16
17
18
有生育意愿的家庭数户
4
8
16
20
26
该组数据中变量与之间的关系可以用线性回归模型拟合,则下列说法正确的是( )
A.变量与正相关
B.
C.若产假时长为20周,则估计有37户家庭有生育意愿
D.样本数据的残差为
11.(6分)(24-25高二下·吉林长春·阶段练习)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据.从该地的人群中任选一人,设A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.则下列选项正确的是( )
不够良好
良好
病例组
40
60
对照组
10
90
附:,
0.050
0.010
0.001
3.841
6.635
10.828
A.依据的独立性检验,可推断患该疾病群体与未患该疾病群体的卫生习惯有差异
B.利用该调查数据,可得到的估计值为0.4,的估计值为0.1
C..
D.利用该调查数据,可得到R的估计值为5
第II卷(非选择题)
三、填空题:本题共3小题,每小题5分,共15分。
12.(5分)(24-25高二下·全国·课后作业)某企业不断扩大规模,提高经营收入.统计得到该企业2018-2022年产值(单位:亿元)与企业员工数(单位:千人)之间的数据如下:
年份
2018
2019
2020
2021
2022
千人
1
2
3
4
5
亿元
5
8
10
24
28
从表中数据可知与呈线性相关,根据这5年的数据计算与的相关系数 (保留三位小数).
附:.
13.(5分)(24-25高二下·全国·课后作业)近几年,我国新能源汽车产业进入了加速发展的阶段,呈现市场规模、发展质量“双提升”的良好局面.新能源汽车的核心部件是动力电池,其中的主要成分是碳酸锂.下表是某地2023年3月1日至2023年3月5日电池级碳酸锂的价格与日期的统计数据:
日期代码
1
2
3
4
5
电池级碳酸锂价格(十万元/吨)
4.1
3.9
3.8
3.9
根据表中数据,得出关于的经验回归方程为,根据数据计算出在样本中心点处的残差为,则决定系数的值为 (结果保留两位小数).
14.(5分)(23-24高二下·湖南长沙·期中)随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据(,)
支持
不支持
男生
女生
若通过计算得,根据小概率值的独立性检验,认为支持增加中学生体育锻炼时间的政策与性别有关,则在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为 .
附:,其中.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
四、解答题:本题共5小题,共77分,解答应写出必要的文字说明、证明过程及验算步骤。
15.(13分)(24-25高二下·全国·课后作业)党的二十大报告指出绿水青山就是金山银山.某市为加快生态文明建设进程,加大生态环境保护投入力度,为祖国现代化建设增砖添瓦.现统计了该市近几年的生态环境保护投入资金,统计如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号x
1
2
3
4
5
6
投入资金y/千万
14
31
33
38
41
47
(1)根据上表作出散点图;
(2)观察散点图,判断投入资金y与年份编号x是否具有相关性.如果有,是正相关还是负相关.
16.(15分)(24-25高二下·浙江·期中)随着电商事业的快速发展,网络购物交易额也快速提升,某网上交易平台工作人员对2020年至2024年每年的交易额(取近似值)进行统计分析,结果如下表:
年份
2020
2021
2022
2023
2024
年份代码
1
2
3
4
5
交易额(单位:百亿)
1.5
2
3.5
8
15
(1)据上表数据,计算与的相关系数(精确到0.01),并说明与的线性相关性的强弱;(若,则认为与线性相关性很强;若,则认为与线性相关性一般;若,则认为与线性相关性较弱.)
(2)利用最小二乘法建立关于的线性回归方程,并预测2025年该平台的交易额.
参考数据:,,
参考公式:相关系数;
线性回归方程中,斜率和纵截距的最小二乘估计分别为,.
17.(15分)(2025·山东聊城·一模)某学校为了调动学生学习数学的积极性,在高二年级举行了一次数学有奖竞赛,对考试成绩优秀(即考试成绩不小于分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组的频数为.
(1)求的值和样本容量;
(2)估计所有参赛学生的平均成绩;
(3)假设在抽取的样本中,男生比女生多人,女生的获奖率为,填写下列列联表,并依据小概率值的独立性检验,判断男生与女生的获奖情况是否存在差异?
性别
奖励
合计
获奖
未获奖
男
女
合计
附:,
18.(17分)(23-24高二下·山东烟台·期末)某高中在高二年级举办创新作文比赛活动,满分100分,得分80及以上者获奖.为了解学生获奖情况与选修阅读课程之间的关系,在参赛选手中随机选取了50名学生作为样本,各分数段学生人数及其选修阅读课程情况统计如下:
成绩
学生人数
6
10
24
7
3
选修读课程人数
0
3
9
4
4
(1)根据以上统计数据完成下面的列联表,依据的独立性检验,能否认为学生获奖与选修阅读课程有关联;
获奖
没有获奖
合计
选修阅读课程
不选阅读课程
合计
(2)在上述样本的获奖学生中随机抽取3名学生,设3人中选修阅读课程人数为,求的分布列及数学期望.
参考公式:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
19.(17分)(24-25高二下·广西柳州·期中)近期根据中国消费者信息研究报告显示,超过40%的消费者更加频繁地使用网上购物,某网购专营店统计了2025年1月5日到9日这5天到该专营店购物的人数y和时间第x天间的数据,列表如下:
x
1
2
3
4
5
y
75
84
93
98
100
(1)由表中给出的数据判断是否可以用线性回归模型拟合人数y和时间第x天之间的关系?若可用,求出y关于x的经验回归方程,并估计1月10日到该专营店购物的人数;若不可用,请说明理由(人数用四舍五入法取整数,若相关系数,则线性相关程度很高,可以用线性回归模型拟合,r精确到0.01);
(2)该专营店为了吸引顾客,推出两种促销方案.方案一:购物金额每满100元可减5元;方案二:一次性购物金额超过800元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打9折,中奖两次打8折,中奖三次打6折.某顾客计划在此专营店购买1000元的商品,请从实际付款金额的数学期望的角度分析选哪种方案更优惠.
参考数据:.,,
附:相关系数,,
第 1 页 共 12 页
学科网(北京)股份有限公司
$$
第八章 成对数据的统计分析全章综合测试卷
参考答案与试题解析
第I卷(选择题)
一、单项选择题:本题共8小题,每小题5分,共40分,在每小题给出的四个选项中,只有一项是符合要求的。
1.(5分)(24-25高二下·辽宁辽阳·阶段练习)下列说法中,正确的个数是( )
①回归直线至少经过一个样本点;
②可以用相关系数刻画两个变量的相关程度强弱,值越大两个变量的相关程度越强;
③残差图中,残差点所在的水平带状区域越窄,则回归方程的预报精确度越高;
④根据分类变量X与Y的成对样本数据,计算得到,根据小概率值的独立性检验(),可判断X与Y有关联,此推断犯错误的概率不超过.
A.1 B.2 C.3 D.4
【解题思路】根据线性回归方程和相关系数及残差分析、独立性检验逐个判断正误.
【解答过程】线性回归方程可以不经过任何一个样本点,①错,
值越大则两个变量的相关程度越强,②错,
残差图中残差点所在的水平带状区域越窄,则回归方程的预报精确度越高,③对.
因为,所以可判断与有关且犯错误的概率不超过0.05,④正确.
故选:B.
2.(5分)(24-25高二下·江西上饶·阶段练习)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
【解题思路】根据相关系数的概念即可判断.
【解答过程】由图可知图(1)和图(3)是正相关,故相关系数为正,又因为图(1)的点较图(3)的点分布密集,故相关性图(1)更好,相关系数较大,即;
图(2)和图(4)是负相关,故相关系数为负,又因为图(2)的点较图(4)的点分布密集,故相关性图(2)更好,相关系数的绝对值较大,即,故;
综上可知:,
故选:A.
3.(5分)(24-25高二下·河南驻马店·阶段练习)已知随机变量X,Y的组样本观测值都落在经验回归直线上,则随机变量X,Y的样本相关系数为( )
A. B. C.1 D.
【解题思路】根据线性相关系数的意义分析求解即可.
【解答过程】因为样本观测值都在直线上,
则线性相关性最强,可知,
且,可知随机变量X,Y满足负相关,所以样本相关系数为.
故选:D.
4.(5分)(24-25高二下·江苏·课后作业)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀,得到列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.列联表中c的值为20,b的值为50
D.由列联表可看出成绩与班级有关系
【解题思路】根据成绩优秀的概率求得,进而求得,结合比例判断出正确答案.
【解答过程】依题意,解得,由解得.
补全列联表如下:
优秀
非优秀
总计
甲班
乙班
总计
105
甲班的优秀率为,乙班的优秀率为,
,所以成绩与班级有关.所以D选项正确,ABC选项错误.
故选:D.
5.(5分)(2025·上海浦东新·二模)研究变量,得到一组成对数据,先进行一次线性回归分析,接着增加一个数据,其中,,再重新进行一次线性回归分析,则下列说法正确的是( )
A.变量与变量的相关性变强 B.相关系数的绝对值变小
C.线性回归方程不变 D.拟合误差变大
【解题思路】设变量,的平均数分别为,,分析可知,.对于AB:根据相关系数的计算公式和性质分析判断;对于CD:根据回归方程和拟合误差的性质分析判断.
【解答过程】设变量,的平均数分别为,,
则,,即,,
可知新数据的样本中心点不变,仍为,
对于AB:可得,
同理可得,
则相关系数,
可知相关系数的值不变,变量与变量的相关性不变,故AB错误;
对于C:因为,且线性回归方程过样本中心点,
即均不变,所以线性回归方程不变,故C正确;
因为即为样本中心点,即,
可知残差平方和不变,
所以拟合误差不变,故D错误;
故选:C.
6.(5分)(24-25高二下·河南驻马店·阶段练习)某网店经销某商品,为了解该商品的月销量(单位:千件)与售价(单位:元/件)之间的关系,收集5组数据进行了初步处理,得到如下数表:
根据表中的数据可得回归直线方程,以下说法正确的是( )
A.,具有负相关关系,相关系数
B.每增加一个单位,平均减少个单位
C.第二个样本点对应的残差
D.第三个样本点对应的残差
【解题思路】根据相关系数的绝对值不超过1可得选项A错误;根据回归直线方程可得选项B错误;根据残差的概念可得选项C正确,选项D错误.
【解答过程】A.相关系数的绝对值不超过1,A错误;
B.由回归直线方程知,每增加一个单位,平均减少个单位,B错误;
C.第二个样本点对应的残差,C正确;
D.第三个样本点对应的残差,D错误.
故选:C.
7.(5分)(24-25高二下·全国·课后作业)为了更好地开展多媒体化教学,杭州市某小学对“文理学科教师与喜欢用平板教学”是否有关做了一次研究调查,其中被调查的文科、理科教师人数相同,理科教师喜欢用平板教学的人数占理科教师总人数的80%,文科教师喜欢用平板教学的人数占文科教师总人数的40%,若有95%的把握认为是否喜欢用平板教学和文理学科有关,则调查人数中理科教师人数最少可能是( )
附:,其中.
0.05
0.010
3.841
6.635
A.8 B.12 C.15 D.20
【解题思路】利用独立性检验列联表及观测值可解得答案.
【解答过程】由题意被调查的文理科教师人数相同,设理科教师的人数为,由题意可列出列联表:
理科教师
文科教师
合计
喜欢用平板教学
不喜欢用平板教学
合计
.
由于有的把握认为是否喜欢用平板教学和文理学科有关,
所以,
解得,因为,
故的可能取值为:12,13,14,15,16,17,18,19,
即理科教师的人数可以是:12,13,14,15,16,17,18,19,且考虑到喜欢用平板的人数占理科教师总人数的,故人数为15人时,有实际意义.
故选:C.
8.(5分)(23-24高二下·江苏南京·阶段练习)为了研究关于的线性相关关系,收集了组样本数据(见下表):
若已求得一元线性回归方程为,则下列选项中正确的是( )
(其中相关系数)
A.
B.当时,的预测值为
C.样本数据的第40百分位数为
D.去掉样本点后,与的样本相关系数不会改变
【解题思路】A项,求出,将样本中心点代入回归直线方程可求;B项,利用回归直线方程代值运算预测即可;C项,按百分位数求法步骤求解;D项,新样本平均值没有变化,由相关系数公式可知.
【解答过程】A项,,
所以样本点的中心坐标为,
将它代入得,,解得,故A错误;
B项,当时,的预测值为,故B错误;
C项,由为整数,则样本数据的第40百分位数为,故C错误;
D项,去掉样本点后,新样本数据的平均值没有变化,即仍然成立,
不妨设为第组数据,即,则,其余数据没有变化.
则由相关系数公式可知,
即新样本数据与的相关系数与原数据相关系数相等,
即与的样本相关系数不会改变,故D正确.
故选:D.
二、多项选择题:本题共3小题,每小题6分,共18分,在每小题给出的四个选项中,有多项符合题目的要求,全部选对的得6分,部分选对的得部分分,有选错的得0分。
9.(6分)(24-25高二下·全国·课后作业)记变量与相对应的一组数据的样本相关系数为,变量与相对应的一组数据的样本相关系数为,则( )
A.当与不相关
B.当与呈函数关系
C.当与的相关性强于与的相关性
D.当与的相关性强弱等于与的相关性
【解题思路】根据题意,结合相关系数的含义,逐项判定,即可求解.
【解答过程】对于A中,当样本相关系数为0,只能说明两变量不是线性相关关系,不能说明两变量之间没有其他关系,所以A错误;
对于B中,当样本相关系数为1,两变量呈确定的函数关系,所以B正确;
对于C中,当与的相关性强于与的相关性,所以C错误;
对于D中,样本相关系数相等,说明相关性强弱相等,所以D正确.
故选:BD.
10.(6分)(24-25高二下·辽宁丹东·期中)为了解产假时长对生育意愿的影响,某调查机构随机抽取了一批有生育二胎能力的适龄家庭进行问卷调查,得到如下数据:
产假时长周
14
15
16
17
18
有生育意愿的家庭数户
4
8
16
20
26
该组数据中变量与之间的关系可以用线性回归模型拟合,则下列说法正确的是( )
A.变量与正相关
B.
C.若产假时长为20周,则估计有37户家庭有生育意愿
D.样本数据的残差为
【解题思路】根据线性回归方程的定义逐项计算判断即可.
【解答过程】对于A,因为随着产假时长增大,有生育意愿的家庭数也增大,所以变量与正相关,故A正确;
对于B,因为,
回归直线方程过样本中心,代入计算可得,故B正确;
对于C,因为回归直线方程为,所以当时,,所以估计有37户家庭有生育意愿,故C正确;
对于D,当时,,所以残差为,故D错误.
故选:ABC.
11.(6分)(24-25高二下·吉林长春·阶段练习)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据.从该地的人群中任选一人,设A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.则下列选项正确的是( )
不够良好
良好
病例组
40
60
对照组
10
90
附:,
0.050
0.010
0.001
3.841
6.635
10.828
A.依据的独立性检验,可推断患该疾病群体与未患该疾病群体的卫生习惯有差异
B.利用该调查数据,可得到的估计值为0.4,的估计值为0.1
C..
D.利用该调查数据,可得到R的估计值为5
【解题思路】对于选项A,可由列联表,结合所给公式,求出的值,根据小概率值的独立性检验,即可判断;对于选项B,由已知条件,可直接求得的值,即可判断;对于选项C,可利用公式证明;对于选项D,由已知条件,分别求出的值,即可求出R的值,即可判断.
【解答过程】对于选项A,由列联表得
所以根据小概率值的独立性检验,认为患该疾病群体与未患该疾病群体的卫生习惯有差异,故选项A正确;
对于选项B,由已知得故选项B正确;
对于选项C,由题意得,
又
所以,故选项C正确;
对于选项D,由已知得,
所以,故选项D错误.
故选:ABC.
第II卷(非选择题)
三、填空题:本题共3小题,每小题5分,共15分。
12.(5分)(24-25高二下·全国·课后作业)某企业不断扩大规模,提高经营收入.统计得到该企业2018-2022年产值(单位:亿元)与企业员工数(单位:千人)之间的数据如下:
年份
2018
2019
2020
2021
2022
千人
1
2
3
4
5
亿元
5
8
10
24
28
从表中数据可知与呈线性相关,根据这5年的数据计算与的相关系数 (保留三位小数).
附:.
【解题思路】根据题意,结合表格中的数据,利用相关系数的计算公式,准确计算,即可求解.
【解答过程】由表格中的数据,可得,,
则,
,,
故.
故答案为:.
13.(5分)(24-25高二下·全国·课后作业)近几年,我国新能源汽车产业进入了加速发展的阶段,呈现市场规模、发展质量“双提升”的良好局面.新能源汽车的核心部件是动力电池,其中的主要成分是碳酸锂.下表是某地2023年3月1日至2023年3月5日电池级碳酸锂的价格与日期的统计数据:
日期代码
1
2
3
4
5
电池级碳酸锂价格(十万元/吨)
4.1
3.9
3.8
3.9
根据表中数据,得出关于的经验回归方程为,根据数据计算出在样本中心点处的残差为,则决定系数的值为 (结果保留两位小数).
【解题思路】先根据数据在样本中心点处的残差求,再根据回归直线方程必过样本中心点,求出,做出残差表,根据公式求决定系数的值.
【解答过程】由题知,可得.
又,
由,可得.
列出残差表:
0.1
0.1
0.2
0
0
所以 .
故答案为:.
14.(5分)(23-24高二下·湖南长沙·期中)随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据(,)
支持
不支持
男生
女生
若通过计算得,根据小概率值的独立性检验,认为支持增加中学生体育锻炼时间的政策与性别有关,则在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为 66 .
附:,其中.
0.050
0.010
0.005
0.001
3.841
6.635
7.879
10.828
【解题思路】根据独立性检验公式列出不等式,进而求解即可.
【解答过程】因为有95%以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,
所以,
即,
因为函数在时单调递增,
且,,,
所以的最小值为16,
所以在这被调查的80名女生中支持增加中学生体育锻炼时间的人数的最小值为.
故答案为:66.
四、解答题:本题共5小题,共77分,解答应写出必要的文字说明、证明过程及验算步骤。
15.(13分)(24-25高二下·全国·课后作业)党的二十大报告指出绿水青山就是金山银山.某市为加快生态文明建设进程,加大生态环境保护投入力度,为祖国现代化建设增砖添瓦.现统计了该市近几年的生态环境保护投入资金,统计如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号x
1
2
3
4
5
6
投入资金y/千万
14
31
33
38
41
47
(1)根据上表作出散点图;
(2)观察散点图,判断投入资金y与年份编号x是否具有相关性.如果有,是正相关还是负相关.
【解题思路】(1)根据题意直接作出散点图即可;
(2)由散点图直接判断即可.
【解答过程】(1)作出散点图如下:
(2)由散点图可知,投入资金y与年份编号x具有相关关系,且呈现正相关关系.
16.(15分)(24-25高二下·浙江·期中)随着电商事业的快速发展,网络购物交易额也快速提升,某网上交易平台工作人员对2020年至2024年每年的交易额(取近似值)进行统计分析,结果如下表:
年份
2020
2021
2022
2023
2024
年份代码
1
2
3
4
5
交易额(单位:百亿)
1.5
2
3.5
8
15
(1)据上表数据,计算与的相关系数(精确到0.01),并说明与的线性相关性的强弱;(若,则认为与线性相关性很强;若,则认为与线性相关性一般;若,则认为与线性相关性较弱.)
(2)利用最小二乘法建立关于的线性回归方程,并预测2025年该平台的交易额.
参考数据:,,
参考公式:相关系数;
线性回归方程中,斜率和纵截距的最小二乘估计分别为,.
【解题思路】(1)根据相关系数的计算公式可得,再判断可得答案;
(2)根据公式求线性回归方程,再将代入方程进行预测.
【解答过程】(1)由已知得,,
,,
,
故,
,所以线性相关性程度很强;
(2),,
则,
所以关于的线性回归方程为,
当时,,
所以预计2025年该平台的交易额为15.9百亿.
17.(15分)(2025·山东聊城·一模)某学校为了调动学生学习数学的积极性,在高二年级举行了一次数学有奖竞赛,对考试成绩优秀(即考试成绩不小于分)的学生进行了奖励.学校为了掌握考试情况,随机抽取了部分考试成绩,并以此为样本制作了如图所示的样本频率分布直方图.已知第一小组的频数为.
(1)求的值和样本容量;
(2)估计所有参赛学生的平均成绩;
(3)假设在抽取的样本中,男生比女生多人,女生的获奖率为,填写下列列联表,并依据小概率值的独立性检验,判断男生与女生的获奖情况是否存在差异?
性别
奖励
合计
获奖
未获奖
男
女
合计
附:,
【解题思路】(1)由频率分布直方图中,所有矩形面积之和为可得的值,将第一组的容量除以第一组的频率可得出样本容量;
(2)将每个矩形底边的中点值乘以对应矩形的面积,相加可得出平均数;
(3)根据题意完善列联系表,结合临界值表可得出结论.
【解答过程】(1)由频率分布直方图中,所有矩形面积之和为可得,解得,
样本容量为.
(2)所有参赛学生的平均成绩为.
(3)由题意可知,获奖人数为人,
由题意可得如下列联表
性别
奖励
合计
获奖
未获奖
男
女
合计
所以,,
所以,依据小概率值的独立性检验,男生与女生的获奖无差异.
18.(17分)(23-24高二下·山东烟台·期末)某高中在高二年级举办创新作文比赛活动,满分100分,得分80及以上者获奖.为了解学生获奖情况与选修阅读课程之间的关系,在参赛选手中随机选取了50名学生作为样本,各分数段学生人数及其选修阅读课程情况统计如下:
成绩
学生人数
6
10
24
7
3
选修读课程人数
0
3
9
4
4
(1)根据以上统计数据完成下面的列联表,依据的独立性检验,能否认为学生获奖与选修阅读课程有关联;
获奖
没有获奖
合计
选修阅读课程
不选阅读课程
合计
(2)在上述样本的获奖学生中随机抽取3名学生,设3人中选修阅读课程人数为,求的分布列及数学期望.
参考公式:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【解题思路】(1)由题意可得列联表,计算的值,并与临界值表比较,可得结论;
(2)确定变量的取值,求得每个值对应的概率,即可得分布列,根据数学期望公式即可求得期望.
【解答过程】(1)根据已知条件可得
获奖
没有获奖
合计
选修阅读课程
8
12
20
不选阅读课程
2
28
30
合计
10
40
50
零假设:创新作文比赛获奖与选修阅读课程无关联;
根据列联表中数据计算可得:
,
根据小概率值的独立性检验,推断不成立,
即认为创新作文比赛获奖与选修阅读课程有关联,此推断犯错的概率不大于.
(2)由题意可知的可能取值为,
则,,
,
所以随机变量的分布列为:
1
2
3
.
19.(17分)(24-25高二下·广西柳州·期中)近期根据中国消费者信息研究报告显示,超过40%的消费者更加频繁地使用网上购物,某网购专营店统计了2025年1月5日到9日这5天到该专营店购物的人数y和时间第x天间的数据,列表如下:
x
1
2
3
4
5
y
75
84
93
98
100
(1)由表中给出的数据判断是否可以用线性回归模型拟合人数y和时间第x天之间的关系?若可用,求出y关于x的经验回归方程,并估计1月10日到该专营店购物的人数;若不可用,请说明理由(人数用四舍五入法取整数,若相关系数,则线性相关程度很高,可以用线性回归模型拟合,r精确到0.01);
(2)该专营店为了吸引顾客,推出两种促销方案.方案一:购物金额每满100元可减5元;方案二:一次性购物金额超过800元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打9折,中奖两次打8折,中奖三次打6折.某顾客计划在此专营店购买1000元的商品,请从实际付款金额的数学期望的角度分析选哪种方案更优惠.
参考数据:.,,
附:相关系数,,
【解题思路】(1)先计算相关系数,再结合线性回归方程的知识求解即可;
(2)首先根据二项分布的概率公式求出为的概率值,则方案二的期望可求,与方案一的950进行比较即可判断.
【解答过程】(1)由表中数据可得,,所以,所以可用线性回归模型拟合人数与天数之间的关系.而,则所以
令,可得,所以1月10日到该专营店购物的人数约为109.
(2)若选方案一、需付款元.
若选方案二、设需付款元,则的取值可能为,则,
,
所以,因此选择方案二更划算.
第 1 页 共 12 页
学科网(北京)股份有限公司
$$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。