内容正文:
检测8成对数据的统计分析单元检测(能力卷)(2019人教A版)
一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(24-25高二下·全国·课后作业)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:
生产线条数
1
2
3
4
5
产量
21
39
64
87
104
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
2.(2025高三·全国·专题练习)下表为2017—2023年某企业两轮电动车的年产量(单位:万辆),其中2017—2023年的年份代码分别为1—7.
年份代码
1
2
3
4
5
6
7
年产量万辆
31
33
38
44
已知与具有线性相关关系,且满足经验回归方程,则的值为( )
A.146.5 B.164.8 C.179.5 D.197.8
3.(2023·江西南昌·一模)根据分类变量x与y的观察数据,计算得到,依据下表给出的独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是( )
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
A.有95%的把握认为变量x与y独立
B.有95%的把握认为变量x与y不独立
C.变量x与y独立,这个结论犯错误的概率不超过10%
D.变量x与y不独立,这个结论犯错误的概率不超过10%
4.(24-25高二下·全国·课后作业)某景区对2017-2022年景区内农家乐接待人数(单位:万人)进行了统计,得到数据如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号
1
2
3
4
5
6
接待人数万人
4.5
5.6
6.1
6.4
6.8
7.2
则接待人数与年份的相关系数约为( )(参考数据:)
A.0.65 B.0.71 C.0.89 D.0.97
5.(24-25高三上·上海·阶段练习)下列命题错误的是( )
A.两个随机变量的线性相关性越强,相关系数的绝对值越接近于1
B.设,若,则
C.线性回归直线一定经过样本点的中心
D.一个袋子中有个大小相同的球,其中有个黄球、个白球,从中不放回地随机摸出个球作为样本,用随机变量表示样本中黄球的个数,则服从二项分布,且
6.(22-23高三下·重庆北碚·阶段练习)一医疗团队为研究治疗某种疾病的新药能否有助于7天内治愈该疾病病人,在已患病的500例病人中,随机分为两组,实验组服用该新药,对照组不服用该药,在其他治疗措施相同的情况下,统计7天内痊愈病例数,得到如下数据:
7天内未痊愈
7天内痊愈
对照组
30
170
实验组
20
280
根据表格数据,下列结论正确的是( )
参考公式及数据:,其中.
0.10
0.010
0.001
2.706
6.635
10.828
A.在犯错误的概率不大于0.01的前提下,可以认为服用该新药与7天内治愈病人无关
B.在犯错误的概率不大于0.001的前提下,可以认为服用该新药与7天内治愈病人无关
C.根据小概率值的独立性检验,可以推断服用该新药与7天内治愈病人有关
D.根据小概率值的独立性检验,可以推断服用该新药与7天内治愈病人有关
7.(24-25高三上·湖北·期中)已知变量x和变量y的一组成对样本数据为,其中,其回归直线方程为,当增加两个样本数据和后,重新得到的回归直线方程斜率为3,则在新的回归直线方程的估计下,样本数据所对应的残差为( )
A. B. C. D.
8.(2024高三·北京·专题练习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论不一定正确的是( )
A.样本中男性比女性更关注地铁号线开通
B.样本中多数女性是岁及以上
C.样本中岁以下的男性人数比岁及以上的女性人数多
D.样本中岁及以上的人对地铁号线的开通关注度更高
二、多选题(本大题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(2024·湖北襄阳·模拟预测)下列说法正确的有( )
A.若事件A和事件B互斥,
B.数据2,7,4,5,16,1,21,11的第70百分位数为11
C.若随机变量,,则
D.若y关于x的回归方程为,则y与x是线性负相关关系
10.(24-25高三上·江苏扬州·期末)已知两个变量与对应关系如下表:
若与满足一元线性回归模型,且经验回归方程为,则( )
A.与正相关 B.
C.样本数据的第60百分数为 D.各组数据的残差和为
11.(2024·重庆沙坪坝·模拟预测)下列命题正确的是( )
A.若且,则
B.对于随机事件A和B,若,则事件A与事件B独立
C.回归分析中,若相关指数越接近于1,说明模型的拟合效果越好;反之,则模型的拟合效果越差
D.用等高条形图粗略估计两类变量X和Y的相关关系时,等高条形图差异明显,说明X与Y无关
三、填空题(本大题共3小题,每小题5分,共15分,把答案填在题中的横线上)
12.(23-24高二下·江苏扬州·期末)将某保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中6个区域,统计这些区域内的某种水源指标和某植物分布的数量,得到样本,且其相关系数,记关于的线性回归方程为.经计算可知:,则 .
参考公式:.
13.(24-25高三上·上海·开学考试)下表中是某公司一年中每月的广告投入费用与销售额的情况,设广告投入费用为x(单位:万元),销售额为y(单位:万元),则y关于x的回归方程为 .(回归系数精确到0.01)
广告费用(万元)
30
26
21
17
11
18
13
16
17
23
25
29
销售额(万元)
843
725
621
587
485
608
523
554
600
703
728
792
14.(24-25高三上·湖南·阶段练习)某传媒公司针对“社交电商用户是否存在性别差异”进行调查,共调查了个人,得到如下列联表:
是社交电商用户
不是社交电商用户
合计
男性
女性
合计
已知,若根据的独立性检验认为“社交电商用户存在性别差异”,则的最小值为 .
四、解答题(本大题共5小题,共77分,解答应写出文字说明,证明过程或演算步骤)
15. (13分) (24-25高三上·江苏南通·期中)为调查某地区学生在高中学习中错题订正整理情况与考试成绩的关系.首先对该地区所有高中学生错题订正整理情况进行分值评价,给出得分;再组织考试.从这些学生中随机抽取20名学生的错题订正整理情况得分和对应的考试成绩作为样本,得到样本数据,其中和分别表示第个样本错题订正整理情况得分和对应的考试成绩,计算得.
(1)求样本的相关系数(精确到0.01),并推断考试成绩和错题订正整理情况得分的相关程度;
(2)已知20个样本中有8个样本的考试成绩低于样本平均数.利用频率估计概率,从该地区所有高中学生中随机抽取4个学生的错题订正整理情况得分和对应的考试成绩,记抽到考试成绩低于的个数为X,求随机变量X的分布列.
附:相关系数.
16. (15分) (2024高三·北京·专题练习)某地区2019年至2023年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年份
2019
2020
2021
2022
2023
年份代号x
1
2
3
4
5
人均纯收入
2.3
3.3
4.1
4.4
4.9
(1)由表可知与具有线性相关关系,求关于的线性回归方程;
(2)利用(1)中的回归方程,预测该地区2025年农村居民家庭人均纯收入;
(3)用(1)中所求线性回归方程得到与对应的人均纯收入预测值,当数据对应残差的绝对值时,将该数据称作一个“好数据”,经过计算统计得到这5个数据中“好数据”有2个,不是“好数据”的有3个,现从5个数据中任选3个,求恰好有两个“好数据”的概率.
17. (15分) (2025高三·全国·专题练习)近年来,随着人工智能技术的不断发展,各种AI应用也不断普及,ChatGPT就是一款具有人类沟通能力的智能AI工具.随着人工智能的加入,各类传媒、影视、游戏行业迎来了高速的发展,AI技术降低了这些行业的人力成本,提高了效率.某公司2016年—2023年的年投入资金(万元)与年收益(百万元)的数据如下表所示:
年份
2016
2017
2018
2019
2020
2021
2022
2023
1
2
3
4
5
6
7
8
1.95
2.92
4.38
6.58
9.87
15.00
22.50
33.70
(1)用(,均为常数)拟合年收益与年投入资金的关系,求出经验回归方程;
(2)为了促进公司发展,该公司决定在甲、乙两个部门之间进行一次信息化技术比赛,比赛规则如下:两个部门进行三轮答题比赛,每轮只出1道题目,比赛时两部门同时回答这道题,若一部门答对且另一部门答错,则答对的部门得10分,答错的部门得分,若两部门都答对或都答错,则两部门均得0分,累计得分为正者将获得奖品,且两部门答对与否互不影响,每次答题的结果也互不影响,甲部门答对每道题的概率为,乙部门答对每道题的概率为.
(ⅰ)记每一轮比赛中甲部门的得分为,求的分布列和数学期望;
(ⅱ)求三轮比赛后甲部门获得奖品的概率.
参考数据:,,,其中,.
参考公式:对于一组数据,,…,,其经验回归方程的斜率和截距的最小二乘估计分别为,.
18. (17分) (2023·山东烟台·二模)某企业拥有甲、乙两条零件生产线,为了解零件质量情况,采用随机抽样方法从两条生产线共抽取180个零件,测量其尺寸(单位:)得到如下统计表,其中尺寸位于的零件为一等品,位于和的零件为二等品,否则零件为三等品.
生产线
甲
4
9
23
28
24
10
2
乙
2
14
15
17
16
15
1
(1)完成列联表,依据的独立性检验能否认为零件为一等品与生产线有关联?
一等品
非一等品
甲
乙
(2)将样本频率视为概率,从甲、乙两条生产线中分别随机抽取2个零件,每次抽取零件互不影响,以表示这4个零件中一等品的数量,求的分布列和数学期望;
(3)已知该企业生产的零件随机装箱出售,每箱60个.产品出厂前,该企业可自愿选择是否对每箱零件进行检验.若执行检验,则每个零件的检验费用为5元,并将检验出的三等品更换为一等品或二等品;若不执行检验,则对卖出的每个三等品零件支付120元赔偿费用.现对一箱零件随机检验了10个,检出了1个三等品.将从两条生产线抽取的所有样本数据的频率视为概率,以整箱检验费用与赔偿费用之和的期望作为决策依据,是否需要对该箱余下的所有零件进行检验?请说明理由.
附,其中;.
19. (17分) (2024·全国·模拟预测)某校高一学生共有人,年级组长利用数字化学习软件记录每位学生每日课后作业完成的时长,期中考试之后统计得到了如下平均作业时长与学业成绩的数据表:
平均作业时长(单位:小时)
学业成绩优秀:
学业成绩不优秀:
(1)试判断:是否有的把握认为学业成绩优秀与日均作业时长不小于小时且小于小时有关?
(2)常用表示在事件发生的条件下事件发生的优势,在统计中称为似然比.已知该校高一学生女生中成绩优秀的学生占比,现从所有高一学生中任选一人,表示“选到的是男生”,表示“选到的学生成绩优秀”,若,求.
附:,.
学科网(北京)股份有限公司
$$
检测8成对数据的统计分析单元检测(能力卷)(2019人教A版)
一、单选题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(24-25高二下·全国·课后作业)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:
生产线条数
1
2
3
4
5
产量
21
39
64
87
104
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
2.(2025高三·全国·专题练习)下表为2017—2023年某企业两轮电动车的年产量(单位:万辆),其中2017—2023年的年份代码分别为1—7.
年份代码
1
2
3
4
5
6
7
年产量万辆
31
33
38
44
已知与具有线性相关关系,且满足经验回归方程,则的值为( )
A.146.5 B.164.8 C.179.5 D.197.8
3.(2023·江西南昌·一模)根据分类变量x与y的观察数据,计算得到,依据下表给出的独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是( )
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
A.有95%的把握认为变量x与y独立
B.有95%的把握认为变量x与y不独立
C.变量x与y独立,这个结论犯错误的概率不超过10%
D.变量x与y不独立,这个结论犯错误的概率不超过10%
4.(24-25高二下·全国·课后作业)某景区对2017-2022年景区内农家乐接待人数(单位:万人)进行了统计,得到数据如下表:
年份
2017
2018
2019
2020
2021
2022
年份编号
1
2
3
4
5
6
接待人数万人
4.5
5.6
6.1
6.4
6.8
7.2
则接待人数与年份的相关系数约为( )(参考数据:)
A.0.65 B.0.71 C.0.89 D.0.97
5.(24-25高三上·上海·阶段练习)下列命题错误的是( )
A.两个随机变量的线性相关性越强,相关系数的绝对值越接近于1
B.设,若,则
C.线性回归直线一定经过样本点的中心
D.一个袋子中有个大小相同的球,其中有个黄球、个白球,从中不放回地随机摸出个球作为样本,用随机变量表示样本中黄球的个数,则服从二项分布,且
6.(22-23高三下·重庆北碚·阶段练习)一医疗团队为研究治疗某种疾病的新药能否有助于7天内治愈该疾病病人,在已患病的500例病人中,随机分为两组,实验组服用该新药,对照组不服用该药,在其他治疗措施相同的情况下,统计7天内痊愈病例数,得到如下数据:
7天内未痊愈
7天内痊愈
对照组
30
170
实验组
20
280
根据表格数据,下列结论正确的是( )
参考公式及数据:,其中.
0.10
0.010
0.001
2.706
6.635
10.828
A.在犯错误的概率不大于0.01的前提下,可以认为服用该新药与7天内治愈病人无关
B.在犯错误的概率不大于0.001的前提下,可以认为服用该新药与7天内治愈病人无关
C.根据小概率值的独立性检验,可以推断服用该新药与7天内治愈病人有关
D.根据小概率值的独立性检验,可以推断服用该新药与7天内治愈病人有关
7.(24-25高三上·湖北·期中)已知变量x和变量y的一组成对样本数据为,其中,其回归直线方程为,当增加两个样本数据和后,重新得到的回归直线方程斜率为3,则在新的回归直线方程的估计下,样本数据所对应的残差为( )
A. B. C. D.
8.(2024高三·北京·专题练习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图:
根据图中信息,下列结论不一定正确的是( )
A.样本中男性比女性更关注地铁号线开通
B.样本中多数女性是岁及以上
C.样本中岁以下的男性人数比岁及以上的女性人数多
D.样本中岁及以上的人对地铁号线的开通关注度更高
二、多选题(本大题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(2024·湖北襄阳·模拟预测)下列说法正确的有( )
A.若事件A和事件B互斥,
B.数据2,7,4,5,16,1,21,11的第70百分位数为11
C.若随机变量,,则
D.若y关于x的回归方程为,则y与x是线性负相关关系
10.(24-25高三上·江苏扬州·期末)已知两个变量与对应关系如下表:
若与满足一元线性回归模型,且经验回归方程为,则( )
A.与正相关 B.
C.样本数据的第60百分数为 D.各组数据的残差和为
11.(2024·重庆沙坪坝·模拟预测)下列命题正确的是( )
A.若且,则
B.对于随机事件A和B,若,则事件A与事件B独立
C.回归分析中,若相关指数越接近于1,说明模型的拟合效果越好;反之,则模型的拟合效果越差
D.用等高条形图粗略估计两类变量X和Y的相关关系时,等高条形图差异明显,说明X与Y无关
三、填空题(本大题共3小题,每小题5分,共15分,把答案填在题中的横线上)
12.(23-24高二下·江苏扬州·期末)将某保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中6个区域,统计这些区域内的某种水源指标和某植物分布的数量,得到样本,且其相关系数,记关于的线性回归方程为.经计算可知:,则 .
参考公式:.
13.(24-25高三上·上海·开学考试)下表中是某公司一年中每月的广告投入费用与销售额的情况,设广告投入费用为x(单位:万元),销售额为y(单位:万元),则y关于x的回归方程为 .(回归系数精确到0.01)
广告费用(万元)
30
26
21
17
11
18
13
16
17
23
25
29
销售额(万元)
843
725
621
587
485
608
523
554
600
703
728
792
14.(24-25高三上·湖南·阶段练习)某传媒公司针对“社交电商用户是否存在性别差异”进行调查,共调查了个人,得到如下列联表:
是社交电商用户
不是社交电商用户
合计
男性
女性
合计
已知,若根据的独立性检验认为“社交电商用户存在性别差异”,则的最小值为 .
四、解答题(本大题共5小题,共77分,解答应写出文字说明,证明过程或演算步骤)
15. (13分) (24-25高三上·江苏南通·期中)为调查某地区学生在高中学习中错题订正整理情况与考试成绩的关系.首先对该地区所有高中学生错题订正整理情况进行分值评价,给出得分;再组织考试.从这些学生中随机抽取20名学生的错题订正整理情况得分和对应的考试成绩作为样本,得到样本数据,其中和分别表示第个样本错题订正整理情况得分和对应的考试成绩,计算得.
(1)求样本的相关系数(精确到0.01),并推断考试成绩和错题订正整理情况得分的相关程度;
(2)已知20个样本中有8个样本的考试成绩低于样本平均数.利用频率估计概率,从该地区所有高中学生中随机抽取4个学生的错题订正整理情况得分和对应的考试成绩,记抽到考试成绩低于的个数为X,求随机变量X的分布列.
附:相关系数.
16. (15分) (2024高三·北京·专题练习)某地区2019年至2023年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
年份
2019
2020
2021
2022
2023
年份代号x
1
2
3
4
5
人均纯收入
2.3
3.3
4.1
4.4
4.9
(1)由表可知与具有线性相关关系,求关于的线性回归方程;
(2)利用(1)中的回归方程,预测该地区2025年农村居民家庭人均纯收入;
(3)用(1)中所求线性回归方程得到与对应的人均纯收入预测值,当数据对应残差的绝对值时,将该数据称作一个“好数据”,经过计算统计得到这5个数据中“好数据”有2个,不是“好数据”的有3个,现从5个数据中任选3个,求恰好有两个“好数据”的概率.
17. (15分) (2025高三·全国·专题练习)近年来,随着人工智能技术的不断发展,各种AI应用也不断普及,ChatGPT就是一款具有人类沟通能力的智能AI工具.随着人工智能的加入,各类传媒、影视、游戏行业迎来了高速的发展,AI技术降低了这些行业的人力成本,提高了效率.某公司2016年—2023年的年投入资金(万元)与年收益(百万元)的数据如下表所示:
年份
2016
2017
2018
2019
2020
2021
2022
2023
1
2
3
4
5
6
7
8
1.95
2.92
4.38
6.58
9.87
15.00
22.50
33.70
(1)用(,均为常数)拟合年收益与年投入资金的关系,求出经验回归方程;
(2)为了促进公司发展,该公司决定在甲、乙两个部门之间进行一次信息化技术比赛,比赛规则如下:两个部门进行三轮答题比赛,每轮只出1道题目,比赛时两部门同时回答这道题,若一部门答对且另一部门答错,则答对的部门得10分,答错的部门得分,若两部门都答对或都答错,则两部门均得0分,累计得分为正者将获得奖品,且两部门答对与否互不影响,每次答题的结果也互不影响,甲部门答对每道题的概率为,乙部门答对每道题的概率为.
(ⅰ)记每一轮比赛中甲部门的得分为,求的分布列和数学期望;
(ⅱ)求三轮比赛后甲部门获得奖品的概率.
参考数据:,,,其中,.
参考公式:对于一组数据,,…,,其经验回归方程的斜率和截距的最小二乘估计分别为,.
18. (17分) (2023·山东烟台·二模)某企业拥有甲、乙两条零件生产线,为了解零件质量情况,采用随机抽样方法从两条生产线共抽取180个零件,测量其尺寸(单位:)得到如下统计表,其中尺寸位于的零件为一等品,位于和的零件为二等品,否则零件为三等品.
生产线
甲
4
9
23
28
24
10
2
乙
2
14
15
17
16
15
1
(1)完成列联表,依据的独立性检验能否认为零件为一等品与生产线有关联?
一等品
非一等品
甲
乙
(2)将样本频率视为概率,从甲、乙两条生产线中分别随机抽取2个零件,每次抽取零件互不影响,以表示这4个零件中一等品的数量,求的分布列和数学期望;
(3)已知该企业生产的零件随机装箱出售,每箱60个.产品出厂前,该企业可自愿选择是否对每箱零件进行检验.若执行检验,则每个零件的检验费用为5元,并将检验出的三等品更换为一等品或二等品;若不执行检验,则对卖出的每个三等品零件支付120元赔偿费用.现对一箱零件随机检验了10个,检出了1个三等品.将从两条生产线抽取的所有样本数据的频率视为概率,以整箱检验费用与赔偿费用之和的期望作为决策依据,是否需要对该箱余下的所有零件进行检验?请说明理由.
附,其中;.
19. (17分) (2024·全国·模拟预测)某校高一学生共有人,年级组长利用数字化学习软件记录每位学生每日课后作业完成的时长,期中考试之后统计得到了如下平均作业时长与学业成绩的数据表:
平均作业时长(单位:小时)
学业成绩优秀:
学业成绩不优秀:
(1)试判断:是否有的把握认为学业成绩优秀与日均作业时长不小于小时且小于小时有关?
(2)常用表示在事件发生的条件下事件发生的优势,在统计中称为似然比.已知该校高一学生女生中成绩优秀的学生占比,现从所有高一学生中任选一人,表示“选到的是男生”,表示“选到的学生成绩优秀”,若,求.
附:,.
《8》参考答案
题号
1
2
3
4
5
6
7
8
9
10
答案
B
B
D
D
D
C
B
C
BD
ABD
题号
11
答案
BC
1.B
【分析】由正、负相关的概念即可判断.
【详解】由题中数据可知,y随x的增大而增大,且不成比例关系,故y与x正相关.
故选:B
2.B
【分析】先求出,又因为点在经验回归直线上,得出即可计算求解.
【详解】由表中数据得,因为点在经验回归直线上,
所以,所以.
故选:B.
3.D
【分析】根据已知条件,结合独立性检验的定义即可求解.
【详解】因为,
所以变量x与y不独立,这个结论犯错误的概率不超过10%.
故选:D.
4.D
【分析】根据已知数据分别计算各个量得出的值即可.
【详解】由题得,
所以,
故接待人数与年份的相关系数约为0.97.
故选:D.
5.D
【分析】选项A,根据相关系数的表示意义即可求解;选项B,根据条件,利用二项分布的性质,得到,即可求解;选项C,根据最小二乘法求回归方程,即可判断选项C的正误;选项D,根据条件,利用超几何分布的定义即可判断.
【详解】对于选项A,两个随机变量的线性相关性越强,相关系数的绝对值越接近于1,故选项A正确;
对于选项B,由,,得,解得,
故选项B正确;
对于选项C,线性回归直线一定经过样本点的中心,故选项C正确;
对于选项D,由于是不放回地随机摸出20个球作为样本,
由超几何分布的定义知服从的超几何分布,
且,故选项D错误.
故选:D.
6.C
【分析】求出卡方值,和6.635,10.828比较即可根据小概率值的独立性检验判断.
【详解】,所以根据小概率值的独立性检验,有充分证据推断服用该新药对7天内治愈病人有影响,
因此在犯错误的概率不大于0.01的前提下,可以推断服用该新药与7天内治愈病人有关,故C正确,A错误.
,所以根据小概率值的独立性检验,没有充分证据推断服用该新药对7天内治愈病人有关,
因此在犯错误的概率不大于0.001的前提下,不可以推断服用该新药与7天内治愈病人有关,故BD错误.
故选:C.
7.B
【分析】先计算新的数据的平均值,后得到经验回归方程,再结合残差概念计算即可.
【详解】∵,∴增加两个样本点后的平均数为;
∵,∴,
∴增加两个样本点后y的平均数为,
∴,解得,
∴新的经验回归方程为,则当时,,
∴样本点的残差为
故选:B.
8.C
【分析】通过对等高堆积条形图的分析,结合所列列联表及不等式性质,逐一对每个选项进行推理判断即可.
【详解】设等高条形图对应列联表如下:
岁及以上
岁以下
总计
男性
女性
总计
根据第个等高条形图可知,岁及以上男性比岁及以上女性多,即;
岁以下男性比岁以下女性多,即.
根据第个等高条形图可知,男性中岁及以上的比岁以下的多,即;
女性中岁及以上的比岁以下的多,即,
对于A,男性人数为,女性人数为,
因为,所以,所以A正确;
对于B,岁及以上女性人数为,岁以下女性人数为,
因为,所以B正确;
对于C,岁以下男性人数为,岁及以上女性人数为,
无法从图中直接判断与的大小关系,所以C不一定正确;
对于D,岁及以上的人数为,岁以下的人数为,
因为,所以,所以D正确.
故选:C.
9.BD
【分析】根据互斥事件的定义判断A;根据百分位数的定义判断B;根据正态分布性质判断C;根据正负相关的定义判断D.
【详解】对于A,因为事件A和事件B互斥,所以,故错误;
对于B,将原数据重新排列为:1,2,4,5,7,11,16,21,共8个数,
,所以该组数据的第70百分位数即为第6个数11,故正确;
对于C,因为随机变量,,所以,故错误;
对于D,因为y关于x的回归方程为,,则y与x是线性负相关关系,故正确.
故选:BD.
10.ABD
【分析】利用相关性的定义及线性回归直线可判定A,根据样本中心点在回归方程上可判定B,利用百分位数的计算可判定C,利用回归方程计算预测值可得残差即可判定D.
【详解】对于A,由回归直线方程知:,所以y与x正相关,故A正确;
对于B,由表格数据及回归方程易知,故B正确;
对于C,,所以样本数据y的第60百分位数为,故C错误;
对于D,由回归直线方程知时对应的预测值分别为,
故对应残差分别为,显然残差之和为0,故D正确.
故选:ABD
11.BC
【分析】A由正态分布的对称性求概率;B利用条件概率公式转化判断;C、D根据相关指数的实际意义、等高条形图的性质判断
【详解】A:由,根据正态分布对称性,错误;
B:由题意,即,故事件A与事件B独立,正确;
C:相关指数的实际意义知:相关指数越接近于1,说明模型的拟合效果越好;反之,则模型的拟合效果越差,正确;
D:由等高条形图与列联表关系,差异明显表明X与Y相关可能很大,错误.
故选:BC
12./1.875
【分析】根据参考数据及公式先利用相关系数求出,再求即可.
【详解】因为,
所以,
由,
解得,
所以.
故答案为:
13.
【分析】分别求出,再带入线性回归方程求解即可.
【详解】,
,
,
,
所以
所以
所以,
故答案为:.
14.3
【分析】先根据已知计算,再根据独立性检验的性质列不等式计算即可.
【详解】,
所以根据的独立性检验认为是不是社交电商用户与性别有关,则的最小值为3.
故答案为:3.
15.(1)相关系数,考试成绩和错题订正整理情况得分高度相关
(2)答案见解析
【分析】(1)根据相关系数的计算公式即可代入求解;
(2)根据二项分布概率公式求解概率,即可得分布列.
【详解】(1),
接近考试成绩和错题订正整理情况得分高度相关.
(2)考试成绩低于样本平均数的概率记为,
则
x
0
1
2
3
4
p
16.(1)
(2)千元
(3)
【分析】(1)根据已知数据,结合参考数据,分别求得与,即可求得结果;
(2)令,即可求得结果;
(3)根据题意求得好数据个数,再结合组合数,根据古典概型的概率计算公式求解即可.
【详解】(1)根据已知数据以及参考数据可得:,
;
又,
故,
,
故所求线性回归方程为:.
(2)根据(1)所求可得:,令,解得,
故预测该地区2025年农村居民家庭人均纯收入为千元.
(3)根据题意,结合所求线性回归方程可得如下表格:
年份
2019
2020
2021
2022
2023
年份代号x
1
2
3
4
5
人均纯收入
2.3
3.3
4.1
4.4
4.9
2.54
3.17
3.8
4.43
5.06
0.24
0.13
0.3
0.03
0.16
根据“好数据”定义,故组数据中,“好数据”有2组,不是“好数据”的有3组,
从5个数据中任选3个,恰好有两个“好数据”是事件,则.
17.(1)
(2)(ⅰ)分布列见解析,;(ⅱ)
【分析】(1)对两边同时取自然对数得,令,利用最小二乘法可求得,由此可得经验回归方程;
(2)写出的可能取值,分别求出概率即可求出分布列及期望;记三轮比赛后甲部门可获得奖品的得分为,写出的可能取值,分别求出概率即可求解.
【详解】(1)因为,所以两边同时取自然对数,得,
设,所以,
又因为,,,
,
所以,
所以,即,
所以;
(2)(ⅰ)的可能取值为10,0,,
则,
,
,
所以的分布列为
10
0
所以;
(ⅱ)记三轮比赛后甲部门可获得奖品的得分为,则的可能取值为30,20,10,
则,
,
,
所以三轮比赛后甲部门获得奖品的概率为.
18.(1)填表见解析;可以认为零件是否为一等品与生产线有关联
(2)分布列见解析;期望为
(3)应对剩下零件进行检验,理由见解析
【分析】
(1)由表格填写列联表,计算卡方,与3.841比较后得到结论;
(2)首先计算出任取一个甲生产线零件为一等品和任取一个乙生产线零件为一等品的概率,求出的可能取值及相应的概率,得到分布列,求出期望值;
(3)设余下的50个零件中的三等品个数为X,则,求出,再设检验费用与赔偿费用之和为Y,得到,求出,计算出若对余下的所有零件进行检验,则检验费用元,比较后得到结论.
【详解】(1)
由题意得列联表如下:
一等品
非一等品
甲
75
25
乙
48
32
,
因为,依据小概率值的独立性检验,可以认为零件是否为一等品与生产线有关联.
(2)
由已知任取一个甲生产线零件为一等品的概率为,任取一个乙生产线零件为一等品的概率为.
的所有可能取值为0,1,2,3,4.
,
,
,
,
,
所以的分布列为
0
1
2
3
4
P
.
(3)
由已知,每个零件为三等品的频率为,
设余下的50个零件中的三等品个数为X,则,
所以.
设检验费用与赔偿费用之和为Y,
若不对余下的所有零件进行检验,则,
.
若对余下的所有零件进行检验,则总检验费用为元.
因为,所以应对剩下零件进行检验.
19.(1)有把握;
(2).
【分析】(1)完善列联表,计算的观测值并与临界值比对即可得解.
(2)设,根据给定条件,利用条件概率公式、结合互斥事件的加法公式列出方程求解.
【详解】(1)列联表数据如下:
时长
其他
总计
优秀
不优秀
总计
所以有的把握认为学业成绩优秀与日均作业时长不小于小时且小于小时有关.
(2)设,则,
由,得,
而,则.
又,于是,
得,即,
而,因此,
由,得,所以.
学科网(北京)股份有限公司
$$