内容正文:
专题11 成对数据的统计分析
16大高频考点概览
考点01 变量的相关关系
考点04求回归直线方程(重点题型)
考点02相关系数的意义及其辨析
考点05一元线性回归模型参数的最小二乘估计(重点题型)
考点03一元线性回归模型(重点题型)
考点06列联表与独立性检验(重点题型)
地 城
考点01
变量的相关关系
1.(24-25高二下·四川眉山·期末)根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号
1
2
3
4
5
6
1
1.2
1.4
1.6
1.8
2.0
3.08
3.76
4.31
5.02
5.51
6.25
据此给出以下结论:
①这两变量不相关;②这两个变量负相关;③这两个变量正相关.
其中所有正确结论的个数是( )
A.3 B.2 C.1 D.0
2.(24-25高二下·四川乐山·期末)下列变量间的关系,不是相关关系的是( )
A.一块农田的水稻产量与施肥之间的关系
B.正方形的面积与边长之间的关系
C.商品销售收入与其广告费支出之间的关系
D.人体内的脂肪含量与年龄之间的关系
3.(24-25高二下·四川成都·期末)如图,是对某位同学一学期次体育测试成绩(单位:分)进行统计得到的散点图,关于这位同学的成绩分析,下列结论错误的是( )
A.该同学的体育测试成绩总的趋势是在逐步提高,且次测试成绩的极差超过分
B.该同学次测试成绩的众数是分
C.该同学次测试成绩的中位数是分
D.该同学次测试成绩与测试次数具有相关性,且呈正相关
4.(24-25高二下·四川·期末)已知变量x,y呈现线性相关关系,回归方程为,则变量x,y是
A.线性正相关关系 B.线性负相关关系
C.由回归方程无法判断其正负相关关系 D.不存在线性相关关系
5.(24-25高二下·四川成都·期末)以下两个变量成负相关的是_____.
①学生的学籍号与学生的数学成绩;
②坚持每天吃早餐的人数与患胃病的人数;
③气温与冷饮销售量;
④电瓶车的重量和行驶每千米的耗电量.
地 城
考点02
相关系数的意义及其辨析
1.(24-25高二下·四川乐山·期末)已知变量与,与分别都成线性相关关系,且与相关系数满足,且与相关系数满足,下列结论正确的是( )
A.与负相关,与负相关,且与的相关性更强
B.与负相关,与正相关,且与的相关性更强
C.与负相关,与正相关,且与的相关性更弱
D.与正相关,与负相关,且与的相关性更弱
2.(24-25高二下·四川南充·期末)对四组数据进行统计,获得以下散点图,则关于其相关系数的比较,正确的是( )
A. B.
C. D.
3.(24-25高二下·四川乐山·期末)对变量x,y由观测数据得散点图1;对变量u,v由观测数据得散点图2.表示变量x,y之间的线性相关系数,表示变量u,v之间的线性相关系数,则下列说法正确的是( )
A.变量x与y呈现正相关,且 B.变量x与y呈现负相关,且
C.变量u与v呈现正相关,且 D.变量u与v呈现负相关,且
4.(24-25高二下·四川资阳·期末)研究变量,得到一组样本数据,进行回归分析,以下说法正确的是( )
A.两个变量的相关系数的绝对值越接近于1,它们的相关性越弱
B.两个变量与的回归模型中,分别选择了甲、乙两个模型,其回归系数分别为,,则模型甲比模拟乙的拟合效果好
C.在经验回归方程中,当解释变量每增加1个单位时,相应观测值增加0.5个单位
D.经验回归直线经过样本中心点
5.(多选)(24-25高二下·四川眉山·期末)下列有关样本相关系数r,叙述正确的是( )
A.r的取值范围是
B.r的取值范围是
C.越接近1,表示两变量的线性相关程度越强
D.越接近0,表示两变量的线性相关程度越强
6.(多选)(24-25高二下·四川达州·期末)下列说法正确的是( )
A.若,两组成对样本数据的样本相关系数分别为,,则组数据比组数据的线性相关性更强
B.决定系数越接近0拟合效果越好
C.若关于的经验回归方程为,则样本数据相应的残差为
D.若关于的经验回归方程为的样本中心是,则
地 城
考点03
一元线性回归模型
1.(24-25高二下·四川广安·期末)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为.
零件数x(个)
1
2
3
4
5
加工时间y(min)
50
67
71
79
表中有一个数据模糊不清,请你推断出该数据的值为( )
A.55 B.55.8
C.59 D.51
2.(24-25高二下·四川广元·期末)某机构对儿童记忆能力x和识图能力y进行统计分析,得到如下数据:
记忆能力x
4
6
8
10
识图能力y
3
5
7
8
由表中数据,求得经验回归方程为,若某儿童记忆能力为12,则他的识图能力的预测值为( ).
A.10 B.9.8 C.9.5 D.9.2
3.(24-25高二下·四川德阳·期末)变量之间有如下对应数据
2
3
4
5
6
13
12
10
8
7
已知变量与呈线性相关关系,且回归方程为,则的值为( )
A.16 B.14 C.12 D.10
4.(24-25高二下·四川宜宾·期末)数据与有较强的线性相关关系,通过计算得到关于的线性回归方程为,经过分析、计算得,则样本点的残差为( )
A. B. C. D.64.5
5.(24-25高二下·四川乐山·期末)在一次实验中,测得的四组数值分别是,则与之间的回归直线方程可能是( )
A. B. C. D.
6.(24-25高二下·四川自贡·期末)由具有线性相关关系的一组样本数据,得到回归直线方程为,若,则____________.
7.(24-25高二下·四川眉山·期末)已知x,y之间的一组数据:
x
1
4
9
16
y
5.5
4
3.5
3
若y与x满足回归方程,则b的值为________.
8.(24-25高二下·四川眉山·期末)以曲线拟合一组数据时,经代换后的线性回归方程为,则________.
9.(24-25高二下·四川绵阳·期末)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价(元)
销量(件)
由表中数据,求得线性回归方程,若在这些样本点中任取一点,则它在回归直线右上方的概率为_______________
10.(24-25高二下·四川德阳·期末)高温可以使病毒中的蛋白质失去活性,从而达到杀死病毒的效果,某科研团队打算构建病毒的成活率与温度的某种数学模型,通过实验得到部分数据如下表:
温度x(℃)
6
8
10
病毒数量y(万个)
30
22
20
由上表中的数据求得回归方程为,可以预测当温度为14℃时,病毒数量为( )
参考公式:,
A.12 B.10 C.9 D.11
11.(24-25高二下·四川遂宁·期末)从非洲蔓延到东南亚的蝗虫灾害严重威胁了国际农业生产,影响了人民生活.世界性与区域性温度的异常、旱涝频繁发生给蝗灾发生创造了机会.已知蝗虫的产卵量y与温度x的关系可以用模型(其中e为自然对数的底数)拟合,设,其变换后得到一组数据:
x
20
23
25
27
30
z
2
2.4
3
3
4.6
由上表可得经验回归方程,则当x=35时,蝗虫的产卵量y的估计值为( )
A. B. C.8 D.
地 城
考点04
求回归直线方程
1.(24-25高二下·四川眉山·期末)某数字文创公司统计了AI数字复原技术各组研发人员数(人)与月度非遗纹样复原作品数(件)的情况,统计结果如下表:
各组AI研发人员数(人)
3
4
5
6
非遗纹样复原数(件)
5
8
14
17
研发成果类型
基础型
创新型
创新型
创新型
(1)已知与具有较强的线性相关关系,求关于的经验回归方程.
(2)为推广AI非遗复原的模式,现从4个研发小组中随机选取2组进行经验交流,记其中“创新型”的个数为,求的分布列与数学期望.
参考公式:经验回归方程,其中.
参考数据:
1
2
2.(24-25高二下·四川广安·期末)根据《中国统计年鉴》计算整理某城市最近十年蔬菜需求量的统计数据,截取部分统计数据如下表:
年份
2009
2011
2013
2015
2017
需求量(万吨)
336
346
357
376
386
(1)画出散点图;
(2)根据(1)画出的散点图判断需求量与年份是否线性相关,若相关,求出线性回归方程,若不相关,说明理由;
(3)利用(2)中所求的线性回归方程预测该市2023年的蔬菜需求量.
附:参考公式,
t(年份)
0
2
4
m(需求量)
0
19
29
3.(24-25高二下·四川雅安·期末)某超市为销售一种商品,派人统计了去年该商品的每日广告费用(百元)与当日销售量(百件)的关系,以便对今年广告方案的制定提供相关的数据参考,得到的数据如下:
日广告费用(百元)
2
3
4
5
6
日销售量(百件)
1.5
1.7
2.0
2.2
2.6
已知与线性相关.
(1)根据表中的数据,求关于的经验回归方程;
(2)利用(1)中的经验回归方程,估计当日广告费用为1000元时,日销售量为多少件?
附:参考公式:经验回归方程斜率和截距的最小二乘估计公式分别为:,
4.(24-25高二下·四川乐山·期末)某种产品每吨成本6万元,其销售价格(万元/吨)和销售量(吨)的变化情况如下表:
7
7.5
8
8.5
9
10
9
8.5
7.5
5
(1)若与线性相关,求关于的经验回归方程;
(2)根据(1)的结论,预测要使该产品销售利润最大,销售价格是多少?(结果精确到0.1)
附:(参考公式,)
5.(24-25高二下·四川宜宾·期末)通过对某商品在六个城市的销售情况与广告投入的关系进行调研,得到一些统计量的值(如下表).并发现该商品的销售额(单位:百万元)与其广告费(单位:万元)成线性相关.用模型进行拟合,得出相应的经验回归方程并进行残差分析绘制了如图所示的残差图,但在随后数据整理的过程中不小心将部分数据损坏.
城市
广告费万元
3
6
8
10
5
8
336
214
销售额/百万元
6
8
14
15
现将残差绝对值大于1的数据被视为异常数据,需要剔除.
(1)剔除异常数据后,分别计算广告费、销售额的平均值;
(2)求剔除异常数据后的经验回归方程;并估计当广告费为20万元时,销售额为多少.
参考公式:
6.(24-25高二下·四川乐山·期末)2020年至2023年全国粮食年产量y(单位:万万吨)的数据如下表:
年份
2020
2021
2022
2023
年份代号x
1
2
3
4
总产量y
6.69
6.82
6.86
6.95
(1)请用相关系数判断关于的线性相关程度(计算时精确到小数点后2位,若,则线性相关程度较高,若,则线性相关程度一般);
(2)求出y关于x的线性回归方程,并预测2025年全国粮食年产量.
参考公式:相关系数,回归直线方程的斜率,截距.
参考数据:,,.
7.(24-25高二下·四川成都·期末)某种产品的价格(单位:万元/吨)与需求量(单位:吨)之间的对应数据如下表所示:
12
11
10
9
8
5
6
8
10
11
(1)已知可用线性回归模型拟合与的关系,求关于的线性回归方程;
(2)请预测当该产品定价为6万元时需求量能否超过15吨?并说明理由.
参考公式:,.
8.(24-25高二下·四川遂宁·期末)某地随着经济发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款,如表1
年份x
2016
2017
2018
2019
2020
储蓄存款y(千亿元)
5
6
7
8
10
为了研究计算的方便,工作人员将上表的数据进行了处理,,得到表2:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
(1)求z关于t的线性回归方程:
(2)通过(1)中的方程,求出y关于x的回归方程:
(3)用所求回归方程预测到2021年年底,该地储蓄存款额可达多少?
附:对于一组样本数据、、…、,其回归直线的斜率和截距的最小二乘估计值分别为,
地 城
考点05
一元线性回归模型参数的最小二乘估计
1.(24-25高二下·四川绵阳·期末)某学校开设了具有地方特色的包饺子、园艺、剪纸、种植、非物质文化遗产等劳动实践课程.该校为进一步优化劳动教育课程,随机抽取了100名学生进行了一次问卷调查,了解不同性别的学生对已开设劳动课程的满意情况,得到如下列联表:
满意
不满意
合计
男生
35
15
50
女生
40
10
50
合计
75
25
100
(1)根据小概率值的独立性检验,能否认为该校学生对已开设劳动课程的满意情况与学生性别有关联?参考公式及数据:,其中.
(2)从不满意的学生中抽取2名学生进行访谈,求至少抽到一名男生的概率.
2.(24-25高二下·四川凉山·期末)某学校食堂每天中午提供,两种套餐,同学小李第一天午餐时随机选择一种套餐,如果前一天选择套餐,那么第二天选择套餐的概率为;如果前一天选择套餐,那么第二天选择套餐的概率为.
(1)该食堂对套餐的菜品种类与品质等方面进行了改善后,调查了学生对套餐的满意程度情况,统计了100名学生的数据,如下表(单位:人)
套餐满意度情况
套餐改善前
套餐改善后
合计
满意
35
40
75
不满意
15
10
25
合计
50
50
100
根据小概率值的独立性检验,能否认为学生对套餐的满意程度与套餐的改善有关?
(2)若套餐拟提供2种品类的素菜,(,)种品类的荤菜,同学小李从这些菜品中随机选择4种菜品,记选择素菜的种数为,求的最大值,并求此时的值.
(3)设同学小李第天选择套餐的概率为,求.
参考数据:,其中
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
3.(24-25高二下·四川广元·期末)为了了解高中学生课后自主学习数学时间(x分钟/每天)和他们的数学成绩(y分)的关系,某实验小组做了调查,得到一些数据如下表:
编号
1
2
3
4
5
x
10
20
30
40
50
y
70
80
100
120
130
(1)若该组数据中y与x之间的关系可用线性回归模型进行拟合,求y关于x的回归直线方程.(参考数据:)
(2)基于上述调查,某校提倡学生课后自主学习.经过一学期的实施后,抽样调查了160位学生.按照参与课后自主学习与成绩进步情况得到如下2×2列联表:
成绩没有进步
成绩有进步
合计
参与课后自主学习
5
135
140
未参与课后自主学习
5
15
20
合计
10
150
160
依据的独立性检验,分析“课后自主学习与成绩进步”是否有关.
附:回归方程中斜率和截距的最小二乘估计公式分别为:,
,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
4.(24-25高二下·四川自贡·期末)近年来,中国新能源汽车进入高速发展时期.中国汽车工业协会最新发布的数据显示,2024年我国汽车销量达到3143.6万辆,其中新能源汽车销量达到1286.6万辆,占比达到,持续领跑全球.为了了解广大消费者购买新能源汽车意向与年龄是否具有相关性,某汽车公司采用问卷调查形式对200名消费者进行调查,统计后得到如下列联表:
青年人
中老年人
合计
购买新能源汽车
60
35
95
购买燃油车
40
65
105
合计
100
100
200
(1)依据小概率值的独立性检验,能否认为购买新能源汽车意向与年龄有关?
(2)现从上述问卷调查中的100名青年人中,按人数比例采用分层随机抽样的方法抽取10人进行访谈,再从这10人中抽取3人赠送礼品,并记为这3人中购买新能源汽车的人数,求的分布列及数学期望.
参考公式:,其中.
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
0
1
2
3
5.(24-25高二下·四川达州·期末)随着智能家居的迅速发展,扫地机器人已经成为许多家庭不可或缺的清洁助手.某扫地机器人公司在2024年底发布的某款旗舰级扫地机器人产品从2025年1月开始销售.该公司统计了从1月份到5月份每个月的销售量(万件)的数据如下表所示.
月份代码
1
2
3
4
5
销售量(万件)
1.75
2.5
3.75
5.5
7.75
(1)根据表格数据判断模型较为适宜作为月销售量关于月份代码的回归方程,求关于的回归方程;
(2)随机调查了200名购买者对该款扫地机器人的认可程度,得到的部分数据见下表:
认可
不认可
男性购买者
70
30
女性购买者
60
40
依据小概率值的独立性检验,分析购买者对该款扫地机器人的认可程度与性别是否有关联.
参考公式与数据:,,,,,其中.
,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
6.(24-25高二下·四川巴中·期末)一家调查机构在某地随机抽查1000名成年居民对新能源车与燃油车的购买倾向,得到如下表格:
倾向于购买燃油车
倾向于购买新能源车
合计
女性居民
150
250
400
男性居民
350
250
600
合计
500
500
1000
(1)依据小概率值的独立性检验,分析对新能源车与燃油车的购买倾向是否存在性别差异;
(2)从倾向于购买燃油车的居民中按性别采用分层随机抽样的方法抽取10人,再从中抽取4人进行座谈,求在有女性居民参加座谈的条件下,恰有2名男性居民也参加座谈的概率;
(3)从所有参加调查的男性居民中按购买这两种车的倾向性,采用分层随机抽样的方法抽出12人,再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,求的分布列与数学期望.
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
倾向于购买燃油车
倾向于购买新能源车
男性居民
7
5
0
1
2
3
7.(24-25高二下·四川德阳·期末)现代科技日新月异,电子产品更是更新换代迅速,某手机开发公司推出一款新手机,为了解某地区消费者对新手机的满意度,从中随机调查了150名消费者,得到如下数据:
满意
不满意
男
60
40
女
40
10
(1)能否有97.5%的把握认为消费者对新手机的满意度与性别有关;
(2)若用频率估计概率,从该地区消费者中随机选取3人,用表示不满意的人数,求的分布列与数学期望.
参考数据:
0.150
0.100
0.050
0.025
2.072
2.706
3.841
5.024
(,其中)
0
1
2
3
地 城
考点06
列联表与独立性检验
1.(24-25高二下·四川眉山·期末)某校体育锻炼时间准备提供三项体育活动供学生选择.为了解该校学生对“三项体育活动中要有篮球”这种观点的态度(态度分为同意和不同意),随机调查了200名学生,数据如下图:单位:人
男生
女生
合计
同意
70
50
120
不同意
30
50
80
合计
100
100
200
(1)依据的独立性检验,能否认为学生对“三项体育活动中要有篮球”这种观点的态度与性别有关?
(2)现有足球、篮球、跳绳供学生选择.
①若甲、乙两名学生从这三项运动中随机选一种,且他们的选择情况相互独立互不影响.记事件为“甲学生选择足球”,事件为“甲、乙两名学生的选择不同”,判断事件是否独立,并说明理由.
②若该校所有学生每分钟跳绳个数.根据往年经验,该校学生经过训练后,跳绳个数都有明显进步.假设经过训练后每人每分钟跳绳个数比开始时个数增加10,该校有1000名学生,预估经过训练后该校每分钟跳182个以上人数(结果四舍五入到整数).
参考公式和数据:,其中.
0.025
0.010
0.005
5.024
6.635
7.879
若,则,,.
2.(24-25高二下·四川乐山·期末)某游泳俱乐部为了解中学生对游泳是否有兴趣,从某中学随机抽取男生和女生各50人进行调查,对游泳有兴趣的人数占总人数的,女生中有5人对游泳没有兴趣.
(1)完成下面2×2列联表:
有兴趣
没有兴趣
合计
男
女
合计
(2)依据的独立性检验,能否认为游泳兴趣跟性别有关?
附:,其中.
α
0.10
0.05
0.01
0.005
2.706
3.841
6.635
7.879
有兴趣
没有兴趣
合计
男
35
15
50
女
45
5
50
合计
80
20
100
3.(24-25高二下·四川眉山·期末)竹编是某地的地方特色,某地区相关部门对该地居民在过去两年内学习竹编次数进行了详尽统计,然后随机抽取了80名居民的学习数据,现将整理后的结果呈现如下表:
学习竹编次数
0
1
2
3
4
5
6
合计
男
1
3
5
7
9
9
6
40
女
5
6
7
7
6
5
4
40
合计
6
9
12
14
15
14
10
80
(1)若将这两年学习竹编的次数为3次及3次以上的,称为学习竹编“先锋”,其余的称为学习竹编“后起之秀”.请完成以下2×2列联表,并依据小概率值的独立性检验,能否认为性别因素与学习竹编有关系;
性别
学习竹编
合计
后起之秀
先锋
男生
女生
合计
(2)若将这两年内学习竹编6次的居民称为竹编“爱好者”,为进一步优化竹编技术,在样本的“爱好者”中,随机抽取3人进行访谈,设抽取的3人中男性人数为Y,求Y的分布列和数学期望.
附:,
0.1
0.05
0.01
2.706
3.841
6.635
性别
学习竹编
合计
后起之秀
先锋
男生
9
31
40
女生
18
22
40
合计
27
53
80
0
1
2
3
4.(24-25高二下·四川宜宾·期末)某校为了了解学生体能情况,从全校男女生体能测试成绩中随机抽取容量为20的样本数据进行统计分析,样本数据整理如下(满分100分):
女生 75 70 75 70 75 95 85 75 90 75
男生 75 70 80 85 90 80 85 80 90 80
若规定成绩不低于80为A等,成绩低于80为B等.
性别
成绩
合计
A等
B等
女生
10
男生
10
合计
20
(1)完成上表,依据的独立性检验,能否认为体能测试成绩与性别有关联?
(2)从这20名体能测试成绩为等的学生中随机挑选3名,求挑选出男生成绩为等的人数的分布列与数学期望.
附:,其中.
0.05
0.005
3.841
7.897
性别
成绩
合计
A等
B等
女生
3
7
10
男生
8
2
10
合计
11
9
20
0
1
2
5.(24-25高二下·四川南充·期末)为了研究学生数学成绩与整理数学错题是否有关,某课题组在某市中学生中随机抽取了100名学生调查了他们本期期中考试的数学成绩和平时整理数学错题情况,将所得数据整理如下表:
数学成绩优秀
数学成绩不优秀
合计
经常整理错题
40
20
60
不经常整理错题
20
20
40
合计
60
40
100
(1)依据的独立性检验,能否认为该市中学生数学成绩优秀与经常整理数学错题有关?
(2)用频率估计概率,在该市中学生中按“经常整理错题”与“不经常整理错题”用等比例分层抽样随机抽取5名学生,再从这5名学生中随机抽取2人进行座谈.
①用表示抽取的2人中经常整理错题的人数,求的分布列和数学期望及方差;
②求抽取的这2名学生中恰有1名学生经常整理错题且数学成绩优秀的概率.
附:.其中.
独立性检验中5个常用的小概率值和相应的临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
0
1
2
6.(24-25高二下·四川达州·期末)随着人工智能的飞速发展,AI应用场景越来越多.最近AI自习室在家长圈、学生圈中持续走热.某校随机抽取400名学生进行调查,其中期末综合素质测评等级为良好的共180人,有120人利用AI自习室学习并且期末综合测评等级为优秀,有200人未利用AI自习室学习
(1)完成列联表,依据小概率值的独立性检验,能否认为期末综合素质测评等级为优秀与利用AI自习室学习有关联?
良好
优秀
合计
利用AI自习室
120
未利用AI自习室
200
合计
180
400
(2)现有从利用AI自习室学习的学生中以期末综合素质测评等级为依据,用分层随机抽样的方法抽出的10名学生.从这10名学生中随机选取4人进行访谈,记这4人中期末综合素质测评等级为优秀的人数为,求的分布列(用表格表示)与数学期望.
附:.
0.100
0.050
0.025
2.706
3.841
5.024
良好
优秀
合计
利用AI自习室
80
120
200
未利用AI自习室
100
100
200
合计
180
220
400
1 / 38
学科网(北京)股份有限公司
$
专题11 成对数据的统计分析
16大高频考点概览
考点01 变量的相关关系
考点04求回归直线方程(重点题型)
考点02相关系数的意义及其辨析
考点05一元线性回归模型参数的最小二乘估计(重点题型)
考点03一元线性回归模型(重点题型)
考点06列联表与独立性检验(重点题型)
地 城
考点01
变量的相关关系
1.(24-25高二下·四川眉山·期末)根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号
1
2
3
4
5
6
1
1.2
1.4
1.6
1.8
2.0
3.08
3.76
4.31
5.02
5.51
6.25
据此给出以下结论:
①这两变量不相关;②这两个变量负相关;③这两个变量正相关.
其中所有正确结论的个数是( )
A.3 B.2 C.1 D.0
【答案】C
【分析】根据散点图判断.
【详解】画出弹簧伸长长度x和相应所受外力F的散点图,
可以判断这两变量相关,且为正相关,故①②错误,③正确.
故选:C
2.(24-25高二下·四川乐山·期末)下列变量间的关系,不是相关关系的是( )
A.一块农田的水稻产量与施肥之间的关系
B.正方形的面积与边长之间的关系
C.商品销售收入与其广告费支出之间的关系
D.人体内的脂肪含量与年龄之间的关系
【答案】B
【分析】由相关关系概念可得答案.
【详解】A选项,水稻产量与施肥之间没有明确的等量关系,是相关关系,故A错误;
B选项,正方形的面积与边长之间有着明确的等量关系,不是相关关系,故B正确;
C选项,商品销售收入与其广告费支出之间没有明确的等量关系,故C错误;
D选项,人体内的脂肪含量与年龄之间没有明确的等量关系,故D错误.
故选:B
3.(24-25高二下·四川成都·期末)如图,是对某位同学一学期次体育测试成绩(单位:分)进行统计得到的散点图,关于这位同学的成绩分析,下列结论错误的是( )
A.该同学的体育测试成绩总的趋势是在逐步提高,且次测试成绩的极差超过分
B.该同学次测试成绩的众数是分
C.该同学次测试成绩的中位数是分
D.该同学次测试成绩与测试次数具有相关性,且呈正相关
【答案】C
【分析】根据给定的散点图,逐一分析各个选项即可判断作答.
【详解】对于A,由散点图知,8次测试成绩总体是依次增大,极差为,A正确;
对于B,散点图中8个数据的众数是48,B正确;
对于C,散点图中的8个数由小到大排列,最中间两个数都是48,则次测试成绩的中位数是分,C不正确;
对于D,散点图中8个点落在某条斜向上的直线附近,则次测试成绩与测试次数具有相关性,且呈正相关,D正确.
故选:C
4.(24-25高二下·四川·期末)已知变量x,y呈现线性相关关系,回归方程为,则变量x,y是
A.线性正相关关系 B.线性负相关关系
C.由回归方程无法判断其正负相关关系 D.不存在线性相关关系
【答案】B
【分析】根据变量x,y的线性回归方程的系数0,判断变量x,y是线性负相关关系.
【详解】根据变量x,y的线性回归方程是1﹣2x,
回归系数2<0,
所以变量x,y是线性负相关关系.
故选B.
【点睛】本题考查了由线性回归方程判断变量是否正负相关问题,是基础题目.
5.(24-25高二下·四川成都·期末)以下两个变量成负相关的是_____.
①学生的学籍号与学生的数学成绩;
②坚持每天吃早餐的人数与患胃病的人数;
③气温与冷饮销售量;
④电瓶车的重量和行驶每千米的耗电量.
【答案】②
【分析】根据相关关系的知识确定正确答案.
【详解】①无相关关系;②负相关;③④正相关.
故答案为:②
地 城
考点02
相关系数的意义及其辨析
1.(24-25高二下·四川乐山·期末)已知变量与,与分别都成线性相关关系,且与相关系数满足,且与相关系数满足,下列结论正确的是( )
A.与负相关,与负相关,且与的相关性更强
B.与负相关,与正相关,且与的相关性更强
C.与负相关,与正相关,且与的相关性更弱
D.与正相关,与负相关,且与的相关性更弱
【答案】C
【分析】根据相关系数的概念判断.
【详解】由题可知,且,
与成负相关关系,与成正相关关系,且与的相关性更弱.
故选:C.
2.(24-25高二下·四川南充·期末)对四组数据进行统计,获得以下散点图,则关于其相关系数的比较,正确的是( )
A. B.
C. D.
【答案】C
【分析】根据散点图中点的分布的特征,确定四个图对应的相关系数的正负以及大小关系,可得答案.
【详解】由散点图可知第1,3图表示的正相关,且第3个图中的点比第1个图中的点分布更为集中,
所以,
第2,4图表示的负相关,且第4个图中的点比第2个图中的点分布更为集中,
所以,所以,
综上所述,.
故选:C.
3.(24-25高二下·四川乐山·期末)对变量x,y由观测数据得散点图1;对变量u,v由观测数据得散点图2.表示变量x,y之间的线性相关系数,表示变量u,v之间的线性相关系数,则下列说法正确的是( )
A.变量x与y呈现正相关,且 B.变量x与y呈现负相关,且
C.变量u与v呈现正相关,且 D.变量u与v呈现负相关,且
【答案】A
【分析】利用散点图,结合相关系数的知识可得答案.
【详解】观察散点图,得变量x与y呈现正相关,变量u与v呈现负相关,BC错误;
图1中各点比图2中各点更加集中,相关性更好,因此,A正确,D错误.
故选:A
4.(24-25高二下·四川资阳·期末)研究变量,得到一组样本数据,进行回归分析,以下说法正确的是( )
A.两个变量的相关系数的绝对值越接近于1,它们的相关性越弱
B.两个变量与的回归模型中,分别选择了甲、乙两个模型,其回归系数分别为,,则模型甲比模拟乙的拟合效果好
C.在经验回归方程中,当解释变量每增加1个单位时,相应观测值增加0.5个单位
D.经验回归直线经过样本中心点
【答案】D
【分析】根据相关系数、相关指数及回归方程的性质判断即可.
【详解】对于A:两个变量的相关系数的绝对值越接近于1,则它们的相关性越强,故A错误;
对于B:因为,,所以,则模型乙比模拟甲的拟合效果好,故B错误;
对于C:在经验回归方程中,当解释变量每增加1个单位时,相应观测值约增加个单位,故C错误;
对于D:经验回归直线经过样本中心点,故D正确;
故选:D
5.(多选)(24-25高二下·四川眉山·期末)下列有关样本相关系数r,叙述正确的是( )
A.r的取值范围是
B.r的取值范围是
C.越接近1,表示两变量的线性相关程度越强
D.越接近0,表示两变量的线性相关程度越强
【答案】AC
【分析】利用相关系数的取值范围判断AB;利用相关系数的意义判断CD.
【详解】对于AB,样本相关系数r的取值范围是,A正确,B错误;
对于CD,越大,越接近于1,两变量的线性相关程度越强,
越小,越接近于0,两变量的线性相关程度越弱,C正确,D错误.
故选:AC
6.(多选)(24-25高二下·四川达州·期末)下列说法正确的是( )
A.若,两组成对样本数据的样本相关系数分别为,,则组数据比组数据的线性相关性更强
B.决定系数越接近0拟合效果越好
C.若关于的经验回归方程为,则样本数据相应的残差为
D.若关于的经验回归方程为的样本中心是,则
【答案】AD
【分析】对于A,根据相关系数的性质分析判断;对于B,根据决定系数的性质分析判断;对于C,残差计算公式计算判断;对于D,根据经验回归方程过样本中心点分析判断.
【详解】对于选项A:样本相关系数的绝对值越大,线性相关性越强,故A正确;
对于选项B:在回归分析中,越大,残差平方和越小,模型的拟合效果越好,故B错误;
对于选项C:将代入,则,则残差为,故C错误;
对于选项D:经验回归直线必过中心点,将代入则故D正确.
故选: AD.
地 城
考点03
一元线性回归模型
1.(24-25高二下·四川广安·期末)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为.
零件数x(个)
1
2
3
4
5
加工时间y(min)
50
67
71
79
表中有一个数据模糊不清,请你推断出该数据的值为( )
A.55 B.55.8
C.59 D.51
【答案】D
【分析】首先根据回归直线必过样本点中心,代入方程求,即可求不清楚的数据.
【详解】回归直线必过样本点中心,其中,
所以,
所以不清楚的数值为.
故选:D
2.(24-25高二下·四川广元·期末)某机构对儿童记忆能力x和识图能力y进行统计分析,得到如下数据:
记忆能力x
4
6
8
10
识图能力y
3
5
7
8
由表中数据,求得经验回归方程为,若某儿童记忆能力为12,则他的识图能力的预测值为( ).
A.10 B.9.8 C.9.5 D.9.2
【答案】A
【分析】由表格中的数据求得样本中心,代数回归方程求得参数,从而可得答案.
【详解】由表格中的数据可得,,则样本中心为,
代入,则,解得,即,
将代入,可得.
故选:A.
3.(24-25高二下·四川德阳·期末)变量之间有如下对应数据
2
3
4
5
6
13
12
10
8
7
已知变量与呈线性相关关系,且回归方程为,则的值为( )
A.16 B.14 C.12 D.10
【答案】A
【分析】求出样本中心点,代入回归方程可得参数值.
【详解】由已知,,
所以,所以,
故选:A.
4.(24-25高二下·四川宜宾·期末)数据与有较强的线性相关关系,通过计算得到关于的线性回归方程为,经过分析、计算得,则样本点的残差为( )
A. B. C. D.64.5
【答案】A
【分析】先根据线性回归方程过样本中心点求出,再求出观测值,再根据残差得定义即可得解.
【详解】由题意可得,解得,
所以,
当时,,
所以样本点的残差为.
故选:A.
5.(24-25高二下·四川乐山·期末)在一次实验中,测得的四组数值分别是,则与之间的回归直线方程可能是( )
A. B. C. D.
【答案】B
【分析】根据变量的相关性和回归系数之间的关系判断A选项,根据回归直线必过样本中心点判断选项B,C,D即可.
【详解】可知:与之间是正相关的,
故排除A选项,且:
,
B,C,D中只有B选项过点.
故选:B
6.(24-25高二下·四川自贡·期末)由具有线性相关关系的一组样本数据,得到回归直线方程为,若,则____________.
【答案】
【分析】由回归直线过样本中心点可列方程求解.
【详解】由题意,解得.
故答案为:.
7.(24-25高二下·四川眉山·期末)已知x,y之间的一组数据:
x
1
4
9
16
y
5.5
4
3.5
3
若y与x满足回归方程,则b的值为________.
【答案】/
【分析】根据给定的数表,求出的平均数即可.
【详解】依题意,的平均数为,
的平均数为,
所以此曲线必过点,代入方程得,
解得.
故答案为:.
8.(24-25高二下·四川眉山·期末)以曲线拟合一组数据时,经代换后的线性回归方程为,则________.
【答案】
【分析】利用对数的运算法则,再结合回归方程即可求解.
【详解】因为,
所以,
令,则,
又因为,
所以,,
所以.
故答案为:.
9.(24-25高二下·四川绵阳·期末)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价(元)
销量(件)
由表中数据,求得线性回归方程,若在这些样本点中任取一点,则它在回归直线右上方的概率为_______________
【答案】/
【分析】根据表中数据可得回归方程,进而确定在回归直线右上方的个数,进而可得概率.
【详解】由已知,,
又样本中心在回归直线上,
即,解得,
所以回归直线方程为,
当时,,所以点在回归直线上;
当时,,所以点在回归直线左下方;
当时,,所以点在回归直线右上方;
当时,,所以点在回归直线右上方;
当时,,所以点在回归直线右上方;
当时,,所以点在回归直线左下方;
所以个样本点中在回归直线右上方的有个,
所以在这些样本点中任取一点,则它在回归直线右上方的概率为,
故答案为:.
10.(24-25高二下·四川德阳·期末)高温可以使病毒中的蛋白质失去活性,从而达到杀死病毒的效果,某科研团队打算构建病毒的成活率与温度的某种数学模型,通过实验得到部分数据如下表:
温度x(℃)
6
8
10
病毒数量y(万个)
30
22
20
由上表中的数据求得回归方程为,可以预测当温度为14℃时,病毒数量为( )
参考公式:,
A.12 B.10 C.9 D.11
【答案】C
【分析】设回归方程,利用表中数据,根据最小二乘原理求得系数,即得方程,再用方程代入温度预测病毒数量即可.
【详解】y关于x的线性回归方程为,直线过样本中心点
由表格数据得,,
,
,
故根据最小二乘原理知,
所以,
即线性回归方程为;
将代入方程,得,
即可预测病毒数量为.
故选:C
11.(24-25高二下·四川遂宁·期末)从非洲蔓延到东南亚的蝗虫灾害严重威胁了国际农业生产,影响了人民生活.世界性与区域性温度的异常、旱涝频繁发生给蝗灾发生创造了机会.已知蝗虫的产卵量y与温度x的关系可以用模型(其中e为自然对数的底数)拟合,设,其变换后得到一组数据:
x
20
23
25
27
30
z
2
2.4
3
3
4.6
由上表可得经验回归方程,则当x=35时,蝗虫的产卵量y的估计值为( )
A. B. C.8 D.
【答案】A
【分析】根据线性回归方程的性质求出,由此可求.
【详解】由表格数据知:,,
因为数对满足,得,
∴,即,∴,∴x=35时,.
故当x=35时,蝗虫的产卵量y的估计值为.
故选:A.
地 城
考点04
求回归直线方程
1.(24-25高二下·四川眉山·期末)某数字文创公司统计了AI数字复原技术各组研发人员数(人)与月度非遗纹样复原作品数(件)的情况,统计结果如下表:
各组AI研发人员数(人)
3
4
5
6
非遗纹样复原数(件)
5
8
14
17
研发成果类型
基础型
创新型
创新型
创新型
(1)已知与具有较强的线性相关关系,求关于的经验回归方程.
(2)为推广AI非遗复原的模式,现从4个研发小组中随机选取2组进行经验交流,记其中“创新型”的个数为,求的分布列与数学期望.
参考公式:经验回归方程,其中.
参考数据:
【答案】(1)
(2)分布列见解析,
【分析】(1)根据已知数据计算,进而计算求出回归方程;
(2)先计算概率得出分布列,再应用数学期望公式计算即可.
【详解】(1)由题知
所以
所以关于的经验回归方程为
(2)由题意得的取值为1,2
1
2
.
2.(24-25高二下·四川广安·期末)根据《中国统计年鉴》计算整理某城市最近十年蔬菜需求量的统计数据,截取部分统计数据如下表:
年份
2009
2011
2013
2015
2017
需求量(万吨)
336
346
357
376
386
(1)画出散点图;
(2)根据(1)画出的散点图判断需求量与年份是否线性相关,若相关,求出线性回归方程,若不相关,说明理由;
(3)利用(2)中所求的线性回归方程预测该市2023年的蔬菜需求量.
附:参考公式,
【答案】(1)答案见解析
(2)相关,
(3)万吨.
【分析】(1)以年份为横坐标,需求量为纵坐标,画出散点图.
(2)可对数据进行优化,再根据所给的回归方程的有关公式,可求线性回归方程.
(3)利用回归方程进行预测即可.
【详解】(1)画出散点图如图.
(2)由散点图可知,需求量与年份线性相关.
将所给表格中的数据进行处理如下表:
t(年份)
0
2
4
m(需求量)
0
19
29
由表可知,
.
所以 ,
,
所以
所以,
所以.
所以线性回归方程是,即.
(3)当时,,
即预测该地年蔬菜需求量是万吨.
3.(24-25高二下·四川雅安·期末)某超市为销售一种商品,派人统计了去年该商品的每日广告费用(百元)与当日销售量(百件)的关系,以便对今年广告方案的制定提供相关的数据参考,得到的数据如下:
日广告费用(百元)
2
3
4
5
6
日销售量(百件)
1.5
1.7
2.0
2.2
2.6
已知与线性相关.
(1)根据表中的数据,求关于的经验回归方程;
(2)利用(1)中的经验回归方程,估计当日广告费用为1000元时,日销售量为多少件?
附:参考公式:经验回归方程斜率和截距的最小二乘估计公式分别为:,
【答案】(1)
(2)件
【分析】(1)由统计表格中的数据,利用回归系数的公式,求得和,即可得到回归方程;
(2)由(1)知,当时,求得(百件),即可得到结论.
【详解】(1)解:由统计表格中的数据,可得,,
且,,
可得,则,
所以关于的经验回归方程是.
(2)解:由(1)知回归方程是,
当时,(百件),所以估计当日广告费用为元时,日销售量为件.
4.(24-25高二下·四川乐山·期末)某种产品每吨成本6万元,其销售价格(万元/吨)和销售量(吨)的变化情况如下表:
7
7.5
8
8.5
9
10
9
8.5
7.5
5
(1)若与线性相关,求关于的经验回归方程;
(2)根据(1)的结论,预测要使该产品销售利润最大,销售价格是多少?(结果精确到0.1)
附:(参考公式,)
【答案】(1)
(2)预测销售价格是8.7万元/吨时,该产品销售利润最大
【分析】(1)根据给定条件,利用最小二乘法公式求出经验回归方程.
(2)由(1)的结论,求出销售利润函数式,再借助二次函数最值求解.
【详解】(1)依题意,,.
.
.
因此,.
所以关于的经验回归方程为.
(2)销售利润为.
当时,取得最大值,
所以预测销售价格是8.7万元/吨时,该产品销售利润最大.
5.(24-25高二下·四川宜宾·期末)通过对某商品在六个城市的销售情况与广告投入的关系进行调研,得到一些统计量的值(如下表).并发现该商品的销售额(单位:百万元)与其广告费(单位:万元)成线性相关.用模型进行拟合,得出相应的经验回归方程并进行残差分析绘制了如图所示的残差图,但在随后数据整理的过程中不小心将部分数据损坏.
城市
广告费万元
3
6
8
10
5
8
336
214
销售额/百万元
6
8
14
15
现将残差绝对值大于1的数据被视为异常数据,需要剔除.
(1)剔除异常数据后,分别计算广告费、销售额的平均值;
(2)求剔除异常数据后的经验回归方程;并估计当广告费为20万元时,销售额为多少.
参考公式:
【答案】(1)4;6.5
(2);.
【分析】(1)由残差图可知城市D,E的数据异常,故应剔除广告费中的6和8,剔除销售额中的8和14,利用平均数计算公式即得;
(2)先计算出剔除两组数据后,和的值,代入和的计算公式,得到回归方程,即可估计出销售额.
【详解】(1)由题知,剔除城市D,E的数据后,广告费的平均值为:
销售额的平均值为:.
(2)依题意,.
.
所以.
即得:
当时,.
所以,估计当广告费为20万元时,销售额为百万元.
6.(24-25高二下·四川乐山·期末)2020年至2023年全国粮食年产量y(单位:万万吨)的数据如下表:
年份
2020
2021
2022
2023
年份代号x
1
2
3
4
总产量y
6.69
6.82
6.86
6.95
(1)请用相关系数判断关于的线性相关程度(计算时精确到小数点后2位,若,则线性相关程度较高,若,则线性相关程度一般);
(2)求出y关于x的线性回归方程,并预测2025年全国粮食年产量.
参考公式:相关系数,回归直线方程的斜率,截距.
参考数据:,,.
【答案】(1)线性相关程度较高
(2);万万吨
【分析】(1)根据上表中的数据计算出相关系数即可求解;
(2)根据(1)中的数据计算出回归方程的系数得出回归方程,然后将代入回归方程即可求解.
【详解】(1),,
,
,
,
因为,所以线性相关程度较高;
(2),
,
,
所以y关于x的线性回归方程为,
当时,,
所以2025年全国粮食年产量为万万吨.
7.(24-25高二下·四川成都·期末)某种产品的价格(单位:万元/吨)与需求量(单位:吨)之间的对应数据如下表所示:
12
11
10
9
8
5
6
8
10
11
(1)已知可用线性回归模型拟合与的关系,求关于的线性回归方程;
(2)请预测当该产品定价为6万元时需求量能否超过15吨?并说明理由.
参考公式:,.
【答案】(1)
(2)当该产品定价为6万元时需求量不超过15吨,理由见解析
【分析】(1)依次求出,代入公式计算即得,代入可得,即得关于的线性回归方程;
(2)将代入回归方程求得需求量吨,再与15吨比较即得.
【详解】(1)由题意得,
.
,,
,.
关于的线性回归方程为.
(2)当时,代入可得,.
故当该产品定价为6万元时,需求量不超过15吨.
8.(24-25高二下·四川遂宁·期末)某地随着经济发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款,如表1
年份x
2016
2017
2018
2019
2020
储蓄存款y(千亿元)
5
6
7
8
10
为了研究计算的方便,工作人员将上表的数据进行了处理,,得到表2:
时间代号t
1
2
3
4
5
z
0
1
2
3
5
(1)求z关于t的线性回归方程:
(2)通过(1)中的方程,求出y关于x的回归方程:
(3)用所求回归方程预测到2021年年底,该地储蓄存款额可达多少?
附:对于一组样本数据、、…、,其回归直线的斜率和截距的最小二乘估计值分别为,
【答案】(1);
(2);
(3)(千亿元).
【分析】(1)由已知表格中的数据求得,得到与,则线性回归方程可求;
(2)将,代入,即可得到关于的回归方程;
(3)代入求得值即可.
【详解】(1)
,,
,,
∴.
(2)将,代入,
得,即.
所以y关于x的回归方程为.
(3)当时,,
所以预测到2021年年底,该地储蓄存款额可达(千亿元).
地 城
考点05
一元线性回归模型参数的最小二乘估计
1.(24-25高二下·四川绵阳·期末)某学校开设了具有地方特色的包饺子、园艺、剪纸、种植、非物质文化遗产等劳动实践课程.该校为进一步优化劳动教育课程,随机抽取了100名学生进行了一次问卷调查,了解不同性别的学生对已开设劳动课程的满意情况,得到如下列联表:
满意
不满意
合计
男生
35
15
50
女生
40
10
50
合计
75
25
100
(1)根据小概率值的独立性检验,能否认为该校学生对已开设劳动课程的满意情况与学生性别有关联?参考公式及数据:,其中.
(2)从不满意的学生中抽取2名学生进行访谈,求至少抽到一名男生的概率.
【答案】(1)认为该校劳动课程与学生性别没有有关联.
(2).
【分析】(1)根据列联表数据求出卡方,与临界值比较即可判断.
(2)结合组合数,利用古典概型概率公式求解即可,注意对于至少、至多问题一般可以直接法或者间接法两种方法求解.
【详解】(1)零假设该校劳动课程与学生性别无关联.
,
∴根据小概率值的独立性检验,没有充分证据说明不成立,
即可认为该校劳动课程与学生性别没有有关联.
(2)记至少抽到一名男生的概率为,
则(或),
∴至少抽到一名男生的概率为.
2.(24-25高二下·四川凉山·期末)某学校食堂每天中午提供,两种套餐,同学小李第一天午餐时随机选择一种套餐,如果前一天选择套餐,那么第二天选择套餐的概率为;如果前一天选择套餐,那么第二天选择套餐的概率为.
(1)该食堂对套餐的菜品种类与品质等方面进行了改善后,调查了学生对套餐的满意程度情况,统计了100名学生的数据,如下表(单位:人)
套餐满意度情况
套餐改善前
套餐改善后
合计
满意
35
40
75
不满意
15
10
25
合计
50
50
100
根据小概率值的独立性检验,能否认为学生对套餐的满意程度与套餐的改善有关?
(2)若套餐拟提供2种品类的素菜,(,)种品类的荤菜,同学小李从这些菜品中随机选择4种菜品,记选择素菜的种数为,求的最大值,并求此时的值.
(3)设同学小李第天选择套餐的概率为,求.
参考数据:,其中
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)学生对套餐的满意程度与套餐的优化无关
(2)当时,有最大值
(3)
【分析】(1)利用独立性检验思想可求解.
(2)根据超几何分布公式可得,利用二次函数的配方法可求最大值及此时的的值.
(3)同学小李第天选择套餐的概率为,则第天选择套餐的概率为,,由此可得,求解即可.
【详解】(1)零假设:学生对套餐的满意程度与套餐的优化相互独立.
没有充分理由证明不成立,即学生对套餐的满意程度与套餐的优化无关.
(2)由题意知:小李同学选择荤菜种数的概率为:
由于,所以在处取得最大值.
(3)同学小李第天选择套餐的概率为,则第天选择套餐的概率为,,
,
当时,,所以是以为首项,为公比的等比数列,
因此.
3.(24-25高二下·四川广元·期末)为了了解高中学生课后自主学习数学时间(x分钟/每天)和他们的数学成绩(y分)的关系,某实验小组做了调查,得到一些数据如下表:
编号
1
2
3
4
5
x
10
20
30
40
50
y
70
80
100
120
130
(1)若该组数据中y与x之间的关系可用线性回归模型进行拟合,求y关于x的回归直线方程.(参考数据:)
(2)基于上述调查,某校提倡学生课后自主学习.经过一学期的实施后,抽样调查了160位学生.按照参与课后自主学习与成绩进步情况得到如下2×2列联表:
成绩没有进步
成绩有进步
合计
参与课后自主学习
5
135
140
未参与课后自主学习
5
15
20
合计
10
150
160
依据的独立性检验,分析“课后自主学习与成绩进步”是否有关.
附:回归方程中斜率和截距的最小二乘估计公式分别为:,
,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)
(2)在犯错概率不超过的前提下,认为“课后自主学习与成绩进步”有关.
【分析】(1)先计算,进而得即可求解;
(2)计算卡方,利用独立性检验思想即可求解.
【详解】(1)由题意有,
,
,
所以,,
所以;
(2)由题意有,
所以在犯错概率不超过的前提下,认为“课后自主学习与成绩进步”有关.
4.(24-25高二下·四川自贡·期末)近年来,中国新能源汽车进入高速发展时期.中国汽车工业协会最新发布的数据显示,2024年我国汽车销量达到3143.6万辆,其中新能源汽车销量达到1286.6万辆,占比达到,持续领跑全球.为了了解广大消费者购买新能源汽车意向与年龄是否具有相关性,某汽车公司采用问卷调查形式对200名消费者进行调查,统计后得到如下列联表:
青年人
中老年人
合计
购买新能源汽车
60
35
95
购买燃油车
40
65
105
合计
100
100
200
(1)依据小概率值的独立性检验,能否认为购买新能源汽车意向与年龄有关?
(2)现从上述问卷调查中的100名青年人中,按人数比例采用分层随机抽样的方法抽取10人进行访谈,再从这10人中抽取3人赠送礼品,并记为这3人中购买新能源汽车的人数,求的分布列及数学期望.
参考公式:,其中.
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)有关;
(2)分布列见解析;数学期望为.
【分析】(1)利用数表中数据求出,再与临界值比对得解.
(2)求出的可能值及对应的概率,列出分布列并求出期望.
【详解】(1)零假设:购买新能源汽车意向与年龄无关,
由数表中数据经计算得,
依据小概率值的独立性检验,推断零假设不成立,
即认为购买新能源汽车意向与年龄有关,该推断犯错误的概率不超过0.01.
(2)抽取的10人中,购买新能源汽车的有人,购买燃油车的有4人,
的所有可能值为,
,
所以的分布列为:
0
1
2
3
数学期望.
5.(24-25高二下·四川达州·期末)随着智能家居的迅速发展,扫地机器人已经成为许多家庭不可或缺的清洁助手.某扫地机器人公司在2024年底发布的某款旗舰级扫地机器人产品从2025年1月开始销售.该公司统计了从1月份到5月份每个月的销售量(万件)的数据如下表所示.
月份代码
1
2
3
4
5
销售量(万件)
1.75
2.5
3.75
5.5
7.75
(1)根据表格数据判断模型较为适宜作为月销售量关于月份代码的回归方程,求关于的回归方程;
(2)随机调查了200名购买者对该款扫地机器人的认可程度,得到的部分数据见下表:
认可
不认可
男性购买者
70
30
女性购买者
60
40
依据小概率值的独立性检验,分析购买者对该款扫地机器人的认可程度与性别是否有关联.
参考公式与数据:,,,,,其中.
,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)
(2)见解析
【分析】(1)令,将非线性转化为线性,利用最小二乘法得出关于的回归方程;
(2)先假设市民对直播带货认可程度与年龄无关联,再计算卡方,进行独立性检验即可.
【详解】(1)令,得,可得,
,
则,
,
所以关于的回归方程为,
所以关于的回归方程.
(2)零假设: 市民对直播带货认可程度与年龄无关;
因为,
依据小概率值的独立性检验,推断成立,
所以认为市民对直播带货认可程度与年龄无关联.
6.(24-25高二下·四川巴中·期末)一家调查机构在某地随机抽查1000名成年居民对新能源车与燃油车的购买倾向,得到如下表格:
倾向于购买燃油车
倾向于购买新能源车
合计
女性居民
150
250
400
男性居民
350
250
600
合计
500
500
1000
(1)依据小概率值的独立性检验,分析对新能源车与燃油车的购买倾向是否存在性别差异;
(2)从倾向于购买燃油车的居民中按性别采用分层随机抽样的方法抽取10人,再从中抽取4人进行座谈,求在有女性居民参加座谈的条件下,恰有2名男性居民也参加座谈的概率;
(3)从所有参加调查的男性居民中按购买这两种车的倾向性,采用分层随机抽样的方法抽出12人,再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,求的分布列与数学期望.
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)对新能源车与燃油车的购买倾向存在性别差异;
(2)
(3)分布列见解析,期望值
【分析】(1)根据表中数据代入公式计算即可判断得出结论;
(2)由分层抽样确定不同性别的人数,再利用条件概率公式计算可得结果;
(3)根据分层抽样确定倾向于购买新能源车与燃油车的人数,得出的所有可能取值并计算对应的概率可得分布列并求得期望值.
【详解】(1)零假设为:对新能源车与燃油车的购买倾向不存在性别差异;
易知,
所以依据小概率值的独立性检验,我们推断假设不成立,
即认为对新能源车与燃油车的购买倾向存在性别差异,此推断犯错误的概率不大于;
(2)根据表中数据可知按性别采用分层随机抽样的方法抽取10人中3人为女性,7人为男性;
再从中抽取4人进行座谈,共有种,
其中有女性居民参加座谈的情况共有种;
恰有2名男性居民参加座谈的情况共有种;
因此在有女性居民参加座谈的条件下,恰有2名男性居民也参加座谈的概率为
;
(3)从所有参加调查的男性居民中按购买这两种车的倾向性,
采用分层随机抽样的方法抽出12人,可知抽取结果如下表:
倾向于购买燃油车
倾向于购买新能源车
男性居民
7
5
再从中随机抽取3人进行座谈,记这3人中倾向于购买新能源车的居民人数为,
的所有可能取值为;
所以,;
,,
的分布列如下:
0
1
2
3
数学期望.
7.(24-25高二下·四川德阳·期末)现代科技日新月异,电子产品更是更新换代迅速,某手机开发公司推出一款新手机,为了解某地区消费者对新手机的满意度,从中随机调查了150名消费者,得到如下数据:
满意
不满意
男
60
40
女
40
10
(1)能否有97.5%的把握认为消费者对新手机的满意度与性别有关;
(2)若用频率估计概率,从该地区消费者中随机选取3人,用表示不满意的人数,求的分布列与数学期望.
参考数据:
0.150
0.100
0.050
0.025
2.072
2.706
3.841
5.024
(,其中)
【答案】(1)有
(2)分布列见解析,
【分析】(1)先利用公式求出,利用临界值表进行判定;
(2)先求出不满意的概率为,由二项分布求解概率,列表得到分布列,利用期望公式进行求解
【详解】(1)
所以有97.5%的把握认为消费者对新手机的满意度与性别有关.
(2)由表中数据可知,被调查者中“不满意”的频率为.
所以,,,
,,
其分布列为
0
1
2
3
所以.
地 城
考点06
列联表与独立性检验
1.(24-25高二下·四川眉山·期末)某校体育锻炼时间准备提供三项体育活动供学生选择.为了解该校学生对“三项体育活动中要有篮球”这种观点的态度(态度分为同意和不同意),随机调查了200名学生,数据如下图:单位:人
男生
女生
合计
同意
70
50
120
不同意
30
50
80
合计
100
100
200
(1)依据的独立性检验,能否认为学生对“三项体育活动中要有篮球”这种观点的态度与性别有关?
(2)现有足球、篮球、跳绳供学生选择.
①若甲、乙两名学生从这三项运动中随机选一种,且他们的选择情况相互独立互不影响.记事件为“甲学生选择足球”,事件为“甲、乙两名学生的选择不同”,判断事件是否独立,并说明理由.
②若该校所有学生每分钟跳绳个数.根据往年经验,该校学生经过训练后,跳绳个数都有明显进步.假设经过训练后每人每分钟跳绳个数比开始时个数增加10,该校有1000名学生,预估经过训练后该校每分钟跳182个以上人数(结果四舍五入到整数).
参考公式和数据:,其中.
0.025
0.010
0.005
5.024
6.635
7.879
若,则,,.
【答案】(1)有的把握认为学生对“三项体育活动中要有篮球”这种观点的态度与性别有关
(2)①相互独立,理由见解析;②841人
【分析】(1)根据独立性检验计算得出答案;
(2)根据事件的独立性定义来进行验证;利用正态分布的概率分布,根据对称性计算得结果;
【详解】(1)零假设为:学生对“三项体育活动中要有篮球”这种观点的态度与性别独立,
由题设列联表,有,
所以拒绝接受假设,故有的把握认为学生对“三项体育活动中要有篮球”这种观点的态度与性别有关.
(2)① 则
故事件独立.
②训练后,故预估经过训练后该校每分钟跳182个以上人数为
答:故预估经过训练后该校每分钟跳182个以上人数约为人.
2.(24-25高二下·四川乐山·期末)某游泳俱乐部为了解中学生对游泳是否有兴趣,从某中学随机抽取男生和女生各50人进行调查,对游泳有兴趣的人数占总人数的,女生中有5人对游泳没有兴趣.
(1)完成下面2×2列联表:
有兴趣
没有兴趣
合计
男
女
合计
(2)依据的独立性检验,能否认为游泳兴趣跟性别有关?
附:,其中.
α
0.10
0.05
0.01
0.005
2.706
3.841
6.635
7.879
【答案】(1)列联表见解析
(2)能
【分析】(1)根据条件知对游泳有兴趣的总人数为80,女生中对游泳有兴趣的人数为45人,男生中对游泳有兴趣的人数为35人,即可求出结果;
(2)根据(1)中结果,计算出,即可求出结果.
【详解】(1)由题知对游泳有兴趣的总人数为,又女生中有5人对游泳没有兴趣,
所以女生中对游泳有兴趣的人数为45人,男生中对游泳有兴趣的人数为35人,男生中有15人对游泳没有兴趣,
故2×2列联表如下表:
有兴趣
没有兴趣
合计
男
35
15
50
女
45
5
50
合计
80
20
100
(2)由(1)知,
所以依据的独立性检验,能认为游泳兴趣跟性别有关.
3.(24-25高二下·四川眉山·期末)竹编是某地的地方特色,某地区相关部门对该地居民在过去两年内学习竹编次数进行了详尽统计,然后随机抽取了80名居民的学习数据,现将整理后的结果呈现如下表:
学习竹编次数
0
1
2
3
4
5
6
合计
男
1
3
5
7
9
9
6
40
女
5
6
7
7
6
5
4
40
合计
6
9
12
14
15
14
10
80
(1)若将这两年学习竹编的次数为3次及3次以上的,称为学习竹编“先锋”,其余的称为学习竹编“后起之秀”.请完成以下2×2列联表,并依据小概率值的独立性检验,能否认为性别因素与学习竹编有关系;
性别
学习竹编
合计
后起之秀
先锋
男生
女生
合计
(2)若将这两年内学习竹编6次的居民称为竹编“爱好者”,为进一步优化竹编技术,在样本的“爱好者”中,随机抽取3人进行访谈,设抽取的3人中男性人数为Y,求Y的分布列和数学期望.
附:,
0.1
0.05
0.01
2.706
3.841
6.635
【答案】(1)据小概率值的独立性检验,能认为性别因素与学习竹编有关系;
(2)分布列见解析,数学期望为1.8.
【分析】(1)完善列联表,再计算的观测值,与临界值比对作答.
(2)求出的可能值,并求出各个值对应的概率,列出分布列并求出期望.
【详解】(1)根据统计表格数据可得列联表如下:
性别
学习竹编
合计
后起之秀
先锋
男生
9
31
40
女生
18
22
40
合计
27
53
80
零假设为:性别与学习竹编情况独立,即性别因素与学习竹编无关,
根据列联表的数据计算得,
根据小概率值的独立性检验,推断不成立,
即该地区性别因素与学习竹编有关系,此推断犯错误的概率不超过0.1.
(2)样本中“爱好者”共10名,其中6名男生,4名女生,
则的所有可能取值为0,1,2,3,
,
,
所以所求分布列为:
0
1
2
3
数学期望.
4.(24-25高二下·四川宜宾·期末)某校为了了解学生体能情况,从全校男女生体能测试成绩中随机抽取容量为20的样本数据进行统计分析,样本数据整理如下(满分100分):
女生 75 70 75 70 75 95 85 75 90 75
男生 75 70 80 85 90 80 85 80 90 80
若规定成绩不低于80为A等,成绩低于80为B等.
性别
成绩
合计
A等
B等
女生
10
男生
10
合计
20
(1)完成上表,依据的独立性检验,能否认为体能测试成绩与性别有关联?
(2)从这20名体能测试成绩为等的学生中随机挑选3名,求挑选出男生成绩为等的人数的分布列与数学期望.
附:,其中.
0.05
0.005
3.841
7.897
【答案】(1)有关;
(2)分布列见解析,.
【分析】(1)根据题意补充完整列联表,然后根据的公式计算出其观测值,并与附表中的数据进行对比即可作出判断;
(2)这9名学生中,而的可能取值为0,1,2,然后结合超几何分布计算概率的方式逐一求出每个的取值所对应的概率即可得分布列,进而求得数学期望.
【详解】(1)解:填表如下:
性别
成绩
合计
A等
B等
女生
3
7
10
男生
8
2
10
合计
11
9
20
假设:体能测试成绩与性别无关.
.
假设不成立,认为体能测试成绩与性别有关.
(2)解:由题知且.
于是,的分布列为
0
1
2
所以的数学期望.
5.(24-25高二下·四川南充·期末)为了研究学生数学成绩与整理数学错题是否有关,某课题组在某市中学生中随机抽取了100名学生调查了他们本期期中考试的数学成绩和平时整理数学错题情况,将所得数据整理如下表:
数学成绩优秀
数学成绩不优秀
合计
经常整理错题
40
20
60
不经常整理错题
20
20
40
合计
60
40
100
(1)依据的独立性检验,能否认为该市中学生数学成绩优秀与经常整理数学错题有关?
(2)用频率估计概率,在该市中学生中按“经常整理错题”与“不经常整理错题”用等比例分层抽样随机抽取5名学生,再从这5名学生中随机抽取2人进行座谈.
①用表示抽取的2人中经常整理错题的人数,求的分布列和数学期望及方差;
②求抽取的这2名学生中恰有1名学生经常整理错题且数学成绩优秀的概率.
附:.其中.
独立性检验中5个常用的小概率值和相应的临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有关,理由见解析;
(2)①分布列见解析,,;②
【分析】(1)由列联表中数据,计算卡方,进行独立性检验即可;
(2)①由的可能取值结合超几何分布计算相应的概率,列出分布列,计算期望以及方差;
②设“这2名学生中经常整理错题的人数为i人”(), “这2 名学生中恰有1名次同学经常整理错题且数学成绩优秀”,由条件概率计算,再由全概率公式计算即可.
【详解】(1)零假设为该市中学生数学成绩优秀与经常整理数学错题无关.
根据列联表中数据,经计数得到
根据小概率值的独立性检验,我们推断零假设不成立,所以能认为数学成绩优秀与经常整理数学错题有关联.
(2)①由等比例的分层抽样知,随机抽取的5名学生中经常整理错题的有3人,不经常整理错题的有2人.
的可能取值为.
,
则的分布列为
0
1
2
数学期望.
方差;
②设“这2名学生中经常整理错题的人数为i人”(),
“这2 名学生中恰有1名次同学经常整理错题且数学成绩优秀”
则
,
据全概率公式得:.
所以这2名同学中恰有1名同学经常整理错题且数学成绩优秀的概率为.
6.(24-25高二下·四川达州·期末)随着人工智能的飞速发展,AI应用场景越来越多.最近AI自习室在家长圈、学生圈中持续走热.某校随机抽取400名学生进行调查,其中期末综合素质测评等级为良好的共180人,有120人利用AI自习室学习并且期末综合测评等级为优秀,有200人未利用AI自习室学习
(1)完成列联表,依据小概率值的独立性检验,能否认为期末综合素质测评等级为优秀与利用AI自习室学习有关联?
良好
优秀
合计
利用AI自习室
120
未利用AI自习室
200
合计
180
400
(2)现有从利用AI自习室学习的学生中以期末综合素质测评等级为依据,用分层随机抽样的方法抽出的10名学生.从这10名学生中随机选取4人进行访谈,记这4人中期末综合素质测评等级为优秀的人数为,求的分布列(用表格表示)与数学期望.
附:.
0.100
0.050
0.025
2.706
3.841
5.024
【答案】(1)列联表,能认为期末综合素质测评等级为优秀与利用AI自习室学习有关联.
(2)分布列见解析,.
【分析】(1)由已知补全列联表;计算,可得结论;
(2)求得良好,优秀的学生人数分别为4人,6人,利用超几何分布可得分布列与数学期望.
【详解】(1)由题可得列联表为:
良好
优秀
合计
利用AI自习室
80
120
200
未利用AI自习室
100
100
200
合计
180
220
400
,
所以能认为期末综合素质测评等级为优秀与利用AI自习室学习有关联.
(2)由题意可得利用AI自习室学习的学生中良好,优秀的人数分别为80人,120人,
所以用分层随机抽样的方法抽出的10名学生中良好,优秀的学生人数分别为4人,6人,
从这10名学生中随机选取4人进行访谈,记这4人中期末综合素质测评等级为优秀的人数为,
则的值为0,1,2,3,4.
,,,
,,
所以的分布列为:
1 / 38
学科网(北京)股份有限公司
$