内容正文:
考点11 回归分析与独立性检验
概率与统计,是历年高考的必考点,尤其是新高考改革后,各卷都有考查,其主要考查内容有:数字特征与概率的计算问题、随机变量的均值与方差、回归分析与独立性检验、二项分布及其应用等。例如:2021年全国高考乙卷(文)、(理)[17],2022年全国新高考卷Ⅱ[19],2022年全国乙卷(文)、(理)[19],2022年全国甲卷(文)[17],2022年北京高考[18]等都对数字特征与概率的计算问题进行了考查。
〔1〕回归分析的实际应用
1.求回归直线方程(线性回归方程)的一般步骤
(1)画散点图;
(2)求回归直线方程;
(3)用回归直线方程进行预报。
2.利用回归方程进行预测,把回归直线方程看作一次函数,求函数值。
3.利用回归直线判断正、负相关,决定正相关还是负相关的是系数。
4.回归方程的拟合效果,可以利用相关系数判断,当越趋近于1时,两变量的线性相关性越强。
〔2〕独立性检验的实际应用
1.独立性检验的一般步骤
(1)根据样本数据列出2×2列联表;
(2)计算随机变量的观测值k,查表确定临界值;
(3)如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”。
2.独立性检验的应用
可以利用独立性检验来推断两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度。具体做法是:
(1)根据实际问题需要的可信程度(或容许犯错误概率的上界)确定临界值;
(2)利用公式,由观测数据计算得到随机变量的观测值k;
(3)如果,就说有的把握认为“X与Y有关系”(或说在犯错误的概率不超过的前提下认为“X与Y有关系”),否则就说样本观测数据没有提供“X与Y有关系”的充分证据(或说在犯错误的概率不超过的前提下不能认为“X与Y有关系”)。
例1.(2021·全国·高考乙卷(文)、(理)·17)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
例2.(2020·全国·高考真题(理))某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
1.(2022·广西北海·一模(文))近年来,新能源汽车产业大规模发展,某品牌汽车投人市场以来,受到多位消费者欢迎,汽车厂家为扩大销售,对旗下两种车型电池续航进行满意度调查,制作了如下2×2列联表.
不满意
满意
合计
男
18
女
40
合计
100
已知从全部100人中随机抽取1人调查满意度为满意的概率为
0.15
0.10
0.05
0.10
0.001
2.072
2.706
3.841
6.635
10.828
附:,其中.
(1)完成上面的2×2列联表;
(2)根据(2)中的2×2列联表,判断是否有90%的把握认为满意度与消费者的性别有关?
2.(2022·四川雅安·模拟预测(理))某地区对高一年级学生进行体质健康测试(简称体测),现随机抽取了900名学生的体测结果等级(“良好及以下”或“优秀”)进行分析.得到如下列联表:
良好及以下
优秀
合计
男
450
200
650
女
150
100
250
合计
600
300
900
(1)计算并判断是否有99%的把握认为本次体测结果等级与性别有关系?
(2)将