内容正文:
必考点08 一元线性回归模型及其应用
题型一列联表和等高堆积条形图的应用
例题1某为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:
组别
尿棕色素
合计
阳性数
阴性数
铅中毒病人
29
7
36
对照组
9
28
37
合计
38
35
73
试画出列联表的等高堆积条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
例题2某艺术馆为了研究学生性别和喜欢国画之间的联系,随机抽取80名学生进行调查(其中有男生50名,女生30名),并绘制等高条形图,则这80名学生中喜欢国画的人数为( )
A.24 B.32 C.48 D.58
【解题技巧提炼】
等高堆积条形图的优劣点
(1)优点:较直观地展示了与的差异性.
(2)劣点:不能给出推断“两个分类变量有关系”犯错误的概率.
题型二由χ2进行独立性检验
例题1(2020·全国卷Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
空气质量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400
人次>400
空气质量好
空气质量不好
附:χ2=,
例题2下表是某届某校本科志愿报名时,对其中304名学生进入高校时是否知道想学专业的调查表:
知道想学专业
不知道想学专业
合计
男生
63
117
180
女生
42
82
124
合计
105
199
304
根据表中数据,则下列说法正确的是________.(填序号)
①性别与知道想学专业有关;
②性别与知道想学专业无关;
③女生比男生更易知道所学专业.
【解题技巧提炼】
解决独立性检验问题的基本步骤
(1)根据已知的数据作出列联表;
(2)作出相应的等高堆积条形图,可以利用图形做出相应判断;
(3)求χ2的观测值;
(4)判断可能性:与临界值比较,得出事件有关的可能性大小.
独立性检验解决实际问题的主要环节
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
(3)根据检验规则得出推断结论.
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
题型一列联表和等高堆积条形图的应用
1.根据如图所示的等高堆积条形图可知喝酒与患胃病________关系.(填“有”或“没有”)
2.为考察A,B两种药物预防某疾病的效果,进行动物试验,分别得到如下等高堆积条形图:
根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A,B对该疾病均有显著的预防效果
D.药物A,B对该疾病均没有预防效果
题型二 利用回归直线方程对总体进行估计
1.(2020·新高考全国卷Ⅰ)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
SO2
PM2.5
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
SO2
PM2.5
[0,150]
(150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
附:χ2=,
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
2.某