内容正文:
十三、统计案例
1.变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种________关系.
(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为________,点分布在左上角到右下角的区域内,两个变量的相关关系为________.
2.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有____________,这条直线叫________.
(2)线性回归方程为=x+,其中=-.
(3)相关系数
当r>0时,表明两个变量________;
当r<0时,表明两个变量________.
r的绝对值越接近于1,表明两个变量的线性相关性________.r的绝对值越接近于0时,表明两个变量之间________________.通常|r|大于________时,认为两个变量有很强的线性相关性.
3.独立性检验
2×2列联表:假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:
y
x
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
χ2=(其中n=a+b+c+d为样本容量).
1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.
2.由回归方程进行预报,仅是一个预报值,而不是真实发生的值.
3.使用χ2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,在选取样本容量时一定要注意.
1.有五组变量:
①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;
②平均日学习时间和平均学习成绩;
③某人每日吸烟量和身体健康情况;
④圆的半径与面积;
⑤汽车的重量和每千米耗油量
其中两个变量成正相关的是( )
A.①③ B.②④ C.②⑤ D.④⑤
2.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A.=-10x+200 B.=10x+200
C.=-10x-200 D.=10x-200
3.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+已知i=225,i=1 600,=4,该班某学生的脚长为24,据此估计身高为( )
A.160 B.163 C.166 D.170
4.为了了解疾病A是否与性别有关,在某医院随机地对入院的50人进行了问卷调查,得到了如下的列联表:则认为疾病A与性别有关的把握约为( )
患疾病A
不患疾病A
总计
男
20
5
25
女
10
15
25
总计
30
20
50
A.95% B.99%
C.99.5% D.99.9%
5.(多选)如图四个散点图中,适合用线性回归模型拟合其中两个变量的是( )
A.① B.② C.③ D.④
6.(多选)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如表.
非一线
一线
总计
愿生
45
20
65
不愿生
13
22
35
总计
58
42
100
附表
α
0.025
0.010
0.001
xα
5.024
6.635
10.828
由χ2=算得,χ2=≈9.616,参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.001的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过0.025的前提下,认为“生育意愿与城市级别有关”
C.在犯错误的概率不超过0.01的前提下,认为“生育意愿与城市级别有关”
D.在犯错误的概率不超过0.01的前提下,认为“生育意愿与城市级别无关”
7.有下列关系;
①炼钢时钢水的含碳量与冶炼时间的关系;
②曲线上的点与该点的坐标之间的关系;
③柑橘的产量与气温之间的关系;
④森林的同一种树木,其横断面积直径与高度之间的关系.
其中具有相关关系的是________.(填序号)
8.为考察喜欢黑色的人是否患抑郁症,对200名大学生进行调查,得到如下2×2列联表:
患抑郁症
未患抑郁症
总计
喜欢黑色
70
30
100
不喜欢黑色
35
65
100
总计
105
95
200
则有________的把握认为