内容正文:
1.变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种________关系.
(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为________,点分布在左上角到右下角的区域内,两个变量的相关关系为________.
2.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有____________,这条直线叫________.
(2)回归方程为=x+,其中=-.
(3)相关系数
当r>0时,表明两个变量________;
当r<0时,表明两个变量________.
r的绝对值越接近于1,表明两个变量的线性相关性________.r的绝对值越接近于0时,表明两个变量之间________________.通常|r|大于________时,认为两个变量有很强的线性相关性.
3.独立性检验
2×2列联表:假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
χ2=(其中n=a+b+c+d为样本容量).
1.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.
2.由回归方程进行预报,仅是一个预报值,而不是真实发生的值.
3.使用χ2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,在选取样本容量时一定要注意.
1.有五组变量:
①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;
②平均日学习时间和平均学习成绩;
③某人每日吸烟量和身体健康情况;
④圆的半径与面积;
⑤汽车的重量和每千米耗油量
其中两个变量成正相关的是( )
A.①③ B.②④
C.②⑤ D.④⑤
2.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A.=-10x+200 B.=10x+200
C.=-10x-200 D.=10x-200
3.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+已知i=225,i=1 600,=4,该班某学生的脚长为24,据此估计身高为( )
A.160 B.163
C.166 D.170
4.为了了解疾病A是否与性别有关,在某医院随机地对入院的50人进行了问卷调查,得到了如下的列联表:则认为疾病A与性别有关的把握约为( )
患疾病A
不患疾病A
总计
男
20
5
25
女
10
15
25
总计
30
20
50
A.95% B.99%
C.99.5% D.99.9%
5.(多选)如图四个散点图中,适合用线性回归模型拟合其中两个变量的是( )
A.① B.②
C.③ D.④
6.(多选)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生的人数可能有________人.( )
附:χ2=
附表:
α=P(χ2≥k)
0.050
0.010
xk
3.841
6.635
A.25 B.45
C.60 D.75
7.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如表:
专业
性别
非统计专业
统计专业
男
13
10
女
7
20
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到χ2=≈4.844,因为χ2>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性最大为________.
8.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场以降低生产成本,某白酒酿造企业市场部对该企业9月份的产品销量(千箱)与单位成本(元)的资料进行线性回归分析,结果如下:=,=71,
x=79,iyi=1 481,
=≈-1.818 2,=71-(-1.818 2)×≈77.36,则销量每增加1千箱,单位成本下降________元.
9.对于线性回归方程=x+,当x=3时,对应的y的估计值是17,当x=8时,对应的y的估计值是22,那么,该线性回归方程是________,根据线性回归方程