内容正文:
2026年高二下学期期末备考专题训练----专题06成对数据的统计分析
一、选择题
1.下列两个变量中能够具有相关关系的是( )
A.人的身高与受教育的程度 B.人的体重与眼睛的近视程度
C.企业员工的工号与工资 D.儿子的身高与父亲的身高
2.在下列各散点图中,两个变量具有正相关关系的是( )
A. B.
C. D.
3.已知变量x,y的数据如下:
x
3
4
6
7
y
2.5
3
m
5.9
若x与y的回归直线方程为,则( )
A.3.5 B.4 C.4.2 D.5
4.变量X与Y相对应的一组数据为,,,,;变量U与V相对应的一组数据为,,,,.表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则( )
A.
B.
C.
D.
5.为研究高中生的性别与是否喜欢数学课程之间的关系,运用列联表进行检验,经计算,参考下表,则认为“性别与喜欢数学有关”犯错误的概率不超过( )
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
A. B. C. D.
6.下列命题:
①回归方程为时,变量x与y具有负的线性相关关系;
②在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;
③在回归分析中,对一组给定的样本数据,,而言,当样本相关系数越接近1时,样本数据的线性相关程度越强.
④对分类变量X与Y的随机变量的观测值k来说,k越小,判断“X与Y有关系”的把握越大.
其中正确的命题序号是( )
A.①② B.①②③ C.①③④ D.②③④
7.某电影公司为了解某部电影宣传对票房的影响,在某市内随机抽取了5个大型电影院,得到其宣传费用x(单位:十万元)和销售额y(单位:十万元)的数据如下:
x(十万元)
5
6
7
8
9
y(十万元)
55
60
70
75
80
由统计数据知y与x满足线性回归方程,其中,当宣传费用时,销售额y的估计值为( )
A.85.5 B.86.5 C.87.5 D.88.5
二、多项选择题
8.为考察某种药物预防疾病的效果,进行动物实验,得到如下药物结果与动物实验的数据:
患病
未患病
服用药
10
45
没服用药
20
30
由上述数据得出下列结论,其中正确的是( )
附:;
0.05
0.025
0.010
0.005
3.841
5.024
6.635
7.879
A.根据小概率值的独立性检验,推断服用药物是有效的,此推断犯错误的概率不超过0.025
B.根据小概率值的独立性检验,推断服用药物是有效的,此推断犯错误的概率不超过0.01
C.该药物的预防有效率超过
D.若将所有试验数据都扩大到原来的10倍,根据小概率值的独立性检验,推断服用药物是有效的,此推断犯错误的概率不超过0.005
9.已知变量x,y之间的线性回归方程为,且变量x,y之间的一组相关数据如表所示,则下列说法正确的是( )
x
6
8
10
12
y
6
m
3
2
A.变量x,y之间呈负相关关系
B.可以预测,当时,
C.
D.该回归直线必过点
三、填空题
10.下面是一个列联表:
项目
y1
y2
总计
x1
a
21
70
x2
5
c
30
总计
b
d
100
则由上表可得_____________.
11.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得如表所示的数据:
单位:名
性别
疗效
设:服用此药的效果与患者的性别无关,(小数点后保留3位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的概率不大于____________________________.
四、解答题
12.随着科技的进步,近年来,我国新能源汽车产业迅速发展,2006年,在国家节能减排的宏观政策指导下,科技部在“十一五”启动了“863”计划新能源汽车重大项目.自2011年起,国家相关部门重点扶持新能源汽车的发展,也逐步得到消费者的认可.各大品牌新能源汽车除了靠不断提高汽车的性能和质量来提升品牌竞争力,在广告投放方面的花费也是逐年攀升.小张同学对某品牌新能源汽车近8年出售的数量及广告费投入情况进行了统计,具体数据见下表:
年份代码
1
2
3
4
5
6
7
8
年销售量/十万辆
3
4
5
6
7
9
10
12
广告费投入/亿元
3.6
4.1
4.4
5.2
6.2
7.5
7.9
9.1
(1)求广告费投入y(亿元)与年销售量x(十万辆)之间的线性回归方程(精确到0.01);
(2)若某人随机在甲、乙两家汽车店购买一辆汽车,如果在甲汽车店购买,那么购买新能源汽车的概率为0.6;如果在乙汽车店购买,那么购买新能源汽车的概率为0.8,求这个人购买的是新能源汽车的概率.
参考数据:,.
附:回归直线中,,.
13.为了研究学生每天整理数学错题情况,某课题组在某市中学生中随机抽取了100名学生调查了他们期中考试的数学成绩和平时整理数学错题情况,并绘制了下列两个统计图表,图1为学生期中考试数学成绩的频率分布直方图,图2为学生一个星期内整理数学错题天数的扇形图.若本次数学成绩在110分及以上视为优秀,将一个星期有4天及以上整理数学错题视为“经常整理”,少于4天视为“不经常整理”.已知数学成绩优秀的学生中,经常整理错题的学生占70%.
数学成绩优秀
数学成绩不优秀
合计
经常整理
不经常整理
合计
(1)求图1中m的值;
(2)根据图1、图2中的数据,补全上方列联表,根据调查数据回答:在犯错误的概率不超过5%的前提下,可以认为数学成绩优秀与经常整理数学错题有关吗?
(3)用频率估计概率,在全市中学生中按“经常整理错题”与“不经常整理错题”进行分层抽样,随机抽取5名学生,再从这5名学生中随机抽取2人进行座谈.这2名同学中经常整理错题且数学成绩优秀的人数X的分布列和数学期望.
附:,.
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
参考答案
1.答案:D
解析:对于A:人的身高与受教育的程度不具有相关关系,故A错误;
对于B:人的体重与眼睛的近视程度不具有相关关系,故B错误;
对于C:企业员工的工号与工资不具有相关关系,故C错误.
对于D:儿子的身高与父亲的身高具有相关关系,故D正确.
故选:D
2.答案:B
解析:对于A,散点的变化具有波动性,非正相关关系,A错误;
对于B,当x变大时,y的变化趋势也是逐渐增大,可知两个变量具有正相关关系,B正确;
对于C,当x变大时,y的变化趋势是逐渐减小,可知两个变量具有负相关关系,C错误;
对于D,两个变量的变化无规律,二者没有相关性,D错误.
故选:B.
3.答案:B
解析:由题意可得,,
则,解得.
故选:B.
4.答案:C
解析:Y随X的增大而增大,故变量Y与X正相关,即,V随U的增大而减小,故变量V与U负相关,即.故.
故选:C.
5.答案:B
解析:因为,结合表格可知,所以认为“性别与喜欢数学有关”犯错误的概率不超过0.010.
故选:B.
6.答案:B
解析:对①:由,故变量x与y具有负的线性相关关系,故①正确;
对②:在残差图中,残差点分布的带状区域的宽度越狭窄,
其模型拟合的精度越高,故②正确;
对③:样本相关系数越接近1时,样本数据的线性相关程度越强,故③正确;
对④:对分类变量X与Y的随机变量的观测值k来说,k越小,
判断“X与Y有关系”的把握越小,故④错误.
故选:B.
7.答案:C
解析:因为:,.
由线性回归方程经过点且得:.
所以.
当时,.
故选:C.
8.答案:AD
解析:根据列联表
患病
未患病
合计
服用药
10
45
55
没服用药
20
30
50
合计
30
75
105
计算,
对于A,因为,所以根据小概率值的独立性检验,推断服用药物是有效的,此推断犯错误的概率不超过0.025,A正确;
对于B,因为根据小概率值的独立性检验,推断服用药物是无效的,此推断犯错误的概率不超过0.01,B错误;
对于C,可推断该药物的预防有效率超过,C错误;
对于D,若将所有试验数据都扩大到原来的10倍,
则
根据小概率值的独立性检验,推断服用药物是有效的,此推断犯错误的概率不超过0.005,D正确;
故选:AD.
9.答案:ABD
解析:对于A:由线性回归方程为可知:,所以变量x,y之间呈负相关关系,故选项A正确;
对于B:当时,,故选项B正确;
对于C:,,因为回归直线过样本中心点,
所以,解得:,故选项C不正确;
对于D:由C可知,所以,所以该回归直线必过样本中心点,故选项D正确;
故选:ABD.
10.答案:74
解析:由题意知,所以.
故答案为:74.
11.答案:0.05
解析:由公式计算得,
根据小概率值的独立性检验,认为服用此药的效果与患者的性别有关,
判断出错的概率不大于0.05.
故答案为:0.05.
12.答案:(1)
(2)0.7
解析:(1),,
由参考数据
所以
故广告费投入y关于年销售量x的回归方程为.
(2)设“在甲汽车店购买汽车”,“在乙汽车店购买汽车”,
“购买的是新能源汽车”,
,,,
由全概率公式得,.
13.答案:(1)
(2)表格见解析,有
(3)分布列见解析,0.7
解析:(1)由题意可得,
解得;
(2)数学成绩优秀的有人,不优秀的人人,
经常整理错题的有人,不经常整理错题的是人,
经常整理错题且成绩优秀的有人,则
数学成绩优秀
数学成绩不优秀
合计
经常整理
35
25
60
不经常整理
15
25
40
合计
50
50
100
零假设为:数学成绩优秀与经常整理数学错题无关,
根据列联表中的数据,经计算得到可得,
由于,所以在犯错误的概率不超过5的前提下,
可以认为数学成绩优秀与经常整理数学错题有关联;
(3)由分层抽样知,随机抽取的5名学生中经常整理错题的有3人,
不经常整理错题的有2人,则X可能取为0,1,2,
经常整理错题的3名学生中,恰抽到k人记为事件,
则
参与座谈的2名学生中经常整理错题且数学成绩优秀的恰好抽到m人记为事件
则,,,,
,,
,
,
,
故X的分布列如下:
X
0
1
2
P
则可得X的数学期望为.
学科网(北京)股份有限公司
$