内容正文:
成对数据的统计分析(2)
2025—2026学年高二数学暑假作业-成对数据的统计分析(2)
1.已知两个线性相关变量x与y的统计数据如下表:
x
3
4
5
6
y
2.5
3
4
4.5
其回归直线方程是,据此计算,则样本点在处的残差为( )
A. B. C. D.
2.有一散点图如图所示,在A,B,C,D,E这5个点中去掉后,下列说法错误的是( )
A.相关系数r变大
B.残差平方和变大
C.变量x,y正相关
D.解释变量x与预报变量y的相关性变强
3.某医疗研究机构为检验某种新研发的药物对特定疾病治疗是否有效,随机选取了200名患者进行双盲实验.其中100人服用新药,100人服用旧药,统计结果如下表
治愈
未治愈
合计
服用新药
67
33
100
服用旧药
48
52
100
合计
115
85
200
附:统计量临界值表
0.10
0.05
0.01
0.005
k
2.706
3.841
6.635
7.879
其中.
则下列说法正确的是( )
A.有的把握认为新研发的药物对特定疾病治疗有效
B.有的把握认为新研发的药物对特定疾病治疗无效
C.有的把握认为新研发的药物对特定疾病治疗无效
D.有的把握认为新研发的药物对特定疾病治疗有效
4.5天内某校当天新增感冒人数y与每日温差x(单位:℃)的数据如下表:
x
5
7
8
9
11
y
9
m
15
17
20
由于保存不善,有1个数据模糊不清,用m代替,已知y关于x的经验回归方程为,则( )
A.13 B.14 C.15 D.12
5.观察下列散点图,其中两个变量的相关关系判断一定正确的是( )
A.图1中y与x呈正相关
B.图2中y与x不相关
C.图3中y与x的线性相关系数小于0
D.图1中y与x的线性相关系数小于图2中y与x的线性相关系数
6.以下结论错误的是( )
A.根据列联表中的数据计算得出,而,则根据小概率值的独立性检验,认为两个分类变量有关系
B.在回归直线中,变量时,变量y的值一定是15
C.的值越大,两个事件的相关性的可能性就越大
D.在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好
7.(多选)下列说法正确的是( )
A.若两个具有线性相关关系的变量的相关性越强,则线性相关系数r的值越接近于1
B.经验回归方程为时,变量x和y负相关
C.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
D.对两个变量y和x进行回归分析,得到一组样本数据,,,,其经验回归方程必过点,则
8.某校调查学生参加体育锻炼与性别的关系,得到如下列联表(单位:人):
经常锻炼
不经常锻炼
合计
男生
35
55
90
女生
65
45
110
合计
100
100
200
参照公式(其中),计算得___________.(保留两位小数)
9.第31届世界大学生运动会将于2023年7月28日至8月8日在成都举行,组委会安排100名志愿者担任对外翻译工作,在下面“性别与会法语”的列联表中,____________.
会法语
不会法语
总计
男
a
b
40
女
12
d
总计
36
100
10.人工智能大模型已成为新一代数字技术核心,某企业自主研发了人工智能大模型,为了比较其与传统人工智能模型的文本生成效果,随机抽取两种模型各次文本生成效果,已知每次文本生成效果分为有效生成与无效生成两种情况,且部分统计数据如下表.
有效生成
无效生成
合计
模型A
4
模型B
12
合计
16
(1)完成列联表,并以样本估计总体,频率估计概率,若利用模型随机生成次文本,求该文本生成效果为有效生成的概率;
(2)根据小概率值的独立性检验,判断文本生成效果与模型类型是否有关.
附
0.100
0.050
0.010
2.706
3.841
6.635
独立性检验:
利用独立性假设、随机变量来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
学科网(北京)股份有限公司
$成对数据的统计分析(2)
2025—2026学年高二数学暑假作业-成对数据的统计分析(2)
1.已知两个线性相关变量x与y的统计数据如下表:
x
3
4
5
6
y
2.5
3
4
4.5
其回归直线方程是,据此计算,则样本点在处的残差为( )
A. B. C. D.
2.有一散点图如图所示,在A,B,C,D,E这5个点中去掉后,下列说法错误的是( )
A.相关系数r变大
B.残差平方和变大
C.变量x,y正相关
D.解释变量x与预报变量y的相关性变强
3.某医疗研究机构为检验某种新研发的药物对特定疾病治疗是否有效,随机选取了200名患者进行双盲实验.其中100人服用新药,100人服用旧药,统计结果如下表
治愈
未治愈
合计
服用新药
67
33
100
服用旧药
48
52
100
合计
115
85
200
附:统计量临界值表
0.10
0.05
0.01
0.005
k
2.706
3.841
6.635
7.879
其中.
则下列说法正确的是( )
A.有的把握认为新研发的药物对特定疾病治疗有效
B.有的把握认为新研发的药物对特定疾病治疗无效
C.有的把握认为新研发的药物对特定疾病治疗无效
D.有的把握认为新研发的药物对特定疾病治疗有效
4.5天内某校当天新增感冒人数y与每日温差x(单位:℃)的数据如下表:
x
5
7
8
9
11
y
9
m
15
17
20
由于保存不善,有1个数据模糊不清,用m代替,已知y关于x的经验回归方程为,则( )
A.13 B.14 C.15 D.12
5.观察下列散点图,其中两个变量的相关关系判断一定正确的是( )
A.图1中y与x呈正相关
B.图2中y与x不相关
C.图3中y与x的线性相关系数小于0
D.图1中y与x的线性相关系数小于图2中y与x的线性相关系数
6.以下结论错误的是( )
A.根据列联表中的数据计算得出,而,则根据小概率值的独立性检验,认为两个分类变量有关系
B.在回归直线中,变量时,变量y的值一定是15
C.的值越大,两个事件的相关性的可能性就越大
D.在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好
7.(多选)下列说法正确的是( )
A.若两个具有线性相关关系的变量的相关性越强,则线性相关系数r的值越接近于1
B.经验回归方程为时,变量x和y负相关
C.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
D.对两个变量y和x进行回归分析,得到一组样本数据,,,,其经验回归方程必过点,则
8.某校调查学生参加体育锻炼与性别的关系,得到如下列联表(单位:人):
经常锻炼
不经常锻炼
合计
男生
35
55
90
女生
65
45
110
合计
100
100
200
参照公式(其中),计算得___________.(保留两位小数)
9.第31届世界大学生运动会将于2023年7月28日至8月8日在成都举行,组委会安排100名志愿者担任对外翻译工作,在下面“性别与会法语”的列联表中,____________.
会法语
不会法语
总计
男
a
b
40
女
12
d
总计
36
100
10.人工智能大模型已成为新一代数字技术核心,某企业自主研发了人工智能大模型,为了比较其与传统人工智能模型的文本生成效果,随机抽取两种模型各次文本生成效果,已知每次文本生成效果分为有效生成与无效生成两种情况,且部分统计数据如下表.
有效生成
无效生成
合计
模型A
4
模型B
12
合计
16
(1)完成列联表,并以样本估计总体,频率估计概率,若利用模型随机生成次文本,求该文本生成效果为有效生成的概率;
(2)根据小概率值的独立性检验,判断文本生成效果与模型类型是否有关.
附
0.100
0.050
0.010
2.706
3.841
6.635
独立性检验:
利用独立性假设、随机变量来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
答案以及解析
1.答案:B
解析:根据题意,,又在回归直线方程上,所以
,所以回归直线方程为,时,得到预估值为3.15,所以样本点在处的残差为.故选:B.
2.答案:B
解析:观察散点图知,变量呈线性相关,点D偏离回归直线较远,去掉后:
对于A,相关性变强,相关系数r变大,A正确;
对于B,残差平方和变小,B错误;
对于C,散点的分布是从左下到右上,因此变量正相关,C正确;
对于D,解释变量x与预报变量y的相关性变强,D正确.故选:B.
3.答案:D
解析:因为,又因为当时,对应的犯错的概率为,所以有的把握认为新研发的药物对特定疾病治疗有效.故选:D.
4.答案:B
解析:由,,所以,解得.故选:B.
5.答案:D
解析:对于A,图1中y随x增大而减小 y与x呈负相关,A错误;
对于B,图2中各点较分散,y与x的相关性不强,不能肯定不相关,B错误;
对于C,图3中y随x增大而增大,y与x呈正相关,相关系数大于0,C错误;
对于D,图1与图2,y与x都呈负相关,相关系数为负,而图1中y与x的线性相关性较图2中y与x的线性相关性强,所以,图1中y与x的线性相关系数小于图2中y与x的线性相关系数,D正确.故选:D.
6.答案:B
解析:对于选项A:,故根据小概率值的独立性检验,认为两个分类变量有关系,即A正确:
对于选项B,回归直线方程中,当变量等于200时,y的值平均是15,不能说一定是15,故B错误;
对于选项C:越大,“X与Y有关系”可信程度越大,即相关性的可能性就越大,即C正确;
对于选项D:在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好,即D正确.故选:B.
7.答案:BCD
解析:对于A,若两个具有线性相关关系的变量的相关性越强,则线性相关系数r的绝对值越接近于1,故A不正确;
对于B,因为斜率小于0,所以变量x和y负相关,故B正确;
对于C,在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高,故C正确;
对于D,因为经验回归方程必过点,所以,,所以,故D正确.故选:BCD.
8.答案:8.08
解析:根据题意有:.
9.答案:88
解析:根据表格中的数据,因为志愿者的总人数为100,所以,
解得.故答案为:88.
10.答案:(1)0.9
(2)见解析
解析:(1)首先补全列联表:
有效生成
无效生成
合计
模型A
36
4
40
模型B
28
12
40
合计
64
16
80
根据频率估计概率,模型共生成次,其中有效生成次,
因此随机生成次为有效生成的频率为,
根据频率估计概率,利用模型随机生成次文本,该文本生成效果为有效生成的概率0.9.
(2)零假设:文本生成效果与模型类型无关.
代入卡方公式计算,令,
.
因为小概率值对应的临界值,由于,因此不成立.
结论:依据的独立性检验,认为文本生成效果与模型类型有关.
学科网(北京)股份有限公司
$