内容正文:
成对数据的统计分析(3)
2025—2026学年高二数学暑假作业-成对数据的统计分析(3)
1.变量X与Y相对应的一组数据为,,,,;变量U与V相对应的一组数据为,,,,.为变量X与Y之间的样本相关系数,为变量U与V之间的样本相关系数,则( )
A. B. C. D.
2.2025年中国“人造太阳”再创世界纪录,实现“亿度千秒”稳态运行,其核心参数研究中,科研团队对某聚变反应的温度x(单位:1000万度)和反应持续时间y(单位:秒)的一组观测数据作线性相关分析,其回归直线方程是,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=16,则实数的值是( )
A. B.1 C.2 D.4
3.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为.
零件数x(个)
1
2
3
4
5
加工时间y(min)
50
67
71
79
表中有一个数据模糊不清,请你推断出该数据的值为( )
A.55 B.55.8 C.59 D.51
4.下列说法中,正确的是( )
A.经验回归直线必经过样本点中心
B.样本相关系数r的值越大,两个变量的相关程度越强
C.在残差图中,残差点所在的水平带状区域越宽,回归方程的预报精确度越高
D.根据分类变量X与Y的成对样本数据,计算得到,根据小概率值的独立性检验),可判断X与Y有关联,此推断犯错误的概率不超过0.05
5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
附表:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.若的观测值,我们有99.9%的把握认为吸烟与患肺病有关系,那么在1000个吸烟的人中必有999人患有肺病
B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能性患有肺病
C.从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得判断出现错误
D.以上三种说法都不正确
6.某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20,则下列结论正确的是( )
附表:
a
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关
B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
C.根据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
D.是否接受去外地长时间出差与性别无关
7.(多选)下列说法正确的是( )
A.样本数据2,3,3,4,7,8,10,18的第80百分位数为10
B.样本数据的正线性相关程度越强,则样本相关系数r的值越大
C.根据分类变量x与y的成对数据,计算得到,依据的独立性检验,结论为变量x与y不独立
D.一元线性回归模型的残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内
8.已知一组数据()大致呈线性分布,其回归直线方程为,则的最小值为____.
9.已知电商平台统计的连续5天某商品的点击量(单位:万次)如下:
样本号i
1
2
3
4
5
第天
1
2
3
4
5
点击量
2.4
2.7
4.1
6.4
7.9
并计算得,,,,.建立点击量y关于天数x的线性回归方程,预测第6天的点击量为____________
10.“阳光杯”中学生篮球联赛是毕节市威宁自治县极具本土特色的体育赛事,赛事深度融合威宁多民族文化与高原风情,是当地群众最喜爱的体育赛事之一.威宁县某中学为了研究不同性别的学生对该赛事的了解情况,进行了一次抽样调查,随机抽取该校男生和女生各80名作为样本.设事件“了解‘阳光杯’中学生篮球联赛”,“学生为女生”,已知,.
(1)完成下列列联表,并依据的独立性检验,能否认为该校学生对“阳光杯”中学生篮球联赛的了解情况与性别有关联?
了解
不了解
合计
男生
女生
合计
(2)现从该样本不了解“阳光杯”中学生篮球联赛的学生中,采用分层随机抽样的方法抽取10名学生,再从这10名学生中随机抽取2人,设抽取的2人中男生的人数为X,求X的分布列和数学期望.
附:,其中.
α
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
学科网(北京)股份有限公司
$成对数据的统计分析(3)
2025—2026学年高二数学暑假作业-成对数据的统计分析(3)
学科网(北京)股份有限公司
1.变量X与Y相对应的一组数据为,,,,;变量U与V相对应的一组数据为,,,,.为变量X与Y之间的样本相关系数,为变量U与V之间的样本相关系数,则( )
A. B. C. D.
2.2025年中国“人造太阳”再创世界纪录,实现“亿度千秒”稳态运行,其核心参数研究中,科研团队对某聚变反应的温度x(单位:1000万度)和反应持续时间y(单位:秒)的一组观测数据作线性相关分析,其回归直线方程是,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=16,则实数的值是( )
A. B.1 C.2 D.4
3.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归直线方程为.
零件数x(个)
1
2
3
4
5
加工时间y(min)
50
67
71
79
表中有一个数据模糊不清,请你推断出该数据的值为( )
A.55 B.55.8 C.59 D.51
4.下列说法中,正确的是( )
A.经验回归直线必经过样本点中心
B.样本相关系数r的值越大,两个变量的相关程度越强
C.在残差图中,残差点所在的水平带状区域越宽,回归方程的预报精确度越高
D.根据分类变量X与Y的成对样本数据,计算得到,根据小概率值的独立性检验),可判断X与Y有关联,此推断犯错误的概率不超过0.05
5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
附表:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.若的观测值,我们有99.9%的把握认为吸烟与患肺病有关系,那么在1000个吸烟的人中必有999人患有肺病
B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能性患有肺病
C.从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得判断出现错误
D.以上三种说法都不正确
6.某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20,则下列结论正确的是( )
附表:
a
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关
B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
C.根据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
D.是否接受去外地长时间出差与性别无关
7.(多选)下列说法正确的是( )
A.样本数据2,3,3,4,7,8,10,18的第80百分位数为10
B.样本数据的正线性相关程度越强,则样本相关系数r的值越大
C.根据分类变量x与y的成对数据,计算得到,依据的独立性检验,结论为变量x与y不独立
D.一元线性回归模型的残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内
8.已知一组数据()大致呈线性分布,其回归直线方程为,则的最小值为____.
9.已知电商平台统计的连续5天某商品的点击量(单位:万次)如下:
样本号i
1
2
3
4
5
第天
1
2
3
4
5
点击量
2.4
2.7
4.1
6.4
7.9
并计算得,,,,.建立点击量y关于天数x的线性回归方程,预测第6天的点击量为____________
10.“阳光杯”中学生篮球联赛是毕节市威宁自治县极具本土特色的体育赛事,赛事深度融合威宁多民族文化与高原风情,是当地群众最喜爱的体育赛事之一.威宁县某中学为了研究不同性别的学生对该赛事的了解情况,进行了一次抽样调查,随机抽取该校男生和女生各80名作为样本.设事件“了解‘阳光杯’中学生篮球联赛”,“学生为女生”,已知,.
(1)完成下列列联表,并依据的独立性检验,能否认为该校学生对“阳光杯”中学生篮球联赛的了解情况与性别有关联?
了解
不了解
合计
男生
女生
合计
(2)现从该样本不了解“阳光杯”中学生篮球联赛的学生中,采用分层随机抽样的方法抽取10名学生,再从这10名学生中随机抽取2人,设抽取的2人中男生的人数为X,求X的分布列和数学期望.
附:,其中.
α
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
答案以及解析
1.答案:B
解析:由变量X与Y相对应的一组数据为,,,,,可得变量Y与X正相关,所以.而由变量U与V相对应的一组数据为,,,,,可得变量V与U负相关,所以.因此.故选:B.
2.答案:B
解析:由可知
,.因为回归直线过样本中心点,即,将其坐标代入方程可得,解得.故选:B.
3.答案:D
解析:回归直线必过样本点中心,其中,所以,所以不清楚的数值为.故选:D.
4.答案:A
解析:对于A,经验回归方程必经过样本点中心,A正确;
对于B,样本相关系数r的绝对值越大,两个变量的相关程度越强,B错误;
对于C,在残差图中,残差点所在的水平带状区域越窄,回归方程的预报精确度越高,C错误;
对于D,由,根据小概率值的独立性检验,没有充分证据推断X与Y有关联,即无关,D错误.故选:A.
5.答案:C
解析:对于选项A:若的观测值,我们有的把握认为吸烟与患肺病有关系,但在1000个吸烟的人中未必有999人患有肺病,故选项A不正确;
对于选项B:从独立性检验可以知道有的把握认为吸烟与患肺病有关系时,是指吸烟与患肺病有关系的概率,而不是吸烟的人有的可能性患有肺病,故选项B不正确;
对于选项C:若从统计量中求出有的把握认为吸烟与患肺病有关系,则有的可能性使得判断出现错误,故选项C正确.故选:C
6.答案:B
解析:由题意,列出列联表:
接受
不接受
合计
男
40
60
100
女
20
80
100
合计
60
140
200
零假设为:是否接受去外地长时间出差与性别相互独立,即是否接受去外地长时间出差与性别无关,所以,根据小概率值的独立性检验,我们推断不成立,即认为是否接受去外地长时间出差与性别有关,此推断犯错误的概率不大于0.005.故选:B.
7.答案:ABD
解析:选项A:将样本数据从小到大排列:2,3,3,4,7,8,10,18,则,所以第80百分位数为第7个数字,即10,故A正确.
选项B:样本正相关系数r的取值范围是,r越接近1,随机变量之间的线性相关程度越强.故正线性相关程度越强,则样本相关系数r越接近1,故B正确.
选项C:在独立性检验中,当时,没有充分证据推断原假设不成立,应认为变量x与y独立,故C错误.
选项D:残差均匀分布在0附近的水平带状区域,则模型拟合效果好,故D正确.故选:ABD.
8.答案:-16
解析:回归直线经过,且,,代入回归方程得:,即,所以当时,的最小值为-16.故答案为:-16.
9.答案:9.11万次
解析:因为,则,所以y关于x的回归直线方程为,当时,,故预测第6天的点击量约为9.11万次,故答案为:9.11万次.
10.答案:(1)列联表如下:
了解
不了解
合计
男生
40
40
80
女生
20
60
80
合计
60
100
160
依据的独立性检验,认为该校学生对“阳光杯”赛事的了解情况与性别有关联.
(2)X的分布列为:
X
0
1
2
P
数学期望为.
解析:(1)由题意,,可知“了解‘阳光杯’中学生篮球联赛”的女生有人,则不了解联赛的女生有60人,“了解‘阳光杯’中学生篮球联赛”的男生有 人,则不了解联赛的男生有40人.所以
了解
不了解
合计
男生
40
40
80
女生
20
60
80
合计
60
100
160
零假设:该校学生对“阳光杯”赛事的了解情况与性别无关.依题意,,,,,,则,
依据的独立性检验,推断不成立,所以认为该校学生对“阳光杯”赛事的了解情况与性别有关联.
(2)由(1)知,抽取的10名学生中,男生有4人,女生有6人.X可能的取值为0,1,2
则,,,
X的分布列为
X
0
1
2
P
数学期望
$