内容正文:
专题突破练17 成对数据的统计分析
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.(2025上海普陀高三下学期质量调研)某市职业技能大赛的移动机器人比赛项目有19名同学参赛,他们在预赛中所得的积分互不相同,只有积分在前10名的同学才能进入决赛.若该比赛项目中的某同学知道自己的积分后,要判断自己能否进入决赛,则他只需要知道这19名同学的预赛积分的( )
A.平均数 B.众数 C.中位数 D.方差
2.(2025河北部分高中高三下学期模拟考试)在一组数据中,2,4,6出现的频率分别为0.3,0.4,0.3,则这组数据的方差为( )
A.2 B.2.4 C.3 D.4
3.(2025山西运城高三上学期开学摸底调研)下列说法错误的是( )
A.某校高一年级共有学生500人,现按性别采用分层随机抽样的方法抽取容量为50的样本,若样本中男生有30人,则该校高一年级女生的人数是200
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.在经验回归方程中,样本相关系数r越大,则两个变量的线性相关性越强
D.根据分类变量X与Y的成对样本数据,计算得到χ2=3.937,根据小概率值α=0.05的独立性检验(x0.05=3.841),可判断X与Y有关联,此推断犯错误的概率不大于0.05
4.(2025广东湛江普通高考测试)一组数据1,3,7,9,m(m>0)的中位数不小于平均数,则m的取值范围为( )
A.[5,7] B.[5,15] C.[7,15] D.[5,20]
5.(2025福建莆田高三第二次教学质量检测)为了解女儿身高与其母亲身高的关系,随机抽取5对母女的身高数据如下:
母亲身高x/cm
164
166
166
166
168
女儿身高y/cm
165
165
166
167
167
根据最小二乘法(即(yi-)2取最小),得y关于x的经验回归方程为( )
A.=x-1 B.=x+1 C.x+83 D.=166
6.(2025重庆学业质量调研抽测)某校数学建模兴趣小组收集了一组恒温动物体重W(单位:克)与心率f(单位:次/分钟)的对应数据(Wi,fi)(i=1,2,…,8).根据生物学常识和散点图得出f与W近似满足f=cWk(c,k为参数),令xi=ln Wi,yi=ln fi,计算得到=7,=4.由最小二乘法得到经验回归方程为x+6.8,则k的值为( )
A.-0.4 B.0.4 C.-0.2 D.0.2
7.(2025湖北鄂州高三下学期一模)随着春节申遗成功,世界对中国文化的理解和认同进一步加深.某学校为了解学生对春节习俗的认知情况,随机抽取了100名学生进行了测试,将他们的成绩适当分组后,画出的频率分布直方图如图所示,则下列数据一定不位于区间[80,85)内的是( )
A.众数
B.第70百分位数
C.中位数
D.平均数
8.(2025辽宁县域重点高中高三下学期二模)某实验中学为调查本校高三学生的学习成绩是否与坚持进行体育锻炼有关联,随机选取了高三300名学生的某次联考成绩进行统计,得到如下表格:
单位:人
分数
锻炼
合计
坚持锻炼
不坚持锻炼
分数≥600
100
80
180
分数<600
50
70
120
合计
150
150
300
依据小概率值α=m的独立性检验,可以认为高三学生的学习成绩与坚持进行体育锻炼有关联,则m的值可能是( )
附:χ2=,n=a+b+c+d.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
A.0.001 B.0.005 C.0.01 D.0.05
二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.(2025河北秦皇岛昌黎第一中学高三第一次模拟演练补偿考试)已知一组数据的频率分布直方图如图所示,则下列结论正确的是( )
A.该组数据服从正态分布
B.该组数据的平均数小于中位数
C.该组数据的众数小于平均数
D.该组数据的中位数小于众数
10.(2025山东青岛平度高考模拟检测试题)为了研究y与x的线性相关关系,收集了5组样本数据(见下表),假设经验回归方程为x+0.28,则( )
x
1
2
3
4
5
y
0.5
0.8
1
1.2
1.5
A.=0.24
B.x=5时的残差为0.02
C.样本数据y的第40百分位数为0.8
D.去掉样本点(3,1)后,y与x的样本相关系数不变
11.(2025云南玉溪高三二模)某校有男生m人,女生n人,且男生身高的均值为,方差为,女生身高的均值为,方差为,全体学生身高的均值和方差分别为,s2,则下列说法一定正确的有( )
A.若,则)
B.若m=n,则)
C.若,则s2≥)
D.若m=n,则s2≥)
三、填空题:本题共2小题,每小题5分,共10分.
12.(2025云南昆明第一中学高三第八次联考)某研究性学习小组针对“使用某APP的用户是否存在性别差异”,向40n(n∈N*)个人进行调查.用Ω表示所有调查对象构成的集合.以Ω为样本空间建立古典概型,并定义一对分类变量X和Y如下:
对于Ω中的每一名学生,X=Y=
现得到下表:
性别
调查对象
是某APP的用户(Y=1)
不是某APP的用户(Y=0)
男性(X=1)
8n
12n
女性(X=0)
12n
8n
若根据α=0.05的独立性检验,认为使用某APP的用户存在性别差异(其中x0.05=3.841),则n的最小值为 .(参考公式:χ2=,其中n=a+b+c+d )
13.(2025内蒙古通辽模拟)红铃虫是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数y(单位:个)和温度x(单位:℃)的8组观测数据,制成图1所示的散点图.现用两种模型,①y=ebx+a,②y=cx2+d分别进行拟合,由此得到相应的经验回归方程并进行残差分析,进一步得到图2所示的残差图.
图1 产卵数散点图
图2 两种模型的残差图
根据收集到的数据,计算得到如下值:
(xi-)2
(ti-)2
(zi-)(xi-)
(yi-)(ti-)
24
2.9
646
168
422 688
50.4
70 308
表中zi=ln yi,zi,ti=ti.
(1)根据残差图,比较模型①②的拟合效果,模型 比较合适.
(2)根据(1)中所选择的模型,求出y关于x的经验回归方程是 .
附:对于一组数据(ω1,v1),(ω2,v2),…,(ωn,vn),其经验回归直线ω的斜率和截距的最小二乘估计分别为.
核心素养创新练
14.(17分)(2025吉林普通中学高三上学期第二次模拟考试)国家设立国家自然科学基金,用于资助基础研究,支持人才培养和团队建设.现对近4年的国家自然科学基金项目支出(以下简称项目支出)概况进行统计,得到数据如下表:
年份
2020年
2021年
2022年
2023年
年份序号x
1
2
3
4
项目支出y/百亿元
90
96
100
108
(1)经过数据分析,发现年份序号与项目支出具有线性相关关系.请求出项目支出y关于年份序号x的经验回归方程,并预测2026年的项目支出.
(2)天元基金是国家自然科学基金中的数学专项基金之一,为促进甲、乙两个地区天元基金申报者的交流,天元基金委员会举办了论坛活动.经调查统计,甲、乙两个地区共有200人参加此次论坛活动,具体数据如下表:
单位:人
地区
性别
合计
男
女
甲
65
35
100
乙
45
55
100
合计
110
90
200
(i)根据小概率值α=0.005的独立性检验,能否认为申报者所在地区与性别有关联?
(ii)为了解此次论坛活动的满意度(满意度评分满分为10分),按性别进行分层随机抽样,从上述200人中抽取40人进行访谈,其中男性样本的满意度的平均数为9,方差为7.19,女性样本的满意度的平均数为7,方差为6.79,由这些数据,请求出总样本的满意度的平均数和方差,并对全体参加此次论坛活动的天元基金申报者的满意度的平均数和方差作出估计.
附:,χ2=,其中n=a+b+c+d.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
答案:
1.C 解析 因为19名同学的积分中位数是第10名得分,所以知道中位数即可判断是否在前10名.故选C.
2.B 解析 这组数据的平均数=2×0.3+4×0.4+6×0.3=4,方差s2=0.3×(2-4)2+0.4×(4-4)2+0.3×(6-4)2=2.4.故选B.
3.C 解析 对于A,该校高一年级女生的人数是500=200,故A正确;对于B,由8×75%=6,得第75百分位数为=10,故B正确;对于C,在经验回归方程中,样本相关系数r的绝对值越大,两个变量的线性相关性越强,故C错误;对于D,零假设为H0:分类变量X与Y无关联,由χ2=3.937>3.841=x0.05,可以推断H0不成立,即认为X与Y有关联,此推断犯错误的概率不大于0.05,故D正确.故选C.
4.B 解析 因为这组数据的平均数为=4+>4,
所以这组数据的中位数只可能是m或7.若这组数据的中位数是m,则4+m≤7,即5≤m≤7;若这组数据的中位数是7,则4+7≤m,即7≤m≤15.
综上所述,m的取值范围为[5,15].故选B.
5.C 解析 观察数据,可得y与x有关,故排除D.又=166,=166,所以经验回归方程必过点(166,166),所以排除A,B.故选C.
6.A 解析 因为f=cWk,两边取对数可得ln f=ln c+kln W,又xi=ln Wi,yi=ln fi,依题意,经验回归方程x+6.8必过样本点的中心(),所以4=7+6.8,解得=-0.4,所以k=-0.4.故选A.
7.B 解析 对于A,众数为=82.5∈[80,85);对于B,C,x==0.044,设中位数、第70百分位数分别为m,n,注意到(0.024+0.036)×5=0.3<0.5<0.3+0.060×5=0.6<0.7<0.6+0.044×5=0.82,设0.060×(m-80)=0.5-0.3,0.044×(n-85)=0.7-0.6,解得m=[80,85),n=[80,85);对于D,设平均数为z,则z=72.5×0.12+77.5×0.18+82.5×0.3+87.5×0.22+92.5×0.12+97.5×0.06=83.6∈[80,85).故选B.
8.D 解析 零假设为H0:高三学生的学习成绩与坚持进行体育锻炼无关联.由题意,χ2=5.6>3.841=x0.05,结合表格数据及选项,依据α=0.05的独立性检验,可以推断H0不成立,即可以认为高三学生的学习成绩与坚持进行体育锻炼有关联,则m的值可能是0.05.故选D.
9.BD 解析 对于A,根据正态分布的图象性质可知,该组数据的频率分布直方图没有明显的关于某对称轴对称,所以不服从正态分布,故A错误;对于B,根据题图可知,平均数靠左,小于中位数,故B正确;对于C,根据题图可知,众数靠右,大于平均数,故C错误;对于D,根据题图可知,中位数靠左,小于众数,故D正确.故选BD.
10.ABD 解析 由题意得=3,=1,所以1=3+0.28,得=0.24,故A正确;由=0.24x+0.28,当x=5时,=0.24×5+0.28=1.48,所以x=5时的残差为1.5-1.48=0.02,故B正确;因为5×0.4=2,所以样本数据y的第40百分位数为=0.9,故C错误;r=,去掉样本点(3,1)后,=3,=1,由于3-3=0,(3-3)×(1-1)=0,所以去掉样本点(3,1)后,y与x的样本相关系数不变,故D正确.故选ABD.
11.ABD 解析 对于A,若,则全体均值),故A正确;对于B,若m=n,则),故B正确;对于C,因为s2=]+],当时,由A选项可知)=,代入上式可得s2=,若m≠n,则可能s2<)(例如m=3n,=1,=5时),故C不正确;对于D,当m=n时,由B可知),可得s2=)+,因为s2=)+)恒成立,故D正确.
故选ABD.
12.3 解析 零假设为H0:使用某APP的用户不存在性别差异.因为根据α=0.05的独立性检验,认为使用某APP的用户存在性别差异,所以χ2=n>x0.05=3.841,即n>3.841=2.400 625,所以n的最小值为3.
13.(1)① (2)=e0.3x-4.3 解析 (1)模型①更合适,理由如下:模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状区域宽度窄,所以模型①的拟合精度更高,经验回归方程的预报精度相应就会越高,故选模型①比较合适.
(2)令z=ln y,则x,由所给的参考数据可得,=0.3,所以=2.9-0.3×24=-4.3,所以z关于x的经验回归方程为=0.3x-4.3,所以产卵数y关于温度x的经验回归方程为=e0.3x-4.3.
14.解 (1)(方法一)(1+2+3+4)=2.5,(90+96+100+108)=98.5,
(xi-)(yi-)=(-1.5)×(-8.5)+(-0.5)×(-2.5)+0.5×1.5+1.5×9.5=29,
=(-1.5)2+(-0.5)2+0.52+1.52=5,
所以=5.8,=98.5-5.8×2.5=84,所以国家自然科学技术基金项目支出y关于年份序号x的经验回归方程为=5.8x+84.当x=7时,=5.8×7+84=124.6,故预测2026年的国家自然科学技术基金项目支出为124.6百亿元.
(方法二)(1+2+3+4)=2.5,(90+96+100+108)=98.5,xiyi=1×90+2×96+3×100+4×108=1 014,=1+4+9+16=30,=5.8,=98.5-5.8×2.5=84,
所以国家自然科学技术基金项目支出y关于年份序号x的经验回归方程为=5.8x+84.当x=7时,=5.8×7+84=124.6,故预测2025年的国家自然科学技术基金项目支出为124.6百亿元.
(2)(ⅰ)零假设为H0:天元基金申报者的所在地区与性别无关联.根据列联表中的数据,经计算得到χ2=8.081>7.879=x0.005.
依据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为天元基金申报者的所在地区与性别有关联,此推断犯错误的概率不大于0.005.
(ⅱ)把男性样本的满意度平均数记为,方差记为;女性样本的满意度平均数记为,方差记为;总样本的满意度平均数记为,方差记为s2.则=9,=7.19,=7,=6.79,可得9+7=8.1,s2=[7.19+(9-8.1)2]+[6.79+(7-8.1)2]=8.故总样本的满意度的平均数为8.1,方差为8.并据此估计全体参加论坛活动的天元基金申报者的满意度的平均数为8.1,方差为8.
10
学科网(北京)股份有限公司
$