内容正文:
课时分层评价23 成对数据统计分析中的综合问题
(时间:60分钟 满分:110分)
(本栏目内容,在学生用书中以独立形式分册装订!)
(1—9题,每小题5分,共45分)
1.设两个变量x和y之间具有线性相关关系,它们的相关系数为r,y关于x的回归直线方程为=kx+b,则( )
A.k与r的符号相反 B.b与r的符号相同
C.k与r的符号相同 D.b与r的符号相反
答案:C
解析:由线性相关关系可知:若k>0,等价于两个变量正相关,等价于r>0;若k<0,等价于两个变量负相关,等价于r<0;所以k与r的符号相同,故A错误,C正确;又因为b与r的符号没有关系,故B、D错误.故选C.
2.如图是学校高二1、2班期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么( )
A.两个班6名学生的数学成绩优秀率可能相等
B.1班6名学生的数学成绩优秀率一定高于2班
C.2班6名学生中数学成绩不优秀的一定多于优秀的
D.“两班学生的数学成绩优秀率存在差异”判断一定正确
答案:A
解析: 题图是学校高二1、2班期中考试数学成绩优秀率的等高堆积条形图,从两个班随机抽取的6名学生的期中考试数学成绩优秀率无法确定哪个班的比较高,2班6名学生数学成绩不优秀的和优秀的人数也不能确定,故A正确,B,C错误;两个班期中考试数学成绩的优秀率均在0.5左右,并不能直接确定“两班学生的数学成绩优秀率存在差异”,故D错误.故选A.
3.设某制造公司进行技术升级后的第x个月(x=1,2,3,4,5)的利润为y(单位:百万元),根据统计数据,求得y关于x的经验回归方程为=6x+3,若x=1时的观测值y=10,则x=1时的残差为( )
A.-1 B.1
C.3 D.6
答案:B
解析:因为x=1时的预测值为=6×1+3=9,所以残差为10-9=1.故选B.
4.手机给人们的生活带来便捷,但同时也对中学生的生活和学习造成了一定的影响.某校几个学生成立研究性学习小组,就使用手机对学习成绩的影响随机抽取了该校100名学生的期末考试成绩并制成如下列联表,则下列说法正确的是( )
手机使用情况
成绩
总计
成绩优秀
成绩不优秀
不用手机
40
10
50
使用手机
5
45
50
总计
45
55
100
(参考公式:χ2= ,其中n=a+b+c+d)
A.在犯错误的概率不超过0.01的前提下认为使用手机与学习成绩无关
B.在犯错误的概率不超过0.1的前提下认为使用手机与学习成绩无关
C.依据小概率α=0.01的独立性检验,认为使用手机对学习成绩有影响
D.依据小概率α=0.01的独立性检验,认为使用手机对学习成绩没有影响
答案:C
解析:由列联表中的数据,计算χ2= ≈49.49>6.635,依据小概率α=0.01的独立性检验,认为使用手机对学习成绩有影响,且此结论犯错误的概率不超过0.01,故A、B、D错误,C正确.故选C.
5.云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续增长.已知某科技公司2021年至2025年云计算市场规模数据,且市场规模y与年份代码x的关系可以用模型y=c1(其中e为自然对数的底数)拟合,设z=ln y,得到数据统计表如下:
年份
2021年
2022年
2023年
2024年
2025年
年份代码x
1
2
3
4
5
云计算市场规模y/千万元
7.4
11
20
36.6
56.7
z=ln y
2
2.4
3
3.6
4
由上表可得经验回归方程z=0.52x+a,则2028年该科技公司云计算市场规模y的估计值为( )
A.e5.08 B.e5.6
C.e6.12 D.e6.5
答案:B
解析:因为=3,=3,所以a=-0.52=3-3×0.52=1.44,即经验回归方程z=0.52x+1.44,当x=8时,z=0.52×8+1.44=5.6,所以y=ez=e5.6,即2028年该科技公司云计算市场规模y的估计值为e5.6.故选B.
6.(多选)下列说法错误的是( )
A.当样本相关系数r满足|r|=1时,成对样本数据的两个变量之间满足一种线性关系
B.残差等于预测值减去观测值
C.决定系数R2越大,模型拟合效果越差
D.在独立性检验中,当χ2≥xα(xα为α的临界值)时,推断零假设H0不成立
答案:BC
解析:当样本相关系数r=±1,即|r|=1时,成对样本数据的两个变量之间满足一种线性关系,故A正确;残差等于观测值减去预测值,故B错误;决定系数R2越大,模型拟合效果越好,故C错误;根据独立性检验的规则,当χ2≥xα时,推断零假设H0不成立,故D正确.故选BC.
7.新能源汽车的核心部件是动力电池,电池占了整车成本的很大一部分,而其中的原材料碳酸锂又是电池的主要成分.从2020年底开始,碳酸锂的价格不断升高,下表是2022年某企业的前5个月碳酸锂的价格y(单位:万元/千克)与月份x的统计数据.
月份代码x
1
2
3
4
5
碳酸锂价格y/(万元/千克)
0.5
0.6
1
m
1.5
根据表中数据,得出y关于x的经验回归方程为=0.28x+,根据数据计算出在样本点(5,1.5)处的残差为-0.06,则表中m= .
答案:1.4
解析:由题可知,当x=5时,有1.5-=1.5-(0.28×5+)=-0.06,解得=0.16.又==3,==,且经验回归直线过样本点的中心(,),所以0.28×3+0.16=,解得m=1.4.
8.为了了解运动和寿命是否相关,先作了一次抽样调查,被调查的经常锻炼与不经常锻炼的人均为12t,统计得到以下列联表,经计算,依据小概率α=0.05的独立性检验,认为经常锻炼和长寿相关,但依据小概率α=0.01的独立性检验,认为经常锻炼和长寿无关,则调查人数中经常锻炼的人至少有 人.
锻炼
寿命
合计
长寿
不长寿
经常
8t
4t
12t
不经常
5t
7t
12t
合计
13t
11t
24t
答案:36
解析:根据列联表中的数据,经计算得到χ2==t,依题意知3.841≤t<6.635,即得2.543≤t<4.393.又t∈N,则t=3或4,则调查人数中经常锻炼的人至少有12×3=36人.
9.根据下面的数据:
x
1
2
3
4
y
31.6
52.5
72
91.9
求得y关于x的回归直线方程为=20x+12,则这组数据相对于所求的回归直线方程的4个残差的方差为 .
答案:0.105
解析:根据=20x+12,分别将x=1,2,3,4代入求得分别为32,52,72,92,则4个残差为-0.4,0.5,0,-0.1,残差的平均数为0,故残差的方差为s2= [(-0.4-0)2+(0.5-0)2+(0-0)2+(-0.1-0)2]=0.105.
10.(13分)为了解某一地区电动汽车销售情况,某部门根据统计数据,用最小二乘法得到电动汽车销量y(单位:万台)关于x(年份)的线性回归方程为y=3x+800,且销量y的方差=,年份x的方差=5.
(1)求y与x的相关系数r,并据此判断电动汽车销量y与年份x的相关性强弱;
(2)该部门还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
性别
购买非电动汽车
购买电动汽车
总计
男性
39
45
女性
15
总计
依据小概率α=0.05的独立性检验,分析购买电动汽车与车主性别是否有关.
参考公式:(ⅰ)线性回归方程:=x+,其中=,=-;
(ⅱ)相关系数:r=,若r>0.9,则可判断y与x线性相关较强;
(ⅲ)χ2=,其中n=a+b+c+d.附表:
α
0.10
0.05
0.010
0.001
xα
2.706
3.841
6.635
10.828
解:(1)相关系数为r= =·
=·=·=3×==0.937 5>0.9.
(由y关于x的线性回归方程为y=3x+800可知:=3,且=5,=)
故y与x线性相关较强.
(2)依题意,
性别
购买非电动汽车
购买电动汽车
总计
男性
39
6
45
女性
30
15
45
总计
69
21
90
零假设为H0:购买电动汽车与车主性别无关.
根据列联表中的数据,经计算得到
χ2=
==≈5.031>3.841.
依据小概率α=0.05的独立性检验,我们推断H0不成立,即购买电动汽车与车主性别有关联,此推断犯错误的概率不大于0.05.
(11—13题,每小题5分,共15分)
11.某中学课外活动小组为了研究经济走势,根据该市1999-2021年的GDP(国内生产总值)数据绘制出下面的散点图,该小组选择了如下2个模型来拟合GDP值y随年份x的变化情况,模型一:y=kx+b(k>0,x>0);模型二:y=kex+b(k>0,x>0),下列说法正确的是( )
A.变量y与x负相关
B.根据散点图的特征,模型一能更好地拟合GDP值随年份的变化情况
C.变量y与x有较强的线性相关性
D.若选择模型二,y=kex+b的图象不一定经过点(,)
答案:D
解析:对于A,由散点图可知y随年份x的增大而增大,所以变量y与x正相关,故A错误;对于BC,由散点图可知变量y与x的变化趋向于一条曲线,所以模型二能更好地拟合GDP值随年份的变化情况,故B错误,C错误;对于D,若选择模型二:y=kex+b(k>0,x>0),令t=ex,则y=kt+b的图象一定过点(,),不一定过点(,),故D正确.故选D.
12.(多选)“一粥一饭,当思来之不易”,道理虽简单,但每年我国还是有2 000多亿元的餐桌浪费,被倒掉的食物相当于2亿多人一年的口粮.为营造“节约光荣,浪费可耻”的氛围,某市发起了“光盘行动”.某机构为调研民众对“光盘行动”的认可情况,在某大型餐厅中随机调查了90位来店就餐的客人,制成如下所示的列联表,通过计算得到χ2的观测值为9.
认可
不认可
40岁以下
20
20
40岁以上(含40岁)
40
10
已知P(χ2≥6.635)=0.010,P(χ2≥10.828)=0.001,则下列判断正确的是( )
A.在该餐厅用餐的客人中大约有66.7%的客人认可“光盘行动”
B.在该餐厅用餐的客人中大约有99%的客人认可“光盘行动”
C.根据小概率值α=0.01的独立性检验,认为“光盘行动”的认可情况与年龄有关
D.根据小概率值α=0.001的独立性检验,认为“光盘行动”的认可情况与年龄有关
答案:AC
解析:根据题目提供的数据,计算出χ2的观测值,结合选项进行判断.因为χ2的观测值为9,且P(χ2≥6.635)=0.010,P(χ2≥10.828)=0.001,又因为9>6.635,但9<10.828,所以根据小概率值α=0.01的独立性检验,认为“光盘行动”的认可情况与年龄有关,故C正确,D错误;由表可知认可“光盘行动”的人数为60人,所以在该餐厅用餐的客人中认可“光盘行动”的比例为 ×100%≈66.7%,故A正确,B错误.故选AC.
13.汽车轮胎凹槽深度是影响汽车刹车的因素,汽车行驶会导致轮胎面磨损.某实验室通过实验测得行驶里程与某品牌轮胎凹槽深度的数据,建立了如下回归模型y=c1·,通过实验数据分析与计算得到如下结论:①c2=-0.18;②=10,令u=ln y,=0.35,则回归方程应为 .
答案:y=e2.15-0.18x
解析:因为回归模型为y=c1·,因为c2=-0.18,可得y=c1·e-0.18x,两边同时取对数,可得ln y=ln(c1·e-0.18x)=ln c1-0.18x,令u=ln y,此时u=ln c1-0.18x,又因为=10,=0.35,所以ln c1=0.35+0.18×10=2.15,即c1=e2.15,所以y=e2.15·e-0.18x=e2.15-0.18x.
14.(15分)为选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,教育部出台并制定“强基计划”,由试点高校自主命题,校考过程中通过笔试后才能进入面试环节.
(1)为了更好地服务于高三学生,某研究机构对随机抽取的5名高三学生的记忆力x和判断力y进行统计分析,得到下表数据:
x
6
8
9
10
12
y
2
3
4
5
6
请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合,并求y关于x的线性回归方程y=x+(精确到0.01);
(2)现有甲、乙两所大学的笔试环节都设有三门考试科目且每门科目是否通过相互独立,若某考生报考甲大学,每门笔试科目通过的概率均为,该考生报考乙大学,每门笔试科目通过的概率依次为m、、,其中0<m<1,根据规定每名考生只能报考强基计划的一所试点高校,若以笔试过程中通过科目数的期望为依据作出决策,求该考生更希望通过乙大学笔试时m的取值范围.
解:(1)根据表格中的数据,可得
==9,==4,
xiyi=12+24+36+50+72=194,
=36+64+81+100+144=425,
=4+9+16+25+36=90.
可得相关系数r==≈0.99>0.95.
故y与x之间的关系可用线性回归模型进行拟合.
又由===0.7,
可得=4-9×0.7=-2.3.
综上回归直线方程y=0.7x-2.3.
(2)通过甲大学的考试科目数X~B(3,),
则E(X)=3×=.
设通过乙大学的考试科目数为Y,则Y可能的取值为0,1,2,3.
所以P(Y=0)=(1-m)(1-)(1-)=(1-m),
P(Y=1)=m(1-)(1-)+(1-m)××(1-)+(1-m)×(1-)×=-m,
P(Y=2)=m××(1-)+m×(1-)×+(1-m)××=+m,
P(Y=3)=m××=m.
所以E(Y)=-m+2(+m)+3×m=+m.
因为该考生更希望通过乙大学的笔试考试,
所以E(Y)>E(X),即+m>,
又由0<m<1,解得<m<1,
即该考生更希望通过乙大学的笔试时m的范围为(,1).
15.(5分)已知随机变量X与Y的4组样本数据(记为(x1,y1),(x2,y2),(x3,y3),(x4,y4))如下表:
X
1
2
3
4
Y
1
m
n
4
已知上表数据中=2.5.若某同学对m赋了三个值分别为1.5,2,2.5,得到三条回归直线分别为Y=X+,Y=X+,Y=X+,对应的相关系数分别为r1,r2,r3,下列结论中错误的是( )
参考公式:=,
=-,r=
A.三条回归直线有共同交点
B.三个相关系数中,r2最大
C. >
D. >
答案:D
解析:依题意,1+m+n+4=10,即m+n=5.若m=1.5,则n=3.5,此时= =2.5,=2.5,则= = =1.1,=-=2.5-1.1×2.5=-0.25,r1= ≈ ;若m=2,则n=3,此时=2.5,=2.5,同理得=1,=0,r2=1;若m=2.5,则n=2.5,此时=2.5,=2.5,同理得=0.9,=0.25,r3=.三条回归直线均经过点(2.5,2.5),故A正确;由以上,三个相关系数中,r2最大,>,<,故B、C正确,D错误.故选D.
16. (17分)2024年6月25日14时07分,嫦娥六号返回器准确着陆于内蒙古自治区四子王旗预定区域,工作正常,标志着探月工程嫦娥六号任务取得圆满成功,实现了世界首次月球背面采样返回.某学校为了了解学生对探月工程的关注情况,随机从该校学生中抽取了一个容量为90的样本进行调查,调查结果如下表:
关注
不关注
合计
男生
55
60
女生
合计
75
(1)完成上述列联表,依据该统计数据,依据小概率值α=0.01的独立性检验,分析该校学生对探月工程的关注与性别是否有关.
(2)为了激发同学们对探月工程的关注,该校举办了一次探月知识闯关比赛,比赛有两个答题方案可供选择:
方案一:回答4个问题,至少答对3个问题才能晋级;
方案二:在4个问题中随机选择2个问题作答,都答对才能晋级.
已知振华同学答对这4个问题的概率分别为,,,,振华同学回答这4个问题正确与否相互独立,则振华选择哪种方案晋级的可能性更大?
附:χ2=
α
0.1
0.05
0.025
0.01
0.001
xα
2.706
3.841
5.024
6.635
10.828
解:(1)2×2列联表如下:
关注
不关注
合计
男生
55
5
60
女生
20
10
30
合计
75
15
90
零假设为H0:该校学生对探月工程的关注与性别无关.
根据列联表中的数据,经计算得到χ2==9>6.635,
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为该校学生对探月工程的关注与性别有关联,此推断犯错误的概率不大于0.01.
(2)记这4个问题为a,b,c,d,记振华答对a,b,c,d的事件分别为A,B,C,D,
分别记按方案一、二晋级的概率为P1,P2,
则P1=P(ABC)+P(ABD)+P(ACD)+P(BCD)+P(ABCD)
=()3××2+()2×××3=,
P2=P(AB)+P(AC)+P(AD)+P(BC)+P(BD)+P(CD)
=[()2×3+××3]=,
因为>,振华选择方案一晋级的可能性更大.
学生用书⬇第97页
学科网(北京)股份有限公司
$