内容正文:
密 ○ 封 ○ 装 ○ 订 ○ 线 密 ○ 封 ○ 装 ○ 订 ○ 线
密 封 线 内 不 要 答 题
姓名 班级 考号
密 ○ 封 ○ 装 ○ 订 ○ 线 密 ○ 封 ○ 装 ○ 订 ○ 线
密 封 线 内 不 要 答 题
高中同步达标检测卷
第七章 统计案例
(全卷满分150分 考试用时120分钟)
一、单项选择题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.对两个变量x,y的三组数据进行统计,得到以下散点图,关于两个变量相关系数的比较,正确的是( )
A.r1>r2>r3 B.r2>r3>r 1 C.r1>r3>r2 D.r3>r2>r1
2.某村庄对该村内的50名老年人和年轻人每年是否体检的情况进行了调查,统计数据如表所示:
每年体检
不是每年都体检
总计
老年人
a
7
c
年轻人
6
b
d
总计
e
f
50
已知抽取的老年人、年轻人各25名,则对列联表数据的分析错误的是( )
A.a=18 B.b=19
C.c+d=50 D.f-e=-2
3.已知变量x和y的统计数据如下表:
x
6
8
10
12
y
2
3
5
6
根据上表可得线性回归方程,据此可以预测当x=15时,=( )
A.7.8 B.6.5 C.9.6 D.8.2
4.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为
X
Y
y1
y2
合计
x1
10
18
28
x2
m
26
m+26
合计
10+m
44
m+54
则当整数m取 时,X与Y的关系最弱( )
A.8 B.9 C.14 D.19
5.为了调查高一学生在分班选科时是否选择物理与性别的关系,随机调查了100名高一学生,得到2×2列联表如下:
选择物理
不选择物理
总计
男
35
20
55
女
15
30
45
总计
50
50
100
由此得出的正确结论是( )
A.有99%的把握认为“是否选择物理与性别有关”
B.有99%的把握认为“是否选择物理与性别无关”
C.有99.9%的把握认为“是否选择物理与性别有关”
D.有99.9%的把握认为“是否选择物理与性别无关”
附:χ2=,其中n=a+b+c+d.
P(χ2≥k)
0.10
0.05
0.025
0.010
0.005
0.001
k
2.706
3.841
5.024
6.635
7.879
10.828
6.某手机商城统计了1~5月某品牌手机的实际销售量,如下表所示:
时间x/月
1
2
3
4
5
销售量y/万部
0.5
0.8
1.0
1.2
1.5
若y与x线性相关,且线性回归方程为,则下列说法不正确的是( )
A.样本点的中心为(3,1.0)
B.由表中数据可知,变量y与x正相关
C.=0.28
D.预测x=7时该品牌手机的销售量为1.86万部
7.在对具有线性相关关系的两个变量x和y进行统计分析时,得到如表所示的数据:
x
4
m
8
10
12
y
1
2
3
5
6
由表中数据求得y关于x的回归方程为=0.65x-1.8,则(4,1),(m,2),(8,3)这三个样本点中,距离回归直线最近的点是( )
A.(4,1) B.(m,2)
C.(8,3) D.(4,1)或(m,2)
8.在某活动现场,为了解不同时段的入口游客人流量,从上午10点开始第一次向指挥中心反馈入口人流量,以后每过一个小时反馈一次.指挥中心统计了前5次的数据(i,yi),其中i=1,2,3,4,5,yi为第i次入口人流量数据(单位:百人),由此得到y关于i的回归方程为log2(i+1)+5.已知=9,根据回归方程,预测下午4点时入口游客的人流量数据(单位:百人)为(参考数据:log23≈1.6,log25≈2.3)( )
A.9.6 B.11.0 C.11.3 D.12.0
二、多项选择题(本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求,全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.某厂近几年陆续购买了几台A型机床,该型机床已投入生产的时间x(单位:年)与当年所需要支出的维修费用y(单位:万元)有如下统计数据:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7
根据表中的数据可得y关于x的线性回归方程为,则( )
A.y与x的样本相关系数r>0
B.=0.08
C.表中维修费用的第60百分位数为6
D.该型机床已投入生产的时间为10年时,当年所需要支出的维修费用一定是12.38万元
10.某中学为了研究高三年级学生的身高和性别的相关性问题,从高三年级800名学生中随机抽取200名学生测量身高,测量数据的列联表如下:
性别
身高
低于170 cm
不低于170 cm
总计
女
80
16
96
男
20
84
104
总计
100
100
200
下列说法正确的有( )
A.该样本是由分层随机抽样而得
B.该中学高三年级学生身高最高的是男生
C.有99.9%的把握认为该中学高三年级学生的身高与性别有关
D.若该样本中男生身高h(单位:cm)服从正态分布N(175,25),则该样本中身高在区间(175,180]内的男生超过30人
附:① χ2=,其中n=a+b+c+d.
②若X~N(μ,σ2),则随机变量X的取值落在区间(μ-σ,μ+σ]上的概率约为68.3%.
临界值表:
P(χ2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k
2.072
2.706
3.841
5.024
6.635
7.879
10.828
11.某农科所针对耕种深度x(单位:cm)与水稻每公顷产量y(单位:t)的关系进行研究,所得部分数据如下表:
耕种深度x/cm
8
10
12
14
16
18
每公顷产量y/t
6
8
m
n
11
12
已知m<n,用最小二乘法求出y关于x的线性回归方程为)2=24,数据在样本(12,m),(14,n)处的残差分别为ε1,ε2(残差=观测值-预测值).则( )
参考数据:两个变量x,y之间的相关系数r=;
参考公式:.
A.m+n=17 B. C. D.ε1+ε2=-1
三、填空题(本题共3小题,每小题5分,共15分)
12.某市大力发展科技创新,其科技创新投入资金x(单位:百万元)与回报资金y(单位:百万元)满足一元线性回归模型+e,已知投入200万元时,回报450万元,且每多投入100万元,回报资金多130万元.若2025年该市计划科技创新投入350万元,则预估回报资金为 万元.
13.某单位为了调查对工作的满意程度与性别是否具有相关性,随机抽取了若干名员工,所得数据统计如表所示,其中x∈N+,且x<16,若有90%的把握可以认为对工作的满意程度与性别具有相关性,则x的值是 .
对工作满意
对工作不满意
男性
5x
5x
女性
4x
6x
附:χ2=,其中n=a+b+c+d.
P(χ2≥k)
0.10
0.05
0.025
0.010
0.005
0.001
k
2.706
3.841
5.024
6.635
7.879
10.828
14.某网购公司统计了近5年在本公司网购的人数,得到如下的相关数据:(其中“x=1”表示2020年,“x=2”表示2021年,且x为整数,依次类推;y表示人数)
x
1
2
3
4
5
y/万人
20
50
100
150
180
根据表中的数据,可以求出=42,若预测该公司的网购人数能超过300万,则x的最小值为 .
四、解答题(本题共5小题,共77分.解答应写出文字说明、证明过程或演算步骤)
15.(13分)某学校对高三(1)班50名学生第一次模拟考试的数学成绩和化学成绩进行统计,得到如下数据:数学成绩的方差为=10,化学成绩的方差为=500 500,其中xi,yi(i∈N且1≤i≤50)分别表示这50名学生的数学成绩和化学成绩,y关于x的线性回归方程为.
(1)求x与y的样本相关系数r;
(2)从概率统计规律来看,本次考试高三(1)班学生的数学成绩η服从正态分布N(μ,σ2),用样本平均数作为μ的估计值,用样本方差作为σ2的估计值.试估计该校800名高三学生中,数学成绩位于区间(96.84,106.32]的人数.
附:①线性回归方程x中,;
②样本相关系数r=;
③若η~N(μ,σ2),则P(μ-σ<η≤μ+σ)≈0.68,P(μ-2σ<η≤μ+2σ)≈0.95;
④≈3.16.
16.(15分)2024年6月25日14时07分,嫦娥六号返回器准确着陆于内蒙古四子王旗预定区域,工作正常,标志着探月工程嫦娥六号任务取得圆满成功,实现世界首次月球背面采样返回.某学校为了了解学生对探月工程的关注情况,随机从该校学生中抽取了一个容量为90的样本进行调查,调查结果如下表:
关注
不关注
合计
男生
55
60
女生
合计
75
(1)完成上述列联表,依据该统计数据判断,能否有99%的把握认为该校学生对探月工程的关注与性别有关;
(2)为了激发同学们对探月工程的关注,该校举办了一次探月知识闯关比赛,比赛有两个答题方案可供选择:
方案一:回答4个问题,至少答对3个问题才能晋级;
方案二:在4个问题中随机选择2个问题作答,都答对才能晋级.
已知振华同学答对这4个问题的概率分别为,他回答这4个问题正确与否相互独立,则振华选择哪种方案晋级的可能性更大?
附: χ2=.
P(χ2≥k)
0.1
0.05
0.025
0.01
0.001
k
2.706
3.841
5.024
6.635
10.828
17.(15分)电机与变压器中绕组常用的绝缘材料的耐热等级根据绝缘耐温(绝缘材料的极限允许工作温度)分为如下7个级别:
耐热等级
Y
A
E
B
F
H
C
绝缘耐温/℃
[90,
105)
[105,
120)
[120,
130)
[130,
155)
[155,
180)
[180,
200)
[200,
230)
某绝缘材料生产企业为测试甲、乙两种生产工艺对绝缘耐温的影响,分别从采用两种工艺生产的产品中各随机抽取50件,测量各件产品的绝缘耐温(单位:℃),其频率分布直方图如下:
甲
乙
(1)若10月份该企业采用甲工艺生产的产品为65万件,估计其中耐热等级达到C级的产品数;
(2)若规定产品耐热等级达到C级为合格,除此之外均为不合格.完成以下表格,并判断是否有95%的把握认为测试结果与不同的生产工艺有关.
合格
不合格
甲
乙
附:χ2=,其中n=a+b+c+d.
P(χ2≥k)
0.25
0.15
0.10
0.05
k
1.323
2.072
2.706
3.841
18.(17分)抽球试验规则如下:盒子中初始装有1个白球和2个红球,每次有放回地任取1个,连续取两次,将以上过程记为一轮.如果每一轮取到的2个球都是白球,则记该轮为成功,否则记为失败.在抽取过程中,如果某一轮成功,则停止;否则,在盒子中再放入一个红球,然后接着进行下一轮抽球,如此继续下去,直至成功.
(1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量X,求X的分布列和数学期望;
(2)为验证抽球试验成功的概率不超过,有1 500名数学爱好者独立进行该抽球试验,记t表示成功时抽球试验的轮次数,y表示对应的人数,部分统计数据如表所示:
t
1
2
3
4
5
y
256
100
66
48
30
求y关于t的回归方程,并预测成功的总人数(精确到1).
参考公式:在线性回归方程中,.
参考数据:≈1.46,≈0.46,≈0.212其中xi=xi.
19.(17分)某大型企业对F产品进行研发与创新,根据市场调研与模拟,得到研发投入x(单位:亿元)与研发创新的直接收益y(单位:亿元)的数据统计如下:
x
2
3
4
6
8
10
13
21
22
23
24
25
y
13
22
31
42
50
56
58
68.5
68
67.5
66
66
当0<x≤17时,建立了y与x的两个回归模型:模型①=4.1x+11.8;模型②-14.4.当x>17时,确定y与x满足的线性回归方程为.
(1)根据下列表格中的数据,比较当0<x≤17时,模型①和②的决定系数,并选择拟合精度更高、更可靠的模型,预测该企业对产品研发的投入为17亿元时的直接收益;
回归模型
模型①
模型②
回归方程
=4.1x+11.8
-14.4
)2
182.4
79.2
(2)为鼓励科技创新,当研发的投入不少于20亿元时,国家给予该企业补贴收益10亿元,以回归方程为预测依据,比较研发投入17亿元与20亿元时该企业实际收益的大小;
(3)研发改造后,该企业F产品的效率X大幅提高,已知X服从正态分布N(0.52,0.012),该企业对研发团队的奖励方案如下:若F产品的效率不超过50%,不予奖励;若F产品的效率超过50%但不超过53%,每件F产品奖励2万元;若F产品的效率超过53%,每件F产品奖励5万元.求每件F产品获得奖励的数学期望(保留两位小数).
附:①决定系数R2=1-,R2越大,说明拟合效果越好;②中,;③若随机变量X服从正态分布N(μ,σ2),则P(μ-σ<X≤μ+σ)≈0.682 6,P(μ-2σ<X≤μ+2σ)≈0.954 4;④≈4.1.
答案与解析
第七章 统计案例
1.C 由散点图可知图1表示的是正相关,故r1>0;图2和图3表示的是负相关,且图2中的点比图3中的点分布更为集中,因此r2<0,r3<0,且|r2|>|r3|,所以r2<r3<0.
综上,r1>r3>r2.
2.D 由已知得a+7=c=25,6+b=d=25,a+6=e,7+b=f,e+f=50,c+d=50,
所以a=18,b=19,e=24,f=26,f-e=2.
3.D 根据题表中的数据得=4,
∴=0.7x-2.3,
当x=15时,=0.7×15-2.3=8.2.
4.C 在两个分类变量的列联表中,当|ad-bc|的值越小时,认为两个分类变量有关的可能性越小.令|ad-bc|=0,得10×26=18m,解得m≈14.4,又m为整数,所以当m=14时,X与Y的关系最弱.
5.A 因为χ2=≈9.09>6.635,所以有99%的把握认为“是否选择物理与性别有关”.
6.D 由题表中的数据得,=1.0,则样本点的中心为(3,1.0),故A中说法正确;
由题表中的数据可得,y随着x的增大而增大,所以变量y与x正相关,故B中说法正确;
将(3,1.0)代入,得=0.28,故C中说法正确;
由选项C可知线性回归方程为=0.24x+0.28,
将x=7代入=0.24x+0.28,得=0.24×7+0.28=1.96,故D中说法不正确.
7.B 由题表中的数据,可得×(1+2+3+5+6)=3.4,
将代入=0.65x-1.8,得3.4=0.65×-1.8,解得m=6.
当x=4时,=0.65×4-1.8=0.8,1-0.8=0.2;
当x=6时,=0.65×6-1.8=2.1,2.1-2=0.1;
当x=8时,=0.65×8-1.8=3.4,3.4-3=0.4.
因为0.1<0.2<0.4,所以(4,1),(6,2),(8,3)这三个样本点中距离回归直线最近的点是(6,2),即(m,2).
8.C 设x=log2(i+1),i=1,2,3,4,5,则x+5,
≈=1.9,又=9,所以9=×1.9+5,得,
所以log2(i+1)+5,
下午4点对应的i=7,预测此时入口游客的人流量数据(单位:百人)为×log28+5≈11.3.
9.ABC 根据题表中的数据可得=5,
所以样本中心点为(4,5).
对于A,由题表中的数据可得y随着x的增大而增大,所以y与x正相关,所以样本相关系数r>0,故A正确;
对于B,将(4,5)代入方程,得=0.08,故B正确;
对于C,维修费用从小到大依次为2.2,3.8,5.5,6.5,7,则第60百分位数为=6,故C正确;
对于D,由B知=1.23x+0.08,当x=10时,=12.3+0.08=12.38,故所需要支出的维修费用大概是12.38万元,故D错误.
10.CD 对于A,由已知信息不能确定样本是不是由分层随机抽样而得,故A错误;对于B,没有给出具体的身高数据,所以不能推出该中学高三年级学生身高最高的是男生,故B错误;对于C, χ2=≈82.05>10.828,所以有99.9%的把握认为该中学高三年级学生的身高与性别有关,故C正确;对于D,因为σ2=25,所以σ=5,所以P(175<h≤180)=P(170<h≤180)≈×68.3%=34.15%,104×34.15%=35.516≈36(人),即该样本中身高在区间(175,180]内的男生超过30人,故D正确.
11.ABD ∵=24,
∴=9,∴m+n=17,因此A正确;
由题表数据得=13,
∴r=)=40,
∴,
∴,
则ε1+ε2=m-=m+n-18=17-18=-1,因此B,D正确,C错误.
12.答案 645
解析 由题意得,当x=2时,=4.5,故4.5=2+e.
又每多投入100万元,回报资金多130万元,故=1.3,则+e=1.9,
所以=1.3x+1.9,当x=3.5时,=1.3×3.5+1.9=6.45,故预估回报资金为645万元.
13.答案 14或15
解析 根据题表中数据可得χ2=,由已知得≥2.706,解得x≥13.394 7,
因为x∈N+,且x<16,所以x=14或x=15.
14.答案 8
解析 由已知得,=100,
将(3,100)代入线性回归方程,得100=42×3+,解得=-26,则=42x-26,
令42x-26>300,可得x>≈7.76,
因为x为整数,所以x的最小值为8.
15.解析 (1)因为=8,
所以=400,(3分)
又=0.4,
所以)=200,(5分)
所以r=.(7分)
(2)因为=500 500,
所以500 500-50=500,解得=100,即μ=100,
因为σ2=10,所以σ≈3.16,(10分)
所以数学成绩η服从正态分布N(100,10),
则P(96.84<η≤106.32)=P(μ-σ<η≤μ+2σ)
=P(μ-σ<η≤μ+σ)+P(μ-2σ<η≤μ+2σ)
≈×0.95=0.815,(12分)
所以该校高三学生中数学成绩位于区间(96.84,106.32]的大约有800×0.815=652人.(13分)
16.解析 (1)列联表如下:
关注
不关注
合计
男生
55
5
60
女生
20
10
30
合计
75
15
90
故χ2==9>6.635,(5分)
所以能有99%的把握认为该校学生对探月工程的关注与性别有关.(7分)
(2)记这4个问题分别为a,b,c,d,振华答对a,b,c,d的事件分别为A,B,C,D,按方案一、二晋级的概率分别为P1,P2,(8分)
则P1=P(ABCBCD)+P(ABCD)
=,(11分)
P2=P(CD)
=,(14分)
因为,所以振华选择方案一晋级的可能性更大.(15分)
17.解析 (1)由题中的频率分布直方图知,采用甲工艺生产的产品中,耐热等级达到C级的频率为(0.06+0.02)×10=0.8,(3分)
∴估计10月份采用甲工艺生产的产品中,耐热等级达到C级的产品为65×0.8=52(万件).(6分)
(2)由题中的频率分布直方图知,采用甲工艺生产的产品中,耐热等级达到C级的为50×0.8=40(件),则未达到C级的为10件;(9分)
采用乙工艺生产的产品中,耐热等级达到C级的为50×(0.02+0.04)×10=30(件),则未达到C级的为20件.(12分)
由此可得表格如下:
合格
不合格
甲
40
10
乙
30
20
∴χ2=≈4.762>3.841,(14分)
∴有95%的把握认为测试结果与不同的生产工艺有关.(15分)
18.解析 (1)记事件A1表示“第一轮成功”,事件A2表示“第一轮失败”,
则P(A1)=;
记事件B1表示“第二轮成功”,事件B2表示“第二轮失败”,
则P(B1)=;
记事件C1表示“第三轮成功”,事件C2表示“第三轮失败”,
则P(C1)=,(3分)
由题意可知X的可能取值为1,2,3,
则P(X=1)=P(A1)=,
P(X=3)=P(A2)P(B2)=,(6分)
所以X的分布列为
X
1
2
3
P
EX=1×.(8分)
(2)xi=(i=1,2,3,4,5),由题知,=100,
×30=346,
则≈=290,
≈100-290×0.46=-33.4,(11分)
所以=290x-33.4,则-33.4.
当t=6时,-33.4≈15;当t=7时,-33.4≈8;
当t=8时,-33.4≈3;当t=9时,-33.4≈-1<0,
根据反比例函数的单调性,易知当t≥9时,<0,(15分)
而256+100+66+48+30+15+8+3=526,
故预测成功的总人数为526.(17分)
19.解析 (1)由题表得182.4>79.2,即,所以模型①的决定系数小于模型②的决定系数,说明模型②的拟合精度更高、更可靠.(3分)
当x=17时,-14.4≈21.3×4.1-14.4=72.93,
所以预测该企业对产品研发的投入为17亿元时的直接收益为72.93亿元.(5分)
(2)当x>17时,由已知得=7.2,所以=67.2,
所以=67.2+0.7×23=83.3,(8分)
所以当x>17时,y与x满足的线性回归方程为=-0.7x+83.3.
当x=20时,=-0.7×20+83.3=69.3.
所以当x=20时,实际收益的预测值为69.3+10=79.3(亿元),
因为79.3>72.93,
所以研发投入20亿元时该企业的实际收益更大.(12分)
(3)因为P(0.52-0.02<X≤0.52+0.02)≈0.954 4,
所以P(X>0.50)≈0.5+=0.977 2,所以P(X≤0.50)=1-P(X>0.50)=0.022 8,
因为P(0.52-0.01<X≤0.52+0.01)≈0.682 6,
所以P(X>0.53)≈0.5-=0.158 7,
所以P(0.50<X≤0.53)=0.977 2-0.158 7=0.818 5.(15分)
设每件F产品获得的奖励为Y万元,则Y的分布列为
Y
0
2
5
P
0.022 8
0.818 5
0.158 7
所以EY=0×0.022 8+2×0.818 5+5×0.158 7≈2.43(万元).(17分)
学科网(北京)股份有限公司
$$