内容正文:
阶段测评(三)[范围8.1~8.3]
(时间:50分钟,满分:100分)
一、选择题:本题共6小题,每小题5分,共30分,在每小题给出的四个选项中,只有一项是符合题目要求的.
1.对于变量x与y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫做( )
A.函数关系 B.线性关系
C.相关关系 D.回归关系
答案 C
2.某无人机专卖店统计了5月份前5天每天无人机的实际销量,结果如下表所示.
日期编号x
1
2
3
4
5
销量y/部
9
a
17
b
27
经分析知,y与x有较强的线性相关关系,且求得线性回归方程为=4.5x+3.7,则a+b的值为( )
A.28 B.30
C.33 D.35
解析 依题意=(1+2+3+4+5)=3,
=(9+a+17+b+27)=,
又回归直线方程=4.5x+3.7过点(,),所以=4.5×3+3.7,解得a+b=33.
故选C.
答案 C
3.(2025·梅州高二期末)我国新能源汽车的卓越性能赢得全球人民的信赖,某品牌新能源汽车凭借科研创新、广告宣传和可靠的售后保障,在全球赢得了很好的营销局面,下表为该品牌新能源汽车的科研经费投入和全球市场规模统计.
科研经费x1(单位:百亿元)
2
4
6
12
16
市场规模y1(单位:百万辆)
1
1.5
2
3
3.5
如此得到y关于x的经验回归方程:y=0.18x+,估计当该品牌新能源汽车的科研经费投入20(百亿元)时,全球市场规模将达到________百万辆.( )
A.4 B.4.14
C.4.36 D.4.58
解析 由表中数据可得==8,==2.2,
故样本中心为(8,2.2),
所以=-0.18=2.2-0.18×8=0.76,
即y=0.18x+0.76,
故当x=20时,y=0.18×20+0.76=4.36,
故选C.
答案 C
4.在两个变量Y与X的回归模型中,分别选择了4个不同的模型,它们的样本相关系数r如表所示,其中线性相关性最强的模型是( )
模型
模型1
模型2
模型3
模型4
相关系数r
0.48
0.15
0.96
0.30
A.模型1 B.模型2
C.模型3 D.模型4
解析 样本相关系数r的绝对值越接近1,说明Y与X的线性相关性越强.
故选C.
答案 C
5.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用过血清的人与另外500名未使用过血清的人一年中的感冒记录进行比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知P(χ2≥3.841)≈0.05.对此,有以下四个结论,正确的是( )
A.依据小概率值α=0.05的独立性检验,可以认为“这种血清能起到预防感冒的作用”
B.若某人未使用该血清,那么他在一年中有95%的可能性得感冒
C.这种血清预防感冒的有效率为95%
D.这种血清预防感冒的有效率为5%
解析 由题意,因为χ2≈3.918,P(χ2≥3.841)≈0.05,所以依据小概率值α=0.05的独立性检验,可以认为“这种血清能起到预防感冒的作用”.
答案 A
6.某校高二学生选课情况如下列联表一和列联表二(单位:人).
表一
选物理
不选物理
总计
男生
340
110
450
女生
140
210
350
总计
480
320
800
表二
选生物
不选生物
总计
男生
150
300
450
女生
150
200
350
总计
300
500
800
试根据小概率值α=0.005的独立性检验,分析物理和生物选课与性别是否有关( )
附:χ2=,n=a+b+c+d,α=P(χ2≥xα).
α
0.15
0.10
0.05
0.025
0.01
0.005
0.001
xα
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.选物理与性别有关,选生物与性别有关
B.选物理与性别无关,选生物与性别有关
C.选物理与性别有关,选生物与性别无关
D.选物理与性别无关,选生物与性别无关
解析 由题意,先分析物理课是否与性别有关.
根据表格数据,n=800,a=340,b=110,c=140,d=210,
∴χ2==103.7,
结合题干表格数据,x0.005=7.879,∴χ2>x0.005,
因此,有充分证据推断选择物理学科与性别有关;
再分析生物课是否与性别有关.
根据表格数据,n=800,a=150,b=300,c=150,d=200,
∴χ2==7.619,
结合题干表格数据,x0.005=7.879,∴χ2<x0.005,
因此,没有充分证据推断选择生物学科与性别有关.
故选C.
答案 C
二、选择题:本题共2小题,每小题6分,共12分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
7.下列关于变量间的线性相关系数r说法正确的是( )
A.相关系数r的取值范围为[-1,1]
B.|r|=1的充要条件是成对数据构成的点都在回归直线上
C.两个变量正相关的充要条件是r>0
D.相关系数r越小,则变量间的线性相关性越弱
解析 选项A:相关系数r的取值范围为[-1,1],判断正确;
选项B:|r|=1的充要条件是成对数据构成的点都在回归直线上,判断正确;
选项C:两个变量正相关的充要条件是r>0,判断正确;
选项D:相关系数r的绝对值越小,则变量间的线性相关性越弱,判断错误.
故选ABC.
答案 ABC
8.某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下表所示的列联表.经计算χ2≈4.762,则可以推断出( )
满意
不满意
男
30
20
女
40
10
A.该学校男生对食堂服务满意的概率的估计值为
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.依据α=0.05的独立性检验,可以认为男、女生对该食堂服务的评价有差异
D.依据α=0.01的独立性检验,可以认为男、女生对该食堂服务的评价有差异
解析 对于选项A,该学校男生对食堂服务满意的概率的估计值为=,故A正确;
对于选项B,该学校女生对食堂服务满意的概率的估计值为=>,故B错误;
因为χ2≈4.762>3.841=x0.05,所以依据α=0.05的独立性检验,可以认为男、女生对该食堂服务的评价有差异,故C正确、D错误.
故选AC.
答案 AC
三、填空题:本题共3小题,每小题5分,共15分.
9.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=xi++ei(i=1,2,…,n),且ei=0,则R2为________.
答案 1
10.下面是一个2×2列联表:
X
Y
合计
y1
y2
x1
a
21
70
x2
5
c
30
合计
b
d
100
则b-d=________,χ2≈________.(保留小数点后3位)
解析 由2×2列联表得:
a=49,b=54,c=25,d=46.
∴b-d=54-46=8.
χ2=≈24.047.
答案 8 24.047
11.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,其变换后得到线性回归方程z=0.2x+3,则c=________.
解析 y=cekx⇔ln y=ln cekx=kx+ln c,即z=kx+ln c,
∴k=0.2,ln c=3⇒c=e3.
答案 e3
四、解答题:本题共3小题,共43分.解答应写出文字说明、证明过程或演算步骤.
12.(13分)某中学团委在高二年级(其中男生150名,女生150名)中,对是否喜欢观看该世界杯进行了问卷调查,各班男生喜欢观看的人数统计分别为6,7,8,8,6,5,14,14,12,10,各班女生喜欢观看的人数统计分别为4,4,4,5,5,6,7,7,8,10.
喜欢观看
不喜欢观看
合计
男生
150
女生
150
合计
300
(1)根据题意补全2×2列联表;
(2)依据小概率值α=0.001的独立性检验,能否认为该校学生喜欢观看世界杯与性别有关?参考临界值表:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
χ2=,n=a+b+c+d.
解析 (1)由题设,喜欢观看的男生有6+7+8+8+6+5+14+14+12+10=90人,故不喜欢观看的男生有150-90=60人;
喜欢观看的女生有4+4+4+5+5+6+7+7+8+10=60人,故不喜欢观看的女生有150-60=90人;
列联表如下:
喜欢观看
不喜欢观看
合计
男生
90
60
150
女生
60
90
150
合计
150
150
300
(2)由χ2==12>10.828,
所以依据小概率值α=0.001的独立性检验,能认为该校学生喜欢观看世界杯与性别有关.
13.(15分)下面是最近五年某市参加高考人数y与年份代号x之间的关系统计表.
年份代号x
1
2
3
4
5
高考人数y(千人)
35
33
28
29
25
(其中2019年代号为1,2020年代号为2,……2023年代号为5)
(1)求y关于x的线性回归方程;
(2)根据(1)的结果预测该市2026年参加高考的人数;
(3)试分析该市参加高考人数逐年减少的原因.
(参考公式:=,=-)
解析 (1)设回归方程为=x+,由表中数据知,=3,=30.
所以=
=-=-2.4,
所以=-=30-(-2.4)×3=37.2,
所以y关于x的回归方程=-2.4x+37.2.
(2)由(1)得y关于x的回归方程=-2.4x+37.2.
令x=8,=-2.4×8+37.2=18(千人),
所以预测该市2026年参加高考的人数为18千人.
(3)①该市经济发展速度慢;
②该市人口数量减少.
14.(15分)(2025·西宁高二期末)某机构为了解科技工作者对deepseek的使用情况与年龄是否有关,从甲市科技工作者中抽取了200人进行调查,得到下表.
使用deepseek
不使用deepseek
总计
年轻人(40周岁及40周岁以下)
100
中老年人(40周岁以上)
30
80
总计
200
(1)补全表中数据,根据小概率值α=0.01的独立性检验,是否可以认为科技工作者对deepseek的使用情况与年龄有关联?
(2)将样本中使用deepseek的频率作为甲市科技工作者中使用该软件的概率,从甲市科技工作者中随机抽取3人,记X为这3人中使用deepseek的人数,求X的分布列和数学期望.
附:χ2=,其中n=a+b+c+d.
α
0.010
0.005
0.001
xα
6.635
7.879
10.828
解析 (1)依题意,补全2×2列联表如下:
使用deepseek
不使用deepseek
总计
年轻人(40周岁及40周岁以下)
100
20
120
中老年人(40周岁以上)
50
30
80
总计
150
50
200
零假设为H0:科技工作者对deepseek的使用情况与年龄无关联,
由列联表中的数据,得
χ2=≈11.111>6.635.
根据小概率值α=0.01的独立性检验,可以推出H0不成立,即可以认为科技工作者对deepseek的使用情况与年龄有关联.
(2)样本中使用deepseek的频率为=,由题意可知X~B,
X的可能取值为0,1,2,3,
P(X=0)==,
P(X=1)=C××=,
P(X=2)=C××=,
P(X=3)==.
所以X的分布列为
X
0
1
2
3
P
E(X)=0×+1×+2×+3×=或
E(X)=3×=.
学科网(北京)股份有限公司
$