内容正文:
一、选择题:本题共7小题,在每小题给出的四个选项中,只有一项是符合题目要求的.
1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力 ( )
A.平均数与方差 B.回归分析
C.独立性检验 D.概率
2.对具有线性相关关系的变量x,y有一组观测数据(xi,yi )(i=1,2,…,8),其回归直线方程是=x+,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数的值是 ( )
A. B. C. D.
3.2020年初,新型冠状病毒(COVID-19)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效.某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:
周数(x)
1
2
3
4
5
治愈人数(y)
2
17
36
103
142
由表格可得y关于x的回归方程为=6x2+a,则此回归模型第4周的残差(实际值与预报值之差)为 ( )
A.5 B.-13 C.13 D.0
4.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为 ( )
A.-1 B.0 C. D.1
5.一车间为规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验,测得的数据如下
零件数x (个)
2
3
4
5
加工时间y(分钟)
26
a
49
54
根据上表可得回归方程=9.4x+9.1,则实数a的值为 ( )
A.37.3 B.38 C.39 D.39.5
6.在对具有线性相关的两个变量x和y进行统计分析时,得到如下数据:
x
4
m
8
10
12
y
1
2
3
5
6
由表中数据求得y关于x的回归方程为=0.65x-1.8,则(4,1),(m,2),(8,3)这三个样本点中落在回归直线下方的有 ( )
A.1个 B.2个 C.3个 D.0个
7.某工厂某产品产量x(千件)与单位成本y(元)满足回归直线方程=77.36-1.82x,则以下说法中正确的是 ( )
A.产量每增加1000件,单位成本约下降1.82元
B.产量每减少1000件,单位成本约下降1.82元
C.当产量为1千件时,单位成本为75.54元
D.当产量为2千件时,单位成本为73.72元
二、选择题:本题共4小题,在每小题给出的四个选项中,有多项符合题目要求.
8.下列说法中正确的有 ( )
A.将一组数据中的每一个数据都加上或减去同一个常数后,方差不变
B.设有一个线性回归方程=3-5x,变量x增加1个单位时,y平均增加5个单位
C.设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x和y之间的线性相关程度越弱
D.在一个2×2列联表中,由计算得K2的值,在K2≥2.706的前提下,K2的值越大,判断两个变量间有关联的把握就越大
9.下列叙述正确的是 ( )
A.相关关系是一种确定性关系,一般可分为正相关和负相关
B.回归直线一定过样本点的中心(,)
C.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好
D.某同学研究卖出的热饮杯数y与气温x(℃)的关系,得到回归方程y=-2.35x+146.7,则气温为2℃时,一定可卖出142杯热饮
10.为了对变量x与y的线性相关性进行检验,由样本点(x1,y1)、(x2,y2)、…、(x10,y10) 求得两个变量的样本相关系数为r,那么下面说法中错误的有 ( )
A.若所有样本点都在直线y=-2x+1上,则r=1
B.若所有样本点都在直线y=-2x+1上,则r=-2
C.若|r|越大,则变量x与y的线性相关性越强
D.若|r|越小,则变量x与y的线性相关性越强
11.某课外兴趣小组通过随机调查,利用2×2列联表和K2统计量研究数学成绩优秀是否与性别有关.计算得K2=6.748,经查阅临界值表知P(K2≥6.635)=0.010,则下列判断正确的是 ( )
A.每100个数学成绩优秀的人当中就会有1名是女生
B.若某人数学成绩优秀,那么他为男生的概率是0.010
C.有99%的把握认为“数学成绩优秀与性别有关”
D.在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”
三、填空题:本题共4小题,将答案填在题中横线上.
12.某设备的使用年限x与所支出的维修费用的统计数据如下表:
使用年限x
(单位:年)
2
3
4
5
6
维修费用y
(单位:万元)
1.5
4.5
5.5
6.5
7.0
根据上表可得回归直线方程为=1.3x+,据此模型预测,若使用年限为14年,估计维修费约为 万元.
13.在2017年3月15日,某市物价部门对本市的5家商场的某种商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:
价格x
9
9.5
10
10.5
11
销售量y
11
10
8
6
5
由散点图可知,销售量y与价格x之间有较好的线性相关关系,其线性回归方程是:y=-3.2x+a,则a= .
14.在独立性检验中,统计量K2有两个临界值:3.841和6.635.当K2>3.841时,有95%的把握说明两个事件有关;当K2>6.635时,有99%的把握说明两个事件有关;当K2≤3.841时,认为两个事件无关.在一项打鼾与患心脏病的调查中,共调查了2000人,经计算K2=20.87.根据这一数据分析,我们有理由认为打鼾与患心脏病之间是 的(有关、无关).
15.某医疗研究所为了了解某种血清预防感冒的作用,把500名使用过该血清的人与另外500名未使用该血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”.已知利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是 .
①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.
四、解答题:本题共2小题,解答应写出文字说明、证明过程或演算步骤.
16.为迎接2020年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动.现从参加冬奥知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩(满分为100分)分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图.
(1)求a的值;
(2)记A表示事件“从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分”,估计A的概率;
(3)在抽取的100名学生中,规定:比赛成绩不低于80分为“优秀”,比赛成绩低于80分为“非优秀”.请将下面的2×2列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?
优秀
非优秀
合计
男生
40
女生
50
合计
100
参考公式及数据:K2=,n=a+b+c+d.
P(K2≥k0)
0.10
0.02
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
17.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的SO2浓度(单位:μg/m3 ),得下表:
SO2
PM2.5
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
SO2
PM2.5
[0,150]
(150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
附:K2=,其中n=a+b+c+d.
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
作业(十四) 统计模型
1.C 解析:判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.
2.C 解析: 因为x1+x2+x3+…+x8=6,y1+y2+y3+…+y8=3,所以=,=,所以样本中心点的坐标为(,), 代入回归直线方程得=×+,解得=,选C.
3.C 解析:设t=x2,则=(1+4+9+16+25)=11,=(2+17+36+103+142)=60,a=60-6×11=-6,所以=6x2-6.令x=4,得e4=y4-=103-6×42+6=13,选C.
4.D 解析:由题设知,所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,∴这组样本数据完全正相关,故其相关系数为1,选D.
5.C 解析:根据题意可得:==3.5,==,根据回归方程过中心点(,)可得:=9.4×3.5+9.1,
解得:a=39,选C.
6.B 解析:因为=(4+m+8+10+12)=(34+m),=(1+2+3+5+6)=,所以将其代入=0.65x-1.8可得m=6,故当x=4时,y=2.6-1.8=0.8<1,在直线上方;当x=8时,y=5.2-1.8=3.4>3,在直线下方;当m=6时,y=3.9-1.8=2.1>2,在直线下方,选B.
7.A 解析:令f(x)=77.36-1.82x,因为f(x+1)-f(x)=77.36-1.82(x+1)-77.36+1.82x=-1.82,所以产量每增加1000件,单位成本约下降1.82元,故选A.
8.ACD 解析:根据方差公式,可知将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变.故A正确; 变量x增加一个单位时,y平均减小5个单位,故B不正确; 设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x和y之间的线性相关程度越弱,故C正确; 在一个2×2列联表中,由计算得K2的值,若K2≥2.706,则有95%的把握判断两个变量间有相关关系,因此在K2≥2.706的前提下,K2的值越大,判断两个变量间有关联的把握就越大,故D正确,选ACD.
9.BC 解析:对于A:相关系数是不确定的关系,故A错误;对于B:回归直线必过样本中心,故B正确;对于C:相关系数越大,相关性越强,故R2为0.98的模型比R2为0.80的模型拟合的效果好,故C正确;对于D:根据回归直线,可预测大概卖出142杯,而不是一定卖出142杯,故D错误,选BC.
10.ABD 解析:若所有样本点都在直线y=-2x+1上,且直线斜率为负数,则r=-1,A、B选项均错误;若|r|越大,则变量x与y的线性相关性越强,C选项正确,D选项错误,选ABD.
11.CD 解析:因为K2=6.748≥6.635,所以有99%的把握认为“数学成绩优秀与性别有关”即在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”,选CD.
12.18 解析:==4,==5,则中心点为(4,5),代入回归直线方程可得=5-1.3×4=-0.2,=1.3x-0.2.当x=14时,=1.3×14-0.2=18(万元),即估计使用14年时,维修费用是18万元.
13.40 解析:根据题意:==10,==8,∵=-3.2+a,∴a=3.2×10+8=40.
14.有关 解析:K2=20.87>6.635时,有99%的把握说明打鼾与患心脏病有关.
15.① 解析:因为K2≈3.918≥3.841,而P(K2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”,故①正确;②显然错误;因为我们检验的是假设是否成立,和该血清预防感冒的有效率是没有关系的,故③④错误.
16.解:(1)由题可得(0.005+0.010+0.020+0.030+a+0.010)×10=1,解得a=0.025.
(2)由(1)知a=0.025,则比赛成绩不低于80分的频率为(0.025+0.010)×10=0.35,故从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分的概率约为0.35.
(3)由(2)知,在抽取的100名学生中,比赛成绩优秀的有100×0.35=35人,非优秀的人数为100-35=65,非优秀的男生人数为40人,所以非优秀的女生人数为25人,由此可得完整的2×2列联表:
优秀
非优秀
合计
男生
10
40
50
女生
25
25
50
合计
35
65
100
所以K2的观测值k==≈9.890<10.828,
所以没有99.9%的把握认为“比赛成绩是否优秀与性别有关”.
17.解:(1)由表格可知,该市100天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数有32+6+18+8=64天,所以该市一天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的概率为=0.64.
(2)由所给数据,可得2×2列联表为:
SO2
PM2.5
[0,150]
(150,475]
合计
[0,75]
64
16
80
(75,115]
10
10
20
合计
74
26
100
(3)根据2×2列联表中的数据可得
K2的观测值k===≈7.4844>6.635,因为根据临界值表可知,有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
学科网(北京)股份有限公司
$