内容正文:
周测卷(二十) 统计、成对数据的统计分析
1.C 由散点图可知,用y=b1 ln(k1x)经过变换得到线性回归模型进行拟合比用y=k2x+b2拟合的效果好,故|r1|>|r2|,又y与x负相关,∴-r1>-r2,即r1<r2,故选C.
2.B 对于A,由雷达图知,小红语文与化学的成绩差约为95-70=25(分),小蓝数学与化学的成绩差约为95-80=15(分),所以小红相对成绩并不均衡,显然有偏科的情况,故A错误;对于B,小红、小蓝的地理成绩差距在10分以上,数学成绩的差距的5分左右,故B正确;对于C,小红、小蓝的历史成绩一样,故C错误;对于D,显然小红的语文成绩比小蓝高,故D错误.故选B.
3.D 对A,由表可知y随x增大而减少,可认为变量x,y线性负相关,且由相关系数|r|=0.986可知相关性强,故A正确;对B,=×(9+9.5+10+10.5+11)=10,=×(11+10+8+6+5)=8.故回归直线恒过定点(10,8),故8=-3.2×10+⇒=40,故B正确;对C,当x=8.5时,=-3.2×8.5+40=12.8,故C正确;对D,相应于点(10.5,6)的残差=6-(-3.2×10.5+40)=-0.4,故D不正确.故选D.
4.A 若H0成立的可能性不足1%,则χ2>6.635,由选项知:χ2=7.879.故选A.
5.D 由y=ebx-0.5得ln y=bx-0.5,
∴=b·-0.5,解得b=1.6,∴回归方程为y=e1.6x-0.5,若x=5,则y=e8-0.5=e.故选D.
6.C 对于A,甲班数学成绩的平均分为45×0.02+55×0.16+65×0.22+75×0.3+85×0.2+95×0.1=73,乙班数学成绩的平均分为45×0.06+55×0.1+65×0.3+75×0.22+85×0.16+95×0.16=73,故A错误;对于B,由频率分布直方图无法得到哪个班的最高分高,故B错误;对于C,甲班数学成绩的及格率为1-0.02-0.16=0.82,乙班数学成绩的及格率为1-0.06-0.1=0.84,故甲班的数学成绩的及格率低,故C正确;对于D,甲、乙两个班各班的总人数不知,故D错误.故选C.
7.D 对于A,由题图知8月1日至9日的每天最高气温的平均数大于35 ℃,25日至28日的每天最高气温的平均数大于35 ℃,29日至31日每天最高气温大于20 ℃且小于25 ℃,与35 ℃相差总和小于45 ℃,而每天最高气温不低于40 ℃的有7天,大于37 ℃且小于40 ℃的有8天,它们与35 ℃相差总和超过45 ℃,因此该地区2023年8月每天最高气温的平均数不低于35 ℃,故A不正确;对于B,该地区2023年8月每天最高气温不低于40 ℃的数据有7个,其它都低于40 ℃,把31个数据由小到大排列,中位数必小于40 ℃,因此该地区2023年8月每天最高气温的中位数低于40 ℃,故B不正确;对于C,该地区2023年8月前半月每天最高气温的数据极差小,波动较小,后半月每天最高气温的极差大,数据波动很大,因此该地区2023年8月前半月每天最高气温的方差小于后半月每天最高气温的方差,故C不正确;对于D,该地区2023年8月每天最高气温的数据极差大,每天最低气温的数据极差较小,每天最高气温的数据波动也比每天最低气温的数据波动大,因此该地区2023年8月每天最高气温的方差大于每天最低气温的方差,故D正确.故选D.
8.B 依题意,设男、女学生的人数都为5x,则男、女学生的总人数为10x,建立2×2列联表如下,
性别
是否喜欢网络课程
喜欢网络课程
不喜欢网络课程
合计
男生
4x
x
5x
女生
3x
2x
5x
合计
7x
3x
10x
故χ2==,由题意可得6.635<<10.828,所以139.335<10x<227.388,结合选项可知,只有B符合题意.故选B.
9.AC 对于A,这组数据的平均数为×(3+4×2+5+6×3+7×4+8×5+9×2+10×2)=7,故A正确;对于B,这组数据的方差为×[(3-7)2+2×(4-7)2+(5-7)2+3×(6-7)2+4×(7-7)2+5×(8-7)2+2×(9-7)2+2×(10-7)2]=3.6,则标准差为,故B错误;对于C,因为8出现的次数最多,所以这组数据的众数为8,故C正确;对于D,因为20×0.8=16,所以这组数据的第80百分位数是=8.5,故D错误.故选AC.
10.AC 对于A,样本中男生的人数为50×=30,故A正确.对于B,每个女生入样的概率均为=,故B错误.对于C,样本的平均数为170×+160×=166,故C正确.对于D,记样本中男生的身高分别为y1,y2,…,y30,其平均数为,方差为s,女生的身高分别为z1,z2,…,z20,其平均数为,方差为s,样本的平均数为,方差为s2,则s2==
=
=s+(-)2+s+(-)2=46.2.故D错误.故选AC.
11.ACD 因为重新求得的经验回归直线l的斜率为1.2,所以x与y正相关,故A正确;因为1.5>1.2,所以去除后y的估计值增加速度变慢,故B错误;将=3代入经验回归方程=1.5x+0.5,可得=5,将(,)称为样本点的中心,则样本点的中心为(3,5),可知去掉两对数据(1.2,2.2)和(4.8,7.8)后,样本点的中心还是(3,5),又去除后重新求得的经验回归直线l的斜率为1.2,所以设l的方程为=1.2x+,则5=3×1.2+,解得=1.4,所以去除后的经验回归方程为=1.2x+1.4,故C正确;去除后,当x=2时,=1.2×2+1.4=3.8,此时y-=3.75-3.8=-0.05,则残差的平方为0.0025,故D正确.故选ACD.
12.BC 该俱乐部的男性会员对运动场所满意的概率的估计值为=,故A错误;该俱乐部的女性会员对运动场所满意的概率的估计值为,>,故B正确;因为χ2≈5.059>3.841 =x0.05,所以根据小概率值α=0.05的独立性检验,可以推断男性会员、女性会员对运动场所的满意程度有差异,故C正确;因为χ2≈5.059<6.635=x0.01,所以根据小概率值α=0.01的独立性检验,无法推断男性会员、女性会员对运动场所的满意程度有差异,故D错误.故选BC.
13.解析:由题意知χ2==>3.841,所以a>7.69或a<1.54,又因为a>5且15-a>5, a∈Z,所以a=8或a=9.
答案:8或9
14.解析:对y=e0.38+ax取对数,得ln y=ax+0.38,所以ln y与x为线性相关关系,因为ln(y1·y2·y3·…·y23)=89.7,所以=3.9,所以3.9=12a+0.38,所以a≈0.29.
答案:0.29
15.解析:由题意得到如下列联表:
性别
是否喜欢看篮球赛
合计
喜欢看篮球赛
不喜欢看篮球赛
男生
n
女生
合计
n
所以χ2==.
因为有95%的把握认为喜欢看篮球赛与性别有关,所以χ2≥3.841,即≥3.841,n≥≈10.24,又,,为整数,所以n的最小值为12.
答案:12
16.解析:由题意得:设小明、小红5次成绩的平均数分别为1,2,方差分别为s,s,∵小明、小红5次成绩的平均数相等,∴7+8+9+6+10=7+9+a+b+10,∴a+b=14,易得1=2=8.∵s=·[(7-8)2+(8-8)2+(9-8)2+(6-8)2+(10-8)2]=2,s=×[(7-8)2+(9-8)2+(a-8)2+(b-8)2+(10-8)2]=[(a-8)2+(b-8)2+6],由s>s得(a-8)2+(b-8)2<4,又a+b=14即b-8=6-a,∴(a-8)2+(6-a)2<4,a2-14a+48<0,∴6<a<8,又a,b∈N*∴a=7,b=7,∴满足条件的(a,b)是(7,7).
答案:(7,7)
17.解:(1)根据等高堆积条形图所给的数据,得到联表如下:
年龄
佩戴头盔
合计
是
否
年龄低于40岁
540
60
600
年龄不低于40岁
340
60
400
合计
880
120
1000
(2)零假设为H0:佩戴安全头盔与年龄无关.
根据列联表中的数据,计算得:
χ2==≈5.682<6.635=x0.01,根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为佩戴安全头盔与年龄无关.
18.解:(1)=×(2+4+6+8+10+12)=7,
∵yi=24.84,∴==4.14,
又xiyi=217.28,x=364,
∴====0.62,
∴=-·=4.14-0.62×7=-0.2,
∴y关于x的经验回归方程为=0.62x-0.2.
(2)令=0.62x-0.2=2.9,解得x=5,
∴该样本中所含的还原糖大约相当于5 mL的标准葡萄糖溶液.
19.解:(1)依题意,得=(55×0.011+65×0.020+75×0.034+85×0.028+95×0.007)×10=75,
所以抽取的200名学生的平均成绩=75.
(2)由于第五组总共要抽取7人,高三学生占,所以抽到的高三学生有7×=3(人),所以这2人都是高三学生的概率为==.
(3)依题意,得s=
==2≈11,
所以当比赛成绩优秀时,x >+s ≈75+11=86,
所以比赛成绩在[86,100]内的频率为(90-86)×0.028+0.007×10=0.182,
因为1500×0.182=273(人),
所以估计参赛的1500名学生中成绩优秀的人数为273人.
20.解:(1)由题得2×2列联表如下.
单位:人
财政补贴幅度
购买意愿
合计
愿意购买新能源汽车
不愿意购买新能源汽车
大于1.5万
65
35
100
不大于1.5万
45
55
100
合计
110
90
200
零假设为H0:该市居民对新能源汽车的购买意愿与财政补贴幅度无关联.依题意得χ2==≈8.08>3.841=x0.050,
所以根据小概率值α =0.050的独立性检验,可以推断H0不成立,即认为该市居民对新能源汽车的购买意愿与财政补贴幅度有关联.
(2)依题意,抽样比为=,因为65×=13,35×=7,
所以在愿意购买新能源汽车的人中抽取13人,在不愿意购买新能源汽车的人中抽取7人.
X的所有可能取值为0,1,2,3,
P(X=0)==,P(X=1)==,P(X=2)==,P(X=3)==,
所以X的分布列为
X
0
1
2
3
P
故E(X)=0×+1×+2×+3×=.
学科网(北京)股份有限公司
$$
周测卷(二十) 统计、成对数据的统计分析
(时间:90分钟 满分:120分)
一、选择题:本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.已知相关变量x和y的散点图如图所示,若用y=b1 ln(k1x)经过变换得到线性回归模型进行拟合与用y=k2x+b2拟合时的样本相关系数分别为r1,r2,则r1,r2的大小关系为( )
A.r1>r2 B.r1=r2
C.r1<r2 D.不确定
2.“互联网+教育”的智慧课堂教学新模式在中小学逐步得以推广.某班主任利用智慧课堂中的成绩分析功能对本班两名同学某次模拟考试的五科成绩进行了分析,绘制成如图所示的雷达图,下列说法正确的是( )
A.小红各科的成绩较为均衡,没有偏科的情况
B.小红和小蓝地理成绩的差距比数学成绩的差距大
C.小红和小蓝的历史成绩差距较大
D.小红五科的成绩都比小蓝差
3.某市物价部门对5家商场的某商品一天的销售量及其价格进行调查,5家商场的售价x(元)和销售量y(件)之间的一组数据如表所示:
售价x
9
9.5
10
10.5
11
销售量y
11
10
8
6
5
按公式计算,y与x的回归直线方程是:=-3.2x+,相关系数|r|=0.986,则下列说法错误的是( )
A.变量x,y线性负相关且相关性较强
B.=40
C.当x=8.5时,y的估计值为12.8
D.相应于点(10.5,6)的残差为0.4
4.为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算的结果,认为H0成立的可能性不足1%,那么χ2的一个可能取值为( )
α
0.05
0.025
0.010
0.005
0.001
xα
3.841
5.024
6.635
7.879
10.828
A.7.879 B.6.635
C.5.024 D.3.841
5.已知变量y关于x的回归方程为y=ebx-0.5,其一组数据如表所示.若x=5,则预测y值可能为( )
x
1
2
3
4
y
e
e3
e4
e6
A.e5 B.e
C.e7 D.e
6.某次考试后,甲、乙两班的数学老师分别统计了各自班级的数学成绩(百分制,均位于[40,100]内),并将所得数据分为6组:[40,50),[50,60),…,[90,100],整理得到如图所示的频率分布直方图,则下列说法正确的是( )
A.乙班数学成绩的平均分的估计值高于甲班数学成绩的平均分的估计值(同一组中的数据用该组区间的中点值代替)
B.乙班数学成绩的最高分高于甲班数学成绩的最高分
C.甲班数学成绩的及格率低于乙班数学成绩的及格率(成绩不低于60分为及格)
D.甲班数学成绩不低于80分的人数多于乙班数学成绩不低于80分的人数
7.某地区2023年夏天迎来近几年来罕见的高温极端天气,当地气象部门统计了8月份每天的最高气温和最低气温,得到如图所示的图表:
某地区2023年8月份每天最高气温与最低气温
根据图表判断,以下结论正确的是( )
A.该地区2023年8月每天最高气温的平均数低于35 ℃
B.该地区2023年8月每天最高气温的中位数高于40 ℃
C.该地区2023年8月前半月每天最高气温的方差大于后半月每天最高气温的方差
D.该地区2023年8月每天最高气温的方差大于每天最低气温的方差
8.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )
附:χ2=,其中n=a+b+c+d
α
0.1
0.05
0.01
0.001
xα
2.706
3.841
6.635
10.828
A.130 B.190
C.240 D.250
二、选择题:本大题共4小题,每小题5分,共20分.在每小题给出的四个选项中,有多个选项是符合题目要求的,全部选对的得5分,部分选对的得2分,不选或有选错的得0分.
9.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个整数来表示,该数越接近10表示满意度越高.现随机抽取20位居民,他们的幸福感指数分别为3,4,4,5,6,6,6,7,7,7,7,8,8,8,8,8,9,9,10,10,则下列说法正确的有( )
A.这组数据的平均数为7 B.这组数据的标准差为3.6
C.这组数据的众数为8 D.这组数据的第80百分位数是8
10.某高中有学生500人,其中男生300人,女生200人,为获得该校学生的身高(单位:cm)信息,按比例分配的分层随机抽样的方法抽取一个样本量为50的样本.经计算得到样本中男生身高的平均数为170,方差为17;女生身高的平均数为160,方差为30.下列说法中正确的是( )
A.样本中男生的人数为30 B.每个女生入样的概率均为
C.样本的平均数为166 D.样本的方差为22.2
11.已知由样本数据(x1,y1),(x2,y2),…,(xn,yn)求得的经验回归方程为=1.5x+0.5,且=3,现发现两对数据(1.2,2.2)和(4.8,7.8)的误差较大,去除后重新求得的经验回归直线l的斜率为1.2,则( )
A.x与y正相关
B.去除后y的估计值增加速度变快
C.去除后的经验回归方程为=1.2x+1.4
D.去除后相应于点(2,3.75)的残差平方为0.0025
12.某俱乐部为了解会员对运动场所的满意程度,随机调查了50名会员,得到如下所示的2×2列联表,经计算得χ2≈5.059,则( )
单位:人
性别
满意程度
合计
满意
不满意
男
18
9
27
女
8
15
23
合计
26
24
50
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
A.该俱乐部的男性会员对运动场所满意的概率的估计值为
B.该俱乐部的男性会员比女性会员对运动场所满意的概率大
C.根据小概率值α=0.05的独立性检验,可以推断男性会员、女性会员对运动场所的满意程度有差异
D.根据小概率值α=0.01的独立性检验,可以推断男性会员、女性会员对运动场所的满意程度有差异
题号
1
2
3
4
5
6
7
8
9
10
11
12
答案
三、填空题:本大题共4小题,每小题5分,共20分.
13.两个分类变量X,Y的2×2列联表如下:
X
Y
合计
Y1
Y2
X1
a
20-a
20
X2
15-a
30+a
45
合计
15
50
65
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
其中a,15-a均为大于5的整数,若根据小概率值α=0.05的独立性检验,认为X与Y有关联,则a的值为________.
14.9月1日至23日(日代码分别为1,2,…,23),某餐馆在区域M内投放广告单数量y(万张)与日代码x的数据符合回归方程y=e0.38+ax,已知y1·y2·y3·…·y23=e89.7,=12,则a≈________(精确到小数点后两位).
15.某大学为了解喜欢看篮球赛是否与性别有关,随机调查了部分学生,在被调查的学生中,男生人数是女生人数的2倍,男生喜欢看篮球赛的人数占男生人数的,女生喜欢看篮球赛的人数占女生人数的.若被调查的男生人数为n,且有95%的把握认为喜欢看篮球赛与性别有关,则n的最小值为________.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
16.小明、小红进行打靶比赛,各打5次且5次打靶成绩如表所示,其中a,b∈N*,若小明、小红5次打靶成绩的平均数相等,要使小明5次成绩的方差大于小红5次成绩的方差,则(a,b)为________.
小明
7
8
9
6
10
小红
7
9
a
b
10
四、解答题:本大题共4小题,共40分,解答应写出文字说明、证明过程或演算步骤.
17.(10分)为持续深化“一盔一带”安全守护行动,有效遏制和减少因电动车闯红灯、逆行、不佩戴安全头盔等行为带来的交通安全隐患,2022年5月以来,泰安交警景区大队根据辖区实际,稳步推进“一盔一带”安全守护行动,确保辖区道路交通环境畅通、有序,该行动开展一段时间后,针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1000名骑行人员中,记录其年龄和是否佩戴头盔情况,其中年龄低于40岁占60%,得到如图的等高堆积条形图.
(1)据等高堆积条形图所给的数据,列出2×2列联表;
(2)根据(1)中的列联表,依据小概率值α=0.01的独立性检验,能否认为佩戴安全头盔与年龄有关.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
18.(10分)还原糖不达标会影响糖果本身的风味,同时还原糖偏高又会使糖果吸潮,不耐贮存,影响糖果的质量.还原糖主要有葡萄糖、果糖、半乳糖、乳糖、麦芽糖等.现采用碘量法测定还原糖含量,用0.05 mol/L硫代硫酸钠滴定标准葡萄糖溶液,并记录耗用硫代硫酸钠的体积数,试验结果见下表.
标准葡萄糖溶液
体积x (单位: mL)
2
4
6
8
10
12
硫代硫酸钠
体积y (单位: mL)
0.9
2.5
3.5
4.7
6
7.24
(1)若y与x有较强的线性相关关系,试求y关于x的经验回归方程;
(2)某工厂抽取产品样本进行检测,所用的硫代硫酸钠溶液大约为2.9 mL,则该样本中所含的还原糖大约相当于多少体积的标准葡萄糖溶液?
附:经验回归方程=x+中,==,=- .
参考数据
xiyi
yi
x
217.28
24.84
364
19.(10分)某高中在全校三个年级开展了一次“不负时代,不负韶华,做好社会主义接班人”演讲比赛.共1500名学生参与比赛,现从各年级参赛的学生中随机抽取200名学生,并按成绩分为五组:[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图,且第五组中高三学生占.
(1)求抽取的200名学生的平均成绩(同一组数据用该组区间的中点值代替);
(2)若在第五组中,按照各年级人数采用比例分配的分层随机抽样的方法抽取7人,再从中选取2人组成宣讲组,在校内进行义务宣讲,求这2人都是高三学生的概率;
(3)若比赛成绩x>+s(s为样本数据的标准差),则认为成绩优秀,试估计参赛的1500名学生中成绩优秀的人数.
参考公式:s= (fi是第i组的频率).
参考数据:≈5.5.
20.(10分)为进一步推动新能源汽车产业健康有序发展,财政部、工业和信息化部、科技部、发展改革委联合印发了《关于进一步完善新能源汽车推广应用财政补贴政策的通知》.为了解某市居民对新能源汽车的购买意愿与财政补贴幅度是否有关联,随机选取200人进行调查,整理数据后获得如下统计表:
愿意购买
新能源汽车
不愿意购买
新能源汽车
补贴大于1.5万
65
35
补贴不大于1.5万
45
55
(1)根据小概率值α=0.050的独立性检验,能否认为该市居民对新能源汽车的购买意愿与财政补贴幅度有关联?
(2)若从补贴大于1.5万的样本中用比例分配的分层随机抽样的方法抽取20人,从这20人中随机抽取3人调查家族收入情况,记X表示这3人中愿意购买新能源汽车的人数,求X的分布列与数学期望.
附:χ2=,其中n=a+b+c+d.
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
学科网(北京)股份有限公司
$$