内容正文:
章末检测试卷(四)
(时间:120分钟 满分:150分)
第4章 统 计
一、单项选择题(本大题共8小题,每小题5分,共40分)
1.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是
A.频率分布直方图 B.回归分析
C.独立性检验 D.用样本估计总体
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
根据题意,结合题目中的数据,列出2×2列联表,求出χ2的观测值,对照临界值表可得出概率结论,这种分析数据的方法是独立性检验.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
2.船员人数y关于船的吨位x的回归直线方程是 =95+0.06x.如果两艘轮船吨位相差1 000吨.则船员平均人数相差
A.40 B.57
C.60 D.95
√
由题意知,回归直线方程是 =95+0.06x,两艘轮船吨位相差1 000吨,所以船员平均人数相差0.06×1 000=60.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
3.在2×2列联表中,若每个数据变为原来的2倍,则χ2的值变为原来的
A.8倍 B.4倍 C.2倍 D.不变
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
5.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用过血清的人与另外500名未使用过血清的人一年中的感冒记录进行比较,提出统计假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知P(χ2≥3.841)≈0.05.对此,有以下四个结论,正确的是
A.有不少于95%的把握认为“这种血清能起到预防感冒的作用”
B.若某人未使用该血清,那么他在一年中有95%的可能性得感冒
C.这种血清预防感冒的有效率为95%
D.这种血清预防感冒的有效率为5%
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
由题意,因为χ2≈3.918,P(χ2≥3.841)≈0.05,由于3.918>3.841所以有不少于95%的把握认为“这种血清能起到预防感冒的作用”.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
6.某种兼职工作虽然以计件的方式计算工资,但是对于同一个人的工资与其工作时间还是存在一定的相关关系,已知小孙的工作时间x(单位:小时)与工资y(单位:元)之间的关系如下表:
x 2 4 5 6 8
y 30 40 50 60 70
若y与x的回归直线方程为 预测当工作时间为9小时时,工资大约为
A.75元 B.76元 C.77元 D.78元
√
∴6.5×9+17.5=76,即当工作时间为9小时时,工资大约为76元.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
x 2 4 5 6 8
y 30 40 50 60 70
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
7.小明同学在做市场调查时得到如右样本数据:
他由此得到回归直线方程为 =-2.1x+15.5,
则下列说法不正确的是
A.变量x与y线性负相关
B.当x=2时可以估计y=11.3
C.a=6
D.变量x与y之间是函数关系
√
x 1 3 6 10
y 8 a 4 2
变量x与y之间具有线性负相关关系,不是函数关系,故D错误.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
二、多项选择题(本大题共4小题,每小题5分,共20分.全部选对的得5分,部分选对的得2分,有选错的得0分)
9.下列四个命题中为真命题的是
A.若甲、乙两组数据的相关系数分别为0.66和-0.85,则乙组数据的线性相关
性更强
B.若甲、乙两组数据的相关系数分别为0.79和0.72,则甲组数据的线性相关性
更强
C.在检验A与B是否有关的过程中,根据所得数据算得χ2=6.352,已知P(χ2≥6.635)
≈0.01,则有不少于99%的把握认为A和B有关
D.在检验A与B是否有关的过程中,根据所得数据算得χ2=6.724,已知P(χ2≥6.635)
≈0.01,则有不少于99%的把握认为A和B有关
√
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
因为|-0.85|更接近于1,|0.79|更接近于1,所以A和B都是真命题;
因为6.352<6.635<6.724,所以C是假命题,D是真命题.
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
10.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归直线方程为 =0.85x-85.71,则下列结论中正确的是
A.y与x具有线性正相关关系
B.回归直线方程过点
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可判定其体重必为58.79 kg
√
√
√
A,B,C均正确,是回归直线方程的性质;
D项是错误的,回归直线方程只能预测学生的体重,应大约为58.79 kg.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
11.某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如表所示的列联表.经计算χ2≈4.762,则可以推断出
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.有不少于95%的把握认为男、女生对该食堂服务的评价有差异
D.有不少于99%的把握认为男、女生对该食堂服务的评价有差异
√
满意 不满意
男 30 20
女 40 10
√
因为6.635>χ2≈4.762>3.841,所以有不少于95%的把握认为男、女生对该食堂服务的评价有差异,故C正确,D错误.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
12.我国5G技术研发试验在2016~2018年进行,分为5G关键技术试验、5G技术方案验证和5G系统验证三个阶段.2020年初以来,5G技术在我国已经进入高速发展的阶段,5G手机的销量也逐渐上升.某手机商城统计了2022年5个月5G手机的实际销量,如下表所示:
月份 2022年1月 2022年2月 2022年3月 2022年4月 2022年5月
月份编号x 1 2 3 4 5
销量y/部 50 96 a 185 227
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
若y与x线性相关,且求得回归直线方程为 =45x+5,则下列说法正确的是
A.a=142
B.y与x正相关
C.y与x的相关系数为负数
D.2022年7月该手机商城的5G手机销量约为365部
√
月份 2022年1月 2022年2月 2022年3月 2022年4月 2022年5月
月份编号x 1 2 3 4 5
销量y/部 50 96 a 185 227
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
从表格数据看,y随x的增大而增大,所以y与x正相关,所以选项B正确;
因为y与x正相关,所以y与x的相关系数为正数,所以选项C错误;
2022年7月对应的月份编号x=7,当x=7时, =45×7+5=320,所以2022年7月该手机商城的5G手机销量约为320部,所以选项D错误.
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
三、填空题(本大题共4小题,每小题5分,共20分)
13.已知某对成对数据中的变量x,y线性相关,相关系数r>0,平移坐标系,则在以 为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限.
因为r>0,
所以大多数的点都落在第一、三象限.
一、三
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
14.根据下表所示数据所求得的回归直线方程为 =4x+242,则实数a=_____.
x 2 3 4 5 6
y 251 254 257 a 266
262
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
15.通过市场调查,得到某种产品的资金投入x(单位:万元)与获得的利润y(单位:万元)的数据,如表所示:
资金投入x 2 3 4 5 6
利润y 0.4 0.6 1 1.2 1.8
根据表格提供的数据,用最小二乘法求得回归直线方程为 现投入资金15万元,则获得利润的估计值(单位:万元)为_____.
4.74
即获得的利润大约为4.74万元.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
资金投入x 2 3 4 5 6
利润y 0.4 0.6 1 1.2 1.8
16.为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如右2×2列联表:
根据列联表数据,求得χ2≈______
(保留3位有效数字),根据右表,有不少于______的把握认为患慢性气管炎与吸烟有关.
患慢性气管炎 未患慢性气管炎 合计
吸烟 20 m 40
不吸烟 n 55 60
合计 25 75 100
附:
P(χ2≥x0) 0.050 0.010 0.001
x0 3.841 6.635 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
22.2
99.9%
由20+m=40,得m=20.
由20+n=25,得n=5.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
所以有不少于99.9%的把握认为患慢性气管炎与吸烟有关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
四、解答题(本大题共6小题,共70分)
17.(10分)在国家实施西部开发战略前,某新闻单位在大学应届毕业生中随机抽取1 000人进行问卷调查,只有80人志愿加入西部建设.而国家实施西部开发战略后,随机抽取1 200名大学应届毕业生进行问卷调查,有400人志愿加入国家西部建设.根据以上数据建立一个2×2的列联表.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
2×2列联表如下.
19
志愿者 非志愿者 合计
开发战略实施前 80 920 1 000
开发战略实施后 400 800 1 200
合计 480 1 720 2 200
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
18.(12分)为了调查某大学学生在某天上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果.
表1:男生上网时间与频率分布表
上网时间(分) [30,40) [40,50) [50,60) [60,70) [70,80]
人数 5 25 30 25 15
表2:女生上网时间与频率分布表
上网时间(分) [30,40) [40,50) [50,60) [60,70) [70,80]
人数 10 20 40 20 10
(1)若该大学生共有女生750人,试估计其中上网时间不少于60分钟的人数;
设750名女大学生中上网时间不少于60分钟的人数为x,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
解得x=225,
所以估计750名女大学生中上网时间不少于60分钟的人数是225.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
(2)完成下面的2×2列联表,并回答能否认为“大学生上网时间与性别有关”.
上网时间少于60分钟 上网时间不少于60分钟 合计
男生
女生
合计
P(χ2≥x0) 0.05 0.025 0.010 0.005 0.001
x0 3.841 5.024 6.635 7.879 10.828
填2×2列联表如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
上网时间少于60分钟 上网时间不少于60分钟 合计
男生 60 40 100
女生 70 30 100
合计 130 70 200
提出统计假设H0:大学生上网时间与性别无关.
故没有充分的证据显示大学生上网时间与性别有关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
19.(12分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:
日期 12月1日 12月2日 12月3日 12月4日 12月5日
温差x(℃) 10 11 13 12 8
发芽数y(颗) 23 25 30 26 16
该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻2天数据的概率;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的回归直线方程
日期 12月1日 12月2日 12月3日 12月4日 12月5日
温差x(℃) 10 11 13 12 8
发芽数y(颗) 23 25 30 26 16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
(3)若由回归直线方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的回归直线方程是可靠的,试问(2)中所得的回归直线方程是否可靠?
日期 12月1日 12月2日 12月3日 12月4日 12月5日
温差x(℃) 10 11 13 12 8
发芽数y(颗) 23 25 30 26 16
故所求得的回归直线方程是可靠的.
20.(12分)为了解某地区某种农产品的年产量x(单位:吨)对价格y(单位:千元/吨)和年利润z的影响,对近五年该农产品的年产量和价格统计如下表:
x 1 2 3 4 5
y 7.0 6.5 5.5 3.8 2.2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
(2)若每吨该农产品的成本为2千元,假设该农产品可全部卖出,估计当年产量为多少时,年利润z取到最大值?(保留两位小数)
年利润z=x(-1.23x+8.69)-2x
=-1.23x2+6.69x
故估计当年产量为2.72吨时,年利润取到最大值.
21.(12分)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展,下表是近几年我国某地区新能源乘用车的年销售量与年份的统计表:
年份 2017 2018 2019 2020 2021
销量(万台) 8 10 13 25 24
某机构调查了该地区30位购车车主的性别与购车种类情况,得到的部分数据如下表所示:
购车种类
车主 传统燃油车 新能源车 合计
男性 6 24
女性 2
合计 30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
(1)求新能源乘用车的销量y关于年份x的相关系数r,并判断y与x是否线性相关;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
依题意,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
|r|接近于1,故y与x线性相关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
(2)请将上述2×2列联表补充完整,并依据χ2的值判断,购车车主购置新能源乘用车与性别是否有关.
购车种类
车主 传统燃油车 新能源车 合计
男性 6 24
女性 2
合计 30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
依题意,完善表格如下:
购车种类
车主 传统燃油车 新能源车 合计
男性 18 6 24
女性 2 4 6
合计 20 10 30
所以没有充分的证据认为购车车主是否购置新能源乘用车与性别有关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
22.(12分)某高校为了提高学生防电信网络诈骗的法律意识,举办了专项知识竞赛,从竞赛成绩中随机抽取了100人的成绩,成绩数据如下表:
成绩
性别 [60,70) [70,80) [80,90) [90,100]
女生 8 10 16 6
男生 7 15 25 13
若学生的测试成绩大于等于80分,则“防电信诈骗意识强”,否则为“防电信诈骗意识弱”.
(1)用100人样本的频率估计概率,求从该校任选5人,恰有2人防电信诈骗意识强的概率;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
100人中成绩不低于80分的人数为60,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
(2)根据上表数据,完成2×2列联表,能否有99%的把握认为“防电信诈骗意识强弱”与性别有关.
男生 女生 合计
防电信诈骗意识强
防电信诈骗意识弱
合计
P(χ2≥x0) 0.050 0.010 0.005
x0 3.841 6.635 7.879
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
2×2列联表如下:
男生 女生 合计
防电信诈骗意识强 38 22 60
防电信诈骗意识弱 22 18 40
合计 60 40 100
所以没有99%的把握认为“防电信诈骗意识强弱”与性别有关.
由公式χ2=中所有值变为原来的2倍,得
(χ2)′==2χ2,故χ2也变为原来的2倍.
4.一唱片公司欲知唱片费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:i=28,=303.4,
i=75,=598.5,iyi=237,则y与x的相关系数r的绝对值为
A.0.6 B.0.5 C.0.4 D.0.3
|r|=
==0.3.
=6.5x+,
由表格数据知,==5,==50,
∴=-6.5=50-32.5=17.5,
∴回归直线方程为=6.5x+17.5,
由回归直线方程为=-2.1x+15.5,可知变量x与y线性负相关,故A正确;
当x=2时,=-2.1×2+15.5=11.3,故B正确;
∵==5,==,
∴回归直线必经过点,
代入=-2.1x+15.5,得=-2.1×5+15.5,解得a=6,故C正确;
8.已知具有线性相关关系的变量x,y,设其样本点为Ai(xi,yi)(i=1,2,…,8),回归直线方程为=x+,若++…+=(6,2)(O为原点),则等于
A. B.- C. D.-
因为++…+=(x1+x2+…+x8,y1+y2+…+y8)=(8,8)=(6,2),
所以8=6,8=2,解得=,=,
因此=×+,
即=-.
(,)
A.该学校男生对食堂服务满意的概率的
估计值为
对于选项A,该学校男生对食堂服务满意的概率的估计值为=,故A正确;
对于选项B,该学校女生对食堂服务满意的概率的估计值为=>,故B错误;
==3,==,
因为点(,)在回归直线上,
所以=45×3+5,解得a=142,所以选项A正确;
(,)
由题意,得=4,=(1 028+a),
代入=4x+242,
可得(1 028+a)=4×4+242,解得a=262.
=x-0.36,
由表中数据可得=4,=1,
所以=x-0.36过点(4,1),
代入可得=0.34,
所以=0.34x-0.36,
当x=15时,=0.34×15-0.36=4.74,
χ2=.
故χ2=≈22.2>10.828.
依题意有=,
附:χ2=,其中n=a+b+c+d为样本容量.
由表中数据可得到χ2=≈2.198<3.841,
设事件A表示“选取的2组数据恰好是不相邻2天的数据”,则事件表示“选取的2组数据恰好是相邻2天的数据”.
样本容量为10,事件包含的样本点个数为4.
∴P()==,
∴P(A)=1-P()=.
=x+;
=12,=27,i yi=977,=434,
∴===2.5,
=-=27-2.5×12=-3,∴=2.5x-3.
由(2)知,当x=10时,=22,与检验数据的误差不超过2颗;
当x=8时,=17,与检验数据的误差不超过2颗.
(1)求y关于x的回归直线方程=x+;
参考公式:==,=-.
由题知=3,=5,iyi=62.7,=55,
===-1.23,
=-=5-(-1.23)×3=8.69,
所以y关于x的回归直线方程为=-1.23x+8.69.
=-1.232+1.23×2,
当x=≈2.72时,年利润z最大.
附:≈25.
(xi-)2=4+1+1+4=10,
==2 019,
==16.
故(xi-)(yi-)=(-2)×(-8)+(-1)×(-6)+0×(-3)+1×9+2×8=47,
(yi-)2=64+36+9+81+64=254,
则r==
=≈=0.94,
则χ2===3.75<3.841,
由频率估计概率可知任选一人防电信诈骗意识强的概率P=.
从学生中任选5人,其中防电信诈骗意识强的人数X~B,
所以恰有2人防电信诈骗意识强的概率P(X=2)=C2×3=.
附:χ2=.
χ2=≈0.694 4<6.635,
$$