内容正文:
章末检测试卷四(第9章)
(时间:120分钟 满分:150分)
第9章 统 计
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是
A.频率分布直方图 B.回归分析
C.独立性检验 D.用样本估计总体
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
根据题意,结合题目中的数据,列出2×2列联表,求出χ2的观测值,对照数表可得出概率结论,这种分析数据的方法是独立性检验.
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
2.两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别反映的变量间的相关关系是
A.①②③ B.②③① C.②①③ D.①③②
√
对于(1),图中的点成带状分布,且从左到右上升,是①正相关关系;对于(2),图中的点没有明显的带状分布,是③不相关;
对于(3),图中的点成带状分布,且从左到右是下降的,是②负相关关系.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
3.某公司由于改进了经营模式,经济效益与日俱增.统计了2022年2月到2022年8月的纯收益y(单位:万元)的数据,如下表:
月份 2 3 4 5 6 7 8
月份代号t 3 4 5 6 7 8 9
纯收益y 66 69 73 81 89 90 91
并得到y关于t的线性回归方程为 =4.75t+51.36.请预测该公司2022年10月的纯收益为
A.94.11万元 B.98.86万元 C.103.61万元 D.108.36万元
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
4.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用过血清的人与另外500名未使用过血清的人一年中的感冒记录进行比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知P(χ2≥3.841)≈0.05.对此,有以下四个结论,正确的是
A.有95%的把握可以认为“这种血清能起到预防感冒的作用”
B.若某人未使用该血清,那么他在一年中有95%的可能性得感冒
C.这种血清预防感冒的有效率为95%
D.这种血清预防感冒的有效率为5%
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
由题意,因为χ2≈3.918,P(χ2≥3.841)≈0.05,所以有95%的把握可以认为“这种血清能起到预防感冒的作用”.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
5.下表给出5组数据(x,y),为选出4组数据使其线性相关程度最强,且保留第1组数据(-5,-3),则应去掉
i 1 2 3 4 5
xi -5 -4 -3 -2 4
yi -3 -2 4 -1 6
A.第2组 B.第3组 C.第4组 D.第5组
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
画出散点图如图所示,则应除去第3组,对应点的坐标是(-3,4).故选B.
6.疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,其前期研发过程中,一般都会进行动物保护测试,为了考察某种疫苗的预防效果,在进行动物试验时,得到如下统计数据:
已知从试验动物中任取一只,取得
“注射疫苗”的概率为0.5,则下列
判断中错误的是
A.“注射疫苗”发病的动物数为10
B.某个发病的动物为“未注射疫苗”动物的概率为
C.有99.5%的把握认为疫苗有效
D.该疫苗的有效率约为80%
√
未发病 发病 合计
未注射疫苗 30
注射疫苗 40
合计 70 30 100
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
由题意,“注射疫苗”与“未注射疫苗”的动物分别为50只,故完善表格如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
未发病 发病 合计
未注射疫苗 30 20 50
注射疫苗 40 10 50
合计 70 30 100
由表格可知,A正确;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
7.在一项调查中有两个变量x和y,下图是由这两个变量近8年来取值数据得到的散点图,那么适宜作为y关于x的回归方程的函数类型是
A.y=a+bx
B.y=p+qcx(q>0)
C.y=m+nx2(n>0)
D.y=c+d
√
散点图呈曲线,A中函数为线性函数,不符合题意,排除A选项;
由散点图可知整体呈增长态势,且增长速度变慢.
对于B选项,函数为指数型函数,当c>1时单调递增,且越增越快,不符合题意,
当0<c<1时为单调递减函数,不符合题意,故排除B;
对于C选项,函数为开口向上的二次函数,增长先慢后快,不符合题意,排除选项C.
D中,当d>0时,函数为单调递增
函数,且增长率逐渐变小,符合
题意,故D正确.故选D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
8.陕西关中的秦腔表演朴实、粗犷、细腻、深刻,再有电子布景的独有特效,深得观众喜爱.戏曲相关部门特意进行了“喜爱看秦腔”调查,发现年龄段与爱看秦腔的人数比存在较好的线性相关关系,年龄在[40,44],[45,49],[50,54],[55,59]的爱看人数比分别是0.10,0.18,0.20,0.30.现用各年龄段的中间值代表年龄段,如42代表[40,44].由此求得爱看人数比y关于年龄段x的经验回归方程为 .那么,年龄在[60,64]的爱看人数比为
A.0.42 B.0.39 C.0.37 D.0.35
√
由题意,对数据进行处理,得出如下表格:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
年龄段x 42 47 52 57
爱看人数比y 0.10 0.18 0.20 0.30
对应的爱看人数比为0.35.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
二、多项选择题(本大题共4小题,每小题5分,共20分.全部选对的得5分,部分选对的得2分,有选错的得0分)
9.下列四个命题中为真命题的是
A.若甲、乙两组数据的相关系数分别为0.66和-0.85,则乙组数据的线性
相关性更强
B.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度
越高
C.在检验A与B是否有关的过程中,根据所得数据算得χ2=6.352,已知
P(χ2≥6.635)≈0.01,则有99%的把握认为A和B有关
D.用R2来刻画回归效果,R2越小,说明拟合效果越好
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
因为|0.66|<|-0.85|,所以A是真命题;
由残差分析可知B是真命题;
因为6.352<6.635,所以C是假命题;
R2越大,拟合效果越好,所以D是假命题.
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
10.我国5G技术研发试验在2016~2018年进行,分为5G关键技术试验、5G技术方案验证和5G系统验证三个阶段.2020年初以来,5G技术在我国已经进入高速发展的阶段,5G手机的销量也逐渐上升.某手机商城统计了2022年5个月5G手机的实际销量,如下表所示:
月份 2022年1月 2022年2月 2022年3月 2022年4月 2022年5月
月份编号x 1 2 3 4 5
销量y/部 50 96 a 185 227
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
若y与x线性相关,且求得线性回归方程为 =45x+5,则下列说法正确的是
A.a=142
B.y与x正相关
C.y与x的相关系数为负数
D.2022年7月该手机商城的5G手机销量约为365部
√
月份 2022年1月 2022年2月 2022年3月 2022年4月 2022年5月
月份编号x 1 2 3 4 5
销量y/部 50 96 a 185 227
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
从表格数据看,y随x的增大而增大,所以y与x正相关,所以选项B正确;
因为y与x正相关,所以y与x的相关系数为正数,所以选项C错误;
2022年7月对应的月份编号x=7,当x=7时,=45×7+5=320,所以2022年7月该手机商城的5G手机销量约为320部,所以选项D错误.故选AB.
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
11.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的线性回归方程为 =0.85x-85.71,则下列结论中正确的是
A.y与x具有正的线性相关关系
B.线性回归方程过点
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可判定其体重必为58.79 kg
√
√
√
A,B,C均正确,是线性回归方程的性质,D项是错误的,线性回归方程只能预测学生的体重,应为大约58.79 kg.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
12.针对时下的“短视频热”,某校团委对“学生性别和喜欢短视频是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢短视频的人数占男生人数的 ,女生喜欢短视频的人数占女生人数的 ,若有95%的把握认为是否喜欢短视频和性别有关,则调查人数中男生可能有
临界值表:
P(χ2≥x0) 0.050 0.010
x0 3.841 6.635
A.30人 B.54人 C.60人 D.75人
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
设男生的人数为6n(n∈N*),
根据题意列出2×2列联表如下表所示:
19
男生 女生 合计
喜欢短视频 5n 4n 9n
不喜欢短视频 n 2n 3n
合计 6n 6n 12n
由于有95%的把握认为是否喜欢短视频和性别有关,
则3.841≤χ2<6.635,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
因为n∈N*,则n的可能取值有9,10,11,12,13,14,
因此,调查人数中男生人数的可能值为54,60,66,72,78,84.故选BC.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
三、填空题(本大题共4小题,每小题5分,共20分)
13.已知x,y之间的一组数据如下表:
x 2 3 4 5 6
y 3 4 6 8 9
③
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
x 2 3 4 5 6
y 3 4 6 8 9
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
14.通过市场调查,得到某种产品的资金投入x(单位:万元)与获得的利润y(单位:万元)的数据,如表所示:
资金投入x 2 3 4 5 6
利润y 0.4 0.6 1 1.2 1.8
根据表格提供的数据,用最小二乘法求线性回归方程为 现投入资金15万元,求获得利润的估计值(单位:万元)为______.
4.74
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
即获得利润大约为4.74万元.
19
资金投入x 2 3 4 5 6
利润y 0.4 0.6 1 1.2 1.8
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
15.为预测某种产品的回收率y,需要研究它和原料有效成分含量x之间的
相关关系,现取了8组观察值.计算知
=1 849,则y关于x的线性回归方程是________________(精确到0.01).
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
16.为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:
患慢性气管炎 未患慢性气管炎 合计
吸烟 20 m 40
不吸烟 n 55 60
合计 25 75 100
根据列联表数据,求得χ2=______(保留3位有效数字),有______的把握认为患慢性气管炎与吸烟有关.
22.2
99.9%
由20+m=40,得m=20.
由20+n=25,得n=5.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
所以有99.9%的把握认为患慢性气管炎与吸烟有关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
四、解答题(本大题共6小题,共70分)
17.(10分)在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取1 000人问卷,只有80人志愿加入西部建设.而国家实施西部开发战略后,随机抽取1 200名应届大学毕业生问卷,有400人志愿加入国家西部建设.根据以上数据建立一个2×2列联表.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
2×2列联表如下.
19
志愿者 非志愿者 合计
开发战略公布前 80 920 1 000
开发战略公布后 400 800 1 200
合计 480 1 720 2 200
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
18.(12分)为了调查某大学学生在某天上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果:
表1:男生上网时间与频率分布表
上网时间(分) [30,40) [40,50) [50,60) [60,70) [70,80]
人数 5 25 30 25 15
表2:女生上网时间与频率分布表
上网时间(分) [30,40) [40,50) [50,60) [60,70) [70,80]
人数 10 20 40 20 10
(1)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数;
解得x=225,
所以估计女生中上网时间不少于60分钟的人数为225.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
(2)完成下面的2×2列联表,并回答能否有90%的把握认为“大学生上网时间与性别有关”.
上网时间少于60分钟 上网时间不少于60分钟 合计
男生
女生
合计
2×2列联表如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
上网时间少于60分钟 上网时间不少于60分钟 合计
男生 60 40 100
女生 70 30 100
合计 130 70 200
提出假设H0:大学生上网时间与性别无关.
因为当H0成立时,χ2≥2.198的概率大于10%,
故没有90%的把握认为“大学生上网时间与性别有关”.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
19.(12分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:
日期 12月1日 12月2日 12月3日 12月4日 12月5日
温差x(℃) 10 11 13 12 8
发芽数y(颗) 23 25 30 26 16
该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻2天数据的概率;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程
日期 12月1日 12月2日 12月3日 12月4日 12月5日
温差x(℃) 10 11 13 12 8
发芽数y(颗) 23 25 30 26 16
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?
故所求得的线性回归方程是可靠的.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
20.(12分)为了解某地区某种农产品的年产量x(单位:吨)对价格y(单位:千元/吨)和年利润z的影响,对近五年该农产品的年产量和价格统计如下表:
x 1 2 3 4 5
y 7.0 6.5 5.5 3.8 2.2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
(2)若每吨该农产品的成本为2千元,假设该农产品可全部卖出,估计当年产量为多少时,年利润z取到最大值?(保留两位小数)
年利润z=x(-1.23x+8.69)-2x=-1.23x2+6.69x
故估计当年产量为2.72吨时,年利润取到最大值.
21.(12分)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展,下表是近几年我国某地区新能源乘用车的年销量与年份的统计表:
年份 2017 2018 2019 2020 2021
销量(万台) 8 10 13 25 24
某机构调查了该地区30位购车车主的性别与购车种类情况,得到的部分数据如右表所示:
传统燃油车 新能源车 合计
男性 6 24
女性 2
合计 30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
年份 2017 2018 2019 2020 2021
销量(万台) 8 10 13 25 24
(1)求新能源乘用车的销量y关于年份x的相关系数r,并判断y与x是否具有线性相关关系;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
依题意,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
|r|接近于1,故y与x具有线性相关关系.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
(2)请将上述2×2列联表补充完整,并依据χ2的值判断,购车车主购置新能源乘用车与性别是否有关.
传统燃油车 新能源车 合计
男性 6 24
女性 2
合计 30
依题意,完善表格如下:
传统燃油车 新能源车 合计
男性 18 6 24
女性 2 4 6
合计 20 10 30
提出假设H0:购车车主购置新能源乘用车与性别无关.
因为当H0成立时,χ2≥6.635的概率约为0.01,所以有90%的把握认为购车车主是否购置新能源乘用车与性别有关.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
22.(12分)某中学在高一学生选科时,要求每位学生先从物理和历史这两个科目中选定一个科目,再从思想政治、地理、化学、生物这四个科目中任选两个科目.选科工作完成后,为了解该校高一学生的选科情况,随机抽取了部分学生作为样本,对他们的选科情况统计后得到下表:
思想政治 地理 化学 生物
物理类 100 120 200 180
历史类 120 140 60 80
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
思想政治 地理 化学 生物
物理类 100 120 200 180
历史类 120 140 60 80
(1)利用上述样本数据填写关于学生选择物理类和历史类与生物学科选法的2×2列联表,分析以上两类学生对生物学科的选法是否存在差异.
选择生物学科 不选择生物学科 合计
物理类
历史类
合计
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
由题意可得,选择物理类的总人数为300,其中选择生物学科的人数为180,不选择生物学科的人数为120;选择历史类的总人数为200,其中选择生物学科的人数为80,不选择生物学科的人数为120;据此完善2×2列联表,如下.
选择生物学科 不选择生物学科 合计
物理类 180 120 300
历史类 80 120 200
合计 260 240 500
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
提出假设H0:两类学生对生物学科的选法没有差异,
因为当H0成立时,P(χ2≥10.828)≈0.001,这里的19.231>10.828,故有99.9%的把握认为两类学生对生物学科的选法存在差异.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
21
22
19
记“学生选择物理类”为事件M,“学生选择历史类”为事件N,“同时选择地理和化学”为事件C,
将2022年10月代号t=11带入线性回归方程,得=4.75×11+51.36=103.61.
某个发病的动物为“未注射疫苗”动物的概率为=,故B正确;
χ2=≈4.762<7.879,故C错误;
“注射疫苗”的50只动物中,未发病的概率为=0.8,故D正确.
=x-0.418 8
求得=49.5,=0.195,因经验回归直线过(,),将(,)代入=x-0.418 8,得=0.012 4,即=0.012 4x-0.418 8,年龄在[60,64]对应的x为62,
将x=62代入=0.012 4x-0.418 8,得=0.012 4×62-0.418 8=0.35,
==3,==,
因为点(,)在回归直线上,
所以=45×3+5,解得a=142,所以选项A正确;
(,)
附:χ2=.
则χ2==,
即3.841≤<6.635,得8.642≤n<14.929,
对于表中数据,现给如下拟合直线:①y=x+1;②y=2x-1;③y=x-;④y=x-.则根据最小二乘法的思想求得拟合程度最好的直线是____(填序号).
由数据可知,==4,==6,
那么回归直线必过点(4,6),经验证可知,选项①y=x+1;②y=2x-1;③y=x-;④y=x-中满足该点的方程为③,故答案为③.
=x-0.36,
由表中数据可得=4,=1,
所以=x-0.36过点(4,1),
代入可得=0.34,
所以=0.34x-0.36,
当x=15时,=0.34×15-0.36=4.74,
i=52,i=228,=478,iyi
=2.62x+11.47
根据已知数据得=6.5,=28.5,
由=,=- ,
直接计算得≈2.62,≈11.47,
所以线性回归方程为=2.62x+11.47.
故χ2=≈22.2>10.828.
设上网时间不少于60分钟的女生人数为x,依题意有=,
由表中数据可得χ2=≈2.198<2.706,
设事件A表示“选取的2组数据恰好是不相邻2天的数据”,则表示“选取的数据恰好是相邻2天的数据”.
样本空间为10,事件包含的样本点个数为4.
∴P()==,
∴P(A)=1-P()=.
=x+;
=12,=27,i yi=977,=434,
∴===2.5,
=-=27-2.5×12=-3,∴=2.5x-3.
由(2)知,当x=10时,=22,与检验数据的误差不超过2颗;
当x=8时,=17,与检验数据的误差不超过2颗.
(1)求y关于x的线性回归方程=x+;
由题知=3,=5,iyi=62.7,=55,
===-1.23,
=-=5-(-1.23)×3=8.69,
所以y关于x的线性回归方程为=-1.23x+8.69.
=-1.232+1.23×2,
当x=≈2.72时,年利润z最大.
==2 019,
==16.
故(xi-)(yi-)=(-2)×(-8)+(-1)×(-6)+0×(-3)+1×9+2×8=47,
(xi-)2=4+1+1+4=10,(yi-)2=64+36+9+81+64=254,
则r==≈0.93,
则χ2===3.75>2.706,
可得χ2==≈19.231,
(2)假设该校高一所有学生中有的学生选择了物理类,其余的学生都选择了历史类,且在物理类的学生中其余两科选择的是地理和化学的概率为,而在历史类的学生中其余两科选择的是地理和化学的概率为.若从该校高一
所有学生中随机抽取100名学生,用X表示这100名学生中同时选择了地理和化学的人数,求随机变量X的均值E(X).
则P(M)=,P(N)=1-P(M)=,P(C|M)=,P(C|N)=,
故P(C)=P(M)P(C|M)+P(N)P(C|N)=×+×=,
由题意可得X~B,
则E(X)=100×=16,故随机变量X的均值E(X)=16.
$$