内容正文:
培优课 成对数据统计分析中的综合问题
1.为了解某地区2025年6~10月份电动汽车的销售情况,某机构经过调查,得到如下表所示的数据.
月份
6月
7月
8月
9月
10月
月份代码x
1
2
3
4
5
销售总额y/亿元
4
6
10
15
20
(1)求y关于x的经验回归方程;
(2)该机构随机调查了该地区200位购车车主的性别与购车种类,其中购买非电动汽车的男性有60人,女性有90人,购买电动汽车的男性有40人,女性有10人,依据α=0.01的独立性检验,能否认为购买电动汽车与性别有关.
附:xiyi=206,=55,在利用最小二乘法求得的经验回归方程=x+中,=,=-.
2.某学校为学生开设了一门模具加工课,经过一段时间的学习,拟举行一次模具加工大赛,学生小明、小红打算报名参加大赛.赛前,小明、小红分别进行了为期一周的封闭强化训练,下表记录了两人在封闭强化训练期间每天加工模具成功的次数,其中小明第7天的成功次数a忘了记录,但知道36≤a≤55,a∈Z(yi,zi分别表示小明、小红第i天的成功次数).
第一天
第二天
第三天
第四天
第五天
第六天
第七天
序号x
1
2
3
4
5
6
7
小明成功次数(y)
16
20
20
25
30
36
a
小红成功次数(z)
16
22
25
26
32
35
35
(1)求这7天内小明成功的总次数不少于小红成功的总次数的概率;
(2)根据小明这7天内前6天的成功次数,求其成功次数y关于序号x的经验回归方程,并估计小明第七天成功次数a的值.
参考数据:1×16+2×20+3×20+4×25+5×30+6×36=582;12+22+32+42+52+62=91.
3.为了调查某地区成年人血液的某项指标,现随机抽取了成年男性、女性各20人组成一个样本,对他们的这项血液指标进行了检测,得到了如下数据.根据医学相关知识,我们认为此项指标大于40为偏高,反之即为正常.
男性:5 7 9 8 18 19 21 23 27 29 25
32 34 35 37 38 41 42 47 54
女性:13 14 21 25 25 28 31 32 34 35
38 40 43 47 48 49 52 55 56 57
(1)依据样本数据研究此项血液指标与性别的关系,列出2×2列联表,并判断能否在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关联;
(2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标为正常的人数X的分布列及数学期望.
附:χ2=,其中n=a+b+c+d.
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
4.某餐馆2024年12月份共有800个线上外卖订单,其中好评订单有600个,其余均为非好评订单.为了提升菜品品质,增加营业额,该餐馆在2025年1月份更换了厨师,更换厨师后该餐馆2025年1月份共有2 000个线上外卖订单,其中好评订单有1 600个,其余均为非好评订单.
(1)根据统计数据,完成下列2×2列联表,并依据α=0.01的独立性检验,能否认为该餐馆订单的好评率与更换厨师有关联;
更换厨师前后
订单评价
合计
好评
非好评
更换厨师前
更换厨师后
合计
(2)现从更换厨师前的订单中按好评和非好评,按比例用分层随机抽样法抽取8个订单进行电话回访,再从这8个订单中随机抽取3个订单发放新品品尝券并让顾客评价,记抽取的3个订单中好评的订单个数为ξ,求ξ的分布列和数学期望;
(3)用样本频率估计总体概率,现从更换厨师后的所有订单中随机抽取100个订单,记其中好评的订单个数为η,求当事件“η=r”的概率最大时r的值.
1 / 2
学科网(北京)股份有限公司
$
培优课 成对数据统计分析中的综合问题
1.解:(1)由题可知=×(1+2+3+4+5)=3,
=×(4+6+10+15+20)=11,
所以===4.1,=11-4.1×3=-1.3,
故所求的经验回归方程为=4.1x-1.3.
(2)由题可得2×2列联表如下.
性别
购车种类
合计
非电动汽车
电动汽车
男
60
40
100
女
90
10
100
合计
150
50
200
零假设为H0:购买电动汽车与性别无关,根据表中数据,得χ2===24>6.635=x0.01,
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为购买电动汽车与性别有关.
2.解:(1)因为36≤a≤55,且a∈Z,所以a的取值共有55-36+1=20种情况,
yi,zi分别表示小明、小红第i天成功次数,
又当小明成功的总次数不少于小红成功的总次数时,yi+a≥zi,
即16+20+20+25+30+36+a≥16+22+25+26+32+35+35,得a≥44,
又36≤a≤55,所以44≤a≤55,且a∈Z,
所以小明成功的总次数不少于小红成功的总次数时,a的取值共有55-44+1=12种情况,
所以这7天内小明成功的总次数不少于小红成功的总次数的概率为=.
(2)由题设可知:xiyi=1×16+2×20+3×20+4×25+5×30+6×36=582,
==,
==,
所以==,=-=-×=11,
所以成功次数y关于序号x的经验回归方程为=x+11.
当x=7时,=×7+11=38,
估计小明第7天成功次数a的值为38.
3.解:(1)由题中数据可得2×2列联表为
性别
血液指标
合计
正常
偏高
男性
16
4
20
女性
12
8
20
合计
28
12
40
χ2=≈1.905<6.635=x0.01,所以不能在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关联.
(2)由样本数据可知,男性此项血液指标正常的概率为,女性此项血液指标正常的概率为.抽取的人中此项血液指标为正常的人数X的可能取值为0,1,2,3,4.
P(X=0)=(1-)2×(1-)2=,
P(X=1)=××(1-)×(1-)2+(1-)2×××(1-)=,
P(X=2)=()2×(1-)2+××(1-)×××(1-)+(1-)2×()2=,
P(X=3)=××(1-)×()2+()2×××(1-)=,
P(X=4)=()2×()2=.
所以随机变量X的分布列为
X
0
1
2
3
4
P
所以E(X)=0×+1×+2×+3×+4×=,
因此此项血液指标为正常的人数X的数学期望为.
4.解:(1)2×2列联表如下:
更换厨师前后
订单评价
合计
好评
非好评
更换厨师前
600
200
800
更换厨师后
1 600
400
2 000
合计
2 200
600
2 800
零假设为H0:该餐馆订单的好评率与更换厨师无关联.
根据列联表中数据,经计算得到χ2=≈8.485>6.635=x0.01,
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为该餐馆订单的好评率与更换厨师有关联.
(2)依题意,用分层随机抽样法抽取的8个订单中,好评订单有8×=6个,非好评有2个,
而从这8个订单中随机抽取3个,其中好评的订单个数ξ的可能值有1,2,3,
则P(ξ=1)==,P(ξ=2)==,P(ξ=3)==,
所以ξ的分布列为
ξ
1
2
3
P
数学期望E(ξ)=1×+2×+3×=.
(3)依题意,更换厨师后好评率为=0.8,
从更换厨师后所有订单中随机抽取100个订单,则η~B(100,0.8),
于是P(η=r)=0.8r×0.2100-r,r≤100,r∈N,
则==,
由>1,解得r<79,而r∈N,则当0≤r≤79时,P(η=r)单调递增;
由≤1,解得r≥79,则当r≥80时,P(η=r)单调递减,
所以使事件“η=r”的概率最大时r的值为80.
1 / 2
学科网(北京)股份有限公司
$