内容正文:
大数据之十年高考真题(2015-2024)与优质模拟题(新高考卷)
专题20概率统计(解答题)
1.【2024年甲卷理科第17题】某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品
合格品
不合格品
总计
甲车间
26
24
0
50
乙车间
70
28
2
100
总计
96
52
2
150
(1)填写如下列联表:
优级品
非优级品
甲车间
乙车间
能否有的把握认为甲、乙两车间产品的优级品率存在差异?能否有的把握认为甲,乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率,设为升级改造后抽取的n件产品的优级品率.如果,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?()
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)答案见详解
(2)答案见详解
【详解】(1)根据题意可得列联表:
优级品
非优级品
甲车间
26
24
乙车间
70
30
可得,
因为,
所以有的把握认为甲、乙两车间产品的优级品率存在差异,没有的把握认为甲,乙两车间产品的优级品率存在差异.
(2)由题意可知:生产线智能化升级改造后,该工厂产品的优级品的频率为,
用频率估计概率可得,
又因为升级改造前该工厂产品的优级品率,
则,
可知,
所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
2.【2024年新高考2卷第18题】某投篮比赛分为两个阶段,每个参赛队由两名队员组成,比赛具体规则如下:第一阶段由参赛队中一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中一次,则该队进入第二阶段.第二阶段由该队的另一名队员投篮3次,每次投篮投中得5分,未投中得0分.该队的比赛成绩为第二阶段的得分总和.某参赛队由甲、乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立.
(1)若,,甲参加第一阶段比赛,求甲、乙所在队的比赛成绩不少于5分的概率.
(2)假设,
(i)为使得甲、乙所在队的比赛成绩为15分的概率最大,应该由谁参加第一阶段比赛?
(ii)为使得甲、乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段比赛?
【答案】(1)
(2)(i)由甲参加第一阶段比赛;(i)由甲参加第一阶段比赛;
【详解】(1)甲、乙所在队的比赛成绩不少于5分,则甲第一阶段至少投中1次,乙第二阶段也至少投中1次,
比赛成绩不少于5分的概率.
(2)(i)若甲先参加第一阶段比赛,则甲、乙所在队的比赛成绩为15分的概率为,
若乙先参加第一阶段比赛,则甲、乙所在队的比赛成绩为15分的概率为,
,
,
,应该由甲参加第一阶段比赛.
(ii)若甲先参加第一阶段比赛,比赛成绩的所有可能取值为0,5,10,15,
,
,
,
,
记乙先参加第一阶段比赛,比赛成绩的所有可能取值为0,5,10,15,
同理
,
因为,则,,
则,
应该由甲参加第一阶段比赛.
3.【2023年新课标全国Ⅱ卷第19题】某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率%时,求临界值c和误诊率;
(2)设函数,当时,求的解析式,并求在区间的最小值.
【答案】(1),;
(2),最小值为.
【详解】(1)依题可知,左边图形第一个小矩形的面积为,所以,
所以,解得:,
.
(2)当时,
;
当时,
,
故,
所以在区间的最小值为.
4.【2023年新课标全国Ⅰ卷第21题】甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若末命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.
(1)求第2次投篮的人是乙的概率;
(2)求第次投篮的人是甲的概率;
(3)已知:若随机变量服从两点分布,且,则.记前次(即从第1次到第次投篮)中甲投篮的次数为,求.
【答案】(1)
(2)
(3)
【详解】(1)记“第次投篮的人是甲”为事件,“第次投篮的人是乙”为事件,
所以,
.
(2)设,依题可知,,则
,
即,
构造等比数列,
设,解得,则,
又,所以是首项为,公比为的等比数列,
即.
(3)因为,,
所以当时,,
故.
5.【2023年高考全国乙卷理第17题】某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
【答案】(1),;
(2)认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
【详解】(1),
,
,
的值分别为: ,
故
(2)由(1)知:,,故有,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
6.【2023年高考全国甲卷理第19题】一项试验旨在研究臭氧效应.实验方案如下:选40只小白鼠,随机地将其中20只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).
(1)设表示指定的两只小白鼠中分配到对照组的只数,求的分布列和数学期望;
(2)实验结果如下:
对照组的小白鼠体重的增加量从小到大排序为:
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
实验组的小白鼠体重的增加量从小到大排序为:
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(i)求40只小鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于的数据的个数,完成如下列联表:
对照组
实验组
(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.
附:
0.100
0.050
0.010
2.706
3.841
6.635
【答案】(1)分布列见解析,
(2)(i);列联表见解析,(ii)能
【详解】(1)依题意,的可能取值为,
则,,,
所以的分布列为:
故.
(2)(i)依题意,可知这40只小白鼠体重增量的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,观察数据可得第20位为,第21位数据为,
所以,
故列联表为:
合计
对照组
6
14
20
实验组
14
6
20
合计
20
20
40
(ii)由(i)可得,,
所以能有的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.
7.【2022年新课标全国Ⅰ卷第20题】一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好
良好
病例组
40
60
对照组
10
90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:;
(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.
附,
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)答案见解析
(2)(i)证明见解析;(ii);
【详解】(1)由已知,
又,,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)因为,
所以
所以,
(ii)
由已知,,
又,,
所以
8.【2022年新课标全国Ⅱ卷第19题】在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间的概率;
(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
【答案】(1)岁;
(2);
(3).
【详解】(1)平均年龄
(岁).
(2)设{一人患这种疾病的年龄在区间},所以
.
(3)设“任选一人年龄位于区间[40,50)”,“从该地区中任选一人患这种疾病”,
则由已知得:
,
则由条件概率公式可得
从该地区中任选一人,若此人的年龄位于区间,此人患这种疾病的概率为.
9.【2022年高考全国乙卷理第19题】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数.
【答案】(1);
(2)
(3)
【详解】(1)样本中10棵这种树木的根部横截面积的平均值
样本中10棵这种树木的材积量的平均值
据此可估计该林区这种树木平均一棵的根部横截面积为,
平均一棵的材积量为
(2)
则
(3)设该林区这种树木的总材积量的估计值为,
又已知树木的材积量与其根部横截面积近似成正比,
可得,解之得.
则该林区这种树木的总材积量估计为
10.【2022年高考全国甲卷理第19题】甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与期望.
【答案】(1);
(2)分布列见解析,.
【详解】(1)设甲在三个项目中获胜的事件依次记为,所以甲学校获得冠军的概率为
.
(2)依题可知,的可能取值为,所以,
,
,
,
.
即的分布列为
0
10
20
30
0.16
0.44
0.34
0.06
期望.
11.【2021年新课标全国Ⅰ卷第18题】某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分,已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记为小明的累计得分,求的分布列;
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
【答案】(1)见解析;(2)类.
【详解】(1)由题可知,的所有可能取值为,,.
;
;
.
所以的分布列为
(2)由(1)知,.
若小明先回答问题,记为小明的累计得分,则的所有可能取值为,,.
;
;
.
所以.
因为,所以小明应选择先回答类问题.
12.【2021年高考全国乙卷理第17题】某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
【答案】(1);(2)新设备生产产品的该项指标的均值较旧设备有显著提高.
【详解】(1),
,
,
.
(2)依题意,,,
,所以新设备生产产品的该项指标的均值较旧设备有显著提高.
13.【2021年高考全国甲卷理第17题】甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)75%;60%;
(2)能.
【详解】(1)甲机床生产的产品中的一级品的频率为,
乙机床生产的产品中的一级品的频率为.
(2),
故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.
14.【2020年新课标全国Ⅱ卷第19题】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:
(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;
(2)根据所给数据,完成下面的列联表:
(3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?
附:,
【答案】(1);(2)答案见解析;(3)有.
【详解】(1)由表格可知,该市100天中,空气中的浓度不超过75,且浓度不超过150的天数有天,
所以该市一天中,空气中的浓度不超过75,且浓度不超过150的概率为;
(2)由所给数据,可得列联表为:
合计
64
16
80
10
10
20
合计
74
26
100
(3)根据列联表中的数据可得
,
因为根据临界值表可知,有的把握认为该市一天空气中浓度与浓度有关.
15.【2020年新课标Ⅲ卷理科第18题】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次空气质量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400
人次>400
空气质量好
空气质量不好
附:,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)该市一天的空气质量等级分别为、、、的概率分别为、、、;(2);(3)有,理由见解析.
【详解】(1)由频数分布表可知,该市一天的空气质量等级为的概率为,等级为的概率为,等级为的概率为,等级为的概率为;
(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为
(3)列联表如下:
人次
人次
空气质量好
空气质量不好
,
因此,有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
16.【2020年新课标Ⅱ卷理科第18题】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
【答案】(1);(2);(3)详见解析
【详解】(1)样区野生动物平均数为,
地块数为200,该地区这种野生动物的估计值为
(2)样本(i=1,2,…,20)的相关系数为
(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,
由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,
采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,
从而可以获得该地区这种野生动物数量更准确的估计.
17.【2020年新课标Ⅰ卷理科第19题】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为,
(1)求甲连胜四场的概率;
(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率.
【答案】(1);(2);(3).
【详解】(1)记事件甲连胜四场,则;
(2)记事件为甲输,事件为乙输,事件为丙输,
则四局内结束比赛的概率为
,
所以,需要进行第五场比赛的概率为;
(3)记事件为甲输,事件为乙输,事件为丙输,
记事件甲赢,记事件丙赢,
则甲赢的基本事件包括:、、、
、、、、,
所以,甲赢的概率为.
由对称性可知,乙赢的概率和甲赢的概率相等,
所以丙赢的概率为.
18.【2019年新课标Ⅲ卷理科第17题】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.
(1)求乙离子残留百分比直方图中的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【答案】(1) ,;(2) ,.
【详解】(1)由题得,解得,由,解得.
(2)由甲离子的直方图可得,甲离子残留百分比的平均值为,
乙离子残留百分比的平均值为
19.【2019年新课标Ⅱ卷理科第18题】11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.
(1)求P(X=2);
(2)求事件“X=4且甲获胜”的概率.
【答案】(1);(2)0.1
【详解】(1)由题意可知,所包含的事件为“甲连赢两球或乙连赢两球”
所以
(2)由题意可知,包含的事件为“前两球甲乙各得分,后两球均为甲得分”
所以
20.【2019年新课标Ⅰ卷理科第21题】为了治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.
(1)求的分布列;
(2)若甲药、乙药在试验开始时都赋予4分,表示“甲药的累计得分为时,最终认为甲药比乙药更有效”的概率,则,,,其中,,.假设,.
(i)证明:为等比数列;
(ii)求,并根据的值解释这种试验方案的合理性.
【答案】(1)见解析;(2)(i)见解析;(ii).
【详解】(1)由题意可知所有可能的取值为:,,
;;
则的分布列如下:
(2),
,,
(i)
即
整理可得:
是以为首项,为公比的等比数列
(ii)由(i)知:
,,……,
作和可得:
表示最终认为甲药更有效的.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为,此时得出错误结论的概率非常小,说明这种实验方案合理.
21.【2018年新课标Ⅱ卷理科第18题】下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【答案】(1)利用模型①预测值为226.1,利用模型②预测值为256.5,(2)利用模型②得到的预测值更可靠.
【详解】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为
=–30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为
=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
点睛:若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;若回归直线方程有待定参数,则根据回归直线方程恒过点求参数.
22.【2018年新课标Ⅲ卷理科第18题】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:
超过
不超过
第一种生产方式
第二种生产方式
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:,
【答案】(1)第二种生产方式的效率更高. 理由见解析
(2)80
(3)能
【详解】(1)第二种生产方式的效率更高.
理由如下:
(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.
(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.
以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.
(2)由茎叶图知.
列联表如下:
超过
不超过
第一种生产方式
15
5
第二种生产方式
5
15
(3)由于,所以有99%的把握认为两种生产方式的效率有差异.
23.【2018年新课标Ⅰ卷理科第20题】某工厂的某种产品成箱包装,每箱件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为,且各件产品是否为不合格品相互独立.
(1)记件产品中恰有件不合格品的概率为,求的最大值点;
(2)现对一箱产品检验了件,结果恰有件不合格品,以(1)中确定的作为的值.已知每件产品的检验费用为元,若有不合格品进入用户手中,则工厂要对每件不合格品支付元的赔偿费用.
(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为,求;
(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
【答案】(1);(2)(i);(ii)应该对余下的产品作检验.
【详解】(1)[方法一]:【通性通法】利用导数求最值
件产品中恰有件不合格品的概率为.
因此.
令,得.当时,;当时,.
所以的最大值点为;
[方法二]:【最优解】均值不等式
由题可知,20件产品中恰有2件不合格品的概率为.
,当且仅当,即可得所求.
(2)由(1)知,.
(i)令表示余下的件产品中的不合格品件数,依题意知,,即.所以.
(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.
由于,故应该对余下的产品作检验.
24.【2017年新课标Ⅰ卷理科第19题】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布.
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在之外的零件数,求及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,其中xi为抽取的第i个零件的尺寸,.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布,则,,.
【答案】(1),(2)(ⅰ)见详解;(ⅱ)需要. ,
【详解】(1)抽取的一个零件的尺寸在之内的概率为0.9974,
从而零件的尺寸在之外的概率为0.0026,
故.
因此.
的数学期望为.
(2)(i)如果生产状态正常,
一个零件尺寸在之外的概率只有0.0026,
一天内抽取的16个零件中,出现尺寸在之外的零件
概率只有0.0408,发生的概率很小.
因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程
可能出现了异常情况,需对当天的生产过程进行检查,
可见上述监控生产过程的方法是合理的.
(ii)由,
得的估计值为,的估计值为,
由样本数据可以看出有一个零件的尺寸在之外,
因此需对当天的生产过程进行检查.
剔除之外的数据,
剩下数据的平均数为,
因此的估计值为.
,
剔除之外的数据,
剩下数据的样本方差为,
因此的估计值为.
25.【2017年新课标Ⅲ卷理科第18题】某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间,需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高
气温
[10,
15)
[15,
20)
[20,
25)
[25,
30)
[30,
35)
[35,
40)
天数
2
16
36
25
7
4
以最高气温位于各区间的频率代替最高气温位于该区间的概率.
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列.
(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?
【答案】(1)详见解析;(2).
【详解】(1)由题意知,所有的可能取值为200,300,500,由表格数据知
的分布列为
200
300
500
0.2
0.4
0.4
(2)由题意知,这种酸奶一天的需求量至多为500,至少为200,因此只需考虑
当时,若最高气温不低于25,则2n;
若最高气温位于区间,则1200-2n;
若最高气温低于20,则=800-2n
因此
当00时,若最高气温不低于20,则2n,
若最高气温低于20,则=800-2n,
因此160+1.2n
所以时,的数学期望达到最大值,最大值为520元.
26.【2017年新课标Ⅱ卷理科第18题】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg).其频率分布直方图如下:
(1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50 kg
箱产量≥50 kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
附:,
【答案】(1);
(2)列联表见解析,有;
(3).
【详解】(1)记表示事件“旧养殖法的箱产量低于” ,表示事件“新养殖法的箱产量不低于” ,
旧养殖法的箱产量低于的频率为,
即的估计值为0.62,
新养殖法的箱产量不低于的频率为,
即的估计值为0.66,
因此事件A的概率估计值为.
(2)根据箱产量的频率分布直方图得列联表:
箱产量
箱产量
合计
旧养殖法
62
38
100
新养殖法
34
66
100
合计
96
104
200
,
所以有的把握认为箱产量与养殖方法有关.
(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于的直方图面积为
,
箱产量低于的直方图面积为,
所以新养殖法箱产量的中位数的估计值为.
27.【2016年新课标Ⅲ卷理科第18题】下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
(Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:,,
,≈2.646.
参考公式:相关系数
回归方程中斜率和截距的最小二乘估计公式分别为:
【答案】(Ⅰ)答案见解析;(Ⅱ)答案见解析.
【详解】(Ⅰ)由折线图中数据和附注中参考数据得
,,,
,
.
因为与的相关系数近似为0.99,说明与的线性相关相当高,从而可以用线性回归模型拟合与的关系.
(Ⅱ)由及(Ⅰ)得,
.
所以,关于的回归方程为:.
将2016年对应的代入回归方程得:.
所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.
28.【2016年新课标Ⅱ卷理科第18题】某险种的基本保费为(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:
上年度出险次数
0
1
2
3
4
保费
设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数
0
1
2
3
4
概率
0.30
0.15
0.20
0.20
0.10
0.05
(Ⅰ)求一续保人本年度的保费高于基本保费的概率;
(Ⅱ)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出的概率;
(Ⅲ)求续保人本年度的平均保费与基本保费的比值.
【答案】(Ⅰ)0.55;(Ⅱ);(Ⅲ)1.23.
【详解】(Ⅰ)设表示事件:“一续保人本年度的保费高于基本保费”,则事件发生当且仅当一年内出险次数大于1,故
(Ⅱ)设表示事件:“一续保人本年度的保费比基本保费高出”,则事件发生当且仅当一年内出险次数大于3,故
又,故
因此所求概率为
(Ⅲ)记续保人本年度的保费为,则的分布列为
因此续保人本年度的平均保费与基本保费的比值为
29.【2016年新课标Ⅰ卷理科第19题】某公司计划购买2台机器,该种机器使用三年后即被淘汰,机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(1)求X的分布列;
(2)若要求,确定n的最小值;
(3)以购买易损零件所需费用的期望值为决策依据,在与之中选其一,应选用哪个?
【答案】(1)见解析.
(2)见解析.
(3)见解析.
【详解】(1)由柱状图并以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2,从而
;
;
;
;
;
;
.
所以的分布列为
16
17
18
19
20
21
22
(2)由(1)知,,故的最小值为19.
(3)购买零件所用费用含两部分,一部分为购买零件的费用,另一部分为备件不足时额外购买的费用.
当n=19时,费用的期望为:19×200+500×0.2+1000×0.08+1500×0.04=4040;
当n=20时,费用的期望为:20×200+500×0.08+1000×0.04=4080.
可知当时所需费用的期望值小于时所需费用的期望值,故应选.
30.【2015年新课标Ⅱ理科第18题】某公司为了解用户对其产品的满意度,从A、B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:
A地区:
62
73
81
92
95
85
74
64
53
76
78
86
95
66
97
78
88
82
76
89
B地区:
73
83
62
51
91
46
53
73
64
82
93
48
95
81
74
56
54
76
65
79
(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度的平均值及分散程度(不要求算出具体值,给出结论即可):
(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”,假设两地区用户的评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.
【答案】(Ⅰ)见解析(Ⅱ)0.44
【详解】(Ⅰ)两地区用户满意度评分的如下
通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.
(Ⅱ)记表示事件:“A地区用户满意度等级为满意或非常满意”;
表示事件:“A地区用户满意度等级为非常满意”;
表示事件:“B地区用户满意度等级为不满意”;
表示事件:“B地区用户满意度等级为满意”.
则与独立,与独立,与互斥,.
.
由所给数据得,,,发生的概率分别为,,,.
故,,,
故.
31.【2015年新课标Ⅰ理科第19题】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费和年销售量(=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
46.6
563
6.8
289.8
1.6
1469
108.8
表中,=
(Ⅰ)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;
(Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y-x.根据(Ⅱ)的结果回答下列问题:
(ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少?
(ⅱ)年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据,,……,,其回归线的斜率和截距的最小二乘估计分别为:
【答案】(Ⅰ);(Ⅱ);(Ⅲ)(ⅰ);(ⅱ)46.24
【详解】(Ⅰ)由散点图可以判断,适合作为年销售关于年宣传费用的回归方程类型.
(Ⅱ)令,先建立关于的线性回归方程,由于=,
∴=563-68×6.8=100.6.
∴关于的线性回归方程为,
∴关于的回归方程为.
(Ⅲ)(ⅰ)由(Ⅱ)知,当=49时,年销售量的预报值
=576.6,
年利润的预报值.
(ⅱ)根据(Ⅱ)的结果知,年利润z的预报值
,
∴当=,即时,取得最大值.
故宣传费用为46.24千元时,年利润的预报值最大.
1.(2024·浙江金华·三模)在的二项式展开式的所有项中,依次不放回地抽取两项,且每一项被取到的可能性相等.
(1)在第一次取到有理项的条件下,求第二次取到无理项的概率;
(2)记取到有理项的项数为随机变量X,求X的分布列及数学期望.
【答案】(1)
(2)分布列见解析,
【分析】(1)根据题意,由二项式展开式的通项公式即可得到二项展开式中有3项有理项,6项无理项,再由条件概率公式代入计算,即可得到结果;
(2)根据题意,由条件可得的可能取值为,然后分别计算其对应的概率,即可得到分布列与期望.
【详解】(1)由题可得二项式展开式的通项为,,
令,解得.
故二项展开式中有3项有理项,6项无理项.
记事件“第一次取到有理项”,事件“第二次取到无理项”,
所以,,
则.
(2)由题意可得的可能取值为,
,
,
,
则分布列为:
X
0
1
2
P
.
2.(2024·河北保定·二模)单位面积穗数、穗粒数、千粒重是影响小麦产量的主要因素,某小麦品种培育基地在一块试验田种植了一个小麦新品种,收获时随机选取了100个小麦穗,对每个小麦穗上的小麦粒数进行统计得到如下统计表:
穗粒数
穗数
4
10
56
22
8
其中同一组中的数据用该组区间的中点值作代表.从收获的小麦粒中随机选取5组,每组1000粒,分别称重,得到这5组的质量(单位:)分别为:.
(1)根据抽测,这块试验田的小麦亩穗数为40万,试估计这块试验田的小麦亩产量(结果四舍五入到);
公式:亩产量亩穗数样本平均穗粒数.
(2)已知该试验田穗粒数近似服从正态分布,其中近似为样本平均数,近似为样本方差.若小麦穗粒数不低于28粒的穗数超过总体的,则称该小麦品种为优质小麦品种,试判断该试验田中的小麦品种是否为优质小麦品种.
参考数据:若近似服从正态分布,则.
【答案】(1);
(2)该试验田中的小麦为优质小麦品种.
【分析】(1)用每组区间的中点值乘以穗数求和除以100得到样本平均穗粒数,再由题所给数据得到样本平均千粒重,代入所给公式即可;
(2)先根据数据求得,再由,根据正态分布的原则,求得概率即可判断.
【详解】(1)该试验田样本平均穗粒数为,
样本平均千粒重为,
所以这块试验田的小麦亩产量的估计值为,
(2)由(1)得,
所以,
由得:,
故:,
所以该试验田中的小麦为优质小麦品种.
3.(2024·内蒙古包头·一模)为了比较两种治疗高血压的药(分别称为甲药,乙药)的疗效,随机选取20位患者服用甲药,20位患者服用乙药,这40位患者在服用一段时间后,记录他们日平均降低的血压数值(单位:mmhg).根据记录的数据绘制了如下茎叶图:
(1)根据茎叶图判断哪种药的疗效更好?并给出两种理由进行说明;
(2)求40位患者在服用一段时间后,日平均降低血压数值的中位数,并将日平均降低血压数值超过和不超过的患者数填入下面的列联表:
超过
不超过
服用甲药
服用乙药
(3)根据(2)中的列联表,能否有的把握认为这两种药物的疗效有差异?
附:,
0.15
0.10
0.05
2.072
2.706
3.841
【答案】(1)乙药的疗效更好,理由见解析
(2),列联表见解析
(3)没有95%的把握认为这两种药物的疗效有差异
【分析】(1)根据茎叶图数据分析即可;
(2)根据茎叶图数据分析出中位数,即可得到列联表;
(3)计算出卡方,即可判断.
【详解】(1)乙药的疗效更好.参考理由如下:
(ⅰ)用各自的平均数说明.
设甲药观测数据的平均数为,乙药观测数据的平均数为,
由茎叶图可知,,
,
因为,所以乙药的疗效更好.
(ⅱ)用茎2和茎3上分布的数据说明.
由茎叶图可知,用甲药有的患者日平均降低血压数值在20及以上,
用乙药有的患者日平均降低血压数值在20及以上,所以乙药的疗效更好.
(ⅲ)用各自的中位数说明.
由茎叶图可知,用甲药的患者日平均降低血压数值的中位数为,
用乙药的患者日平均降低血压数值的中位数为,所以乙药的疗效更好.
(ⅳ)用各自的叶在茎上的整体分布说明.
由茎叶图可知,用甲药的患者日平均降低血压数值分布集中在“单峰”茎1上,且关于茎1大致呈对称分布;
用乙药的患者日平均降低血压数值分布集中在“单峰”茎2上,且关于茎2大致呈对称分布,
又用两种降压药患者日平均降低血压数值都分布的区间内,所以乙药的疗效更好.
(2)由茎叶图可知内有个数据,内有个数据,内有个数据,,则中位数位于之间,
且内的数据从小到大排列为,,,,,,,,,,,,,,,
所以中位数.
列联表如下:
超过
不超过
服用甲药
7
13
服用乙药
13
7
(3)由于,
所以没有的把握认为这两种药物的疗效有差异.
4.(2024·四川成都·三模)“绿色出行,低碳环保”的理念已经深入人心,逐渐成为新的时尚.甲、乙、丙三人为响应“绿色出行,低碳环保”号召,他们计划6月1日选择“共享单车”或“地铁”两种出行方式中的一种.他们之间的出行互不影响,其中,甲选择“共享单车”的概率为,乙选择“共享单车”的概率为,丙选择“共享单车”的概率为.
(1)若有两人选择“共享单车”出行,求丙选择“共享单车”的概率;
(2)记甲、乙、丙三人中选择“共享单车”出行的人数为X,求X的分布列与数学期望.
【答案】(1)
(2)分布列见解析,.
【分析】(1)利用条件概率公式求解;
(2)由X可能的取值,计算相应的概率,得分布列,由公式计算数学期望.
【详解】(1)记甲、乙、丙三人选择“共享单车”出行分别为事件A,B,C,记三人中恰有两人选择“共享单车”出行为事件D,
则,
又,
所以,
即若有两人选择“共享单车”出行,丙选择“共享单车”的概率为.
(2)由题意可知,X的所有可能取值为0,1,2,3,
则,
,
,
,
所以X的分布列为
X
0
1
2
3
P
故,
即X的数学期望为.
5.(2024·河北邢台·一模)小张参加某知识竞赛,题目按照难度不同分为A类题和B类题,小张回答A类题正确的概率为0.9,小张回答B类题正确的概率为0.45.已知题库中B类题的数量是A类题的两倍.
(1)求小张在题库中任选一题,回答正确的概率;
(2)已知题库中的题目数量足够多,该知识竞赛需要小张从题库中连续回答10个题目,若小张在这10个题目中恰好回答正确k个(,1,2,,10)的概率为,则当k为何值时,最大?
【答案】(1)0.6
(2)6
【分析】(1)由独立事件的乘法概率求出即可;
(2)由二项分布中最大值的计算求出即可,可设,利用组合数的性质求出即可.
【详解】(1)设小张回答A类题正确的概率为,小张回答B类题正确的概率为,小张在题库中任选一题,回答正确的概率为,
由题意可得,
所以,
所以小张在题库中任选一题,回答正确的概率为0.6.
(2)由(1)可得,
设,
即,
所以,
即,
解得,
又,所以时,最大.
6.(2024·内蒙古包头·二模)某企业拟对某产品进行科技升级,根据市场调研与模拟,得到科技升级投入(万元)与科技升级直接收益(万元)的数据统计如下:
序号
1
2
3
4
5
6
7
2
3
4
6
8
10
13
13
22
31
42
50
56
58
根据表格中的数据,建立了与的两个回归模型:模型①:模型②:.
(1)根据下列表格中的数据,比较模型①、②的相关指数的大小,并选择拟合精度更高、更可靠的模型;
(2)根据(1)选择的模型,预测对该产品科技升级的投入为100万元时的直接收益.
回归模型
模型①
模型②
回归方程
182.4
79.2
(附:刻画回归效果的相关指数越大,模型的拟合效果越好)
【答案】(1)模型①的相关指数小于模型②的相关指数,即模型②的拟合效果精度更高、更可靠.
(2)198.6
【分析】(1)利用相关指数的定义判断相关性即可.
(2)将给定数值代入拟合模型中求预测值即可.
【详解】(1)由表格中的数据,,
所以,模型①的相关指数小于模型②的相关指数,
即模型②的拟合效果精度更高、更可靠.
(2)当万元时,科技升级直接收益的预测值为:
(万元)
7.(2024·甘肃酒泉·三模)为促进全面阅读,建设书香校园,鼓励学生参加阅读活动,某校随机抽查了男、女生各200名,统计他们在暑假期间每天阅读时长,并把每天阅读时长超过1小时的记为“阅读达标”,时长不超过1小时的记为“阅读不达标”,阅读达标与阅读不达标的人数比为,阅读达标的女生与男生的人数比为.
(1)完成下面的列联表:
性别
阅读达标情况
合计
阅读达标
阅读不达标
男生
女生
合计
(2)根据上述数据,依据小概率值的独立性检验,能否认为“阅读达标情况”与“性别”有关联?
(3)从阅读达标的学生中按男、女生人数比例用分层随机抽样的方法抽取5人进行座谈,再从这5人中任选2人,记这2人中男生人数为X,求X的分布列和数学期望.
参考公式:,.
0.10
0.05
0.01
0.001
2.706
3.841
6.635
10.828
【答案】(1)列联表见详解
(2)“阅读达标情况”与“性别”有关联
(3)分布列见详解,
【分析】(1)根据分析阅读达标与阅读不达标的人数,以及阅读达标的女生与男生的人数,进而可得列联表;
(2)根据列联表计算,并与临界值对比分析,结合独立性检验分析说明;
(3)由题意可知:X的可能取值为0,1,2,结合超几何分布求分布列和期望.
【详解】(1)由题意可知:阅读达标与阅读不达标的人数分别为200,200,
阅读达标的女生与男生的人数比为,
据此可得列联表:
性别
阅读达标情况
合计
阅读达标
阅读不达标
男生
80
120
200
女生
120
80
200
合计
200
200
400
(2)零假设: “阅读达标情况”与“性别”没有关联,
由(1)可得:,
依据小概率值的独立性检验,可知零假设不成立,
所以“阅读达标情况”与“性别”有关联.
(3)因为抽取5人中男、女生人数分别为,
由题意可知:X的可能取值为0,1,2,则有:
,
所以X的分布列为
X
0
1
2
P
数学期望为.
8.(2024·四川成都·三模)随着科技的进步,近年来,我国新能源汽车产业迅速发展,各大品牌新能源汽车除了靠不断提高汽车的性能和质量来提升品牌竞争力,在广告投放方面的花费也是逐年攀升.小赵同学对某品牌新能源汽车近5年的广告费投入(单位:亿元)进行了统计,具体数据见下表:
年份代号
1
2
3
4
5
广告费投入
4.8
5.6
6.2
7.6
8.8
并随机调查了200名市民对该品牌新能源汽车的认可情况,得到的部分数据见下表
认可
不认可
50岁以下市民
70
30
50岁以上市民
60
40
(1)求广告费投入与年份代号之间的线性回归方程;
(2)是否有90%的把握认为市民的年龄与对该品牌新能源汽车的认可度具有相关性?
(3)若以这200名市民的年龄与对该品牌新能源汽车的认可度情况估计整体情况,则从全市市民中随机选取20人,记选到认可该品牌新能源汽车且50岁以上的市民人数为,求数学期望与方差.
附:①回归直线中,,;
②,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)
(2)没有
(3)
【分析】(1)计算出平均数后,结合所给公式计算即可得;
(2)结算出卡方即可得.
(3)由二项分布的期望、方差公式即可求解.
【详解】(1),,
则,
则,故;
(2)由题以可得
,
故没有的把握认为市民的年龄与对该品牌新能源汽车的认可度具有相关性.
(3)若以这200名市民的年龄与对该品牌新能源汽车的认可度情况估计整体情况,则从全市市民中随机选取1人,
记选到认可该品牌新能源汽车且50岁以上的市民的概率为,
若从全市市民中随机选取20人,记选到认可该品牌新能源汽车且50岁以上的市民人数为,
则,
所以数学期望与方差分别为.
9.(2024·浙江台州·二模)台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入、该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示:令,数据经过初步处理得:
44
4.8
10
40.3
1.612
19.5
8.06
现有①和②两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数.
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出y关于x的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少?
(3)该公司生产的电动车毛利润为每辆200元(不含广告费、研发经费).该公司在加大广告投入的同时也加大研发经费的投入,年研发经费为年广告费的199倍.电动车的年净利润受年广告费和年研发经费影响外还受随机变量影响,设随机变量服从正态分布,且满足.在(2)的条件下,求该公司年净利润的最大值大于1000(百万元)的概率.(年净利润=毛利润×年销售量-年广告费-年研发经费-随机变量).
附:①相关系数,
回归直线中公式分别为,;
②参考数据:,,,.
【答案】(1)模型②的拟合程度更好
(2),当年广告费为6(百万元)时,产品的销售量大概是13(百万辆)
(3)0.3
【分析】(1)分别求得模型①和②的相关系数,,然后比较得出结论;
(2)利用最小二乘法求解;
(3)由净利润为,求解.
【详解】(1)解:设模型①和②的相关系数分别为,.
由题意可得:,
.
所以,由相关系数的相关性质可得,模型②的拟合程度更好.
(2)因为,
又由,,
得,
所以,即回归方程为.
当时,,
因此当年广告费为6(百万元)时,产品的销售量大概是13(百万辆).
(3)净利润为,,
令,
所以.
可得在上为增函数,在上为减函数.
所以,
由题意得:,即,
,
即该公司年净利润大于1000(百万元)的概率为0.3.
10.(2024·湖北黄石·三模)已知甲口袋中有个白球,个红球(,,),乙口袋中都是红球,所有红球与白球除了颜色再没有其他差别.设.
(1)从甲口袋中依次取2球(每次取1球,不放回),求第2个球为白球的概率();
(2)化简;
(3)如果从甲口袋中任取1球是白球的概率为,现在随机从甲、乙口袋中任取1球,观察其颜色,结果为红球,并将其放回原口袋中,求仍在这个口袋中取1球是白球的概率.
【答案】(1)
(2)
(3)
【分析】(1)直接用全概率公式即可;
(2)将转化为若干概率之和的倍,即可求解;
(3)使用条件概率的定义即可求解.
【详解】(1)设分别表示“第1个球是白球”和“第2个球是白球”,
则.
故所求概率为.
(2)设从甲口袋中反复不放回地取出球,第1次取出白球发生于第次取的过程中的概率为,这里,
则.
故.
(3)设分别表示“选择的是甲口袋”,“选择的是乙口袋”,“第1次取出的是红球”,“第2次取出的是白球”,
则,,,.
故,,
所以.
故在第1次结果为红球的条件下,求仍在这个口袋中取1球是白球的概率为.
11.(2024·山东聊城·三模)今年五一节期间,聊城百货大楼有限公司搞促销活动,下表是该公司5月1号至10号(日期简记为1,2,3,……,10)连续10天的销售情况:
日期
1
2
3
4
5
6
7
8
9
10
销售额(万元)
19
19.3
19.6
20
21.2
22.4
23.8
24.6
25
25.4
由上述数据,用最小二乘法得到销售额和日期的线性回归方程为,日期的方差约为3.02,销售额的方差约为2.59.
(1)根据线性回归方程,分析销售额随日期变化趋势的特征,并计算第4天的残差;
(2)计算相关系数,并分析销售额和日期的相关程度(精确到0.001);
(3)该公司为了促销,拟打算对电视机实行分期付款方式销售,假设顾客购买一台电视机选择分期付款的期数及相应的概率和公司获得的利润(单位:元)情况如下表:
2
4
6
400
600
800
已知成等比数列.
设该公司销售两台电视机所获得的利润为(单位:元),当的概率取得最大值时,求利润的分布列和数学期望.
参考公式:相关系数.回归方程中斜率和截距的最小二乘法估计公式分别为:.相关数据.
【答案】(1)日期每增加一天,销售额约增加万元,第4天的残差为
(2),销售额和日期的相关程度较强
(3)分布列见解析,1200
【分析】(1)根据线性回归方程特点分析,再将代入回归方程计算,利用残差定义求解即可;
(2)由相关系数的公式结合题中的数据计算,然后根据相关系数与1比较即可判断;
(3)先根据等比中项性质得,,由题意可得的可能取值有,计算其对应的概率,利用基本不等式求得的概率取得最大值时,从而列出分布列,求出期望即可.
【详解】(1)根据线性回归方程,日期每增加一天,销售额约增加万元,
把代入回归直线方程,得,
因为,所以第4天的残差为;
(2)由得,
比较接近于1,故销售额和日期的相关程度较强.
(3)由成等比数列,得,且,
设其公比为,则,所以,
由题意可得的值分别为,
则,,,
,,
又,取得最大值的条件即,
此时,
故分布列为:
800
1000
1200
1400
1600
期望.
12.(2024·山东济南·三模)近年来,我国众多新能源汽车制造企业迅速崛起.某企业着力推进技术革新,利润稳步提高.统计该企业2019年至2023年的利润(单位:亿元),得到如图所示的散点图.其中2019年至2023年对应的年份代码依次为1,2,3,4,5.
(1)根据散点图判断,和哪一个适宜作为企业利润y(单位:亿元)关于年份代码x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)中的判断结果,建立y关于x的回归方程;
(3)根据(2)的结果,估计2024年的企业利润.
参考公式及数据;
,,
,,,,
【答案】(1)适宜作为企业利润y(单位:亿元)关于年份代码x的回归方程类型
(2)
(3)估计2024年的企业利润为93.3亿元
【分析】(1)利用散点图的变化趋势,即可得出答案;
(2)利用最小二乘法求出即可得解;
(3)令即可得解.
【详解】(1)由散点图的变化趋势,知适宜作为企业利润y(单位:亿元)关于年份代码x的回归方程类型;
(2)由题意得:,,
,
,
所以;
(3)令,,
估计2024年的企业利润为99.25亿元.
13.(2024·山东济宁·三模)产品重量误差是检测产品包装线效能的重要指标.某食品加工厂为了检查一条新投入使用的全自动包装线的效能,随机抽取该包装线上的20件产品作为样本,并检测出样本中产品的重量(单位:克),重量的分组区间为.由此得到样本的频率分布直方图(如图),已知该产品标准重量为500克.
(1)求直方图中的值;
(2)若产品重量与标准重量之差的绝对值大于或等于5,即判定该产品包装不合格,在上述抽取的20件产品中任取2件,求恰有一件合格产品的概率;
(3)以样本的频率估计概率,若从该包装线上任取4件产品,设为重量超过500克的产品数量,求的数学期望和方差.
【答案】(1)0.05;
(2);
(3),.
【分析】(1)利用频率分布直方图中小矩形面积和为1求出的值.
(2)求出抽取的20件产品中的不合格件数,再利用古典概率计算即得.
(3)求出样本中,重量超过500克的产品数量及对应概率,利用二项分布的期望、方差公式计算得解.
【详解】(1)依题意,,解得,
所以直方图中的值是0.05.
(2)样本中不合格产品数量为,
记事件表示“在上述抽取的20件产品中任取2件,恰有一件合格产品”则,
所以在上述抽取的20件产品中任取2件,恰有一件合格产品的概率为.
(3)根据该样本频率分布直方图,重量超过500克的产品数量为,
则从包装线上任取一件产品,其重量超过500克的概率为所以,
随机变量,因此,.
14.(2024·浙江绍兴·二模)盒子中装有大小形状相同的4个小球,其中2个白色2个红色. 每次取一球,若取出的是白球,则不放回;若取出的是红球,则取完放回.
(1)取两次,求恰好一红一白的概率;
(2)取两次,记取到白球的个数为随机变量,求随机变量的分布列及均值;
(3)在第2次取出的球是红球的条件下,求第1次取出的球是白球的概率.
【答案】(1)
(2)分布列见解析,
(3)
【分析】(1)借助全概率公式计算即可得;
(2)得到随机变量所有可能取值后求出对应概率,即可得分布列,借助分布列计算即可得均值;
(3)借助全概率公式与条件概率公式计算即可得.
【详解】(1)记事件:第一次取到是红球,事件:第二次取到是红球,
则;
(2)随机变量可取0,1,2,
,,,
随机变量分布列如下:
0
1
2
所以;
(3),
,
则.
15.(2024·浙江·二模)甲、乙两人进行知识问答比赛,共有道抢答题,甲、乙抢题的成功率相同.假设每题甲乙答题正确的概率分别为和,各题答题相互独立.规则为:初始双方均为0分,答对一题得1分,答错一题得﹣1分,未抢到题得0分,最后累计总分多的人获胜.
(1)若,,求甲获胜的概率;
(2)若,设甲第题的得分为随机变量,一次比赛中得到的一组观测值,如下表.现利用统计方法来估计的值:
①设随机变量,若以观测值的均值作为的数学期望,请以此求出的估计值;
②设随机变量取到观测值的概率为,即;在一次抽样中获得这一组特殊观测值的概率应该最大,随着的变化,用使得达到最大时的取值作为参数的一个估计值.求.
题目
1
2
3
4
5
6
7
8
9
10
得分
1
0
0
﹣1
1
1
﹣1
0
0
0
题目
11
12
13
14
15
16
17
18
19
20
得分
﹣1
0
1
1
﹣1
0
0
0
1
0
表1:甲得分的一组观测值.
附:若随机变量,的期望,都存在,则.
【答案】(1)
(2)①;②
【分析】(1)根据甲抢到题目数,分类讨论利用条件概率和全概率公式求解.
(2)①由公式计算的数学期望与观测值的均值相等,可求出的估计值;
②由概率的表达式,利用导数求取最大值时时的取值.
【详解】(1)记甲获胜为事件,甲抢到3道题为事件,甲抢到2道题为事件,甲抢到1道题为事件,甲抢到0道题为事件,
则,,
,,
而,
,
,
,
所以
.
(2)①,,,
所以;
因为,
由表中数据可知,
所以,.
②因为取值相互独立,
所以
,
所以;
令得,
又,
所以当时,,单调递增;
当时,,单调递减;
即当时取到最大值,从而.
原创精品资源学科网独家享有版权,侵权必究!1
学科网(北京)股份有限公司
$$
大数据之十年高考真题(2015-2024)与优质模拟题(新高考卷)
专题20概率统计(解答题)
1.【2024年甲卷理科第17题】某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品
合格品
不合格品
总计
甲车间
26
24
0
50
乙车间
70
28
2
100
总计
96
52
2
150
(1)填写如下列联表:
优级品
非优级品
甲车间
乙车间
能否有的把握认为甲、乙两车间产品的优级品率存在差异?能否有的把握认为甲,乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率,设为升级改造后抽取的n件产品的优级品率.如果,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?()
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
2.【2024年新高考2卷第18题】某投篮比赛分为两个阶段,每个参赛队由两名队员组成,比赛具体规则如下:第一阶段由参赛队中一名队员投篮3次,若3次都未投中,则该队被淘汰,比赛成绩为0分;若至少投中一次,则该队进入第二阶段.第二阶段由该队的另一名队员投篮3次,每次投篮投中得5分,未投中得0分.该队的比赛成绩为第二阶段的得分总和.某参赛队由甲、乙两名队员组成,设甲每次投中的概率为p,乙每次投中的概率为q,各次投中与否相互独立.
(1)若,,甲参加第一阶段比赛,求甲、乙所在队的比赛成绩不少于5分的概率.
(2)假设,
(i)为使得甲、乙所在队的比赛成绩为15分的概率最大,应该由谁参加第一阶段比赛?
(ii)为使得甲、乙所在队的比赛成绩的数学期望最大,应该由谁参加第一阶段比赛?
3.【2023年新课标全国Ⅱ卷第19题】某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率%时,求临界值c和误诊率;
(2)设函数,当时,求的解析式,并求在区间的最小值.
4.【2023年新课标全国Ⅰ卷第21题】甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若末命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.
(1)求第2次投篮的人是乙的概率;
(2)求第次投篮的人是甲的概率;
(3)已知:若随机变量服从两点分布,且,则.记前次(即从第1次到第次投篮)中甲投篮的次数为,求.
5.【2023年高考全国乙卷理第17题】某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
6.【2023年高考全国甲卷理第19题】一项试验旨在研究臭氧效应.实验方案如下:选40只小白鼠,随机地将其中20只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).
(1)设表示指定的两只小白鼠中分配到对照组的只数,求的分布列和数学期望;
(2)实验结果如下:
对照组的小白鼠体重的增加量从小到大排序为:
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
实验组的小白鼠体重的增加量从小到大排序为:
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(i)求40只小鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于的数据的个数,完成如下列联表:
对照组
实验组
(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异.
附:
0.100
0.050
0.010
2.706
3.841
6.635
7.【2022年新课标全国Ⅰ卷第20题】一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好
良好
病例组
40
60
对照组
10
90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:;
(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.
附,
0.050
0.010
0.001
k
3.841
6.635
10.828
8.【2022年新课标全国Ⅱ卷第19题】在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间的概率;
(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
9.【2022年高考全国乙卷理第19题】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数.
10.【2022年高考全国甲卷理第19题】甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与期望.
11.【2021年新课标全国Ⅰ卷第18题】某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分,已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记为小明的累计得分,求的分布列;
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
12.【2021年高考全国乙卷理第17题】某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
13.【2021年高考全国甲卷理第17题】甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
14.【2020年新课标全国Ⅱ卷第19题】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:
(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;
(2)根据所给数据,完成下面的列联表:
(3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?
附:,
15.【2020年新课标Ⅲ卷理科第18题】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次空气质量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400
人次>400
空气质量好
空气质量不好
附:,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
16.【2020年新课标Ⅱ卷理科第18题】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
17.【2020年新课标Ⅰ卷理科第19题】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为,
(1)求甲连胜四场的概率;
(2)求需要进行第五场比赛的概率;
(3)求丙最终获胜的概率.
18.【2019年新课标Ⅲ卷理科第17题】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.
(1)求乙离子残留百分比直方图中的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
19.【2019年新课标Ⅱ卷理科第18题】11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.
(1)求P(X=2);
(2)求事件“X=4且甲获胜”的概率.
20.【2019年新课标Ⅰ卷理科第21题】为了治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.
(1)求的分布列;
(2)若甲药、乙药在试验开始时都赋予4分,表示“甲药的累计得分为时,最终认为甲药比乙药更有效”的概率,则,,,其中,,.假设,.
(i)证明:为等比数列;
(ii)求,并根据的值解释这种试验方案的合理性.
21.【2018年新课标Ⅱ卷理科第18题】下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
22.【2018年新课标Ⅲ卷理科第18题】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:
超过
不超过
第一种生产方式
第二种生产方式
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:,
23.【2018年新课标Ⅰ卷理科第20题】某工厂的某种产品成箱包装,每箱件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为,且各件产品是否为不合格品相互独立.
(1)记件产品中恰有件不合格品的概率为,求的最大值点;
(2)现对一箱产品检验了件,结果恰有件不合格品,以(1)中确定的作为的值.已知每件产品的检验费用为元,若有不合格品进入用户手中,则工厂要对每件不合格品支付元的赔偿费用.
(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为,求;
(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
24.【2017年新课标Ⅰ卷理科第19题】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布.
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在之外的零件数,求及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,其中xi为抽取的第i个零件的尺寸,.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布,则,,.
25.【2017年新课标Ⅲ卷理科第18题】某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间,需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高
气温
[10,
15)
[15,
20)
[20,
25)
[25,
30)
[30,
35)
[35,
40)
天数
2
16
36
25
7
4
以最高气温位于各区间的频率代替最高气温位于该区间的概率.
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列.
(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?
26.【2017年新课标Ⅱ卷理科第18题】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg).其频率分布直方图如下:
(1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50 kg
箱产量≥50 kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
附:,
27.【2016年新课标Ⅲ卷理科第18题】下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
(Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:,,
,≈2.646.
参考公式:相关系数
回归方程中斜率和截距的最小二乘估计公式分别为:
28.【2016年新课标Ⅱ卷理科第18题】某险种的基本保费为(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:
上年度出险次数
0
1
2
3
4
保费
设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数
0
1
2
3
4
概率
0.30
0.15
0.20
0.20
0.10
0.05
(Ⅰ)求一续保人本年度的保费高于基本保费的概率;
(Ⅱ)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出的概率;
(Ⅲ)求续保人本年度的平均保费与基本保费的比值.
29.【2016年新课标Ⅰ卷理科第19题】某公司计划购买2台机器,该种机器使用三年后即被淘汰,机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(1)求X的分布列;
(2)若要求,确定n的最小值;
(3)以购买易损零件所需费用的期望值为决策依据,在与之中选其一,应选用哪个?
30.【2015年新课标Ⅱ理科第18题】某公司为了解用户对其产品的满意度,从A、B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:
A地区:
62
73
81
92
95
85
74
64
53
76
78
86
95
66
97
78
88
82
76
89
B地区:
73
83
62
51
91
46
53
73
64
82
93
48
95
81
74
56
54
76
65
79
(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度的平均值及分散程度(不要求算出具体值,给出结论即可):
(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”,假设两地区用户的评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.
31.【2015年新课标Ⅰ理科第19题】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费和年销售量(=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
46.6
563
6.8
289.8
1.6
1469
108.8
表中,=
(Ⅰ)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;
(Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y-x.根据(Ⅱ)的结果回答下列问题:
(ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少?
(ⅱ)年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据,,……,,其回归线的斜率和截距的最小二乘估计分别为:
1.(2024·浙江金华·三模)在的二项式展开式的所有项中,依次不放回地抽取两项,且每一项被取到的可能性相等.
(1)在第一次取到有理项的条件下,求第二次取到无理项的概率;
(2)记取到有理项的项数为随机变量X,求X的分布列及数学期望.
2.(2024·河北保定·二模)单位面积穗数、穗粒数、千粒重是影响小麦产量的主要因素,某小麦品种培育基地在一块试验田种植了一个小麦新品种,收获时随机选取了100个小麦穗,对每个小麦穗上的小麦粒数进行统计得到如下统计表:
穗粒数
穗数
4
10
56
22
8
其中同一组中的数据用该组区间的中点值作代表.从收获的小麦粒中随机选取5组,每组1000粒,分别称重,得到这5组的质量(单位:)分别为:.
(1)根据抽测,这块试验田的小麦亩穗数为40万,试估计这块试验田的小麦亩产量(结果四舍五入到);
公式:亩产量亩穗数样本平均穗粒数.
(2)已知该试验田穗粒数近似服从正态分布,其中近似为样本平均数,近似为样本方差.若小麦穗粒数不低于28粒的穗数超过总体的,则称该小麦品种为优质小麦品种,试判断该试验田中的小麦品种是否为优质小麦品种.
参考数据:若近似服从正态分布,则.
3.(2024·内蒙古包头·一模)为了比较两种治疗高血压的药(分别称为甲药,乙药)的疗效,随机选取20位患者服用甲药,20位患者服用乙药,这40位患者在服用一段时间后,记录他们日平均降低的血压数值(单位:mmhg).根据记录的数据绘制了如下茎叶图:
(1)根据茎叶图判断哪种药的疗效更好?并给出两种理由进行说明;
(2)求40位患者在服用一段时间后,日平均降低血压数值的中位数,并将日平均降低血压数值超过和不超过的患者数填入下面的列联表:
超过
不超过
服用甲药
服用乙药
(3)根据(2)中的列联表,能否有的把握认为这两种药物的疗效有差异?
附:,
0.15
0.10
0.05
2.072
2.706
3.841
4.(2024·四川成都·三模)“绿色出行,低碳环保”的理念已经深入人心,逐渐成为新的时尚.甲、乙、丙三人为响应“绿色出行,低碳环保”号召,他们计划6月1日选择“共享单车”或“地铁”两种出行方式中的一种.他们之间的出行互不影响,其中,甲选择“共享单车”的概率为,乙选择“共享单车”的概率为,丙选择“共享单车”的概率为.
(1)若有两人选择“共享单车”出行,求丙选择“共享单车”的概率;
(2)记甲、乙、丙三人中选择“共享单车”出行的人数为X,求X的分布列与数学期望.
5.(2024·河北邢台·一模)小张参加某知识竞赛,题目按照难度不同分为A类题和B类题,小张回答A类题正确的概率为0.9,小张回答B类题正确的概率为0.45.已知题库中B类题的数量是A类题的两倍.
(1)求小张在题库中任选一题,回答正确的概率;
(2)已知题库中的题目数量足够多,该知识竞赛需要小张从题库中连续回答10个题目,若小张在这10个题目中恰好回答正确k个(,1,2,,10)的概率为,则当k为何值时,最大?
6.(2024·内蒙古包头·二模)某企业拟对某产品进行科技升级,根据市场调研与模拟,得到科技升级投入(万元)与科技升级直接收益(万元)的数据统计如下:
序号
1
2
3
4
5
6
7
2
3
4
6
8
10
13
13
22
31
42
50
56
58
根据表格中的数据,建立了与的两个回归模型:模型①:模型②:.
(1)根据下列表格中的数据,比较模型①、②的相关指数的大小,并选择拟合精度更高、更可靠的模型;
(2)根据(1)选择的模型,预测对该产品科技升级的投入为100万元时的直接收益.
回归模型
模型①
模型②
回归方程
182.4
79.2
(附:刻画回归效果的相关指数越大,模型的拟合效果越好)
7.(2024·甘肃酒泉·三模)为促进全面阅读,建设书香校园,鼓励学生参加阅读活动,某校随机抽查了男、女生各200名,统计他们在暑假期间每天阅读时长,并把每天阅读时长超过1小时的记为“阅读达标”,时长不超过1小时的记为“阅读不达标”,阅读达标与阅读不达标的人数比为,阅读达标的女生与男生的人数比为.
(1)完成下面的列联表:
性别
阅读达标情况
合计
阅读达标
阅读不达标
男生
女生
合计
(2)根据上述数据,依据小概率值的独立性检验,能否认为“阅读达标情况”与“性别”有关联?
(3)从阅读达标的学生中按男、女生人数比例用分层随机抽样的方法抽取5人进行座谈,再从这5人中任选2人,记这2人中男生人数为X,求X的分布列和数学期望.
参考公式:,.
0.10
0.05
0.01
0.001
2.706
3.841
6.635
10.828
8.(2024·四川成都·三模)随着科技的进步,近年来,我国新能源汽车产业迅速发展,各大品牌新能源汽车除了靠不断提高汽车的性能和质量来提升品牌竞争力,在广告投放方面的花费也是逐年攀升.小赵同学对某品牌新能源汽车近5年的广告费投入(单位:亿元)进行了统计,具体数据见下表:
年份代号
1
2
3
4
5
广告费投入
4.8
5.6
6.2
7.6
8.8
并随机调查了200名市民对该品牌新能源汽车的认可情况,得到的部分数据见下表
认可
不认可
50岁以下市民
70
30
50岁以上市民
60
40
(1)求广告费投入与年份代号之间的线性回归方程;
(2)是否有90%的把握认为市民的年龄与对该品牌新能源汽车的认可度具有相关性?
(3)若以这200名市民的年龄与对该品牌新能源汽车的认可度情况估计整体情况,则从全市市民中随机选取20人,记选到认可该品牌新能源汽车且50岁以上的市民人数为,求数学期望与方差.
附:①回归直线中,,;
②,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
9.(2024·浙江台州·二模)台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入、该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示:令,数据经过初步处理得:
44
4.8
10
40.3
1.612
19.5
8.06
现有①和②两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数.
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出y关于x的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少?
(3)该公司生产的电动车毛利润为每辆200元(不含广告费、研发经费).该公司在加大广告投入的同时也加大研发经费的投入,年研发经费为年广告费的199倍.电动车的年净利润受年广告费和年研发经费影响外还受随机变量影响,设随机变量服从正态分布,且满足.在(2)的条件下,求该公司年净利润的最大值大于1000(百万元)的概率.(年净利润=毛利润×年销售量-年广告费-年研发经费-随机变量).
附:①相关系数,
回归直线中公式分别为,;
②参考数据:,,,.
10.(2024·湖北黄石·三模)已知甲口袋中有个白球,个红球(,,),乙口袋中都是红球,所有红球与白球除了颜色再没有其他差别.设.
(1)从甲口袋中依次取2球(每次取1球,不放回),求第2个球为白球的概率();
(2)化简;
(3)如果从甲口袋中任取1球是白球的概率为,现在随机从甲、乙口袋中任取1球,观察其颜色,结果为红球,并将其放回原口袋中,求仍在这个口袋中取1球是白球的概率.
11.(2024·山东聊城·三模)今年五一节期间,聊城百货大楼有限公司搞促销活动,下表是该公司5月1号至10号(日期简记为1,2,3,……,10)连续10天的销售情况:
日期
1
2
3
4
5
6
7
8
9
10
销售额(万元)
19
19.3
19.6
20
21.2
22.4
23.8
24.6
25
25.4
由上述数据,用最小二乘法得到销售额和日期的线性回归方程为,日期的方差约为3.02,销售额的方差约为2.59.
(1)根据线性回归方程,分析销售额随日期变化趋势的特征,并计算第4天的残差;
(2)计算相关系数,并分析销售额和日期的相关程度(精确到0.001);
(3)该公司为了促销,拟打算对电视机实行分期付款方式销售,假设顾客购买一台电视机选择分期付款的期数及相应的概率和公司获得的利润(单位:元)情况如下表:
2
4
6
400
600
800
已知成等比数列.
设该公司销售两台电视机所获得的利润为(单位:元),当的概率取得最大值时,求利润的分布列和数学期望.
参考公式:相关系数.回归方程中斜率和截距的最小二乘法估计公式分别为:.相关数据.
12.(2024·山东济南·三模)近年来,我国众多新能源汽车制造企业迅速崛起.某企业着力推进技术革新,利润稳步提高.统计该企业2019年至2023年的利润(单位:亿元),得到如图所示的散点图.其中2019年至2023年对应的年份代码依次为1,2,3,4,5.
(1)根据散点图判断,和哪一个适宜作为企业利润y(单位:亿元)关于年份代码x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)中的判断结果,建立y关于x的回归方程;
(3)根据(2)的结果,估计2024年的企业利润.
参考公式及数据;
,,
,,,,
13.(2024·山东济宁·三模)产品重量误差是检测产品包装线效能的重要指标.某食品加工厂为了检查一条新投入使用的全自动包装线的效能,随机抽取该包装线上的20件产品作为样本,并检测出样本中产品的重量(单位:克),重量的分组区间为.由此得到样本的频率分布直方图(如图),已知该产品标准重量为500克.
(1)求直方图中的值;
(2)若产品重量与标准重量之差的绝对值大于或等于5,即判定该产品包装不合格,在上述抽取的20件产品中任取2件,求恰有一件合格产品的概率;
(3)以样本的频率估计概率,若从该包装线上任取4件产品,设为重量超过500克的产品数量,求的数学期望和方差.
14.(2024·浙江绍兴·二模)盒子中装有大小形状相同的4个小球,其中2个白色2个红色. 每次取一球,若取出的是白球,则不放回;若取出的是红球,则取完放回.
(1)取两次,求恰好一红一白的概率;
(2)取两次,记取到白球的个数为随机变量,求随机变量的分布列及均值;
(3)在第2次取出的球是红球的条件下,求第1次取出的球是白球的概率.
15.(2024·浙江·二模)甲、乙两人进行知识问答比赛,共有道抢答题,甲、乙抢题的成功率相同.假设每题甲乙答题正确的概率分别为和,各题答题相互独立.规则为:初始双方均为0分,答对一题得1分,答错一题得﹣1分,未抢到题得0分,最后累计总分多的人获胜.
(1)若,,求甲获胜的概率;
(2)若,设甲第题的得分为随机变量,一次比赛中得到的一组观测值,如下表.现利用统计方法来估计的值:
①设随机变量,若以观测值的均值作为的数学期望,请以此求出的估计值;
②设随机变量取到观测值的概率为,即;在一次抽样中获得这一组特殊观测值的概率应该最大,随着的变化,用使得达到最大时的取值作为参数的一个估计值.求.
题目
1
2
3
4
5
6
7
8
9
10
得分
1
0
0
﹣1
1
1
﹣1
0
0
0
题目
11
12
13
14
15
16
17
18
19
20
得分
﹣1
0
1
1
﹣1
0
0
0
1
0
表1:甲得分的一组观测值.
附:若随机变量,的期望,都存在,则.
原创精品资源学科网独家享有版权,侵权必究!1
学科网(北京)股份有限公司
$$