内容正文:
专题06 概率与统计(12个考点清单+11类题型解读)
知识点01:条件概率
(1)一般地,设,为两个随机事件,且,我们称为在事件发生的条件下,事件发生的条件概率,简称条件概率.
知识点02:条件概率性质应用
(1)由条件概率的定义,对任意两个事件与,若,则.我们称上式为概率的乘法公式.
(2)如果和是两个互斥事件,则;
知识点03:全概率公式及其应用
一般地,设,,是一组两两互斥的事件,,且,,则对任意的事件,有,我们称此公式为全概率公式.
知识点04:贝叶斯公式及其应用
(1)设,,是一组两两互斥的事件,,且,,
则对任意的事件,,有,.
知识点05:离散型随机变量分布列均值,方差
(1)
(2)
知识点06:均值和方差的性质
①若与都是随机变量,且,则由与之间分布列的关系可知.
②若与相互独立,则.
③若与都是随机变量,且,则由与之间分布列的关系可知.
知识点07:二项分布
1.定义
一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,不发生的概率,那么事件恰好发生次的概率是(,,,…,)
于是得到的分布列
…
…
…
…
由于表中第二行恰好是二项式展开式
各对应项的值,称这样的离散型随机变量服从参数为,的二项分布,记作,并称为成功概率.
注意:由二项分布的定义可以发现,两点分布是一种特殊的二项分布,即时的二项分布,所以二项分布可以看成是两点分布的一般形式.
2.二项分布的适用范围及本质
(1)适用范围:
①各次试验中的事件是相互独立的;
②每次试验只有两种结果:事件要么发生,要么不发生;
③随机变量是这次独立重复试验中事件发生的次数.
(2)本质:二项分布是放回抽样问题,在每次试验中某一事件发生的概率是相同的.
3.二项分布的期望、方差
若,则,.
知识点08:超几何分布
1.定义
在含有件次品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,,1,2,…,,其中,且,,,,,称分布列为超几何分布列.如果随机变量的分布列为超几何分布列,则称随机变量服从超几何分布.
0
1
…
…
2.超几何分布的适用范围件及本质
(1)适用范围:
①考察对象分两类;
②已知各类对象的个数;
③从中抽取若干个个体,考察某类个体个数的概率分布.
(2)本质:超几何分布是不放回抽样问题,在每次试验中某一事件发生的概率是不相同的.
知识点09:正态分布
一、正态曲线
1.定义:我们把函数,(其中是样本均值,是样本标准差)的图象称为正态分布密度曲线,简称正态曲线.正态曲线呈钟形,即中间高,两边低.
2.正态曲线的性质
(1)曲线位于轴上方,与轴不相交;
(2)曲线是单峰的,它关于直线对称;
(3)曲线在处达到峰值(最大值);
(4)曲线与轴之间的面积为1;
(5)当一定时,曲线的位置由确定,曲线随着的变化而沿轴平移,如图甲所示:
(6)当一定时,曲线的形状由确定.越小,曲线越“高瘦”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示::
甲 乙
二、正态分布
1.定义
随机变量落在区间的概率为,即由正态曲线,过点和点的两条轴的垂线,及轴所围成的平面图形的面积,如下图中阴影部分所示,就是落在区间的概率的近似值.
一般地,如果对于任何实数,,随机变量满足,则称随机变量服从正态分布.正态分布完全由参数,确定,因此正态分布常记作.如果随机变量服从正态分布,则记为.
其中,参数是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.
2.原则
若,则对于任意的实数,为下图中阴影部分的面积,对于固定的和而言,该面积随着的减小而变大.这说明越小,落在区间的概率越大,即集中在周围的概率越大
特别地,有;;.
由,知正态总体几乎总取值于区间之内.而在此区间以外取值的概率只有,通常认为这种情况在一次试验中几乎不可能发生,即为小概率事件.在实际应用中,通常认为服从于正态分布的随机变量只取之间的值,并简称之为原则.
知识点10:线性回归模型
1.线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为
其中,,,(,)称为样本点的中心.
2.残差分析
对于预报变量,通过观测得到的数据称为观测值,通过回归方程得到的称为预测值,观测值减去预测值等于残差,称为相应于点的残差,即有.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
(1)残差图
通过残差分析,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.
(2)通过残差平方和分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;反之,不合适.
(3)相关指数
用相关指数来刻画回归的效果,其计算公式是:.
越接近于,说明残差的平方和越小,也表示回归的效果越好.
题型六】线性回归模型
知识点11:非线性回归模型
解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换元将陌生的非线性回归方程化归转化为我们熟悉的线性回归方程.
求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,还原后即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.
1.建立非线性回归模型的基本步骤:
(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);
(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二次函数、指数函数、对数函数、幂函数模型等);
(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;
(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;
(6)消去新元,得到非线性回归方程;
(7)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等.
知识点12:独立性检验
1.分类变量和列联表
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2×2列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
总计
总计
从列表中,依据与的值可直观得出结论:两个变量是否有关系.
2.等高条形图
(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图表示列联表数据的频率特征.
(2)观察等高条形图发现与相差很大,就判断两个分类变量之间有关系.
3.独立性检验
(1)定义:利用独立性假设、随机变量来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
(2)公式:,其中为样本容量.
(3)独立性检验的具体步骤如下:
①计算随机变量的观测值,查下表确定临界值:
0.5
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
②如果,就推断“与有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“与有关系”.
题型一:条件概率 7
题型二:全概率公式 8
题型三:贝叶斯公式 9
题型四:离散型随机变量的均值与方差 10
题型五:独立事件的乘法公式 12
题型六:二项分布及其应用 14
题型七:超几何分布 15
题型八:正态分布 18
题型九:线性回归方程 20
题型十:非线性回归方程 22
题型十一:独立性检验 24
【题型一:条件概率】
一、单选题
1.(23-24高二下·天津滨海新·期末)中国空间站的主体结构包括天和核心舱、问天实验舱和梦天实验舱.假设中国空间站要安排甲,乙,丙,丁,戊,己6名航天员开展实验,设事件A=“有4名航天员在天和核心舱”,事件B=“甲乙二人在天和核心舱”,则( )
A. B. C. D.
2.(23-24高二下·上海·期末)将一枚硬币连续抛掷三次,每次得到正面或反面的概率均为 ,且三次抛掷的结果互相独立. 记事件为 “至少两次结果为正面”,事件为 “第三次结果为正面”,则 ( )
A. B. C. D.
3.(23-24高二下·河南商丘·期中)已知事件,,若,且,,则下列结论正确的是( )
A. B.
C. D.
4.(2024·山西太原·二模)某校高二年级学生中有60%的学生喜欢打篮球,40%的学生喜欢打排球,80%的学生喜欢打篮球或排球.在该校高二年级的学生中随机调查一名学生,若该学生喜欢打篮球,则他也喜欢打排球的概率为( )
A. B. C. D.
5.(23-24高二下·安徽马鞍山·期末)假设A,B是两个事件,且,,则下列结论一定正确的是( )
A. B.
C. D.
6.(23-24高二下·重庆九龙坡·期中)在某次流感疫情爆发期间,A,B,C三个地区均爆发了流感,经调查统计A,B,C地区分别有的人患过流感,且A,B,C三个地区的人数的比为.现从这三个地区中随机选取一人,则此人患过流感的概率为( )
A. B. C. D.
【题型二:全概率公式】
一、单选题
1.(23-24高二下·湖北·期末)随着我国铁路的发展,列车的正点率有了显著的提高.据统计,途经某车站的只有和谐号和复兴号列车,且和谐号列车的列次为复兴号列车的列次的3倍,和谐号列车的正点率为0.98,复兴号列车的正点率为0.99,则一列车能正点到达该车站的概率为( )
A.0.9825 B.0.9833 C.0.9867 D.0.9875
2.(23-24高二下·江西南昌·阶段练习)已知某羽毛球小组共有20名运动员,其中一级运动员4人,二级运动员6人,三级运动员10人.现在举行一场羽毛球选拔赛,若一级、二级、三级运动员能够晋级的概率分别为0.9,0.6,0.2,则这20名运动员中任选一名运动员能够晋级的概率为( )
A.0.42 B.0.46 C.0.58 D.0.62
3.(24-25高二上·四川眉山·阶段练习)在5张彩票中有2张有奖,甲、乙两人先后从中各任取一张,则乙中奖的概率为( )
A. B. C. D.
4.(24-25高二下·全国·课后作业)某医院针对某种疾病研制了新的特效药,可有效减轻症状,缩短病程.现将该药品投入临床试验,若不使用新药,病人3天可痊愈的概率为0.3,若使用新药,则3天痊愈的概率为0.9,假设临床病人有0.7的概率选择新药,若某病人3天痊愈,则该病人未使用新药的概率为( )
A.0.3 B.0.21 C.0.125 D.0.09
5.(24-25高二下·全国·课后作业)无人酒店是利用人工智能与物联网技术,为客人提供自助入住等服务的新型酒店,胜在科技感与新奇感.去某地旅游的游客有无人酒店和常规酒店两种选择,某游客去该地旅游,第一天随机选择一种酒店入住,如果第一天入住无人酒店,那么第二天还入住无人酒店的概率为0.8,如果第一天入住常规酒店,那么第二天入住无人酒店的概率为0.6,则该游客第二天入住无人酒店的概率为( )
A.0.8 B.0.7 C.0.6 D.0.5
【题型三:贝叶斯公式】
一、单选题
1.(23-24高三上·云南曲靖·阶段练习)根据曲靖一中食堂人脸识别支付系统后台数据分析发现,高三年级小孔同学一周只去食堂一楼和二楼吃饭.周一去食堂一楼和二楼的概率分别为和,若他周一去了食堂一楼,那么周二去食堂二楼的概率为,若他周一去了食堂二楼,那么周二去食堂一楼的概率为,现已知小孔同学周二去了食堂二楼,则周一去食堂一楼的概率为( ).
A. B. C. D.
2.(23-24高二下·广东广州·期末)有3台车床加工同一型号的零件,第1台加工的次品率为 ,第2,3台加工的次品率均为 ,加工出来的零件混放在一起. 已知第1,2,3台车床加工的零件数分别占总数的. 如果取到的零件是次品,则它是第3台车床加工的概率是( )
A. B. C. D.
3.(23-24高二下·福建龙岩·阶段练习)某人下午5:00下班,他所积累的资料表明:
到家时间
5:35到5:39
5:40到5:44
5:45到5:49
5:50到5:54
迟于5:54
乘地铁到家的概率
0.10
0.25
0.45
0.15
0.05
乘汽车到家的概率
0.30
0.35
0.20
0.10
0.05
某日他抛一枚硬币决定乘地铁还是乘汽车回家,结果他是5:47到家的,则他乘地铁回家的概率为( )
A. B. C. D.
4.(23-24高二下·广东广州·期中)某校高三(1)班和(2)班各有40名同学,其中参加数学兴趣社团的学生分别有10人和8人,现从这两个班中随机抽取一名同学,若抽到的是参加数学兴趣社团的学生,则他来自高三(1)班的概率是( )
A. B. C. D.
5.(23-24高二下·福建厦门·期中)现有编号为1,2,3的三个口袋,其中1号口袋内装有两个1号球,一个2号球和一个3号球;2号口袋内装有两个1号球,一个3号球;3号口袋内装有三个1号球,两个2号球;第一次先从1号口袋内随机抽取1个球,将取出的球放入与球同编号的口袋中,第二次从该口袋中任取一个球,下列说法不正确的是( )
A.在第一次抽到3号球的条件下,第二次抽到1号球的概率是
B.第二次取到1号球的概率
C.如果第二次取到1号球,则它来自1号口袋的概率最大
D.如果将5个不同小球放入这3个口袋内,每个口袋至少放1个,则不同的分配方法有150种
【题型四:离散型随机变量的均值与方差】
一、单选题
1.(23-24高二下·新疆·期中)已知X服从两点分布,若,则( )
A. B. C. D.
2.(23-24高二下·江苏南通·期中)已知,若,则( )
A. B.4 C. D.9
3.(23-24高二下·湖北武汉·期末)2024年“与辉同行”直播间开播,董宇辉领衔7位主播从“心”出发,其中男性5人,女性3人,现需排班晚8:00黄金档,随机抽取两人,则女生人数的期望为( )
A. B. C. D.
4.(23-24高二下·江苏南京·阶段练习)已知离散型随机变量X的概率分布如表,离散型随机变量Y满足,则( )
X
0
1
2
3
P
a
5a
A. B. C. D.
5.(23-24高二下·江苏连云港·期中)已知X的分布列为
0
1
且,,则的值为( )
A.1 B. C. D.
6.(23-24高二下·全国·期末)离散型随机变量X的分布列中部分数据丢失,丢失数据以x,代替,分布列如下:则 ( )
1
2
3
4
5
6
0.21
0.20
0.10
0.10
A.0.35 B.0.45 C.0.55 D.0.65
7.(23-24高二下·甘肃·期末)随机变量的概率分布列为,其中是常数,则的值为( )
A.5 B.6 C.7 D.35
8.(24-25高二下·全国·课后作业)已知两个盒子中分别装有形状、大小、质量均相同的小球.其中,盒中有3个红球,1个白球;盒中有1个红球,3个白球,现从两个盒子中同时各取走一个小球,一共取三次,此时记盒中的红球个数为盒中的红球个数为,则( )
A. B.
C. D.
【题型五:独立事件的乘法公式】
一、单选题
1.(24-25高二上·吉林·阶段练习)某乒乓球队在长春训练基地进行封闭式集训,甲、乙两位队员进行对抗赛,每局依次轮流发球,连续赢2个球者获胜,通过分析甲、乙过去对抗赛的数据知,甲发球甲赢的概率为,乙发球甲赢的概率为,不同球的结果互不影响,已知某局甲先发球.则该局打4个球甲赢的概率为( )
A. B. C. D.
2.(24-25高二上·湖北鄂州·期中)“五道方”是一种民间棋类游戏,甲,乙两人进行“五道方”比赛,约定连胜两场者赢得比赛.若每场比赛,甲胜的概率为,乙胜的概率为,则比赛6场后甲赢得比赛的概率为( )
A. B. C. D.
3.(24-25高二上·吉林长春·期中)2024年斯诺克武汉公开赛前夕,肖国栋与斯佳辉两人进行了热身赛,约定每局胜者得1分,负者得0分,热身进行到有一人比对方多2分或打满6局时停止,设肖国栋在每局中获胜的概率为,斯佳辉在每局中获胜的概率为,且各局胜负相互独立,比赛停止时已打局数为,则( )
A. B. C. D.
4.(24-25高二上·山东淄博·阶段练习)对于一个古典概型的样本空间和事件,若,,,则下列结论错误的是( )
A.事件A与事件互斥 B.
C.事件与事件相互独立 D.
5.(24-25高二上·内蒙古赤峰·期中)金秋十月,某校举行运动会,甲、乙两名同学均从跳高、跳远、100米跑和200米跑这四个项目中选择两个项目参加.设事件 “甲、乙两人所选项目恰有一个相同”,事件 “甲、乙两人所选项目完全不同”,事件 “甲、乙两人所选项目完全相同”,事件 “甲、乙两人均未选择100米跑项目”,则( )
A.A与C是对立事件 B.C与D相互独立
C.A与D相互独立 D.B与D不互斥
二、解答题
6.(23-24高二下·江苏南通·期中)为普及安全知识,某单位举办了一场安全知识竞赛,经过初赛、复赛,有甲、乙两个代表队(每队三人)进入决赛,决赛规则如下:共进行三轮比赛,每轮比赛中每人各答一题,每答对一题得 10 分,答错不得分. 假设甲队每人答题正确的概率均为,乙队三人答题正确的概率分别.
(1)若决赛中三轮总得分大于70分就能获得特别奖,求乙队获得特别奖的概率;
(2)因两队在决赛中得分相同,现进行附加赛. 规则如下:甲,乙两队抽签决定谁先答题,每队每人各答题一次为一轮,有两人及以上答对就算成功答题,并继续下一轮答题,否则换另一队答题,连续两轮成功答题的队伍获胜,比赛结束. 求附加赛中甲队恰好在第5轮结束时获胜的概率.
7.(2024·全国·模拟预测)设某电子元件制造厂有甲、乙、丙、丁4条生产线,现有40个该厂生产的电子元件,其中由甲、乙、丙、丁生产线生产的电子元件分别为5个、10个、10个、15个,且甲、乙、丙、丁生产线生产该电子元件的次品率依次为.
(1)若将这40个电子元件按生产线生产的分成4箱,现从中任取1箱,再从中任取1个电子元件,求取到的电子元件是次品的概率.
(2)若将这40个电子元件装入同一个箱子中,再从这40个电子元件中任取1个电子元件,取到的电子元件是次品,求该电子元件是乙生产线生产的概率.
8.(24-25高二上·四川成都·期中)中国乒乓球队是中国体育军团的王牌之师,屡次在国际大赛上争金夺银,被体育迷们习惯地称为“梦之队”.2024年巴黎奥运会,中国乒乓球队包揽全部五枚金牌.其中团体赛由四场单打和一场双打比赛组成,采用五场三胜制.每个队由三名运动员组成,当一个队赢得三场比赛时,比赛结束.2024年8月10日,中国队对战瑞典队,最终以取得团体赛冠军,赛前某乒乓球爱好者对赛事情况进行分析,根据以往战绩,中国队在每场比赛中获胜的概率均为.
(1)求中国队以的比分获胜的概率;
(2)求中国队在已输一场的情况下获胜的概率;
(3)求至多进行四场比赛的概率.
【题型六:二项分布及其应用】
一、单选题
1.(23-24高二下·天津西青·期末)某人每次射击击中目标的概率均为,此人连续射击三次,至少有两次击中目标的概率为( )
A. B. C. D.
2.(23-24高二下·江苏淮安·期末)已知随机变量,若,则( )
A. B.或 C. D.或
二、填空题
3.(23-24高二下·江苏南通·期末)设随机变量,且,则 ;若,则的方差为 .
三、解答题
4.(23-24高二下·安徽合肥·期中)某大学为丰富学生课余生活,举办趣味知识竞赛,分为“个人赛”和“对抗赛”,竞赛规则如下:
①个人赛规则:每位学生需要从“历史类、数学类、生活类”问题中随机选1道试题作答,其中“历史类”有8道,“数学类”有6道,“生活类”有4道,若答对将获得一份奖品.
②对抗赛规则:两位学生进行答题比赛,每轮只有1道题目,比赛时两位参赛者同时回答这一个问题,若一人答对且另一人答错,则答对者获得1分,答错者得分;若两人都答对或都答错,则两人均得0分,对抗赛共设3轮,每轮获得1分的学生会获得一份奖品,且两位参赛者答对与否互不影响,每次答题的结果也互不影响.
(1)学生甲参加个人赛,若学生甲答对“历史类”“数学类”“生活类”的概率分别为,,,求学生甲答对所选试题的概率;
(2)学生乙和学生丙参加对抗赛,若每道题学生乙和学生丙答对的概率分别为,,求三轮结束学生乙仅获得一份奖品的概率.
5.(24-25高二下·全国·课后作业)随着生活水平的提高,家用小轿车进入千家万户,在给出行带来方便的同时也给交通造成拥堵.交通部门为了解决某十字路口的拥堵问题,安装了红绿灯.通过测试后发现,私家车在此路口遇到红灯的概率为.
(1)若遇到红灯的概率为,求不同时刻的5辆私家车在该路口有3辆车遇到红灯的概率;
(2)当私家车遇到红灯的方差达到最大时,求5辆私家车遇到红灯的车辆数的分布列与期望.
6.(23-24高二下·天津·阶段练习)我国是全球制造业大国,制造业增加值自2010年起连续12年位居世界第一,主要产品产量稳居世界前列.为深入推进传统制造业改造提升,全面提高传统制造业核心竞争力,某设备生产企业对现有生产设备进行技术攻坚突破.设备生产的零件的直径为X(单位:nm).
(1)现有旧设备生产的零件共7个,其中直径大于10nm的有4个.现从这7个零件中随机抽取3个.记ξ表示取出的零件中直径大于10nm的零件的个数,求ξ的分布列及数学期望.
(2)技术攻坚突破后设备生产的零件的合格率为,每个零件是否合格相互独立.现任取6个零件进行检测,若合格的零件数η超过半数,则可认为技术攻坚成功.求技术攻坚成功的概率及η的方差;
【题型七:超几何分布】
一、单选题
1.(23-24高二下·江苏扬州·阶段练习)已知甲参加青年志愿者的选拔,选拔以现场答题的方式进行.已知在备选的10道试题中,甲能答对其中的6道题,规定每次考试都从备选题中随机抽出3道题进行测试,设甲答对的试题数为X,则的概率为( )
A. B. C. D.
2.(23-24高二下·浙江宁波·期末)袋子中有n个大小质地完全相同的球,其中4个为红球,其余均为黄球,从中不放回地依次随机摸出2个球,已知摸出的2个球都是红球的概率为,则两次摸到的球颜色不相同的概率为( )
A. B. C. D.
二、解答题
3.(23-24高二下·北京怀柔·期末)某学校对食堂饭菜质量进行满意度调查,随机抽取了200名学生进行调查,获取数据如下:
满意度性别
满意
不满意
弃权
男生
80
30
10
女生
50
20
10
(1)用频率估计概率,该校学生对食堂饭菜质量满意的概率;
(2)用分层抽样的方法从上表中不满意的50人中抽取5人征求整改建议,再从这5个人中随机抽取2人参与食堂的整改监督,则抽取的2人中女生的人数X,求X的分布列和期望.
4.(24-25高二下·全国·课后作业)某试验机床生产了12个电子元件,其中8个合格品,4个次品.从中随机抽出4个电子元件作为样本,用X表示样本中合格品的个数.
(1)若有放回的抽取,求X的分布列;
(2)若不放回的抽取,求样本中合格品的比例与总体中合格品的比例之差的绝对值不超过的概率.
5.(23-24高二下·上海松江·期末)某超市为促进消费推出优惠活动,为预估活动期间客户投入的消费金额,采用随机抽样统计了200名客户的消费金额,分组如下:(单位:元),得到如图所示频率分布直方图:
活跃客户
非活跃客户
总计
男
20
女
60
总计
(1)若把消费金额不低于800元的客户,称为“活跃客户”,经数据处理,现在列联表中得到一定的相关数据,求列联表中的值,并根据列联表判断是否有的把握认为“活跃客户”与性别有关?
(2)为感谢客户,该超市推出免单福利,方案如下:从“活跃客户”中按分层抽样的方法抽取12人,从中抽取2人进行免单,试写出免单总单金额的分布列及其期望.(每一组消费金额按该组中点值估计,期望结果保留至整数)
附:
0.150
0.100
0.050
0.010
0.005
k
2.072
2.706
3.841
6.635
7.879
6.(24-25高二下·全国·课后作业)4月23日是联合国教科文组织确定的“世界读书日”.为了解某地区高一学生阅读时间的分配情况,从该地区随机抽取500名高一学生进行在线调查,得到了这500名学生的日平均阅读时间(单位:h),并将样本数据分成九组,绘制成如图所示的频率分布直方图.
(1)从这500名学生中随机抽取一人,求日平均阅读时间在内的概率;
(2)为进一步了解这500名学生数字媒体阅读时间和纸质图书阅读时间的分配情况,从日平均阅读时间在三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人,记日平均阅读时间在内的学生人数为X,求X的分布列;
(3)以样本的频率估计概率,从该地区所有高一学生中随机抽取10名学生,用表示这10名学生中恰有k名学生日平均阅读时间在内的概率,其中.当最大时,写出k的值.(只需写出结论)
【题型八:正态分布】
一、单选题
1.(24-25高二上·黑龙江哈尔滨·期中)某市高中数学统考中,甲、乙、丙三所学校的数学成绩分别服从正态分布,,,其正态分布的密度曲线如图所示,则( )
A. B.
C. D.
2.(24-25高二上·黑龙江哈尔滨·阶段练习)已知随机变量服从正态分布,则( )
A.0.1 B.0.2 C.0.3 D.0.4
3.(23-24高二下·陕西西安·期末)某市高中数学统考,假设考试成绩服从正态分布.如果按照,,,的比例将考试成绩从高到低分为四个等级.若某同学考试成绩的等级为,则该同学的考试成绩可能为( )(参考数据:)
A.120 B.90 C.80 D.60
二、解答题
4.(23-24高二下·山西长治·期中)某种香梨的重量(单位:)服从正态分布,将该种香梨按照其重量及对应的售价进行分拣,分为4类依次记为.已知,售价最高,为10元;,售价为8元;,售价为6元;其余的为,售价为5元.
(1)任选1个香梨,求其重量大于的概率;
(2)以表示香梨的售价(单位:元),写出的分布列,并估计该种香梨售价的平均值.
附:若,则,,.
5.(24-25高二下·全国·课后作业)某企业的产品正常生产时,产品尺寸(单位:)服从正态分布,从当前生产线上随机抽取400件产品进行检测,产品尺寸汇总如表
产品尺寸/
件数
8
54
54
160
72
40
12
根据产品质量标准和生产线的实际情况,产品尺寸在以外视为小概率事件,一旦小概率事件发生视为生产线出现异常,产品尺寸在以内为正品,以外为次品.
(1)判断生产线是否正常工作,并说明理由;
(2)用频率表示概率,若再随机从生产线上取3件产品复检,正品检测费为20元/件,次品检测费为30元/件,记这3件产品检测费为随机变量X,求X的均值及方差.
附:.
6.(23-24高二下·浙江·期中)某校高三年级有750人,某次考试不同成绩段的人数,且所有得分都是整数.
(1)求该校高三年级本次考试的平均成绩及标准差;
(2)计算本次考试得分超过141的人数;(精确到整数)
(3)本次考试中有一类多项选择题,每道题的四个选项中有两个或三个选项正确,全部选对得6分,部分选对得部分分(正确答案有三个选项的,则每个选项2分;正确答案是2个选项的,则每个选项为3分),有选择错误的得0分.小明同学在做多项选择题时,选择一个选项的概率为,选择两个选项的概率为,选择三个选项的概率为.已知某个多项选择题有三个选项是正确的,小明在完全不知道四个选项正误的情况下,只好根据自己的经验随机选择,记小明做这道多项选择题所得的分数为,求的分布列及数学期望.
参考数据:若,则;;.
【题型九:线性回归方程】
一、单选题
1.(24-25高二上·黑龙江哈尔滨·期中)下列命题是真命题的是( )
A.经验回归方程至少经过其样本数据点,,…,中的一个
B.可以用相关系数r来刻画两个变量x和y线性相关程度的强弱,r的绝对值越小,说明两个变量线性相关程度越强
C.线性回归分析中决定系数用来刻画回归的效果,若值越小,则模型的拟合效果越好
D.残差点分布在以横轴为对称轴的水平带状区域内,该区域越窄,拟合效果越好
2.(24-25高二上·河南南阳·阶段练习)某产品的广告费用与销售额的统计数据如下表:
广告费用/万元
4
2
3
5
销售额/万元
49
26
39
54
根据上表可得线性回归方程 中的为9.4,据此模型预测广告费用为6万元时销售额为( )
A.9.1万元 B.9.2万元
C.67.7万元 D.65.5万元
3.(24-25高二下·全国·课后作业)已知由样本数据组成的一个样本,得到经验回归方程为,且,增加两个样本点和后,得到新样本的经验回归方程为.在新的经验回归方程下,样本的残差为( )
A. B. C. D.
4.(23-24高二下·广东珠海·阶段练习)一唱片公司欲知唱片费用(十万元)与唱片销售量(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,则与的相关系数的绝对值为( )(相关系数:)
A.0.6 B.0.5 C.0.4 D.0.3
二、解答题
5.(23-24高二下·黑龙江双鸭山·开学考试)如图是某机构统计的某地区2016年至2022年生活垃圾无害化处理量y(单位:万吨)的折线图.
注:年份代码1-7分别对应年份2016-2022.
求y关于t的回归直线方程(系数精确到0.01),并预测2024年该地区生活垃圾无害化处理量.
参考数据:,,,
参考公式:回归方程中斜率和截距的最小乘估计公式分别为,.
6.(23-24高二下·河北沧州·期中)2023年全国竞走大奖赛(第1站)暨世锦赛及亚运会选拔赛3月4日在安徽黄山开赛.重庆队的贺相红以2小时22分55秒的成绩打破男子35公里竞走亚洲纪录.某田径协会组织开展竞走的步长和步频之间的关系的课题研究,得到相应的试验数据:
步频(单位:)
0.28
0.29
0.30
0.31
0.32
步长(单位:)
90
95
99
103
117
(1)根据表中数据,得到步频和步长近似为线性相关关系,求出关于的回归直线方程,并利用回归方程预测,当步长为时,步频约是多少?
(2)记,其中为观测值,为预测值,为对应的残差,求(1)中步长的残差的和,并探究这个结果是否对任意具有线性相关关系的两个变量都成立?若成立,请证明;若不成立,请说明理由.
参考数据:,.
参考公式:,.
7.(24-25高三上·山东济宁·阶段练习)某学校对高三(1)班50名学生的第一次模拟考试的数学成绩和化学成绩统计得到数据如下:数学成绩的方差为,化学成绩的方差为,,其中(,且)分别表示这50名学生的数学成绩和化学成绩,关于的线性回归方程为.
(1)求与的样本相关系数;
(2)从概率统计规律来看,本次考试高三(1)班学生数学成绩服从正态分布,用样本平均数作为的估计值,用样本方差作为的估计值,试估计该校共1600名高三学生中,数学成绩位于区间的人数.
附:①回归方程中,;
②样本相关系数;③;
④若,则.
【题型十:非线性回归方程】
一、解答题
1.(23-24高二下·宁夏石嘴山·期中)红铃虫(Pectinophora gossypiella)是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数(个)和温度()的8组观测数据,制成图1所示的散点图.现用两种模型①,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:
25
2.9
646
168
422688
50.4
70308
表中;;;
(1)根据残差图,比较模型①、②的拟合效果,哪种模型比较合适?
(2)根据(1)中所选择的模型,求出关于的回归方程.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,,
2.(23-24高二下·河北石家庄·阶段练习)网络直播带货助力乡村振兴,它作为一种新颖的销售土特产的方式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数x(其中10场为一个周期)与产品销售额y(千元)的数据统计如下:
直播周期数x
1
2
3
4
5
产品销售额y(千元)
3
7
15
30
40
根据数据特点,甲认为样本点分布在指数型曲线的周围,据此他对数据进行了一些初步处理.如下表:
3.7
55
382
65
978
101
其中
(1)请根据表中数据,建立y关于x的回归方程;
(2)乙认为样本点分布在直线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲、乙两人所建立的模型,谁的拟合效果更好?(精确到0.01)
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,相关指数:.
3.(23-24高二下·湖北·期末)某乡村企业希望通过技术革新增加产品收益,根据市场调研,技术革新投入经费(单位:万元)和增加收益(单位:万元)的数据如下表:
4
6
8
10
12
27
42
55
56
60
为了进一步了解技术革新投入经费对增加收益的影响,通过对表中数据进行分析,分别提出了两个回归模型:①,②.
(1)根据以上数据,计算模型①中与的相关系数(结果精确到0.01);
(2)若,则选择模型①;否则选择模型②.根据(1)的结果,试建立增加收益关于技术革新投入经费的回归模型,并预测时的值(结果精确到0.01).
附:i)回归直线的斜率、截距的最小二乘估计以及相关系数分别为:,,
ii)参考数据:设,,,,,.
【题型十一:独立性检验】
一、解答题
1.(2025高三·全国·专题练习) 2022年北京冬奥组委发布的《北京2022年冬奥会和冬残奥会经济遗产报告(2022)》显示,北京冬奥会已签约45家赞助企业,冬奥会赞助成为一项跨度时间较长的营销方式.为了解该45家赞助企业每天销售额与每天线上销售时间之间的相关关系,某平台对45家赞助企业进行跟踪调查,其中每天线上销售时间不少于8小时的企业有20家,余下的企业中,每天的销售额不足30万元的企业占,统计后得到如下列联表:
销售额不少于30万元
销售额不足30万元
合计
线上销售时间不少于8小时
17
20
线上销售时间不足8小时
合计
45
请完成上面的列联表,并依据的独立性检验,能否认为赞助企业每天的销售额与每天线上销售时间有关?
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参考公式:,其中.
2.(2024高三·全国·专题练习)中国大学先修课程,是在高中开设的具有大学水平的课程,旨在让学有余力的高中生早接受大学思维方式、学习方法的训练,为大学学习乃至未来的职业生涯做好准备.某高中开设大学先修课程已有两年,两年共招收学生2000人,其中有300人参与学习先修课程,两年全校共有优等生200人,学习先修课程的优等生有60人.这两年学习先修课程的学生都参加了考试,并且都参加了某高校的自主招生考试,结果如下表所示:
分数
人数
20
55
105
70
50
参加自主招生获得通过的概率
0.9
0.8
0.6
0.5
0.4
填写列联表,并画出列联表的等高条形图,并通过图形判断学习先修课程与优等生是否有关系,根据列联表的独立性检验,能否在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系?
优等生
非优等生
总计
学习大学先修课程
没有学习大学先修课程
总计
参考数据:
0.15
0.10
0.05
0.025
0.010
0.005
2.072
2.706
3.841
5.024
6.635
7.879
参考公式:,其中.
3.(2024高三·全国·专题练习)微生物生态学的研究表明,水生生物中存在大量的有益微生物,这些有益水生微生物对于维持水质平衡具有非常重要的作用.研究人员为了研究某种有益水生微生物在特定营养物质浓度下的增长速率与水体类型(淡水或咸水)的关系,对100个水体环境样本中的有益水生微生物在一段时间内的数量进行了观察,经统计得到如下的列联表:
水体环境类型
增长情况
合计
快速增长
未快速增长
淡水环境
25
咸水环境
10
合计
100
已知从这100个水体环境样本中随机抽取1个,该水体环境中的有益水生微生物属于“快速增长”的概率为.
(1)求;
(2)根据小概率值的独立性检验,判断该有益水生微生物“快速增长”与水体环境类型是否有关?根据小概率值的独立性检验,判断该有益水生微生物“快速增长”与水体环境类型是否有关?
附:,
0.01
0.005
0.001
6.635
7.879
10.828
4.(23-24高三下·湖南长沙·期中)新型冠状病毒疫情已经严重影响了我们正常的学习、工作和生活.某市为了遏制病毒的传播,利用各种宣传工具向市民宣传防治病毒传播的科学知识.某校为了解学生对新型冠状病毒的防护认识,对该校学生开展防疫知识有奖竞赛活动,并从女生和男生中各随机抽取30人,统计答题成绩分别制成如下频数分布表和频率分布直方图.规定:成绩在80分及以上的同学成为“防疫标兵”.
名女生成绩频数分布表:
成绩
频数
10
10
6
4
附:
0.100
0.050
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
(1)根据以上数据,完成以下列联表,并判断是否有%的把握认为“防疫标兵”与性别有关;
男生
女生
合计
防疫标兵
非防疫标兵
合计
(2)以样本估计总体,以频率估计概率,现从该校女生中随机抽取人,其中“防疫标兵”的人数为,求随机变量的分布列与数学期望.
5.(24-25高三上·湖南·期中)电动车的安全问题越来越引起广大消费者的关注,目前电动车的电池有石墨烯电池与铅酸电池两种.某公司为了了解消费者对两种电池的电动车的偏好,在社会上随机调查了500名市民,其中被调查的女性市民中偏好铅酸电池电动车的占,得到以下的2-2列联表:
偏好石墨烯电池电动车
偏好铅酸电池电动车
合计
男性市民
200
100
女性市民
合计
500
(1)根据以上数据,完成2×2列联表,依据小概率的独立性检验,能否认为市民对这两种电池的电动车的偏好与性别有关;
(2)采用分层抽样的方法从偏好石墨烯电池电动车的市民中随机抽取7人,再从这7名市民中抽取2人进行座谈,求在有女性市民参加座谈的条件下,恰有一名女性市民参加座谈的概率;
(3)用频率估计概率,在所有参加调查的市民中按男性和女性进行分层抽样,随机抽取5名市民,再从这5名市民中随机抽取2人进行座谈,记2名参加座谈的市民中来自偏好石墨烯电池电动车的男性市民的人数为X,求X的分布列和数学期望.
参考公式:,其中.
参考数据:
0.100
0.050
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
原创精品资源学科网独家享有版权,侵权必究!学科网(北京)股份有限公司10
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$
专题06 概率与统计(12个考点清单+11类题型解读)
知识点01:条件概率
(1)一般地,设,为两个随机事件,且,我们称为在事件发生的条件下,事件发生的条件概率,简称条件概率.
知识点02:条件概率性质应用
(1)由条件概率的定义,对任意两个事件与,若,则.我们称上式为概率的乘法公式.
(2)如果和是两个互斥事件,则;
知识点03:全概率公式及其应用
一般地,设,,是一组两两互斥的事件,,且,,则对任意的事件,有,我们称此公式为全概率公式.
知识点04:贝叶斯公式及其应用
(1)设,,是一组两两互斥的事件,,且,,
则对任意的事件,,有,.
知识点05:离散型随机变量分布列均值,方差
(1)
(2)
知识点06:均值和方差的性质
①若与都是随机变量,且,则由与之间分布列的关系可知.
②若与相互独立,则.
③若与都是随机变量,且,则由与之间分布列的关系可知.
知识点07:二项分布
1.定义
一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,不发生的概率,那么事件恰好发生次的概率是(,,,…,)
于是得到的分布列
…
…
…
…
由于表中第二行恰好是二项式展开式
各对应项的值,称这样的离散型随机变量服从参数为,的二项分布,记作,并称为成功概率.
注意:由二项分布的定义可以发现,两点分布是一种特殊的二项分布,即时的二项分布,所以二项分布可以看成是两点分布的一般形式.
2.二项分布的适用范围及本质
(1)适用范围:
①各次试验中的事件是相互独立的;
②每次试验只有两种结果:事件要么发生,要么不发生;
③随机变量是这次独立重复试验中事件发生的次数.
(2)本质:二项分布是放回抽样问题,在每次试验中某一事件发生的概率是相同的.
3.二项分布的期望、方差
若,则,.
知识点08:超几何分布
1.定义
在含有件次品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,,1,2,…,,其中,且,,,,,称分布列为超几何分布列.如果随机变量的分布列为超几何分布列,则称随机变量服从超几何分布.
0
1
…
…
2.超几何分布的适用范围件及本质
(1)适用范围:
①考察对象分两类;
②已知各类对象的个数;
③从中抽取若干个个体,考察某类个体个数的概率分布.
(2)本质:超几何分布是不放回抽样问题,在每次试验中某一事件发生的概率是不相同的.
知识点09:正态分布
一、正态曲线
1.定义:我们把函数,(其中是样本均值,是样本标准差)的图象称为正态分布密度曲线,简称正态曲线.正态曲线呈钟形,即中间高,两边低.
2.正态曲线的性质
(1)曲线位于轴上方,与轴不相交;
(2)曲线是单峰的,它关于直线对称;
(3)曲线在处达到峰值(最大值);
(4)曲线与轴之间的面积为1;
(5)当一定时,曲线的位置由确定,曲线随着的变化而沿轴平移,如图甲所示:
(6)当一定时,曲线的形状由确定.越小,曲线越“高瘦”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示::
甲 乙
二、正态分布
1.定义
随机变量落在区间的概率为,即由正态曲线,过点和点的两条轴的垂线,及轴所围成的平面图形的面积,如下图中阴影部分所示,就是落在区间的概率的近似值.
一般地,如果对于任何实数,,随机变量满足,则称随机变量服从正态分布.正态分布完全由参数,确定,因此正态分布常记作.如果随机变量服从正态分布,则记为.
其中,参数是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.
2.原则
若,则对于任意的实数,为下图中阴影部分的面积,对于固定的和而言,该面积随着的减小而变大.这说明越小,落在区间的概率越大,即集中在周围的概率越大
特别地,有;;.
由,知正态总体几乎总取值于区间之内.而在此区间以外取值的概率只有,通常认为这种情况在一次试验中几乎不可能发生,即为小概率事件.在实际应用中,通常认为服从于正态分布的随机变量只取之间的值,并简称之为原则.
知识点10:线性回归模型
1.线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为
其中,,,(,)称为样本点的中心.
2.残差分析
对于预报变量,通过观测得到的数据称为观测值,通过回归方程得到的称为预测值,观测值减去预测值等于残差,称为相应于点的残差,即有.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
(1)残差图
通过残差分析,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.
(2)通过残差平方和分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;反之,不合适.
(3)相关指数
用相关指数来刻画回归的效果,其计算公式是:.
越接近于,说明残差的平方和越小,也表示回归的效果越好.
题型六】线性回归模型
知识点11:非线性回归模型
解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换元将陌生的非线性回归方程化归转化为我们熟悉的线性回归方程.
求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,还原后即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.
1.建立非线性回归模型的基本步骤:
(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);
(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二次函数、指数函数、对数函数、幂函数模型等);
(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;
(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;
(6)消去新元,得到非线性回归方程;
(7)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等.
知识点12:独立性检验
1.分类变量和列联表
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2×2列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
总计
总计
从列表中,依据与的值可直观得出结论:两个变量是否有关系.
2.等高条形图
(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图表示列联表数据的频率特征.
(2)观察等高条形图发现与相差很大,就判断两个分类变量之间有关系.
3.独立性检验
(1)定义:利用独立性假设、随机变量来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
(2)公式:,其中为样本容量.
(3)独立性检验的具体步骤如下:
①计算随机变量的观测值,查下表确定临界值:
0.5
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
②如果,就推断“与有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“与有关系”.
题型一:条件概率 7
题型二:全概率公式 10
题型三:贝叶斯公式 13
题型四:离散型随机变量的均值与方差 16
题型五:独立事件的乘法公式 20
题型六:二项分布及其应用 27
题型七:超几何分布 31
题型八:正态分布 38
题型九:线性回归方程 43
题型十:非线性回归方程 48
题型十一:独立性检验 52
【题型一:条件概率】
一、单选题
1.(23-24高二下·天津滨海新·期末)中国空间站的主体结构包括天和核心舱、问天实验舱和梦天实验舱.假设中国空间站要安排甲,乙,丙,丁,戊,己6名航天员开展实验,设事件A=“有4名航天员在天和核心舱”,事件B=“甲乙二人在天和核心舱”,则( )
A. B. C. D.
【答案】B
【分析】由条件概率公式、古典概型概率公式求解即可.
【详解】由条件概率公式、古典概型概率公式可知,所求为.
故选:B.
2.(23-24高二下·上海·期末)将一枚硬币连续抛掷三次,每次得到正面或反面的概率均为 ,且三次抛掷的结果互相独立. 记事件为 “至少两次结果为正面”,事件为 “第三次结果为正面”,则 ( )
A. B. C. D.
【答案】C
【分析】由题意,先计算,再利用条件概率的公式,即可求得结论.
【详解】由题意,,,
则.
故选:C
3.(23-24高二下·河南商丘·期中)已知事件,,若,且,,则下列结论正确的是( )
A. B.
C. D.
【答案】C
【分析】根据条件概率公式计算,注意在时,.
【详解】因为,
所以,,
,
,,
,
故选:C.
4.(2024·山西太原·二模)某校高二年级学生中有60%的学生喜欢打篮球,40%的学生喜欢打排球,80%的学生喜欢打篮球或排球.在该校高二年级的学生中随机调查一名学生,若该学生喜欢打篮球,则他也喜欢打排球的概率为( )
A. B. C. D.
【答案】A
【分析】应用条件概率公式计算即可.
【详解】设在该校高二年级的学生中随机调查一名学生,若该学生喜欢打篮球为事件A,
在该校高二年级的学生中随机调查一名学生,则他也喜欢打排球为事件B,
,
.
故选:A.
5.(23-24高二下·安徽马鞍山·期末)假设A,B是两个事件,且,,则下列结论一定正确的是( )
A. B.
C. D.
【答案】A
【分析】根据概率的性质以及条件概率公式即可判断ABC;举例判断D.
【详解】对于A,由于,则,A正确;
对于B,由于,,而,不一定相等,故不一定成立,B错误;
对于C,当相互独立时,,而,则,C错误;
对于D,不妨举例抛掷一枚质地均匀的骰子,设A:向上点数为偶数,B:向上点数不小于4,
则,,则,D错误,
故选:A
6.(23-24高二下·重庆九龙坡·期中)在某次流感疫情爆发期间,A,B,C三个地区均爆发了流感,经调查统计A,B,C地区分别有的人患过流感,且A,B,C三个地区的人数的比为.现从这三个地区中随机选取一人,则此人患过流感的概率为( )
A. B. C. D.
【答案】A
【分析】记事件D:选取的这个人患了流感,记事件E:此人来自A地区,记事件F:此人来自B地区,记事件G:此人来自C地区,则,且彼此互斥,然后根据条件依次得到、、、、、的值,然后根据全概率公式公式求解即可.
【详解】记事件D:选取的这个人患了流感,记事件E:此人来自A地区,
记事件F:此人来自B地区,记事件G:此人来自C地区,
则,且彼此互斥,
由题意可得,,,
,,,
由全概率公式可得
.
故选:A.
【题型二:全概率公式】
一、单选题
1.(23-24高二下·湖北·期末)随着我国铁路的发展,列车的正点率有了显著的提高.据统计,途经某车站的只有和谐号和复兴号列车,且和谐号列车的列次为复兴号列车的列次的3倍,和谐号列车的正点率为0.98,复兴号列车的正点率为0.99,则一列车能正点到达该车站的概率为( )
A.0.9825 B.0.9833 C.0.9867 D.0.9875
【答案】A
【分析】利用全概率公式可得答案.
【详解】依题意,设到达该车站列车为和谐号列车的概率为,为复兴号列车的概率为,
则一列车能正点到达该车站的概率为.
故选:A.
2.(23-24高二下·江西南昌·阶段练习)已知某羽毛球小组共有20名运动员,其中一级运动员4人,二级运动员6人,三级运动员10人.现在举行一场羽毛球选拔赛,若一级、二级、三级运动员能够晋级的概率分别为0.9,0.6,0.2,则这20名运动员中任选一名运动员能够晋级的概率为( )
A.0.42 B.0.46 C.0.58 D.0.62
【答案】B
【分析】由全概率公式即可求解.
【详解】设事件B为“选出的运动员能晋级”,
为“选出的运动员是一级运动员”,
为“选出的运动员是二级运动员”,
为“选出的运动员是三级运动员”,
则,,,
又根据题意可得,,,
由全概率公式可得:
,
任选一名运动员能够晋级的概率为0.46.
故选:B.
3.(24-25高二上·四川眉山·阶段练习)在5张彩票中有2张有奖,甲、乙两人先后从中各任取一张,则乙中奖的概率为( )
A. B. C. D.
【答案】B
【分析】根据给定条件,利用全概率公式列式计算即得.
【详解】记甲中奖的事件为,乙中奖的事件为,
则,,,
所以
.
故选:B
4.(24-25高二下·全国·课后作业)某医院针对某种疾病研制了新的特效药,可有效减轻症状,缩短病程.现将该药品投入临床试验,若不使用新药,病人3天可痊愈的概率为0.3,若使用新药,则3天痊愈的概率为0.9,假设临床病人有0.7的概率选择新药,若某病人3天痊愈,则该病人未使用新药的概率为( )
A.0.3 B.0.21 C.0.125 D.0.09
【答案】C
【分析】根据给定条件,利用全概率公式及条件概率公式计算即得.
【详解】记事件使用新药,则不使用新药,病人3天病愈,
依题意,
,
所以.
故选:C
5.(24-25高二下·全国·课后作业)无人酒店是利用人工智能与物联网技术,为客人提供自助入住等服务的新型酒店,胜在科技感与新奇感.去某地旅游的游客有无人酒店和常规酒店两种选择,某游客去该地旅游,第一天随机选择一种酒店入住,如果第一天入住无人酒店,那么第二天还入住无人酒店的概率为0.8,如果第一天入住常规酒店,那么第二天入住无人酒店的概率为0.6,则该游客第二天入住无人酒店的概率为( )
A.0.8 B.0.7 C.0.6 D.0.5
【答案】B
【分析】由题意记事件第一天入住无人酒店,第二天入住无人酒店,第一天入住常规酒店,得到和,再由全概率公式求解即可;
【详解】记事件第一天入住无人酒店,第二天入住无人酒店,第一天入住常规酒店,
根据题意可知,,
则由全概率公式可得.
故选:B.
【题型三:贝叶斯公式】
一、单选题
1.(23-24高三上·云南曲靖·阶段练习)根据曲靖一中食堂人脸识别支付系统后台数据分析发现,高三年级小孔同学一周只去食堂一楼和二楼吃饭.周一去食堂一楼和二楼的概率分别为和,若他周一去了食堂一楼,那么周二去食堂二楼的概率为,若他周一去了食堂二楼,那么周二去食堂一楼的概率为,现已知小孔同学周二去了食堂二楼,则周一去食堂一楼的概率为( ).
A. B. C. D.
【答案】A
【分析】利用贝叶斯概率公式求解即可.
【详解】记小孔同学周一去食堂一楼为事件A,周二去食堂一楼为事件B,
则本题所求.
故选:A.
2.(23-24高二下·广东广州·期末)有3台车床加工同一型号的零件,第1台加工的次品率为 ,第2,3台加工的次品率均为 ,加工出来的零件混放在一起. 已知第1,2,3台车床加工的零件数分别占总数的. 如果取到的零件是次品,则它是第3台车床加工的概率是( )
A. B. C. D.
【答案】B
【分析】根据全概率公式找出,再由贝叶斯公式求解.
【详解】记取到“第1,2,3台车床加工的零件”分别为事件,
“取到次品”为事件,
故,
,
由全概率公式可得:,
由贝叶斯公式:,
故选:B.
3.(23-24高二下·福建龙岩·阶段练习)某人下午5:00下班,他所积累的资料表明:
到家时间
5:35到5:39
5:40到5:44
5:45到5:49
5:50到5:54
迟于5:54
乘地铁到家的概率
0.10
0.25
0.45
0.15
0.05
乘汽车到家的概率
0.30
0.35
0.20
0.10
0.05
某日他抛一枚硬币决定乘地铁还是乘汽车回家,结果他是5:47到家的,则他乘地铁回家的概率为( )
A. B. C. D.
【答案】C
【分析】应用全概率、贝叶斯公式求乘地铁回家的概率即可.
【详解】若表示乘地铁,表示乘汽车,则,
若表示5:45到5:49到家,则,
所以,
所以.
故选:C
4.(23-24高二下·广东广州·期中)某校高三(1)班和(2)班各有40名同学,其中参加数学兴趣社团的学生分别有10人和8人,现从这两个班中随机抽取一名同学,若抽到的是参加数学兴趣社团的学生,则他来自高三(1)班的概率是( )
A. B. C. D.
【答案】B
【分析】设事件后根据题干得到,,,,由全概率公式求得,由乘法公式得到,由条件概率公式得到.
【详解】设事件为“抽到的学生来自高三(1)班”,事件为“抽到的学生来自高三(2)班”,事件为“抽到的学生参加数学兴趣社团”,
则,,,,
由全概率公式得,
由乘法公式得,
由条件概率公式得,
故选:B.
5.(23-24高二下·福建厦门·期中)现有编号为1,2,3的三个口袋,其中1号口袋内装有两个1号球,一个2号球和一个3号球;2号口袋内装有两个1号球,一个3号球;3号口袋内装有三个1号球,两个2号球;第一次先从1号口袋内随机抽取1个球,将取出的球放入与球同编号的口袋中,第二次从该口袋中任取一个球,下列说法不正确的是( )
A.在第一次抽到3号球的条件下,第二次抽到1号球的概率是
B.第二次取到1号球的概率
C.如果第二次取到1号球,则它来自1号口袋的概率最大
D.如果将5个不同小球放入这3个口袋内,每个口袋至少放1个,则不同的分配方法有150种
【答案】B
【分析】对于A选项利用条件概率公式求解;对于B选项利用全概率公式求解,对于C选项利用贝叶斯公式求解,对于D选项,不同元素的分配问题,先分类再分配即可求解.
【详解】对于A选项,记事件分别表示第一次、第二次取到号球, ,
则第一次抽到号球的条件下,第二次抽到号球的概率,故A正确;
对于B选项,记事件分别表示第一次、第二次取到号球, ,
依题意 两两互斥, 其和为, 并且,
,
,
,
应用全概率公式, 有,
故B错误;
对于C选项,依题设知, 第二次的球取自口袋的编号与第一次取的球上的号数相同,
则,
,
,
故在第二次取到1号球的条件下, 它取自编号为的口袋的概率最大,故C正确;
对于D选项,先将5个不同的小球分成1,1,3或2,2,1三份,
再放入三个不同的口袋,
则不同的分配方法有,故D正确.
故选:B.
【题型四:离散型随机变量的均值与方差】
一、单选题
1.(23-24高二下·新疆·期中)已知X服从两点分布,若,则( )
A. B. C. D.
【答案】A
【分析】根据两点分布的特征计算即可.
【详解】由题意得,则.
故选:.
2.(23-24高二下·江苏南通·期中)已知,若,则( )
A. B.4 C. D.9
【答案】B
【分析】由题意,由期望的性质可知,求解即可.
【详解】由已知服从二项分布,,
.
故选:B.
3.(23-24高二下·湖北武汉·期末)2024年“与辉同行”直播间开播,董宇辉领衔7位主播从“心”出发,其中男性5人,女性3人,现需排班晚8:00黄金档,随机抽取两人,则女生人数的期望为( )
A. B. C. D.
【答案】C
【分析】设抽取的女生人数为,则可能取值为0,1,2,然后求出相应的概率,从而可求出期望.
【详解】设抽取的女生人数为,则可能取值为0,1,2,
,,
,
所以.
故选:C
4.(23-24高二下·江苏南京·阶段练习)已知离散型随机变量X的概率分布如表,离散型随机变量Y满足,则( )
X
0
1
2
3
P
a
5a
A. B. C. D.
【答案】A
【分析】由概率分布列的性质求出,然后得到离散型随机变量Y的概率分布列,求即可.
【详解】由题意可知:,
所以解得,所以离散型随机变量Y的概率分布列为:
Y
-1
1
3
5
P
所以.
故选:A.
5.(23-24高二下·江苏连云港·期中)已知X的分布列为
0
1
且,,则的值为( )
A.1 B. C. D.
【答案】D
【分析】先根据分布列的性质求的值,可求出,,进而可求.
【详解】由可得,
所以,,
所以.
故选:D
6.(23-24高二下·全国·期末)离散型随机变量X的分布列中部分数据丢失,丢失数据以x,代替,分布列如下:则 ( )
1
2
3
4
5
6
0.21
0.20
0.10
0.10
A.0.35 B.0.45 C.0.55 D.0.65
【答案】B
【分析】根据概率之和为1得到方程组,求出,得到答案.
【详解】由题意得,解得,
,解得,
故.
故选:B
7.(23-24高二下·甘肃·期末)随机变量的概率分布列为,其中是常数,则的值为( )
A.5 B.6 C.7 D.35
【答案】A
【分析】运用概率分布列的性质求出参数,结合方差公式和结论即可解题.
【详解】因为,所以,解得,
所以,
所以,
故.
故选:A.
8.(24-25高二下·全国·课后作业)已知两个盒子中分别装有形状、大小、质量均相同的小球.其中,盒中有3个红球,1个白球;盒中有1个红球,3个白球,现从两个盒子中同时各取走一个小球,一共取三次,此时记盒中的红球个数为盒中的红球个数为,则( )
A. B.
C. D.
【答案】A
【分析】得到与的所有可能取值及其对应概率后即可得其分布列,借助分布列即可得其期望与方差.
【详解】由已知,
,
,
则的分布列为:
0
1
可得,;
由已知,
,
,
则的分布列为:
0
1
可得,;
所以.
故选:A.
【题型五:独立事件的乘法公式】
一、单选题
1.(24-25高二上·吉林·阶段练习)某乒乓球队在长春训练基地进行封闭式集训,甲、乙两位队员进行对抗赛,每局依次轮流发球,连续赢2个球者获胜,通过分析甲、乙过去对抗赛的数据知,甲发球甲赢的概率为,乙发球甲赢的概率为,不同球的结果互不影响,已知某局甲先发球.则该局打4个球甲赢的概率为( )
A. B. C. D.
【答案】C
【分析】由于连胜两局者赢,则可写出四局的结果,计算即可.
【详解】由于连胜两局者赢,甲先发球可分为:
该局:第一个球甲赢、第二个球乙赢、第三个球甲赢、第四个球甲赢,
则概率为;
故选:C.
2.(24-25高二上·湖北鄂州·期中)“五道方”是一种民间棋类游戏,甲,乙两人进行“五道方”比赛,约定连胜两场者赢得比赛.若每场比赛,甲胜的概率为,乙胜的概率为,则比赛6场后甲赢得比赛的概率为( )
A. B. C. D.
【答案】C
【分析】利用独立事件的概率乘法公式求解.
【详解】因为约定连胜两场者赢得比赛,
所以比赛6场后甲赢得比赛的情况为:
第一场甲胜,第二场乙胜,第三场甲胜,第四场乙胜,第五场甲胜,第六场甲胜,
所以所求概率为.
故选:C.
3.(24-25高二上·吉林长春·期中)2024年斯诺克武汉公开赛前夕,肖国栋与斯佳辉两人进行了热身赛,约定每局胜者得1分,负者得0分,热身进行到有一人比对方多2分或打满6局时停止,设肖国栋在每局中获胜的概率为,斯佳辉在每局中获胜的概率为,且各局胜负相互独立,比赛停止时已打局数为,则( )
A. B. C. D.
【答案】D
【分析】依题意得到的可能取值,再根据独立事件乘法公式和加法概率公式求出对应的概率即可.
【详解】依题意知,的所有可能值为2,4,6, 设每两局比赛为一轮,可以得到该轮结束时比赛停止的概率为
如果该轮结束时比赛还将继续,那么肖国栋与斯佳辉在该轮中必是各得一分,
此时,该轮比赛结果对下轮比赛是否停止没有影响,
从而有
故选:D.
4.(24-25高二上·山东淄博·阶段练习)对于一个古典概型的样本空间和事件,若,,,则下列结论错误的是( )
A.事件A与事件互斥 B.
C.事件与事件相互独立 D.
【答案】A
【分析】根据已知条件计算,判断B选项,再根据判断C选项,通过计算D选项,通过判断A选项.
【详解】因为,,,
所以,又,则,所以,B正确;
因为,所以事件与事件相互独立,C正确;
所以,D正确;
因为,所以事件与事件不是互斥事件,A错误.
故选:A
5.(24-25高二上·内蒙古赤峰·期中)金秋十月,某校举行运动会,甲、乙两名同学均从跳高、跳远、100米跑和200米跑这四个项目中选择两个项目参加.设事件 “甲、乙两人所选项目恰有一个相同”,事件 “甲、乙两人所选项目完全不同”,事件 “甲、乙两人所选项目完全相同”,事件 “甲、乙两人均未选择100米跑项目”,则( )
A.A与C是对立事件 B.C与D相互独立
C.A与D相互独立 D.B与D不互斥
【答案】C
【分析】列举出甲、乙两名同学选择两个项目参加的所有情况,计算每个事件的概率,可得选项A错误;由相互独立的定义可知选项B错误,选项C正确;由互斥事件的概念可知选项D错误.
【详解】设跳高、跳远、100米跑和200米跑分别为1,2,3,4,则甲、乙两名同学均从跳高、跳远、100米跑和200米跑中选择两个项目参加的情况有:
(1212),(1312),(1412),(2312),(2412),(3412),(1213),
(1313),(1413),(2313),(2413),(3413),(1214),(1314),(1414),(2314),
(2414),(3414),(1223),(1323),(1423),(2323),(2423),(3423),(1224),
(1324),(1424),(2324),(2424),(3424),(1234),(1334),(1434),(2334),(2434),(3434),共36种,
其中A有24种情况,B有6种情况,C有6种情况,D有9种情况,则,,,.
由可得A与C不是对立事件,选项A错误.
,C与D不相互独立,选项B错误.
,A与D相互独立,选项C正确.
由B与D不可能同时发生可知B与D互斥,选项D错误.
故选:C.
二、解答题
6.(23-24高二下·江苏南通·期中)为普及安全知识,某单位举办了一场安全知识竞赛,经过初赛、复赛,有甲、乙两个代表队(每队三人)进入决赛,决赛规则如下:共进行三轮比赛,每轮比赛中每人各答一题,每答对一题得 10 分,答错不得分. 假设甲队每人答题正确的概率均为,乙队三人答题正确的概率分别.
(1)若决赛中三轮总得分大于70分就能获得特别奖,求乙队获得特别奖的概率;
(2)因两队在决赛中得分相同,现进行附加赛. 规则如下:甲,乙两队抽签决定谁先答题,每队每人各答题一次为一轮,有两人及以上答对就算成功答题,并继续下一轮答题,否则换另一队答题,连续两轮成功答题的队伍获胜,比赛结束. 求附加赛中甲队恰好在第5轮结束时获胜的概率.
【答案】(1)
(2)
【分析】(1)由独立乘法、互斥加法公式先求出、,进一步即可求解;
(2)分别求出甲、乙两队成功答题的概率,分甲先答第一轮、乙先答第一轮两种情形讨论即可求解.
【详解】(1)设乙队每轮得分为,
,
,
三轮积分超过70分,
.
(2)其中甲队成功答题的概率为,
其中乙队成功答题的概率为,
若甲先答第一轮:
甲(胜)甲(负)乙(负)甲(胜)甲(胜)
,
甲(负)乙(胜)乙(负)甲(胜)甲(胜)
,
若乙先答第一轮:
乙 (负)甲(负)乙(负)甲(胜)甲(胜)
,,
甲队恰好在第5轮结束获胜的概率为.
7.(2024·全国·模拟预测)设某电子元件制造厂有甲、乙、丙、丁4条生产线,现有40个该厂生产的电子元件,其中由甲、乙、丙、丁生产线生产的电子元件分别为5个、10个、10个、15个,且甲、乙、丙、丁生产线生产该电子元件的次品率依次为.
(1)若将这40个电子元件按生产线生产的分成4箱,现从中任取1箱,再从中任取1个电子元件,求取到的电子元件是次品的概率.
(2)若将这40个电子元件装入同一个箱子中,再从这40个电子元件中任取1个电子元件,取到的电子元件是次品,求该电子元件是乙生产线生产的概率.
【答案】(1)
(2)
【分析】(1)借助相互独立事件的概率乘法公式与全概率公式计算即可得;
(2)借助全概率公式与条件概率公式计算即可得.
【详解】(1)记“电子元件分别由甲、乙、丙、丁生产线生产”为事件、、、,
“取到的电子元件是次品”为事件,
由题意得,
又,
所以
;
(2)由题意,得,
又,
所以
,
所以,
故若取到的电子元件是次品,则该电子元件是乙生产线生产的概率为.
8.(24-25高二上·四川成都·期中)中国乒乓球队是中国体育军团的王牌之师,屡次在国际大赛上争金夺银,被体育迷们习惯地称为“梦之队”.2024年巴黎奥运会,中国乒乓球队包揽全部五枚金牌.其中团体赛由四场单打和一场双打比赛组成,采用五场三胜制.每个队由三名运动员组成,当一个队赢得三场比赛时,比赛结束.2024年8月10日,中国队对战瑞典队,最终以取得团体赛冠军,赛前某乒乓球爱好者对赛事情况进行分析,根据以往战绩,中国队在每场比赛中获胜的概率均为.
(1)求中国队以的比分获胜的概率;
(2)求中国队在已输一场的情况下获胜的概率;
(3)求至多进行四场比赛的概率.
【答案】(1);
(2);
(3).
【分析】(1)利用独立事件的乘法公式进行求解即可;
(2)设事件“中国队在已输一场的情况下获胜”,则有两类情况:①设事件“中国队从第二场开始连胜三场”,②设事件“中国队在二到四场中胜两场,再胜第五场”,分别求出两种情况的概率,再利用互斥事件的加法公式即可求出事件的概率.
(3)设中国队进行三场、四场比赛获胜分别为事件、,瑞典队进行三场、四场比赛获胜分别为事件、,至多进行四场比赛为事件,分别求出、、、的概率,再利用互斥事件的加法公式即可求出事件的概率.
【详解】(1)设事件“中国队以的比分获胜”,
中国队在每一场中获胜的概率均为,
,
中国队以的比分获胜的概率为;
(2)设事件“中国队在已输一场的情况下获胜”,则有两类情况:
①设事件“中国队从第二场开始连胜三场”,
,
②设事件“中国队在二到四场中胜两场,再胜第五场”,
,
与是互斥事件,
,
中国队在已输一场的情况下获胜的概率为;
(3)设中国队进行三场、四场比赛获胜分别为事件、,瑞典队进行三场、四场比赛获胜分别为事件、,至多进行四场比赛为事件,
,,
,,
,,,是互斥事件,
,
至多进行四场比赛的概率为.
【点睛】关键点睛:本题的关键在于理解互斥事件的加法公式和独立事件的乘法公式.
【题型六:二项分布及其应用】
一、单选题
1.(23-24高二下·天津西青·期末)某人每次射击击中目标的概率均为,此人连续射击三次,至少有两次击中目标的概率为( )
A. B. C. D.
【答案】D
【分析】利用二项分布计算公式可求得结果为.
【详解】记“至少有两次击中目标”为事件,连续射击三次击中目标的次数为,
由每次射击击中目标的概率均为,则未击中目标的概率均为;
则.
故选:D
2.(23-24高二下·江苏淮安·期末)已知随机变量,若,则( )
A. B.或 C. D.或
【答案】D
【分析】根据题意结合二项分布的概率公式列式求解即可.
【详解】因为,则,
且,整理可得,解得或.
故选:D.
二、填空题
3.(23-24高二下·江苏南通·期末)设随机变量,且,则 ;若,则的方差为 .
【答案】 /
【分析】(1)用二项分布的概率公式可解;
(2)用二项分布的方差结论即可解决.
【详解】(1) ,则,
则,解得
(2) ,由(1)得,则.
,则
故答案为:;.
三、解答题
4.(23-24高二下·安徽合肥·期中)某大学为丰富学生课余生活,举办趣味知识竞赛,分为“个人赛”和“对抗赛”,竞赛规则如下:
①个人赛规则:每位学生需要从“历史类、数学类、生活类”问题中随机选1道试题作答,其中“历史类”有8道,“数学类”有6道,“生活类”有4道,若答对将获得一份奖品.
②对抗赛规则:两位学生进行答题比赛,每轮只有1道题目,比赛时两位参赛者同时回答这一个问题,若一人答对且另一人答错,则答对者获得1分,答错者得分;若两人都答对或都答错,则两人均得0分,对抗赛共设3轮,每轮获得1分的学生会获得一份奖品,且两位参赛者答对与否互不影响,每次答题的结果也互不影响.
(1)学生甲参加个人赛,若学生甲答对“历史类”“数学类”“生活类”的概率分别为,,,求学生甲答对所选试题的概率;
(2)学生乙和学生丙参加对抗赛,若每道题学生乙和学生丙答对的概率分别为,,求三轮结束学生乙仅获得一份奖品的概率.
【答案】(1);
(2).
【分析】(1)根据题意可知分三类求解:选题为历史类并且答对,选题为数学类且答对,选题为生活类且答对,由条件概率和全概率计算即可;
(2)可先求出乙同学每轮获得1分的概率,然后由二项分布概率模型计算即可.
【详解】(1)设学生甲选1道“历史类”试题为事件A,选1道“数学类”试题为事件B,选1道“生活类”试题为事件C,答对试题为事件D,
则,,,
,,,
所以:,
故学生甲答对所选试题的概率为.
(2)由题可知每一轮中学生乙得1分的概率为,
在3轮比赛后,学生乙得1分的概率为,
故三轮结束学生乙仅获得一份奖品的概率为:.
5.(24-25高二下·全国·课后作业)随着生活水平的提高,家用小轿车进入千家万户,在给出行带来方便的同时也给交通造成拥堵.交通部门为了解决某十字路口的拥堵问题,安装了红绿灯.通过测试后发现,私家车在此路口遇到红灯的概率为.
(1)若遇到红灯的概率为,求不同时刻的5辆私家车在该路口有3辆车遇到红灯的概率;
(2)当私家车遇到红灯的方差达到最大时,求5辆私家车遇到红灯的车辆数的分布列与期望.
【答案】(1)
(2)分布列见解析,
【分析】(1)由独立重复事假概率计算公式即可求解;
(2)由题意确定私家车遇到红灯的概率是,由二项分布即可求解.
【详解】(1)由题设,路口遇到红灯私家车数量,则.
(2)由题设,路口遇到红灯私家车数量,
一辆私家车遇到红灯的方差为,
当且仅当时方差达到最大,此时私家车遇到红灯的概率是.
由题可得,的可能取值为,则
,
,
.
所以其分布列为:
0
1
2
3
4
5
.
6.(23-24高二下·天津·阶段练习)我国是全球制造业大国,制造业增加值自2010年起连续12年位居世界第一,主要产品产量稳居世界前列.为深入推进传统制造业改造提升,全面提高传统制造业核心竞争力,某设备生产企业对现有生产设备进行技术攻坚突破.设备生产的零件的直径为X(单位:nm).
(1)现有旧设备生产的零件共7个,其中直径大于10nm的有4个.现从这7个零件中随机抽取3个.记ξ表示取出的零件中直径大于10nm的零件的个数,求ξ的分布列及数学期望.
(2)技术攻坚突破后设备生产的零件的合格率为,每个零件是否合格相互独立.现任取6个零件进行检测,若合格的零件数η超过半数,则可认为技术攻坚成功.求技术攻坚成功的概率及η的方差;
【答案】(1)分布列见解答,;
(2),;
【分析】(1)由题意可知的可能取值为0,1,2,3,利用超几何分布的概率公式求出相应的概率,得到的分布列,再结合期望公式求解;
(2)由题意可知,服从二项分布,再利用二项分布的概率公式和方差公式求解;
【详解】(1)由题意,可知可取0,1,2,3.
则有;;;.
所以的分布列为:
0
1
2
3
因此的数学期望;
(2)由题意,可取的值为0,1,2,3,4,5,6.
则有;;.
技术攻坚成功的概率.
,的方差;
【题型七:超几何分布】
一、单选题
1.(23-24高二下·江苏扬州·阶段练习)已知甲参加青年志愿者的选拔,选拔以现场答题的方式进行.已知在备选的10道试题中,甲能答对其中的6道题,规定每次考试都从备选题中随机抽出3道题进行测试,设甲答对的试题数为X,则的概率为( )
A. B. C. D.
【答案】D
【分析】根据题意可知:随机抽出3道题有2题答对,1题打错,结合组合数运算求解.
【详解】由题意可知:表示答对2题,即随机抽出3道题有2题答对,1题打错,
所以.
故选:D.
2.(23-24高二下·浙江宁波·期末)袋子中有n个大小质地完全相同的球,其中4个为红球,其余均为黄球,从中不放回地依次随机摸出2个球,已知摸出的2个球都是红球的概率为,则两次摸到的球颜色不相同的概率为( )
A. B. C. D.
【答案】C
【分析】利用超几何分布求解.
【详解】设事件“依次随机摸出2个球,已知摸出的2个球都是红球”为事件,即解得设事件“两次摸到的球颜色不相同”为事件B,
故选:C.
二、解答题
3.(23-24高二下·北京怀柔·期末)某学校对食堂饭菜质量进行满意度调查,随机抽取了200名学生进行调查,获取数据如下:
满意度性别
满意
不满意
弃权
男生
80
30
10
女生
50
20
10
(1)用频率估计概率,该校学生对食堂饭菜质量满意的概率;
(2)用分层抽样的方法从上表中不满意的50人中抽取5人征求整改建议,再从这5个人中随机抽取2人参与食堂的整改监督,则抽取的2人中女生的人数X,求X的分布列和期望.
【答案】(1).
(2)分布列见解析;期望为.
【分析】(1)根据已知,计算该校学生对食堂饭菜质量满意的频率即可.
(2)根据已知,利用超几何分布计算公式、期望的计算公式求解.
【详解】(1)设“对食堂饭菜质量满意”为事件A.
在200人中对饭菜质量满意的有130人,
.
(2)分层抽取比例
男生抽取人,女生抽取人
抽取的2人中女生人数X的所有可能为0,1,2 -
-
-
X
0
1
2
P
随机变量X的数学期望.
4.(24-25高二下·全国·课后作业)某试验机床生产了12个电子元件,其中8个合格品,4个次品.从中随机抽出4个电子元件作为样本,用X表示样本中合格品的个数.
(1)若有放回的抽取,求X的分布列;
(2)若不放回的抽取,求样本中合格品的比例与总体中合格品的比例之差的绝对值不超过的概率.
【答案】(1)答案见解析
(2)
【分析】(1)依题意可得X的可能取值为0、1、2、3、4,求出对应的概率,即可列出分布列、求出数学期望.
(2)总体中合格品的比例为,样本中合格品的比例与总体中合格品的比例之差的绝对值不超过,即样品中合格品的比例大于等于且小于等于,即样本中合格品的个数为2或3,求出对应概率,相加即可得所求概率.
【详解】(1)有放回的抽取时,P(取到合格品)(取到次品),
根据题意可得X的所有可能取值为0,1,2,3,4,
所以,
,
,
,
.
X的分布列为
X
0
1
2
3
4
P
(2)由题意得总体中合格品的比例为,
因为样本中合格品的比例与总体中合格品的比例之差的绝对值不超过,
所以样本中合格品的比例大于等于且小于等于,即样本中合格品的个数为2或3,
,
,
所以P(样本中合格品的比例与总体中合格品的比例之差的绝对值不超过).
5.(23-24高二下·上海松江·期末)某超市为促进消费推出优惠活动,为预估活动期间客户投入的消费金额,采用随机抽样统计了200名客户的消费金额,分组如下:(单位:元),得到如图所示频率分布直方图:
活跃客户
非活跃客户
总计
男
20
女
60
总计
(1)若把消费金额不低于800元的客户,称为“活跃客户”,经数据处理,现在列联表中得到一定的相关数据,求列联表中的值,并根据列联表判断是否有的把握认为“活跃客户”与性别有关?
(2)为感谢客户,该超市推出免单福利,方案如下:从“活跃客户”中按分层抽样的方法抽取12人,从中抽取2人进行免单,试写出免单总单金额的分布列及其期望.(每一组消费金额按该组中点值估计,期望结果保留至整数)
附:
0.150
0.100
0.050
0.010
0.005
k
2.072
2.706
3.841
6.635
7.879
【答案】(1)40;80;有关
(2)分布列见解析,1933
【分析】(1)先完善列联表,再求卡方,即可作出判断;(2)先用分层抽样,然后用超几何分布的概率公式计算,即可得分布列与期望.
【详解】(1)消费金额不低于800元的人数为:人,
则活跃客户共有60人,所以,,
列联表如下
活跃客户
非活跃客户
总计
男
20
80
100
女
40
60
100
总计
60
140
200
计算,
因此有的把握与性别有关.
(2)从“活跃客户”中用分层抽样,抽出消费900元:人,消费1100元:人,
从中抽取2人免单总金额的取值有:,
则,,,
所以的分布列为:
即.
6.(24-25高二下·全国·课后作业)4月23日是联合国教科文组织确定的“世界读书日”.为了解某地区高一学生阅读时间的分配情况,从该地区随机抽取500名高一学生进行在线调查,得到了这500名学生的日平均阅读时间(单位:h),并将样本数据分成九组,绘制成如图所示的频率分布直方图.
(1)从这500名学生中随机抽取一人,求日平均阅读时间在内的概率;
(2)为进一步了解这500名学生数字媒体阅读时间和纸质图书阅读时间的分配情况,从日平均阅读时间在三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人,记日平均阅读时间在内的学生人数为X,求X的分布列;
(3)以样本的频率估计概率,从该地区所有高一学生中随机抽取10名学生,用表示这10名学生中恰有k名学生日平均阅读时间在内的概率,其中.当最大时,写出k的值.(只需写出结论)
【答案】(1)0.20.
(2)答案见解析
(3)
【分析】(1)根据频率之和为1即可求解,
(2)根据分层抽样的抽样比计算的人生,即可根据超几何分布的概率公式即可求解,
(3)根据二项分布的概率公式,结合组合数的性质即可求解.
【详解】(1)由频率分布直方图得,,
解得,所以日平均阅读时间在内的概率为0.20.
(2)由频率分布直方图得,这500名学生中日平均阅读时间在三组内的学生人数分别为.
若采用分层抽样的方法抽取了10人,则从日平均阅读时间在内的学生中抽取人,现从这10人中随机抽取3人,则X的所有可能取值为0,1,2,3,
,
,
所以X的分布列为
X
0
1
2
3
P
(3),理由如下:
由频率分布直方图得抽取的学生中日平均阅读时间在内的概率为0.50,所以从该地区所有高一学生中随机抽取10名学生,恰有k名学生日平均阅读时间在内的分布列大致服从二项分布,,由组合数的性质可得时最大.
【题型八:正态分布】
一、单选题
1.(24-25高二上·黑龙江哈尔滨·期中)某市高中数学统考中,甲、乙、丙三所学校的数学成绩分别服从正态分布,,,其正态分布的密度曲线如图所示,则( )
A. B.
C. D.
【答案】D
【分析】根据给定的曲线,利用正态分布的密度曲线的特征判断即得.
【详解】观察曲线知,.
故选:D
2.(24-25高二上·黑龙江哈尔滨·阶段练习)已知随机变量服从正态分布,则( )
A.0.1 B.0.2 C.0.3 D.0.4
【答案】B
【分析】根据正态分布的对称性即可求解.
【详解】由于服从正态分布,则,
故.
故选:B
3.(23-24高二下·陕西西安·期末)某市高中数学统考,假设考试成绩服从正态分布.如果按照,,,的比例将考试成绩从高到低分为四个等级.若某同学考试成绩的等级为,则该同学的考试成绩可能为( )(参考数据:)
A.120 B.90 C.80 D.60
【答案】B
【分析】根据题意分析可知,结合正态分布的对称性分析求解即可.
【详解】数学测试成绩服从正态分布,则,,
由于等级的概率之和为,
所以,
又因为,
即,
故为A等级,为等级,为等级,为等级,
结合选项可知:该同学的考试成绩可能为90.
故选:B.
二、解答题
4.(23-24高二下·山西长治·期中)某种香梨的重量(单位:)服从正态分布,将该种香梨按照其重量及对应的售价进行分拣,分为4类依次记为.已知,售价最高,为10元;,售价为8元;,售价为6元;其余的为,售价为5元.
(1)任选1个香梨,求其重量大于的概率;
(2)以表示香梨的售价(单位:元),写出的分布列,并估计该种香梨售价的平均值.
附:若,则,,.
【答案】(1)
(2)分布列见解析,元
【分析】(1)依题意,根据正态分布的性质求出,即可得解;
(2)依题意的所有可能取值为,,,,根据正态曲线的性质求出所对应的概率,即可求出分布列与数学期望.
【详解】(1)因为,所以,,
所以,
即任选1个香梨,其重量大于的概率约为;
(2)由题意可知,的所有可能取值为,,,,
则,
,
,
,
所以的分布列为:
10
8
6
5
所以,
即估计该种香梨售价的平均值为元.
5.(24-25高二下·全国·课后作业)某企业的产品正常生产时,产品尺寸(单位:)服从正态分布,从当前生产线上随机抽取400件产品进行检测,产品尺寸汇总如表
产品尺寸/
件数
8
54
54
160
72
40
12
根据产品质量标准和生产线的实际情况,产品尺寸在以外视为小概率事件,一旦小概率事件发生视为生产线出现异常,产品尺寸在以内为正品,以外为次品.
(1)判断生产线是否正常工作,并说明理由;
(2)用频率表示概率,若再随机从生产线上取3件产品复检,正品检测费为20元/件,次品检测费为30元/件,记这3件产品检测费为随机变量X,求X的均值及方差.
附:.
【答案】(1)生产线出现异常,理由见解析
(2)均值为,方差为
【分析】(1)借助正态分布的性质计算可得小概率事件多次发生,故可视为生产线出现异常;
(2)计算出次品率后可得,结合二项分布的期望与方差公式可得、,结合期望与方差的性质即可得X的均值及方差.
【详解】(1)依题意,有,
所以正常产品尺寸的范围为,
生产线正常工作,次品不能多于(件),
而实际上,超出正常范围以外的零件数为,故生产线出现异常;
(2)依题意,尺寸在以外的就是次品,故次品率为,
记这3件产品中次品件数为Y,则Y服从二项分布,
则,
因为,
所以X的均值(元),
方差.
6.(23-24高二下·浙江·期中)某校高三年级有750人,某次考试不同成绩段的人数,且所有得分都是整数.
(1)求该校高三年级本次考试的平均成绩及标准差;
(2)计算本次考试得分超过141的人数;(精确到整数)
(3)本次考试中有一类多项选择题,每道题的四个选项中有两个或三个选项正确,全部选对得6分,部分选对得部分分(正确答案有三个选项的,则每个选项2分;正确答案是2个选项的,则每个选项为3分),有选择错误的得0分.小明同学在做多项选择题时,选择一个选项的概率为,选择两个选项的概率为,选择三个选项的概率为.已知某个多项选择题有三个选项是正确的,小明在完全不知道四个选项正误的情况下,只好根据自己的经验随机选择,记小明做这道多项选择题所得的分数为,求的分布列及数学期望.
参考数据:若,则;;.
【答案】(1)平均成绩,标准差为
(2)17
(3)分布列见解析;期望为
【分析】(1)根据正态分布可得;
(2)应用正态分布的概率性质计算求解;
(3)先求出概率再写出分布列最后求出数学期望.
【详解】(1)由题意得:平均成绩,
标准差为
(2)因为,,
所以
所以超过141的人数为:人
(3)设事件A,表示“小明选择了i个选项”(,2,3),事件B表示“选择的选项是正确的”.
由题知,可取6,4,2,0.
因为,,
,
所以随机变量的分布列为:
6
4
2
0
P
于是,
【题型九:线性回归方程】
一、单选题
1.(24-25高二上·黑龙江哈尔滨·期中)下列命题是真命题的是( )
A.经验回归方程至少经过其样本数据点,,…,中的一个
B.可以用相关系数r来刻画两个变量x和y线性相关程度的强弱,r的绝对值越小,说明两个变量线性相关程度越强
C.线性回归分析中决定系数用来刻画回归的效果,若值越小,则模型的拟合效果越好
D.残差点分布在以横轴为对称轴的水平带状区域内,该区域越窄,拟合效果越好
【答案】D
【分析】根据经验回归方程、相关系数、决定系数、残差等知识确定正确答案.
【详解】对于A,经验回归方程是由最小二乘法计算出来的,它不一定经过其样本数据点,一定经过,所以A错误;
对于B,由相关系数的意义,当越接近1时,表示变量y与x之间的线性相关程度越强,所以B错误;
对于C,用决定系数的值判断模型的拟合效果,越大,模型的拟合效果越好,所以C是错误;
对于D,因为在残差的散点图中,残差分布的水平带状区域的宽度越窄,表明数据越集中,
模型的拟合效果越好,故D正确.
故选:D.
2.(24-25高二上·河南南阳·阶段练习)某产品的广告费用与销售额的统计数据如下表:
广告费用/万元
4
2
3
5
销售额/万元
49
26
39
54
根据上表可得线性回归方程 中的为9.4,据此模型预测广告费用为6万元时销售额为( )
A.9.1万元 B.9.2万元
C.67.7万元 D.65.5万元
【答案】D
【分析】线性回归方程一定过样本中心,得到线性回归方程,然后带值求结果.
【详解】,,
∵线性归回方程经过样本中心,
∴,∴,
∴,当时,,
故选:D.
3.(24-25高二下·全国·课后作业)已知由样本数据组成的一个样本,得到经验回归方程为,且,增加两个样本点和后,得到新样本的经验回归方程为.在新的经验回归方程下,样本的残差为( )
A. B. C. D.
【答案】D
【分析】计算增加样本点后的新的样本中心点,代入经验回归方程可求得;根据经验回归方程可求得,由残差定义可得结果.
【详解】,增加两个样本点后的平均数为;
,,增加两个样本点后的平均数为,
,解得:,新的经验回归方程为:,
则当时,,样本的残差为.
故选:D.
4.(23-24高二下·广东珠海·阶段练习)一唱片公司欲知唱片费用(十万元)与唱片销售量(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,则与的相关系数的绝对值为( )(相关系数:)
A.0.6 B.0.5 C.0.4 D.0.3
【答案】D
【分析】运用相关系数公式进行求解即可.
【详解】因为,,所以,
,
故选:D.
二、解答题
5.(23-24高二下·黑龙江双鸭山·开学考试)如图是某机构统计的某地区2016年至2022年生活垃圾无害化处理量y(单位:万吨)的折线图.
注:年份代码1-7分别对应年份2016-2022.
求y关于t的回归直线方程(系数精确到0.01),并预测2024年该地区生活垃圾无害化处理量.
参考数据:,,,
参考公式:回归方程中斜率和截距的最小乘估计公式分别为,.
【答案】回归方程为,预测2024年该地区生活垃圾无害化处理量将约万吨
【分析】根据最小二乘法计算出回归方程,进而代入预测值,即可求解.
【详解】,,
,
得,
又,,
y关于t的回归方程为.
,将2024对应的代入回归方程得:,
预测2024年该地区生活垃圾无害化处理量将约万吨.
6.(23-24高二下·河北沧州·期中)2023年全国竞走大奖赛(第1站)暨世锦赛及亚运会选拔赛3月4日在安徽黄山开赛.重庆队的贺相红以2小时22分55秒的成绩打破男子35公里竞走亚洲纪录.某田径协会组织开展竞走的步长和步频之间的关系的课题研究,得到相应的试验数据:
步频(单位:)
0.28
0.29
0.30
0.31
0.32
步长(单位:)
90
95
99
103
117
(1)根据表中数据,得到步频和步长近似为线性相关关系,求出关于的回归直线方程,并利用回归方程预测,当步长为时,步频约是多少?
(2)记,其中为观测值,为预测值,为对应的残差,求(1)中步长的残差的和,并探究这个结果是否对任意具有线性相关关系的两个变量都成立?若成立,请证明;若不成立,请说明理由.
参考数据:,.
参考公式:,.
【答案】(1), 0.27秒,;
(2)成立,证明见解析.
【分析】(1)根据已知条件求得回归方程的系数,即可得回归方程,将代入回归方程,即可得到答案;
(2)结合题中数据进行计算,可求得步长的残差和,从而可得结论,结合回归方程系数的计算公式即可证明.。
【详解】(1),,
,,
所以回归直线方程为,
将代入得,解得,所以当步长为时,步频约是0.27秒.
(2)根据(1)得到,;
,;
,;
,;
,,
所以,即步长残差和为0.
对任意具有线性相关关系的两个变量都成立,证明如下:
.
7.(24-25高三上·山东济宁·阶段练习)某学校对高三(1)班50名学生的第一次模拟考试的数学成绩和化学成绩统计得到数据如下:数学成绩的方差为,化学成绩的方差为,,其中(,且)分别表示这50名学生的数学成绩和化学成绩,关于的线性回归方程为.
(1)求与的样本相关系数;
(2)从概率统计规律来看,本次考试高三(1)班学生数学成绩服从正态分布,用样本平均数作为的估计值,用样本方差作为的估计值,试估计该校共1600名高三学生中,数学成绩位于区间的人数.
附:①回归方程中,;
②样本相关系数;③;
④若,则.
【答案】(1)
(2)
【分析】(1)根据相关系数的求法求得正确答案.
(2)先求得,然后根据正态分布的对称性求得正确答案.
【详解】(1)由关于的线性回归方程为知,
即,
又由,可得,
所以与的样本相关系数:
.
(2)由,解得,所以,
又由,
及可得:
,
于是估计该校1600名高三学生中,
数学成绩位于区间的人数约为人.
【题型十:非线性回归方程】
一、解答题
1.(23-24高二下·宁夏石嘴山·期中)红铃虫(Pectinophora gossypiella)是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数(个)和温度()的8组观测数据,制成图1所示的散点图.现用两种模型①,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
根据收集到的数据,计算得到如下值:
25
2.9
646
168
422688
50.4
70308
表中;;;
(1)根据残差图,比较模型①、②的拟合效果,哪种模型比较合适?
(2)根据(1)中所选择的模型,求出关于的回归方程.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,,
【答案】(1)①;
(2).
【分析】(1)根据残差点的分布情况分析即可;
(2)取对数,将非线性回归转化为线性回归,然后根据所给数据代入公式即可得回归方程.
【详解】(1)模型①更合适.
模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状宽度窄,
所以模型①的拟合精度更高,回归方程的预报精度相应就会越高,故选模型①比较合适.
(2)令与温度x可以用线性回归方程来拟合,则.
,
则关于的线性回归方程为,即,
产卵数y关于温度x的回归方程为.
2.(23-24高二下·河北石家庄·阶段练习)网络直播带货助力乡村振兴,它作为一种新颖的销售土特产的方式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数x(其中10场为一个周期)与产品销售额y(千元)的数据统计如下:
直播周期数x
1
2
3
4
5
产品销售额y(千元)
3
7
15
30
40
根据数据特点,甲认为样本点分布在指数型曲线的周围,据此他对数据进行了一些初步处理.如下表:
3.7
55
382
65
978
101
其中
(1)请根据表中数据,建立y关于x的回归方程;
(2)乙认为样本点分布在直线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲、乙两人所建立的模型,谁的拟合效果更好?(精确到0.01)
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,相关指数:.
【答案】(1);
(2)乙建立的回归模型拟合效果更好.
【分析】(1)对两边取对数得,令,利用最小二乘法可求得,由此可得回归方程;
(2)根据公式计算可得相关指数,由此可得结论;
【详解】(1)将两边取对数得:,
令,则,
因为,
所以根据最小二乘估计可知:,
所以,
所以回归方程为,即.
(2)甲建立的回归模型的.
所以乙建立的回归模型拟合效果更好.
3.(23-24高二下·湖北·期末)某乡村企业希望通过技术革新增加产品收益,根据市场调研,技术革新投入经费(单位:万元)和增加收益(单位:万元)的数据如下表:
4
6
8
10
12
27
42
55
56
60
为了进一步了解技术革新投入经费对增加收益的影响,通过对表中数据进行分析,分别提出了两个回归模型:①,②.
(1)根据以上数据,计算模型①中与的相关系数(结果精确到0.01);
(2)若,则选择模型①;否则选择模型②.根据(1)的结果,试建立增加收益关于技术革新投入经费的回归模型,并预测时的值(结果精确到0.01).
附:i)回归直线的斜率、截距的最小二乘估计以及相关系数分别为:,,
ii)参考数据:设,,,,,.
【答案】(1)
(2),约为万元
【分析】(1)根据所给数据求出,,,,,即可求出相关系数;
(2)根据(1)的结论,可判断选择模型②,令,求出关于的线性回归方程,即可求出关于的经验方程,再代入计算可得.
【详解】(1)因为,
,
所以,
,
,
模型①中,相关系数,
(2)因为,所以选择模型②,
令,先建立关于的线性回归方程,
由于,
,
所以关于的线性回归方程为,
即,
当时,(万元),
所以若投入经费万元,收益约为万元.
【题型十一:独立性检验】
一、解答题
1.(2025高三·全国·专题练习) 2022年北京冬奥组委发布的《北京2022年冬奥会和冬残奥会经济遗产报告(2022)》显示,北京冬奥会已签约45家赞助企业,冬奥会赞助成为一项跨度时间较长的营销方式.为了解该45家赞助企业每天销售额与每天线上销售时间之间的相关关系,某平台对45家赞助企业进行跟踪调查,其中每天线上销售时间不少于8小时的企业有20家,余下的企业中,每天的销售额不足30万元的企业占,统计后得到如下列联表:
销售额不少于30万元
销售额不足30万元
合计
线上销售时间不少于8小时
17
20
线上销售时间不足8小时
合计
45
请完成上面的列联表,并依据的独立性检验,能否认为赞助企业每天的销售额与每天线上销售时间有关?
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
参考公式:,其中.
【答案】列联表见解析,有关
【分析】由题意确定列联表,求得,对比数据即可求解.
【详解】由题意分析可得,签约企业共45家,线上销售时间不少于8小时的企业有20家,
那么线上销售时间少于8小时的企业有25家,每天的销售额不足30万元的企业占,
共有.
完成列联表如下:
销售额不少于30万元
销售额不足30万元
合计
线上销售时间不少于8小时
17
3
20
线上销售时间不足8小时
10
15
25
合计
27
18
45
所以.
对应的参数为6.635.而,
所以可判断赞助企业每天的销售额与每天线上销售时间有关.
2.(2024高三·全国·专题练习)中国大学先修课程,是在高中开设的具有大学水平的课程,旨在让学有余力的高中生早接受大学思维方式、学习方法的训练,为大学学习乃至未来的职业生涯做好准备.某高中开设大学先修课程已有两年,两年共招收学生2000人,其中有300人参与学习先修课程,两年全校共有优等生200人,学习先修课程的优等生有60人.这两年学习先修课程的学生都参加了考试,并且都参加了某高校的自主招生考试,结果如下表所示:
分数
人数
20
55
105
70
50
参加自主招生获得通过的概率
0.9
0.8
0.6
0.5
0.4
填写列联表,并画出列联表的等高条形图,并通过图形判断学习先修课程与优等生是否有关系,根据列联表的独立性检验,能否在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系?
优等生
非优等生
总计
学习大学先修课程
没有学习大学先修课程
总计
参考数据:
0.15
0.10
0.05
0.025
0.010
0.005
2.072
2.706
3.841
5.024
6.635
7.879
参考公式:,其中.
【答案】答案见解析
【分析】先补全联表,再应用计算得出值与边界值比较,得出在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系.
【详解】列联表如下:
优等生
非优等生
总计
学习大学先修课程
60
240
300
没有学习大学先修课程
140
1560
1700
总计
200
1800
2000
等高条形图如图:
通过图形可判断学习先修课与优等生有关系,又,
因此在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系.
3.(2024高三·全国·专题练习)微生物生态学的研究表明,水生生物中存在大量的有益微生物,这些有益水生微生物对于维持水质平衡具有非常重要的作用.研究人员为了研究某种有益水生微生物在特定营养物质浓度下的增长速率与水体类型(淡水或咸水)的关系,对100个水体环境样本中的有益水生微生物在一段时间内的数量进行了观察,经统计得到如下的列联表:
水体环境类型
增长情况
合计
快速增长
未快速增长
淡水环境
25
咸水环境
10
合计
100
已知从这100个水体环境样本中随机抽取1个,该水体环境中的有益水生微生物属于“快速增长”的概率为.
(1)求;
(2)根据小概率值的独立性检验,判断该有益水生微生物“快速增长”与水体环境类型是否有关?根据小概率值的独立性检验,判断该有益水生微生物“快速增长”与水体环境类型是否有关?
附:,
0.01
0.005
0.001
6.635
7.879
10.828
【答案】(1),;
(2)答案见解析.
【分析】(1)根据已知概率值及频率估计概率求参数a,再由样本总数求参数b即可;
(2)根据(1)完善列联表,应用卡方公式求卡方值,结合独立性检验的基本思想得结论.
【详解】(1)因为从这100个样本中随机抽取1个,该有益水生微生物属于“快速增长”的概率为,
则,解得,又,解得,
所以,.
(2)由(1)得,列联表如下:
水体环境类型
增长情况
合计
快速增长
未快速增长
淡水环境
30
25
55
咸水环境
10
35
45
合计
40
60
100
令零假设为:该有益水生微生物“快速增长”与水体环境类型无关,
由,根据小概率值的独立性检验,推断不成立,
即认为该有益水生微生物“快速增长”与水体环境类型有关,此推断犯错误的概率不超过0.01.
因为,根据小概率值的独立性检验,没有充分证据推断不成立,
即认为成立,即认为该有益水生微生物“快速增长”与水体环境类型无关.
4.(23-24高三下·湖南长沙·期中)新型冠状病毒疫情已经严重影响了我们正常的学习、工作和生活.某市为了遏制病毒的传播,利用各种宣传工具向市民宣传防治病毒传播的科学知识.某校为了解学生对新型冠状病毒的防护认识,对该校学生开展防疫知识有奖竞赛活动,并从女生和男生中各随机抽取30人,统计答题成绩分别制成如下频数分布表和频率分布直方图.规定:成绩在80分及以上的同学成为“防疫标兵”.
名女生成绩频数分布表:
成绩
频数
10
10
6
4
附:
0.100
0.050
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
(1)根据以上数据,完成以下列联表,并判断是否有%的把握认为“防疫标兵”与性别有关;
男生
女生
合计
防疫标兵
非防疫标兵
合计
(2)以样本估计总体,以频率估计概率,现从该校女生中随机抽取人,其中“防疫标兵”的人数为,求随机变量的分布列与数学期望.
【答案】(1)表格见解析,有%的把握认为“防疫标兵”与性别有关
(2)分布列见解析,
【分析】(1)分别分析男女生样本中 “防疫标兵”和“非防疫标兵”人数,完成列联表,再计算的数值,并与参考数值作比较得出结论;
(2)从该校女生中随机抽取4人,则“防疫标兵”的人数,服从二项分布,分别求出概率从而得到分布列,再计算数学期望.
【详解】(1)由频率分布直方图,
可得名男生中成绩大于等于分的频率为,
故名男生中“防疫标兵”人数为人,“非防疫标兵”人数为人.
由频数分布表,可得名女生中“防疫标兵”人数为人,“非防疫标兵”人数为人.
男生
女生
合计
防疫标兵
18
非防疫标兵
合计
故,所以有%的把握认为“防疫标兵”与性别有关.
(2)名女生样本中有人成绩在分以上,所以女生样本中“防疫标兵”的频率为.
用样本估计总体,以频率估计概率,从该校女生中随机抽取人,
则“防疫标兵”的人数服从二项分布,即.
X的可能取值为.
,,,,.
所以随机变量的分布列为
X
0
1
2
3
4
P
数学期望为.
5.(24-25高三上·湖南·期中)电动车的安全问题越来越引起广大消费者的关注,目前电动车的电池有石墨烯电池与铅酸电池两种.某公司为了了解消费者对两种电池的电动车的偏好,在社会上随机调查了500名市民,其中被调查的女性市民中偏好铅酸电池电动车的占,得到以下的2-2列联表:
偏好石墨烯电池电动车
偏好铅酸电池电动车
合计
男性市民
200
100
女性市民
合计
500
(1)根据以上数据,完成2×2列联表,依据小概率的独立性检验,能否认为市民对这两种电池的电动车的偏好与性别有关;
(2)采用分层抽样的方法从偏好石墨烯电池电动车的市民中随机抽取7人,再从这7名市民中抽取2人进行座谈,求在有女性市民参加座谈的条件下,恰有一名女性市民参加座谈的概率;
(3)用频率估计概率,在所有参加调查的市民中按男性和女性进行分层抽样,随机抽取5名市民,再从这5名市民中随机抽取2人进行座谈,记2名参加座谈的市民中来自偏好石墨烯电池电动车的男性市民的人数为X,求X的分布列和数学期望.
参考公式:,其中.
参考数据:
0.100
0.050
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)列联表见解析,能
(2)
(3)分布列见解析,
【分析】(1)由题意直接确定列联表,计算,对比数据即可判断;
(2)由条件概率计算公式即可求解;
(3)记“3名被抽取的男性市民中,恰好抽到k人参加座谈”记为事件,
求得,再由条件概率乘法公式和互斥事件加法公式计算随机变量取每一个值对应的概率,即可求解;
【详解】(1)被调查的女性市民人数为,
其中偏好铅酸电池电动车的女性市民人数为.
偏好石墨烯电池电动车的女性市民人数为,
所以2×2列联表为:
偏好石墨烯电池电动车
偏好铅酸电池电动车
合计
男性市民
200
100
300
女性市民
80
120
200
合计
280
220
500
零假设:市民对这两种电池的电动车的偏好与市民的性别无关,
根据列联表中的数据可以求得
,
由于,
根据小概率值的独立性检验,我们推断不成立,
即认为市民对这两种电池的电动车的偏好与市民的性别有关.
(2)因为偏好石墨烯电池电动车的市民中,男性市民与女性市民的比为,
所以采用分层抽样的方法抽取7的人中,男性市民有5人,女性市民有2人,
设“有女性市民参加座谈”为事件A,“恰有一名女性市民参加座谈”为事件B,
则,,
所以.
(3)因为所有参加调查的市民中,男性市民和女性市民的比为,
所以由分层抽样知,随机抽取的5名市民中,男性市民有3人,女性市民有2人.
根据频率估计概率知,男性市民偏好石墨烯电池电动车的概率为,偏好铅酸电池电动车的概率为,
从选出的5名市民中随机抽取2人进行座谈,则X可能的取值为0,1,2.
“3名被抽取的男性市民中,恰好抽到k人参加座谈”记为事件,
则.
“参加座谈的2名市民中是偏好石墨烯电池电动车的男性市民的人数恰好为m人”记为事件,
则,,
,,
,,
所以
,
,
,
故X的分布列如下:
X
0
1
2
P
.
原创精品资源学科网独家享有版权,侵权必究!学科网(北京)股份有限公司10
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$