内容正文:
大题04 概率统计
历年北京高考题中,概率统计主要考查用频率估计概率;离散型随机变量的均值;古典概型的概率;独立事件的乘法公式;频率分布表解决概率;二项分布求分布列;离散型随机变量分布列及均值;该部分内容主要以探索创新情境与生活实践情境为载体,重在考查考生的逻辑思维能力及对事件进行分析、分解和转化的能力;预测2025年考查内容涉及以利用排列组合考查离散型随机变量的分布列、均值、方差、二项分布和正态分布等问题为主,注重概率和其他知识的综合考查.
题型一:一元线性回归模型及其应用
3.(2025·北京丰台·期末)如图是我国2015年至2023年岁及以上老人人口数(单位:亿)的折线图,
注:年份代码分别对应年份.
(1)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数(结果精确到)加以说明;
(2)建立关于的回归方程(系数精确到),并预测2024年我国岁及以上老人人口数(单位:亿).
参考数据:,,,.
参考公式:相关系数,若,则与有较强的线性相关性.
回归方程中斜率和截距的最小二乘估计公式分别为:,.
【解题指导】(1)利用相关系数公式可得,进而可得证;
(2)利用最小二乘法可得回归方程,进而可得估计值.
【规范答题】(1)由折线图看出,与之间存在较强的正相关关系,理由如下:
因为,,,,
所以,,
,
所以,
所以,
,故与之间存在较强的正相关关系.
(2)由(1),结合题中数据可得,
,,
,
关于的回归方程为,
年对应的值为,故,
预测年我国岁及以上老人人口数为亿.
一元线性回归模型及其应用问题,解题的思路是:
1、识题:关键词(线性回归方程与最小二乘法)
2、研究方向及步骤:回归直线方程过样本点的中心(,),是回归直线方程最常用的一个特征
将=x+称为Y关于x的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求线性回归方程的一般步骤
(1)收集样本数据,设为(xi,yi)(i=1,2,…,n)(数据一般由题目给出).(2)作出散点图,确定x,y具有线性相关关系.(3)把数据制成表格xi,yi,x,xiyi.(4)计算,,x,xiyi.
(5)代入公式计算,,公式为(6)写出线性回归方程=x+.
3、必备知识:①通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.
②作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
③残差平方和 (yi-i)2,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
④利用R2刻画回归效果决定系数R2是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.R2=1-,R2越大,即拟合效果越好,R2越小,模型拟合效果越差.
1.某县城为活跃经济,特举办传统文化民俗节,小张弄了一个套小白兔的摊位,设表示第i天的平均气温,表示第i天参与活动的人数,,根据统计,计算得到如下一些统计量的值:
,,.
(1)根据所给数据,用相关系数(精确到0.01)判断是否可用线性回归模型拟合与的关系;
(2)现有两个家庭参与套圈,A家庭3位成员每轮每人套住小白兔的概率都为,B家庭3位成员每轮每人套住小白兔的概率分别为,每个家庭的3位成员均玩一次套圈为一轮,每轮每人收费20元,每个小白兔价值40元,且每人是否套住相互独立,以每个家庭的盈利的期望为决策依据,问:一轮结束后,哪个家庭损失较大?
附:相关系数.
【解题指导】(1)计算相关系数,若接近1,则可用线性回归模型拟合与的关系.
(2)A家庭符合二项分布,直接用公式求期望,B家庭先根据题意列出分布列再求期望.
【规范答题】(1)由题可知
,
故可用线性回归模型拟合y与x的关系.
(2)设A家庭中套中小白兔的人数为,则,
所以.
设A家庭的盈利为元,则,
所以.
设B家庭中套中小白兔的人数为,
则的所有可能取值为0,1,2,3,
,
,
,
,
所以.
设B家庭的盈利为元,则,
所以.
因为,所以B家庭的损失较大
2.(2025·北京通州·期末)某公司对某产品作市场调查,获得了该产品的定价(单位:万元/吨)和一天的销量吨)的一组数据,根据这组数据制作了如下统计表和散点图.
0.33
10
3
0.164
100
68
350
表中.
(Ⅰ)根据散点图判断,与哪一个更适合作为关于的经验回归方程;(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果,建立关于的经验回归方程;
(Ⅲ)若生产1吨该产品的成本为0.25万元,依据(Ⅱ)的经验回归方程,预计每吨定价多少时,该产品一天的销售利润最大?最大利润是多少?
(经验回归方程中,,)
【解题指导】(Ⅰ)直接根据散点图的形状即可进行判断;
(Ⅱ)令,则,利用公式求出得值即可求解;
(Ⅲ)求出利润的表达式,由基本不等式求出最值,确定等号成立的条件,即可求解.
【规范答题】(Ⅰ)根据散点图可知,更适合作为关于的经验回归方程;
(Ⅱ)令,则,
所以,
所以,
所以,
故关于的经验回归方程为,
(Ⅲ)一天的利润为
,
当且仅当即时等号成立,
所以预计每吨定价为万元时,该产品一天的销售利润最大,最大利润是万元.
题型二:独立性检验
(2025·北京通州·期末)为了研究高三年级学生的性别和身高是否大于的关联性,同学甲调查丁某中学高三年级所有学生,整理得到列联表1,同学乙从该校高三学生中获取容量为40的有放回简单随机样本,由样本数据整理得到列联表2.
表1单位:人
性别
身高
合计
女
81
16
97
男
28
75
103
合计
109
91
200
表2单位:人
性别
身高
合计
女
15
6
21
男
9
10
19
合计
24
16
40
(1)利用表1,通过比较不低于的学生在女生和男生中的比率,判断该中学高三年级学生的性别和身高是否有关联,如果有关联,请解释它们之间如何相互影响;
(2)利用表2,依据的独立性检验,推断该中学高三年级学生的性别和身高是否有关联,并解释所得结论的实际含义:
(3)以上两种方法得出的结论是否一致?如果不一致,你认为哪种方法得出的结论准确,原因是什么?
(,)
【解题指导】(1)计算频率即可比较;(2)计算与3.841比较即可;(3)从样本容量分析
【规范答题】女学生身高低于,不低于的频率分别为
男学生身高低于,不低于的频率分别为
通过比较发现,如果从女生、男生中各随机选取一名学生,女生中身高
低于的概率大于男生中身高低于的概率,
故高三年级学生的性别和身高有关联.又,故女生中身高低于的频率是男生中身高低于的频率的3倍以上
女生身高更容易低于.
(2),所以没有关联,即没有95%的把握认为该中学高三年级学生的性别和身高有关联.
(3)不一致,第一种准确,第二种样本容量太少,随机性太大.
列联表与独立性检验问题,解题的思路是:
1、识题:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},将这类数据统计表称为2×2列联表
2、研究方向及步骤:(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
3、必备知识:
①临界值:χ2 统计量也可以用来作相关性的度量.χ2 越小说明变量之间越独立,χ2越大说明变量之间越相关
χ2=.忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准.
②独立性检验:基于小概率值α的检验规则是:
当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
1.(2025·北京延庆·期中)为提升学生综合素养,某中学为高二年级提供了“书法”和“剪纸”两门选修课.为了了解选择“书法”或“剪纸”是否与性别有关,调查了高二年级1500名学生的选择倾向,随机抽取了100名,统计选择两门课程人数如下表.
选书法
选剪纸
合计
男生
40
50
女生
合计
30
(1)补全列联表;
(2)根据小概率值的独立性检验,在犯错概率不超过的前提下,是否可以认为选择“书法”或值“剪纸”与性别有关?(计算结果保留到小数点后三位)参考公式:,其中.
0.100
0.050
0.025
2.706
3.841
5.024
【解题指导】(1)根据题意与表中数据计算即可补全列联表.
(2)根据题意求出,与临界值比较即可.
【规范答题】(1)根据题意,共抽取了100人,则补全列联表如表所示.
选书法
选剪纸
合计
男生
40
10
50
女生
30
20
50
合计
70
30
100
(2)设零假设:选择“书法”或值“剪纸”与性别无关.
由表中数据,可得,
根据小概率值的独立性检验,我们推断零假设不成立,
即能认为选择“书法”或值“剪纸”与性别有关,此推断犯错的概率不超过.
2.(2025·北京朝阳一模)2018年8月16日,中共中央政治局常务委员会召开会议,听取关于吉林长春长生公司问题疫苗案件调查及有关问责情况的汇报,中共中央总书记习近平主持会议并发表重要讲话.会议强调,疫苗关系人民群众健康,关系公共卫生安全和国家安全.因此,疫苗行业在生产、运输、储存、使用等任何一个环节都容不得半点瑕疵.国家规定,疫苗在上市前必须经过严格的检测,并通过临床实验获得相关数据,以保证疫苗使用的安全和有效.某生物制品研究所将某一型号疫苗用在动物小白鼠身上进行科研和临床实验,得到统计数据如下:
未感染病毒
感染病毒
总计
未注射疫苗
40
注射疫苗
60
总计
100
100
200
现从未注射疫苗的小白鼠中任取1只,取到“感染病毒”的小白鼠的概率为.
(1)求列联表中的数据,,,的值;
(2)能否有把握认为注射此种疫苗有效?请说明理由;
(3)在感染病毒的小白鼠中,按未注射疫苗和注射疫苗的比例抽取5只进行病例分析,然后从这五只小白鼠中随机抽取3只对注射疫苗情况进行核实,记为3只中未注射疫苗的小白鼠的只数,求的分布列和期望.
附:,.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
【解题指导】(1)根据已知条件,结合频率与频数的关系,以及列联表之间的数据关系,即可求解.
(2)根据已知条件,结合独立性检验公式,即可求解.
(3)通过比例可知抽取的5只小白鼠中,有3只未注射疫苗,2只已注射疫苗,从中抽取3只,则的可能取值为1,2,3,分别求出对应的概率,再结合期望公式,即可求解.
【规范答题】(1)从未注射疫苗的小白鼠中任取1只,取到“感染病毒”的小白鼠的概率为,
,解得,
则,,.
(2),
没有把握认为注射此种疫苗有效.
(3)由于在感染病毒的小白鼠中,未注射疫苗和注射疫苗的比例为,
故抽取的5只小白鼠中,有3只未注射疫苗,2只已注射疫苗,
从中抽取3只,
则的可能取值为1,2,3,
,,,
故的分布列为:
1
2
3
故期望为.
题型三:条件概率
12.(2024·北京顺义·三模)习近平总书记高度重视体育运动的发展,将体育与国家发展、民族振兴紧密联系在一起,多次强调体育“是实现中国梦的重要内容”“体育强则中国强,国运兴则体育兴”,为了响应总书记的号召,某中学组织全体学生开展了丰富多彩的体育实践活动.为了解该校学生参与活动的情况,随机抽取100名学生作为样本,统计他们参加体育实践活动时间(单位:分钟),得到下表:
时间人数类别
性别
男
5
12
13
8
9
8
女
6
9
10
10
6
4
学段
初中
10
高中
4
13
12
7
5
4
(1)从该校随机抽取1名学生,若已知抽到的是女生,估计该学生参加体育实践活动时间在的概率;
(2)从该校参加体育实践活动时间在学生中随机抽取2人,在的学生中随机抽取1人,求其中至少有1名初中学生的概率;
(3)假设同组中每个数据用该组区间中点值代替,样本中的100名学生参加体育实践活动时间的平均数记为,初中、高中学生参加体育实践活动时间的平均数分别记为,,试比较与的大小关系.(结论不要求证明)
【解题指导】(1)根据条件概率公式求解即可;
(2)根据相互独立事件同时发生的概率公式求解即可;
(3)补全初中段的人数表格,再分别计算,即可得解.
【规范答题】(1)女生共有人,
记事件A为“从所有调查学生中随机抽取1人,女生被抽到”,
事件B为“从所有调查学生中随机抽取1人,参加体育活动时间在”,
由题意可知,,
因此,
所以从该校随机抽取1名学生,若已知抽到的是女生,
估计该学生参加体育活动时间在的概率为.
(2)时间在的学生有人,
活动时间在的初中学生有人,
记事件C为“从参加体育活动时间在的学生中随机抽取2人,抽到初中学生”,
事件D为“从参加体育活动时间在的学生中随机抽取1人,抽到的是初中学生”,
由题意知,事件C,D相互独立,
且利用频率估计概率,,
所以至少有1名初中学生的概率;
(3)根据男女生人数先补全初中学生各区间人数:
时间人数类别
性别
男
5
12
13
8
9
8
女
6
9
10
10
6
4
学段
初中
7
8
11
11
10
8
高中
4
13
12
7
5
4
初中生的总运动时间,
高中生的总运动时间,
又,,,
可得由.
条件概率问题,解题的思路是:
1、识题:一般地,设A,B为两个随机事件,且P(A)>0,我们称P(B|A)=为在事件A发生的条件下,事件B发生的条件概率
2、研究方向及步骤:条件概率揭示了P(A),P(AB),P(B|A)三者之间“知二求一”的关系
由条件概率的定义,对任意两个事件A与B,若P(A)>0,则P(AB)=P(A)P(B|A).我们称上式为概率的乘法公式.利用定义计算条件概率的步骤
(1)分别计算概率P(AB)和P(A).
(2)将它们相除得到条件概率P(B|A)=,这个公式适用于一般情形,其中AB表示A,B同时发生.
3、必备知识:条件概率的性质设P(A)>0,则
(1)P(Ω|A)=1;(2)如果B与C是两个互斥事件,则P((B∪C)|A)=P(B|A)+P(C|A);
(3)设和B互为对立事件,则P( )=1-P(B).
1.(2025·北京海淀·三模)某社区计划组织一次公益讲座向居民普及垃圾分类知识,为掌握居民对垃圾分类知识的了解情况并评估讲座的效果,主办方从全体居民中随机抽取10位参加试讲讲座活动,让他们在试讲讲座前后分别回答一份垃圾分类知识问卷.试讲讲座前后,这10位居民答卷的正确率如下表:
编号正确率
1号
2号
3号
4号
5号
6号
7号
8号
9号
10号
试讲讲座前
65%
60%
0%
100%
65%
75%
90%
85%
80%
60%
试讲讲座后
90%
85%
80%
95%
85%
85%
95%
100%
85%
90%
根据居民答卷的正确率可以将他们垃圾分类的知识水平分为以下三个层级:
答卷正确率p
垃圾分类知识水平
一般
良好
优秀
假设每位居民回答问卷的结果之间互相独立,用频率估计概率.
(1)正式讲座前.从该社区的全体居民中随机抽取1人,试估计该居民垃圾分类知识水平恰为“一般”的概率;
(2)正式讲座前,从该社区的全体居民中随机抽取3人,这3人垃圾分类知识水平分别是“一般”、“良好”、“良好”.设随机变量X为“这3人讲座后垃圾分类知识水平达到‘优秀’、的人数”,试估计X的分布列和数学期望;
(3)在未参加讲座的全部居民中再随机抽取若干人参加下一轮的公益讲座并让他们在讲座前后分别填写问卷.从讲座后的答卷中随机抽取一份,如果完成该答卷的居民的知识水平为“良好”,他在讲座前属于哪一知识水平的概率最大?(结论不要求证明)
【解题指导】(1)先根据给出的数据,求出居民垃圾分类知识水平恰为“一般”的频率,可估计相关的概率.
(2)先明确正式讲座前,垃圾分类水平为“一般”和 “良好”的人在试讲讲座后达到“优秀”的概率,再求对应的概率,可得的分布列,并求其期望.
(3)利用条件概率求解判断.
【规范答题】(1)正式讲座前,10位选取的居民中,垃圾分类知识水平为“一般”的人数为5人,所以垃圾分类知识水平位“一般”的频率为:,
所以估计居民垃圾分类知识水平恰为“一般”的频率为:.
(2)由表中提供的数据可得:正式讲座前,垃圾分类知识水平为“一般”的人在讲座后,达到“优秀”的概率估计为:;
正式讲座前,垃圾分类知识水平为“良好”的人在讲座后,达到“优秀”的概率估计为:.
由题意,的值可以为:0,1,2,3
且:,
.
所以的分布列为:
0
1
2
3
所以.
(3)从未参加讲座的居民中抽取1人,垃圾分类水平为“一般”记为事件,则,讲座后,知识水平为“良好”的概率估计为;
从未参加讲座的居民中抽取1人,垃圾分类水平为“良好”记为事件,则,讲座后,知识水平为“良好”的概率估计为;
从未参加讲座的居民中抽取1人,垃圾分类水平为“优秀”记为事件,则,讲座后,知识水平为“良好”的概率估计为;
从参加讲座后的居民中抽取1人,垃圾分类水平为“良好”记为事件,则.
因为,,.
所以他在讲座前属于“一般”知识水平的概率最大.
2.(2025·北京海淀·三模)某汽车专卖店试销A,B,C三种品牌的新能源汽车,销售情况如下表所示:
第一周
第二周
第三周
第四周
A品牌数量(台)
11
10
15
B品牌数量(台)
14
9
13
C品牌数量(台)
6
11
12
(1)从前三周随机选一周,若A品牌销售量比C品牌销售量多,求A品牌销售量比B品牌销售量多的概率;
(2)为跟踪调查新能源汽车的使用情况,根据销售记录,从该专卖店第二周和第三周售出的新能源汽车中分别随机抽取一台.求抽取的两台汽车中A品牌的台数X的分布列和数学期望;
(3)直接写出一组的值,使得表中每行数据方差相等.
【规范答题】(1)根据给定条件,利用条件概率的公式计算作答;
(2)求出的可能取值,分别计算其概率,列出分布列,求出数学期望作答;
(3)利用方差的计算公式,结合题干中每组数据,将每组数据补成两对相邻数据,且和能被4整除的数即可.
【解题指导】(1)记事件为“品牌销售量比品牌多”,则,
记事件为“品牌销售量比品牌多”,则,
所以若品牌销售量比品牌多,品牌销售量比品牌多的概率为.
(2)依题意,在第二周抽取品牌的概率为,第三周抽取品牌的概率为,
的可能取值为0,1,2,
则,,,
所以的分布列为:
0
1
2
数学期望.
(3)由方差,且表中每行方差相等,得:
,,
,,
,,
观察数据:第一组15,11,10,;第二组:14,13,9,;第三组:12,11,6,,
将每组数据补成两对相邻数据,且和能被4整除,即,
此时,,
,于是,
所以是满足题意的一组值.
题型四:二项分布与超几何分布
(2025·北京丰台·二模)为调查某校学生户外活动时长和视力的关系,某研究小组在该校随机选取了100名学生,记录他们的日均户外活动时长(单位:小时)及近视情况,统计得到:日均户外活动时长在区间内有70人,近视率为;日均户外活动时长在区间内有20人,近视率为;日均户外活动时长在区间内有10人,近视率为.
注:近视率是指某区间内近视人数与该区间内人数的比值.
(1)估计该校日均户外活动时长不低于1小时的学生的近视率;
(2)用频率估计概率.从该校日均户外活动时长低于1小时的学生和不低于1小时的学生中各随机选取2名,求这4名学生中恰有2名近视的概率;
(3)为响应国家降低青少年近视率的号召,该校提出“护眼有妙招,科学动起来”的口号,计划在以下2项措施中选择1项实施.
措施一:每日给全校学生增设0.5小时晨跑活动;
措施二:每日给日均户外活动时长低于1小时的学生增设1小时户外活动.假设所有学生都能按要求参加相应活动,记采取措施一后该校全体学生的日均户外活动时长的平均值为,采取措施二后该校全体学生的日均户外活动时长的平均值为.用样本估计总体,试比较与的大小.(结论不要求证明)
【解题指导】(1)根据题意求相应人数和频率,即可得结果;
(2)分析可知从该校日均户外活动时长低于1小时、不低于1小时的学生中随机选取1名,这名学生近视的概率为、,结合独立事件概率乘法公式运算求解;
(3)根据题意结合加权平均数公式分别求,比较大小即可得结果.
【规范答题】(1)由题意,样本中日均户外活动时长不低于1小时的学生有人,
其中近视的学生有人,
所以估计该校日均户外活动时长不低于1小时学生的近视率为.
(2)设事件“从该校日均户外活动时长低于1小时的学生和不低于1小时的学生中各随机选取2名,这4名学生中恰有2名近视”.
由题意,从该校日均户外活动时长低于1小时的学生中随机选取1名,这名学生近视的概率为,
从该校日均户外活动时长不低于1小时的学生中随机选取1名,这名学生近视的概率为.
则.
(3)由题意可知:日均户外活动时长在区间内的频率为;日均户外活动时长在区间内的频率为;日均户外活动时长在区间内的频率为,
则原数据的平均数为,
采取措施一后,该校全体学生的日均户外活动时长的平均值为;
采取措施二后,该校全体学生的日均户外活动时长的平均值为;
因为,所以.
二项分布问题,解题的思路是:
1、识题.
n重伯努利试验具有如下共同特征
(1)同一个伯努利试验重复做n次;(2)各次试验的结果相互独立.
2、研究方向
一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p(0<p<1),用X表示事件A发生的次数,则X的分布列为:记作X~B(n,p).
3、 必备知识:一般地,可以证明:如果X~B(n,p),那么E(X)=np,D(X)=np(1-p).
超几何分布问题,解题的思路是:
1、识题:超几何分布模型是一种不放回抽样
2、研究方向:一般地,假设一批产品共有N件,其中有M件次品,从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为,k=m,m+1,m+2,…,r.
其中n,N,M∈N* ,M≤N,n≤N,m=max{0,n-N+M},r=min{n,M}.如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布.
3、必备知识:超几何分布的期望E(X)==np(p为N件产品的次品率).
1.(2025·北京石景山·期中)在新型冠状病毒疫情期间,某高中学校实施线上教学,为了解线上教学的效果,随机抽取了100名学生对线上教学效果进行评分(满分100分),记低于80的评分为“效果一般”,不低于80分为“效果较好”
(1)根据所给数据完成下列表格;
效果一般
效果较好
合计
男
25
45
女
40
合计
(2)用(1)中表格的数据估计全校线上教学的效果,用频率估计概率.从该校学生中任意抽取3人,记所抽取的3人中认为线上教学“效果一般”的人数为X,求X的分布列和数学期望及方差.
【解题指导】(1)根据题设完善数据表即可;
(2)由题设知,应用二项分布概率公式求对应概率并写出分布列,再由二项分布期望、方差公式求期望及方差.
【规范答题】(1)由题设,表格如下:
效果一般
效果较好
合计
男
25
20
45
女
15
40
55
合计
40
60
100
(2)由(1)知:抽到认为效果一般的学生为,则,
所以,,
,,
的分布列为
0
1
2
3
,.
2.(2025·北京大兴·三模)为测试、两款人工智能软件解答数学问题的能力,将100道难度相当的数学试题从1到100编号后随机分配给这两款软件测试.每道试题只被一款软件解答一次,记录结果如下:
试题类别
软件
软件
测试试题数量
正确解答的数量
测试试题数量
正确解答的数量
函数试题
30
24
20
18
几何试题
20
16
30
20
(1)估计软件能正确解答数学问题的概率;
(2)小明决定采用这两款软件解答3道类似试题(假设其难度和测试的100道题基本相同),其中函数2道,几何1道;使用软件解答2道函数试题,使用软件解答1道几何试题;每道试题只用其中一款软件解答一次.假设用频率估计概率,且每次解答相互独立.用表示3道类似试题被正确解答的个数,求的分布列与数学期望;
(3)小明准备用这两款软件来解决某次数学测试中的第12题(假设其难度和测试的100道题基本相同),但该题内容还未知,从已往情况来看,该题是函数题的概率为,几何题的概率为.假设用频率估计概率,试说明小明用哪款软件正确解答这道试题的概率大?(结论不要求证明)
【解题指导】(1)由古典概型概率计算公式即可求解;
(2)法一:确定的每一个取值,求得对应概率即可求解;法二:用、分别表示这2道函数试题与1道几何试题被正确解答的个数,得到,,再由即可求解;
(3)记“软件能正确解答这道题”为事件,“软件能正确解答这道题”为事件,
由全概率计算公式求得比较大小即可.
【规范答题】(1)记软件能正确解答数学问题为事件,
结合题中数据以及古典概型的概率公式可得.
(2)解法一:使用软件解答函数试题正确的概率为,
使用软件解答几何试题正确的概率为;
的可能取值为0、1、2、3,
,
,
,
,
则其分布列为:
0
1
2
3
其期望为:;
解法二:函数试题用软件解答,几何试题用软件解答.
用、分别表示这2道函数试题与1道几何试题被正确解答的个数,
因为,,
0
1
2
0
1
的可能取值为0、1、2、3,
,,
,,
则其分布列为:
0
1
2
3
由二项分布的期望公式可得,
因为,相互独立,则
.
(3)小明应该使用软件来解决这道试题.
记“软件能正确解答这道题”为事件,“软件能正确解答这道题”为事件,
“该题为几何题”为事件.
则,,,
,,,
由全概率公式可得
.
.
因为,所以软件能够正确解决这道试题的概率更大,
故小明应该使用软件来解决这道试题.
题型五:分布列、均值与方差
(2025·北京朝阳·三模)某老师为了解班里甲、乙两位同学的数学学习情况,从他们的数学小练习成绩中各随机抽取10份,.获得数据如下表:
甲同学
8
6.5
6
6
7.5
8
8
5.5
9
7.5
乙同学
6
7
7
7.5
7.5
8.5
9
7
9.5
9
已知数学小练习满分为10分,最低分为0分.若小练习得分不低于7.5分视为“得分达到良好”,若小练习得分不低于8.5分视为“得分达到优秀”. 假设用频率估计概率,且甲和乙小练习成绩相互独立.
(1)从甲同学的样本中随机抽取1个,求“得分达到良好”的概率;
(2)从乙同学的所有数学小练习成绩中随机抽取 3 份,记随机变量X为“得分达到优秀”的次数.估计X的分布列和期望:
(3)样本中,甲、乙两位同学小练习成绩的方差分别为记为和,试比较和的大小(结论不要求证明).
【解题指导】(1)先算出甲同学“得分达到良好”的个数,再利用古典概型求解即可;
(2)先算出乙同学“得分达到优秀”的个数,用样本估计总体,发现X服从二项分布,计算相关情况概率,写出分布列并计算期望;
(3)分别求出甲乙样本的均值与方差比较即可.
【规范答题】(1)根据题意甲同学“得分达到良好”的有:8,7.5,8,8,9,7.5共6个,
所以从甲同学的样本中随机抽取1个,求“得分达到良好”的概率为.
(2)乙同学“得分达到优秀”的有:8.5,9,9.5,9共4个,
所以乙同学所以数学小练习中“得分达到优秀”的概率为,
从中随机抽取3份,随机变量X服从二项分布,
,,
,,
所以分布列为
X
0
1
2
3
P
期望.
(3)根据题意样本中甲同学成绩的均值
,
乙同学成绩的均值,
所以甲同学成绩的方差,
乙同学成绩的方差,
所以甲、乙两位同学小练习成绩的方差相等.
离散型随机变量及其分布列问题,解题的思路是:
1、 明确随机变量x可能取到的值并求出每一种情况下的概率
2、 写出离散型随机变量的分布列
(1)离散型随机变量的分布列
一般地,设离散型随机变量X的可能取值为 x1,x2,…,xn ,我们称X取每一个值xi的概率P(X=xi)=pi,i=1,2,…,n为X的概率分布列,简称为分布列.
(2)可以用表格来表示X的分布列,如下表
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
还可以用图形表示,如下图直观地表示了掷骰子试验中掷出的点数X的分布列,称为X的概率分布图.
3、必备知识:离散型随机变量的分布列的性质
(1)pi≥0,i=1,2,…,n;(2) p1+p2+…+pn=1.
1.(2025·安徽合肥·三模)某城市推广垃圾分类,设置智能回收箱(方式)和传统垃圾桶(方式).统计显示,60%的居民选择方式,选择方式,若垃圾被正确分类,则垃圾被回收,不用填埋.智能回收箱的正确分类率为,错误分类后需人工处理,人工处理可将错误分类垃圾的40%重新正确分类,其余直接填埋;传统垃圾桶的正确分类率为75%,错误分类后直接填埋.
(1)求垃圾最终被填埋的概率;
(2)若某吨垃圾被填埋,求其最初通过传统垃圾桶投放的概率;
(3)现有一吨垃圾要整体处理,设为其处理成本(单位:元),正确分类无需成本,人工处理成本为200元,填埋成本为500元.求的分布列及数学期望.
【解题指导】(1)根据全概率公式即可求解;
(2)根据条件概率公式即可求解;
(3)由题意,的可能取值为0,200,500,700,分别求得对应概率,即可得出分布列及数学期望.
【规范答题】(1)记为事件“垃圾按照方式分类”,为事件“垃圾最终被填埋”,
则.
(2)由题意得,.
(3)由题意,的可能取值为0,200,500,700,
且,
,
,
,
故分布列如下:
0
200
500
700
0.81
0.036
0.1
0.054
.
2.(2025·北京朝阳·一模)某高中组织学生研学旅行.现有A,B两地可供选择,学生按照自愿的原则选择一地进行研学旅行.研学旅行结束后,学校从全体学生中随机抽取100名学生进行满意度调查,调查结果如下表:
高一
高二
高三
A地
B地
A地
B地
A地
B地
满意
12
2
18
3
15
6
一般
2
2
6
5
6
8
不满意
1
1
6
2
3
2
假设所有学生的研学旅行地点选择相互独立.用频率估计概率.
(1)估计该校学生对本次研学旅行满意的概率;
(2)分别从高一、高二、高三三个年级中随机抽取1人,估计这3人中至少有2人选择去B地的概率;
(3)对于上述样本,在三个年级去A地研学旅行的学生中,调查结果为满意的学生
人数的方差为,调查结果为不满意的学生人数的方差为,写出和的大小关系.`(结论不要求证明)
【解题指导】(1)利用频率估计概率即可求解;
(2)利用频率估计概率即可求解,结合相互独立事件的概率公式求解即可;
(3)求出,,比较大小即可.
【规范答题】(1)从表格数据可知,随机抽取的100名学生对本次研学旅行满意的人数为
,
因此该校学生对本次研学旅行满意的概率可估计为.
(2)设事件:抽取的高一学生选择去B地,
事件:抽取的高二学生选择去B地,
事件:抽取的高三学生选择去B地,
事件:抽取的3人中恰有人选择去B地,,
事件:抽取的3人中至少有2人选择去B地.
从数据表格可知,抽取的100名学生中高一年级学生总数为,
选择去B地的总数为,所以可估计为;
抽取的100名学生中高二年级学生总数为,
选择去B地的总数为,所以可估计为;
抽取的100名学生中高三年级学生总数为,
选择去B地的总数为,所以可估计为;
因为,
所以
.
所以抽取的3人中至少有2人选择去地的概率可估计为
.
(3)在三个年级去A地研学旅行的学生中,
调查结果为满意的学生人数的平均数为,
则调查结果为满意的学生人数的方差为,
调查结果为不满意的学生人数的平均数为,
则调查结果为不满意的学生人数的方差为,
则.
1.(25-26高三上·四川南充·月考)近几年,新能源汽车的更新换代越来越引起人们的关注.某新能源车企想了解年轻司机与中老年司机对新能源车和燃油车的喜好程度,随机抽取了1000名司机,得到的列联表如下:
偏好新能源车
偏好燃油车
总计
年轻司机
300
200
500
中老年司机
200
300
500
总计
500
500
1000
(1)若从抽取的年轻司机中任选1人,求此人偏好新能源车的概率;
(2)依据的独立性检验,能否认为司机对两种汽车的偏好与年龄有关联?
附:,其中.
0.01
0.005
0.001
6.635
7.879
10.828
【分析】(1)根据古典概型计算概率即可;
(2)由公式求得,结合表格数据对比判断即可.
【详解】(1)由题意知年轻司机中,偏好新能源车的有300人,偏好燃油车的有200人,
所以从抽取的年轻司机中任选1人,此人偏好新能源车的概率为.
(2)零假设为:司机对两种汽车的偏好与年龄无关,
由表中的数据,得
依据小概率值的独立性检验,我们推断不成立,
所以能够认为司机对两种汽车的偏好与年龄有关联.
2.(2025·四川德阳·二模)2024年7月26日,第33届夏季奥林匹克运动会在法国巴黎开幕,足球作为其中的一项团队运动项目,风䨾世界,深受大众喜欢,为了解喜爱足球运动是否与性别有关,随机抽取了男性和女性观众各100名进行调查,得到如下列联表.
喜爱足球运动
不喜爱足球运动
合计
男性
60
40
100
女性
30
70
100
合计
90
110
200
(1)判断是否有的把握认为喜爱足球运动与性别有关;
(2)用样本分布的频率估计总体分布的概率,若现在从喜爱足球运动的观众中随机抽取3名,记男性的人数为,求事件的分布列和数学期望;
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
附:.
【分析】(1)先设零假设,再计算与临界值比较即可判断;
(2)应用二项分布得出概率,再计算数学期望即可.
【详解】(1)零假设:喜爱足球运动与性别无关.
由题,
根据小概率值的独立性检验,我们推断不成立.
即有的把握认为喜爱足球运动与性别有关.
(2)由题童可得从喜爱足球运动的观众中随机抽取一人.其为男性的概率为,
故,
0
1
2
3
3.(2025·四川雅安·三模)同城配送是随即时物流发展而出现的非标准化服务,省时省力是消费者使用同城配送服务的主要目的.某同城配送服务公司随机统计了800名消费者的年龄(单位:岁)以及每月使用同城配送服务的次数,得到每月使用同城服务低于5次的有550人,并将每月使用同城配送服务次数不低于5次的消费者按照年龄进行分组,得到如图所示的频率分布直方图.
(1)估计每月使用同城配送服务不低于5次的消费者年龄的平均值和中位数(结果精确到0.1,每组数据用该组区间的中点值代表);
(2)若年龄在内的人位于年龄段,年龄在内的人位于年龄段II,把每月使用同城配送服务低于5次的消费者称为“使用同城配送服务频率低”,否则称为“使用同城配送服务频率高”,若800名消费者中有400名在年龄段I,补全列联表,并判断是否有的把握认为消费者使用同城配送服务频率的高低与年龄段有关?
年龄段I
年龄段II
合计
使用同城配送服务频率高
使用同城配送服务频率低
合计
参考公式:,其中.附:
0.050
0.010
0.001
3.841
6.635
10.828
【分析】(1)根据频率分布直方图中的平均数和中位数求解公式求解即可;
(2)根据题目数据完善列联表,计算卡方,与临界值比较即可判断.
【详解】(1)每月使用同城配送服务不低于5次的消费者年龄的平均数为
设每月使用同城配送服务不低于5的消费者年龄的中位数为,
则,解得.
(2)补全的列联表如下:
年龄段I
年龄段II
合计
使用同城配送服务频率高
145
105
250
使用同城配送服务频率低
255
295
550
合计
400
400
800
所以.
所以,有的把握认为同城配送服务的使用频率高低与年龄段有关.
4.(2025·北京大兴·三模)某地区教育研究部门为了解当前本地区中小学教师在教育教学中运用人工智能的态度、经验、困难等情况,从该地区2000名中小学教师中随机抽取100名进行了访谈.在整理访谈结果的过程中,统计他们对“人工智能助力教学”作用的认识,得到的部分数据如下表所示:
假设用频率估计概率,且每位教师对“人工智能助力教学”作用的认识相互独立.
(1)估计该地区中小学教师中认为人工智能对于教学“没有帮助”的人数;
(2)对受访教师关于“人工智能助力教学”的观点进行赋分:“没有帮助”记0分,“有一些帮助”记2分,“很有帮助”记4分.
①从该地区男教师中抽取4名教师,求这4名教师得分总和为8分的概率;
②统计受访教师的得分,将这100名教师得分的平均值记为,其中年龄在40岁以下(含40岁)教师得分的平均值记为,年龄在40岁以上教师得分的平均值记为,请直接写出的大小关系.(结论不要求证明)
【分析】(1)首先完善表格,然后求出抽取的100人中认为人工智能对于教学“没有帮助”的频率,最后即可计算该地区中小学教师中认为人工智能对于教学“没有帮助”的人数;
(2)对于①,首先求出男教师认为人工智能对于教学“没有帮助”、“有一些帮助”、“很有帮助”的概率,然后确定4名教师得分总和为8分的情况并计算出概率;对于②,首先根据平均值公式求出,然后比较它们的关系即可.
【详解】(1)根据表格中数据,完善表格,
可以得到100名教师中,认为人工智能对于教学“没有帮助”的频率为,用频率估计概率,估计该地区中小学教师中认为人工智能对于教学“没有帮助”的人数为;
(2)①男教师认为人工智能对于教学“没有帮助”的概率为,
男教师认为人工智能对于教学“有一些帮助”的概率为,
男教师认为人工智能对于教学“很有帮助”的概率为,
因为,
所以
.
②,
,
,
因为,所以.
5.(2025·北京平谷·一模)某科研团队研发了一款快速检测某种疾病的试剂盒.为了解该试剂盒检测的准确性,科研团队从某地区(人数众多)随机选取了40位患者和60位非患者,用该试剂盒分别对他们进行了一次检测,结果如下:
抽样人群
阳性人数
阴性人数
患者
36
4
非患者
2
58
(1)试估计使用该试剂盒进行一次检测结果正确的概率;
(2)若从该地区的患者和非患者中分别抽取2人进行一次检测,求恰有一人检测结果错误的概率;
(3)假设该地区有10万人,患病率为0.01.从该地区随机选取一人,用该试剂盒对其检测一次.若检测结果为阳性,能否判断此人患该疾病的概率超过0.2?并说明理由.
【分析】(1)由古典概型概率计算公式求解即可;
(2)设事件:患者检测结果正确,事件:非患者检测结果正确“,事件:该地区的患者和非患者中分别抽取2人进行一次检测,恰有一人检测结果错误,由求解即可;
(3)求得检测一次结果为阳性的人数,确定其中患者人数,即可判断;
【详解】(1)由题意知,使用该试剂盒进行一次检测共有100人,其中检测结果正确的共有94人,
所以使用该试剂盒进行一次检测结果正确的概率估计为.
(2)设事件:患者检测结果正确,事件:非患者检测结果正确“,
事件:该地区的患者和非患者中分别抽取2人进行一次检测,恰有一人检测结果错误;
根据题中数据,可估计为可估计为
该地区的患者中抽取2人进行一次检测,恰有一人检测结果错误的概率为
该地区的非患者中抽取2人进行一次检测,恰有一人检测结果错误的概率为
所以,
所以.
因此恰有一人检测结果错误的概率为
(3)此人患该疾病的概率超过0.2.理由如下:
由题意得,如果该地区所有人用该试剂盒检测一次,
那么结果为阳性的人数为,其中患者人数为900.
若某人检测结果为阳性,那么他患该疾病的概率为.
6.(2025·北京·三模)2023年山东淄博以烧烤文化火出了圈.为了解游客在淄博吃烧烤的消费情况,某记者随机采访了15位游客,他们分别来自A、、三个地区.现将这15位游客一顿烧烤的人均消费金额数据记录如下表(单位:元).
A
32 68 86
57 70 78 91
66 77 79 80 80 81 83 94
假设所有游客消费金额相互独立.
(1)据人流量监测数据显示,五一假期中的某日有超过16万游客“进淄赶烤”.估计其中来自A地区的游客人数;
(2)从来自A地区和地区的游客中各随机选取一人,记为选出的两人中一顿烧烤的人均消费金额大于70元的人数,估计的数学期望;
(3)从样本中来自A、、三个地区的游客中各随机选取一人,记这三人一顿烧烤的人均消费金额分别为,写出方差的大小关系.(结论不要求证明)
【分析】(1)根据A地区的游客人数所占比例计算即可;
(2)写出的所有可能并求得所对应的概率得到分布列然后按照期望公式计算即可;
(3)分别得到分布列,然后计算方差,根据数据比较即可.
【详解】(1)由题意,随机采访的15位游客中有3人来自A地区,
估计16万游客中来自A地区的游客人数为.
(2)从来自A地区和地区的游客中各随机选取一人,其一顿烧烤的人均消费金额大于70元的概率分别约为和.
的可能取值为0,1,2,,
,,
所以,的分布列为:
0
1
2
数学期望.
(3)由题可知:的所有可能结果为:32,68,86,选到的概率均为,
所以的分布列为:
32
68
86
P
所以,;
的所有可能结果为:57,70,78,91,选到的概率均为,
所以的分布列为:
57
70
78
91
P
,
的所有可能结果为:66,77,79,80, 81,83,94,
所以的分布列为:
66
77
79
80
81
83
94
P
,,所以.
7.(2025·北京昌平·二模)在探索数智技术赋能学科学习的过程中,某中学鼓励学生使用某听说平台进行英语口语自主练习.该中学有初中生1200人,高中生800人.为了解全校学生近一个月内使用此听说平台进行英语口语自主练习的次数,从全校学生中随机抽取200名学生进行问卷调查,将他们的使用次数按照,,,,,五个区间进行分组,所得样本数据如下表:
使用次数分组区间
初中生人
高中生人
4
3
38
29
48
28
17
6
3
假设每个学生是否使用此听说平台进行英语口语自主练习相互独立.用频率估计概率.
(1)估计近一个月内全校学生中使用此听说平台进行英语口语自主练习的次数不低于30次的总人数;
(2)从上面参与问卷调查且使用此听说平台进行英语口语自主练习次数不足10次的学生中随机抽取3人,记为这3人中高中生的人数,求的分布列和数学期望;
(3)从该校初中生和高中生中各随机抽取8名学生进行调查,设其中初中生和高中生使用此听说平台进行英语口语自主练习次数位于的人数分别为和,比较与的大小.(结论不要求证明)
【分析】(1)根据频数分布表,结合分层抽样的定义进行求解即可;
(2)根据古典型概率公式,结合数学期望的公式进行求解即可;
(3)根据二项分布求得方差判断即可.
【详解】(1)根据题中数据,,得.
样本中使用此听说平台进行英语口语自主练习的次数不低于30次的频率为.
因此近一个月内全校学生中使用此听说平台进行英语口语自主练习的次数不低于30次的总人数估计为:.
(2)参与问卷调查且使用此听说平台进行英语口语自主练习次数不足10次的学生中,初中生有4人,高中生有3人.
所以的取值范围为.
所以的分布列为
0
1
2
3
的数学期望.
(3),理由如下:
根据分层抽样定义知,随机抽取200名学生中,初中生为120名,高中生为80名,
抽到初中生使用此听说平台进行英语口语自主练习次数位于的频率为,
抽到高中生使用此听说平台进行英语口语自主练习次数位于的频率为,
该校初中生和高中生中各随机抽取8名学生中英语口语自主练习次数位于的人数服从二项分布,
即,
所以,,
因为,所以.
8.(2025·北京通州·一模)某艺术研究中心对春节档6部影片观众满意度进行调查,评分如下
第一部
第二部
第三部
第四部
第五部
第六部
普通观众评分
87.2
85.4
84.9
84.9
84.7
83.6
专业观众评分
88.7
80.0
81.6
77.4
76.1
72.2
(1)从这6部影片中随机选取1部,恰好选到普通观众评分与专业观众评分都低于85分的影片的概率;
(2)现有4名观众,每位观众从这6部影片中各随机选取1部观看.
(ⅰ)若不同观众可选相同影片(假设每位观众的选择相互独立),记X为选到普通观众评分与专业观众评分都低于85分的影片的人数,求X的分布列及数学期望.
(ⅱ)若任意2名观众不能选看相同影片,记Y为选到普通观众评分与专业观众评分都低于85分的影片的人数,试比较这种情况下数学期望与(ⅰ)中的大小关系,(结论不要求证明)
【分析】(1)运用古典概型概率公式计算;
(2)(ⅰ)中求的分布列就是确定的所有可能取值,结合二项分布求每个取值的概率.进而得到分布列和均值;(ⅱ)运用超几何分布求出,与比较即可.
【详解】(1)已知事件为“抽到的影片普通观众评分与专业观众评分都低于85分”,题中给出有部影片满足该条件,而影片总数为部.
根据古典概型概率公式,所以.
(2)(ⅰ)依题意,的可能取值为,,,,.因为每次抽取事件相互独立,且抽到普通观众评分与专业观众评分都低于85分的影片的概率为,共抽取次,所以服从参数,的二项分布,即.
根据二项分布概率公式可得:
,
, ,
,
,
列出的分布列:
.
(ⅱ)确定服从的分布及参数:6部影片中有4部普通观众评分与专业观众评分都低于85分的影片,4名观众任意2名观众不能选看相同影片,所以服从超几何分布,其中,,.
求:根据超几何分布的数学期望公式,可得.
比较大小:因为,,所以.
9.(2025·北京石景山·一模)某市在高中阶段举办“环保知识竞赛”,全体高中生参与了此次活动.现从参赛学生中随机抽取了男、女各30名学生,将他们的成绩(单位:分)按,,,,五个分数段进行分组,统计如下:
成绩
男生人数
3
6
11
8
2
女生人数
a
b
12
4
2
(1)在抽取的60名学生中,从成绩在80分及以上的学生中随机抽取2人,求恰好男、女生各1人,且2人分数段不同的概率;
(2)从该市参赛的男生中随机抽取4人,设成绩在80分及以上的人数为X,用频率估计概率,求X的分布列和数学期望;
(3)试确定a,b的值,使得抽取的女生成绩方差最小.(结论不要求证明)
【分析】(1)先确定成绩在80分及以上的男、女生人数,再利用组合数计算从这些学生中随机抽取2人,恰好男、女生各1人且分数段不同的概率,用到古典概型的概率公式;
(2)先求出从男生中随机抽取1人成绩在80分及以上的概率,判断随机变量X服从二项分布,然后根据二项分布的概率公式求出分布列,再根据期望公式求出数学期望;
(3)根据方差的性质,数据越集中方差越小,确定a,b的值.
【详解】(1)确定成绩在80分及以上的学生人数,男生中成绩在的有8人,在的有2人,共人;女生中成绩在的有4人,在的有2人,共人.所以成绩在80分及以上的学生共有人.
从这16人中随机抽取2人的总组合数为种.
要满足恰好男、女生各1人且分数段不同,分两种情况:
男生从选,女生从选,有种选法.
男生从选,女生从选,有种选法.
所以满足条件的选法共有种.
根据古典概型概率公式所求概率.
(2)从男生中随机抽取1人,成绩在80分及以上的概率为.
从该市参赛的男生中随机抽取4人,设成绩在80分及以上的人数为X,
因为每次抽取是相互独立的,且概率相同,所以X服从参数为,的二项分布,即.
根据二项分布的概率公式,可得:
.
.
.
.
.
所以X的分布列为:
X
0
1
2
3
4
P
根据二项分布的数学期望公式,可得.
(3)因为抽取的女生共30人,所以,即.
当数据越集中时方差越小,所以当时,抽取的女生成绩方差最小.
10.(2025·北京·模拟预测)某次测验满分为100分,A组和B组各有10人参加,成绩如下表:
A
76
78
83
84
85
90
92
95
98
99
B
63
72
73
75
80
81
84
85
92
99
对于该次测验,分数时为及格,分数分时为良好,成绩分时为优秀.
(1)从两组中任取1名学生,求该名学生成绩为良好的概率;
(2)从A组中随机抽取1名学生,再从B组中随机抽取1名学生.用随机变量X表示这两人的成绩为优秀的人数,求X的分布列和数学期望;
(3)从A、B两组中均随机抽取3人,A组成绩为76,83,92.已知B组抽出的3人中有2人的成绩为99,92,直接写出B组3人成绩方差比A组3人成绩方差小的概率,
【分析】(1)应用古典概型求解事件的概率即可;
(2)A组中优秀的学生有5人,再从B组中优秀的学生有2人,再根据超几何分布计算其概率,列出分布列,求期望;
(3)根据平均数与方差的计算公式,结合题意即可得出a的取值范围即可求出概率.
【详解】(1)由题意知,A组中良好的学生有5人,再从B组中良好的学生有7人,
从两组中任取1名学生,求该名学生成绩为良好的概率为.
因此,学生成绩为良好的概率为.
(2)根据题意得,A组中优秀的学生有5人,再从B组中优秀的学生有2人
X的可能取值为0,1,2.
则,,
所以X的分布列为:
X
0
1
2
P
因此,X的数学期望.
(3)A组成绩为成绩分别为76,83,92,平均值为,方差为,
B组抽出的3人中有2人的成绩为99,92, ,平均值为,
所以,
即,
代入检验,可知最小为84,最大,
故B组3人成绩方差比A组3人成绩方差小的概率为.
11.(24-25高三下·北京·月考)无人驾驶技术是汽车研发领域的一个重要方向.某学校技术俱乐部研发了一个感知路况障碍的小汽车模型,该模型通过三个传感器共同判断路段是否有路障.在对该模型进行测试中,该俱乐部同学寻找了个不同的路段作为测试样本,数据如下表:
测试
结果真实
路况
传感器1
传感器2
传感器3
有障碍
无障碍
无法识别
有障碍
无障碍
无法识别
有障碍
无障碍
无法识别
无障碍
4
15
1
1
15
4
8
12
0
有障碍
40
10
10
45
5
10
45
10
5
假设用频率估计概率,且三个传感器对路况的判断相互独立.
(1)从这80个路段中随机抽取一个路段,求传感器1对该路况判断正确的概率;
(2)从这80个路段中随机抽取一个有障碍的路段进行测试,设为传感器1和传感器2判断正确的总路段数,求的分布列和数学期望;
(3)现有一辆小汽车同时装载了以上3种传感器.在通过某路段时,只要3个传感器中一个判断有障碍或无法识别,则小汽车减速.那么是否可以通过提高传感器3的判断正确率,使得小汽车在无障碍的道路上减速的概率小于?(结论不要求证明)
【分析】(1)利用古典概型的概率公式可求得所求事件的概率;
(2)分析可知,随机变量的取值集合为,计算出随机变量在不同取值下的概率,可得出随机变量的分布列,进而可求得的值;
(3)计算出三个传感器判断无障碍的概率,比较大小后可得出结论.
【详解】(1)80个路段中,传感器1判断正确的路段有个.
设“传感器1对该路况判断正确”为事件,则.
(2)80个路段中共有60个有障碍的路段.60个有障碍的路段中,传感器1判断正确的路段有40个,
错误的有个,传感器2判断正确的路段有45个,判断错误的路段有个
的取值集合为.
,,
,
故的分布列为
随机变量的数学期望
(3)可以通过提高传感器3的判断正确率,使得小汽车在无障碍的道路上减速的概率小于.
分析:共有20个无障碍地路段,传感器1判断无障碍的有15个,
由频率估计概率,故无障碍路段上,估计传感器1判断无障碍的概率为.
传感2判断无障碍的有15个,由频率估计概率,故无障碍路段上,
估计传感器2判断无障碍的概率为.
若传感器3在无障碍路段上,判断为无障碍的概率为1.
小汽车在无障碍的道路上减速的概率:.
故可以通过提高传感器3的判断正确率,使得小汽车在无障碍的道路上减速的概率小于.
1.(2025·北京·高考真题)某次考试中,只有一道单项选择题考查了某个知识点,甲、乙两校的高一年级学生都参加了这次考试.为了解学生对该知识点的掌握情况,随机抽查了甲、乙两校高一年级各100名学生该题的答题数据,其中甲校学生选择正确的人数为80,乙校学生选择正确的人数为75.假设学生之间答题相互独立,用频率估计概率.
(1)估计甲校高一年级学生该题选择正确的概率
(2)从甲、乙两校高一年级学生中各随机抽取1名,设X为这2名学生中该题选择正确的人数,估计的概率及X的数学期望;
(3)假设:如果没有掌握该知识点,学生就从题目给出的四个选项中随机选择一个作为答案;如果掌握该知识点,甲校学生选择正确的概率为,乙校学生选择正确的概率为.设甲、乙两校高一年级学生掌握该知识点的概率估计值分别为,,判断与的大小(结论不要求证明).
【分析】(1)用频率估计概率即可求解;
(2)利用独立事件乘法公式以及互斥事件的加法公式可求恰有1人做对的概率及的分布列,从而可求其期望;
(3)根据题设可得关于的方程,求出其解后可得它们的大小关系.
【详解】(1)估计甲校高一年级学生该题选择正确的概率.
(2)设为“从甲校抽取1人做对”,则,,
设为“从乙校抽取1人做对”,则,,
设为“恰有1人做对”,故
依题可知,可取,
,,,
故的分布列如下表:
故.
(3)设为 “甲校掌握这个知识点的学生做该题”,
因为甲校掌握这个知识点则有的概率做对该题目,
未掌握该知识点的同学都是从四个选项里面随机选择一个,
故,即,故,
同理有,,故,
故.
2.(2024·北京·高考真题)某保险公司为了了解该公司某种保险产品的索赔情况,从合同险期限届满的保单中随机抽取1000份,记录并整理这些保单的索赔情况,获得数据如下表:
赔偿次数
0
1
2
3
4
单数
假设:一份保单的保费为0.4万元;前3次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.
(1)估计一份保单索赔次数不少于2的概率;
(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.
(i)记为一份保单的毛利润,估计的数学期望;
(ⅱ)如果无索赔的保单的保费减少,有索赔的保单的保费增加,试比较这种情况下一份保单毛利润的数学期望估计值与(i)中估计值的大小.(结论不要求证明)
【分析】(1)根据题设中的数据可求赔偿次数不少2的概率;
(2)(ⅰ)设为赔付金额,则可取,用频率估计概率后可求的分布列及数学期望,从而可求.
(ⅱ)先算出下一期保费的变化情况,结合(1)的结果可求,从而即可比较大小得解.
【详解】(1)设为“随机抽取一单,赔偿不少于2次”,
由题设中的统计数据可得.
(2)(ⅰ)设为赔付金额,则可取,
由题设中的统计数据可得,
,,
,
故
故(万元).
(ⅱ)由题设保费的变化为,
故(万元),
从而.
3.(2023·北京·高考真题)为研究某种农产品价格变化的规律,收集得到了该农产品连续40天的价格变化数据,如下表所示.在描述价格变化时,用“+”表示“上涨”,即当天价格比前一天价格高;用“-”表示“下跌”,即当天价格比前一天价格低;用“0”表示“不变”,即当天价格与前一天价格相同.
时段
价格变化
第1天到第20天
-
+
+
0
-
-
-
+
+
0
+
0
-
-
+
-
+
0
0
+
第21天到第40天
0
+
+
0
-
-
-
+
+
0
+
0
+
-
-
-
+
0
-
+
用频率估计概率.
(1)试估计该农产品价格“上涨”的概率;
(2)假设该农产品每天的价格变化是相互独立的.在未来的日子里任取4天,试估计该农产品价格在这4天中2天“上涨”、1天“下跌”、1天“不变”的概率;
(3)假设该农产品每天的价格变化只受前一天价格变化的影响.判断第41天该农产品价格“上涨”“下跌”和“不变”的概率估计值哪个最大.(结论不要求证明)
【分析】(1)计算表格中的的次数,然后根据古典概型进行计算;
(2)分别计算出表格中上涨,不变,下跌的概率后进行计算;
(3)通过统计表格中前一次上涨,后一次发生的各种情况进行推断第天的情况.
【详解】(1)根据表格数据可以看出,天里,有个,也就是有天是上涨的,
根据古典概型的计算公式,农产品价格上涨的概率为:
(2)在这天里,有天上涨,天下跌,天不变,也就是上涨,下跌,不变的概率分别是,,,
于是未来任取天,天上涨,天下跌,天不变的概率是
(3)由于第天处于上涨状态,从前次的次上涨进行分析,上涨后下一次仍上涨的有次,不变的有次,下跌的有次,
因此估计第次不变的概率最大.
4.(2022·北京·高考真题)在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到以上(含)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):
甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;
乙:9.78,9.56,9.51,9.36,9.32,9.23;
丙:9.85,9.65,9.20,9.16.
假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.
(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;
(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);
(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)
【分析】(1) 由频率估计概率即可
(2) 求解得X的分布列,即可计算出X的数学期望.
(3) 计算出各自获得最高成绩的概率,再根据其各自的最高成绩可判断丙夺冠的概率估计值最大.
【详解】(1)由频率估计概率可得
甲获得优秀的概率为0.4,乙获得优秀的概率为0.5,丙获得优秀的概率为0.5,
故答案为0.4
(2)设甲获得优秀为事件A1,乙获得优秀为事件A2,丙获得优秀为事件A3
,
,
,
.
∴X的分布列为
X
0
1
2
3
P
∴
(3)丙夺冠概率估计值最大.
因为铅球比赛无论比赛几次就取最高成绩.比赛一次,丙获得9.85的概率为,甲获得9.80的概率为,乙获得9.78的概率为.并且丙的最高成绩是所有成绩中最高的,比赛次数越多,对丙越有利.
5.(2021·北京·高考真题)在核酸检测中, “k合1” 混采核酸检测是指:先将k个人的样本混合在一起进行1次检测,如果这k个人都没有感染新冠病毒,则检测结果为阴性,得到每人的检测结果都为阴性,检测结束:如果这k个人中有人感染新冠病毒,则检测结果为阳性,此时需对每人再进行1次检测,得到每人的检测结果,检测结束.
现对100人进行核酸检测,假设其中只有2人感染新冠病毒,并假设每次检测结果准确.
(I)将这100人随机分成10组,每组10人,且对每组都采用“10合1”混采核酸检测.
(i)如果感染新冠病毒的2人在同一组,求检测的总次数;
(ii)已知感染新冠病毒的2人分在同一组的概率为.设X是检测的总次数,求X的
分布列与数学期望E(X).
(II)将这100人随机分成20组,每组5人,且对每组都采用“5合1”混采核酸检测.设Y是检测的总次数,试判断数学期望E(Y)与(I)中E(X)的大小.(结论不要求证明)
【分析】(1)①由题设条件还原情境,即可得解;
②求出X的取值情况,求出各情况下的概率,进而可得分布列,再由期望的公式即可得解;
(2)求出两名感染者在一组的概率,进而求出,即可得解.
【详解】(1)①对每组进行检测,需要10次;再对结果为阳性的组每个人进行检测,需要10次;
所以总检测次数为20次;
②由题意,可以取20,30,
,,
则的分布列:
所以;
(2)由题意,可以取25,30,
两名感染者在同一组的概率为,不在同一组的概率为,
则.
6 / 15
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
大题04 概率统计
历年北京高考题中,概率统计主要考查用频率估计概率;离散型随机变量的均值;古典概型的概率;独立事件的乘法公式;频率分布表解决概率;二项分布求分布列;离散型随机变量分布列及均值;该部分内容主要以探索创新情境与生活实践情境为载体,重在考查考生的逻辑思维能力及对事件进行分析、分解和转化的能力;预测2025年考查内容涉及以利用排列组合考查离散型随机变量的分布列、均值、方差、二项分布和正态分布等问题为主,注重概率和其他知识的综合考查.
题型一:一元线性回归模型及其应用
3.(2025·北京丰台·期末)如图是我国2015年至2023年岁及以上老人人口数(单位:亿)的折线图,
注:年份代码分别对应年份.
(1)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数(结果精确到)加以说明;
(2)建立关于的回归方程(系数精确到),并预测2024年我国岁及以上老人人口数(单位:亿).
参考数据:,,,.
参考公式:相关系数,若,则与有较强的线性相关性.
回归方程中斜率和截距的最小二乘估计公式分别为:,.
一元线性回归模型及其应用问题,解题的思路是:
1、识题:关键词(线性回归方程与最小二乘法)
2、研究方向及步骤:回归直线方程过样本点的中心(,),是回归直线方程最常用的一个特征
将=x+称为Y关于x的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求线性回归方程的一般步骤
(1)收集样本数据,设为(xi,yi)(i=1,2,…,n)(数据一般由题目给出).(2)作出散点图,确定x,y具有线性相关关系.(3)把数据制成表格xi,yi,x,xiyi.(4)计算,,x,xiyi.
(5)代入公式计算,,公式为(6)写出线性回归方程=x+.
3、必备知识:①通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.
②作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
③残差平方和 (yi-i)2,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
④利用R2刻画回归效果决定系数R2是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.R2=1-,R2越大,即拟合效果越好,R2越小,模型拟合效果越差.
1.某县城为活跃经济,特举办传统文化民俗节,小张弄了一个套小白兔的摊位,设表示第i天的平均气温,表示第i天参与活动的人数,,根据统计,计算得到如下一些统计量的值:
,,.
(1)根据所给数据,用相关系数(精确到0.01)判断是否可用线性回归模型拟合与的关系;
(2)现有两个家庭参与套圈,A家庭3位成员每轮每人套住小白兔的概率都为,B家庭3位成员每轮每人套住小白兔的概率分别为,每个家庭的3位成员均玩一次套圈为一轮,每轮每人收费20元,每个小白兔价值40元,且每人是否套住相互独立,以每个家庭的盈利的期望为决策依据,问:一轮结束后,哪个家庭损失较大?
附:相关系数.
2.(2025·北京通州·期末)某公司对某产品作市场调查,获得了该产品的定价(单位:万元/吨)和一天的销量吨)的一组数据,根据这组数据制作了如下统计表和散点图.
0.33
10
3
0.164
100
68
350
表中.
(Ⅰ)根据散点图判断,与哪一个更适合作为关于的经验回归方程;(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果,建立关于的经验回归方程;
(Ⅲ)若生产1吨该产品的成本为0.25万元,依据(Ⅱ)的经验回归方程,预计每吨定价多少时,该产品一天的销售利润最大?最大利润是多少?
(经验回归方程中,,)
题型二:独立性检验
(2025·北京通州·期末)为了研究高三年级学生的性别和身高是否大于的关联性,同学甲调查丁某中学高三年级所有学生,整理得到列联表1,同学乙从该校高三学生中获取容量为40的有放回简单随机样本,由样本数据整理得到列联表2.
表1单位:人
性别
身高
合计
女
81
16
97
男
28
75
103
合计
109
91
200
表2单位:人
性别
身高
合计
女
15
6
21
男
9
10
19
合计
24
16
40
(1)利用表1,通过比较不低于的学生在女生和男生中的比率,判断该中学高三年级学生的性别和身高是否有关联,如果有关联,请解释它们之间如何相互影响;
(2)利用表2,依据的独立性检验,推断该中学高三年级学生的性别和身高是否有关联,并解释所得结论的实际含义:
(3)以上两种方法得出的结论是否一致?如果不一致,你认为哪种方法得出的结论准确,原因是什么?
(,)
列联表与独立性检验问题,解题的思路是:
1、识题:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},将这类数据统计表称为2×2列联表
2、研究方向及步骤:(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
3、必备知识:
①临界值:χ2 统计量也可以用来作相关性的度量.χ2 越小说明变量之间越独立,χ2越大说明变量之间越相关
χ2=.忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准.
②独立性检验:基于小概率值α的检验规则是:
当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
1.(2025·北京延庆·期中)为提升学生综合素养,某中学为高二年级提供了“书法”和“剪纸”两门选修课.为了了解选择“书法”或“剪纸”是否与性别有关,调查了高二年级1500名学生的选择倾向,随机抽取了100名,统计选择两门课程人数如下表.
选书法
选剪纸
合计
男生
40
50
女生
合计
30
(1)补全列联表;
(2)根据小概率值的独立性检验,在犯错概率不超过的前提下,是否可以认为选择“书法”或值“剪纸”与性别有关?(计算结果保留到小数点后三位)参考公式:,其中.
0.100
0.050
0.025
2.706
3.841
5.024
2.(2025·北京朝阳一模)2018年8月16日,中共中央政治局常务委员会召开会议,听取关于吉林长春长生公司问题疫苗案件调查及有关问责情况的汇报,中共中央总书记习近平主持会议并发表重要讲话.会议强调,疫苗关系人民群众健康,关系公共卫生安全和国家安全.因此,疫苗行业在生产、运输、储存、使用等任何一个环节都容不得半点瑕疵.国家规定,疫苗在上市前必须经过严格的检测,并通过临床实验获得相关数据,以保证疫苗使用的安全和有效.某生物制品研究所将某一型号疫苗用在动物小白鼠身上进行科研和临床实验,得到统计数据如下:
未感染病毒
感染病毒
总计
未注射疫苗
40
注射疫苗
60
总计
100
100
200
现从未注射疫苗的小白鼠中任取1只,取到“感染病毒”的小白鼠的概率为.
(1)求列联表中的数据,,,的值;
(2)能否有把握认为注射此种疫苗有效?请说明理由;
(3)在感染病毒的小白鼠中,按未注射疫苗和注射疫苗的比例抽取5只进行病例分析,然后从这五只小白鼠中随机抽取3只对注射疫苗情况进行核实,记为3只中未注射疫苗的小白鼠的只数,求的分布列和期望.
附:,.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
题型三:条件概率
12.(2024·北京顺义·三模)习近平总书记高度重视体育运动的发展,将体育与国家发展、民族振兴紧密联系在一起,多次强调体育“是实现中国梦的重要内容”“体育强则中国强,国运兴则体育兴”,为了响应总书记的号召,某中学组织全体学生开展了丰富多彩的体育实践活动.为了解该校学生参与活动的情况,随机抽取100名学生作为样本,统计他们参加体育实践活动时间(单位:分钟),得到下表:
时间人数类别
性别
男
5
12
13
8
9
8
女
6
9
10
10
6
4
学段
初中
10
高中
4
13
12
7
5
4
(1)从该校随机抽取1名学生,若已知抽到的是女生,估计该学生参加体育实践活动时间在的概率;
(2)从该校参加体育实践活动时间在学生中随机抽取2人,在的学生中随机抽取1人,求其中至少有1名初中学生的概率;
(3)假设同组中每个数据用该组区间中点值代替,样本中的100名学生参加体育实践活动时间的平均数记为,初中、高中学生参加体育实践活动时间的平均数分别记为,,试比较与的大小关系.(结论不要求证明)
条件概率问题,解题的思路是:
1、识题:一般地,设A,B为两个随机事件,且P(A)>0,我们称P(B|A)=为在事件A发生的条件下,事件B发生的条件概率
2、研究方向及步骤:条件概率揭示了P(A),P(AB),P(B|A)三者之间“知二求一”的关系
由条件概率的定义,对任意两个事件A与B,若P(A)>0,则P(AB)=P(A)P(B|A).我们称上式为概率的乘法公式.利用定义计算条件概率的步骤
(1)分别计算概率P(AB)和P(A).
(2)将它们相除得到条件概率P(B|A)=,这个公式适用于一般情形,其中AB表示A,B同时发生.
3、必备知识:条件概率的性质设P(A)>0,则
(1)P(Ω|A)=1;(2)如果B与C是两个互斥事件,则P((B∪C)|A)=P(B|A)+P(C|A);
(3)设和B互为对立事件,则P( )=1-P(B).
1.(2025·北京海淀·三模)某社区计划组织一次公益讲座向居民普及垃圾分类知识,为掌握居民对垃圾分类知识的了解情况并评估讲座的效果,主办方从全体居民中随机抽取10位参加试讲讲座活动,让他们在试讲讲座前后分别回答一份垃圾分类知识问卷.试讲讲座前后,这10位居民答卷的正确率如下表:
编号正确率
1号
2号
3号
4号
5号
6号
7号
8号
9号
10号
试讲讲座前
65%
60%
0%
100%
65%
75%
90%
85%
80%
60%
试讲讲座后
90%
85%
80%
95%
85%
85%
95%
100%
85%
90%
根据居民答卷的正确率可以将他们垃圾分类的知识水平分为以下三个层级:
答卷正确率p
垃圾分类知识水平
一般
良好
优秀
假设每位居民回答问卷的结果之间互相独立,用频率估计概率.
(1)正式讲座前.从该社区的全体居民中随机抽取1人,试估计该居民垃圾分类知识水平恰为“一般”的概率;
(2)正式讲座前,从该社区的全体居民中随机抽取3人,这3人垃圾分类知识水平分别是“一般”、“良好”、“良好”.设随机变量X为“这3人讲座后垃圾分类知识水平达到‘优秀’、的人数”,试估计X的分布列和数学期望;
(3)在未参加讲座的全部居民中再随机抽取若干人参加下一轮的公益讲座并让他们在讲座前后分别填写问卷.从讲座后的答卷中随机抽取一份,如果完成该答卷的居民的知识水平为“良好”,他在讲座前属于哪一知识水平的概率最大?(结论不要求证明)
2.(2025·北京海淀·三模)某汽车专卖店试销A,B,C三种品牌的新能源汽车,销售情况如下表所示:
第一周
第二周
第三周
第四周
A品牌数量(台)
11
10
15
B品牌数量(台)
14
9
13
C品牌数量(台)
6
11
12
(1)从前三周随机选一周,若A品牌销售量比C品牌销售量多,求A品牌销售量比B品牌销售量多的概率;
(2)为跟踪调查新能源汽车的使用情况,根据销售记录,从该专卖店第二周和第三周售出的新能源汽车中分别随机抽取一台.求抽取的两台汽车中A品牌的台数X的分布列和数学期望;
(3)直接写出一组的值,使得表中每行数据方差相等.
题型四:二项分布与超几何分布
(2025·北京丰台·二模)为调查某校学生户外活动时长和视力的关系,某研究小组在该校随机选取了100名学生,记录他们的日均户外活动时长(单位:小时)及近视情况,统计得到:日均户外活动时长在区间内有70人,近视率为;日均户外活动时长在区间内有20人,近视率为;日均户外活动时长在区间内有10人,近视率为.
注:近视率是指某区间内近视人数与该区间内人数的比值.
(1)估计该校日均户外活动时长不低于1小时的学生的近视率;
(2)用频率估计概率.从该校日均户外活动时长低于1小时的学生和不低于1小时的学生中各随机选取2名,求这4名学生中恰有2名近视的概率;
(3)为响应国家降低青少年近视率的号召,该校提出“护眼有妙招,科学动起来”的口号,计划在以下2项措施中选择1项实施.
措施一:每日给全校学生增设0.5小时晨跑活动;
措施二:每日给日均户外活动时长低于1小时的学生增设1小时户外活动.假设所有学生都能按要求参加相应活动,记采取措施一后该校全体学生的日均户外活动时长的平均值为,采取措施二后该校全体学生的日均户外活动时长的平均值为.用样本估计总体,试比较与的大小.(结论不要求证明)
二项分布问题,解题的思路是:
1、识题.
n重伯努利试验具有如下共同特征
(1)同一个伯努利试验重复做n次;(2)各次试验的结果相互独立.
2、研究方向
一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p(0<p<1),用X表示事件A发生的次数,则X的分布列为:记作X~B(n,p).
3、 必备知识:一般地,可以证明:如果X~B(n,p),那么E(X)=np,D(X)=np(1-p).
超几何分布问题,解题的思路是:
1、识题:超几何分布模型是一种不放回抽样
2、研究方向:一般地,假设一批产品共有N件,其中有M件次品,从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为,k=m,m+1,m+2,…,r.
其中n,N,M∈N* ,M≤N,n≤N,m=max{0,n-N+M},r=min{n,M}.如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布.
3、必备知识:超几何分布的期望E(X)==np(p为N件产品的次品率).
1.(2025·北京石景山·期中)在新型冠状病毒疫情期间,某高中学校实施线上教学,为了解线上教学的效果,随机抽取了100名学生对线上教学效果进行评分(满分100分),记低于80的评分为“效果一般”,不低于80分为“效果较好”
(1)根据所给数据完成下列表格;
效果一般
效果较好
合计
男
25
45
女
40
合计
(2)用(1)中表格的数据估计全校线上教学的效果,用频率估计概率.从该校学生中任意抽取3人,记所抽取的3人中认为线上教学“效果一般”的人数为X,求X的分布列和数学期望及方差.
2.(2025·北京大兴·三模)为测试、两款人工智能软件解答数学问题的能力,将100道难度相当的数学试题从1到100编号后随机分配给这两款软件测试.每道试题只被一款软件解答一次,记录结果如下:
试题类别
软件
软件
测试试题数量
正确解答的数量
测试试题数量
正确解答的数量
函数试题
30
24
20
18
几何试题
20
16
30
20
(1)估计软件能正确解答数学问题的概率;
(2)小明决定采用这两款软件解答3道类似试题(假设其难度和测试的100道题基本相同),其中函数2道,几何1道;使用软件解答2道函数试题,使用软件解答1道几何试题;每道试题只用其中一款软件解答一次.假设用频率估计概率,且每次解答相互独立.用表示3道类似试题被正确解答的个数,求的分布列与数学期望;
(3)小明准备用这两款软件来解决某次数学测试中的第12题(假设其难度和测试的100道题基本相同),但该题内容还未知,从已往情况来看,该题是函数题的概率为,几何题的概率为.假设用频率估计概率,试说明小明用哪款软件正确解答这道试题的概率大?(结论不要求证明)
题型五:分布列、均值与方差
(2025·北京朝阳·三模)某老师为了解班里甲、乙两位同学的数学学习情况,从他们的数学小练习成绩中各随机抽取10份,.获得数据如下表:
甲同学
8
6.5
6
6
7.5
8
8
5.5
9
7.5
乙同学
6
7
7
7.5
7.5
8.5
9
7
9.5
9
已知数学小练习满分为10分,最低分为0分.若小练习得分不低于7.5分视为“得分达到良好”,若小练习得分不低于8.5分视为“得分达到优秀”. 假设用频率估计概率,且甲和乙小练习成绩相互独立.
(1)从甲同学的样本中随机抽取1个,求“得分达到良好”的概率;
(2)从乙同学的所有数学小练习成绩中随机抽取 3 份,记随机变量X为“得分达到优秀”的次数.估计X的分布列和期望:
(3)样本中,甲、乙两位同学小练习成绩的方差分别为记为和,试比较和的大小(结论不要求证明).
离散型随机变量及其分布列问题,解题的思路是:
1、 明确随机变量x可能取到的值并求出每一种情况下的概率
2、 写出离散型随机变量的分布列
(1)离散型随机变量的分布列
一般地,设离散型随机变量X的可能取值为 x1,x2,…,xn ,我们称X取每一个值xi的概率P(X=xi)=pi,i=1,2,…,n为X的概率分布列,简称为分布列.
(2)可以用表格来表示X的分布列,如下表
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
还可以用图形表示,如下图直观地表示了掷骰子试验中掷出的点数X的分布列,称为X的概率分布图.
3、必备知识:离散型随机变量的分布列的性质
(1)pi≥0,i=1,2,…,n;(2) p1+p2+…+pn=1.
1.(2025·安徽合肥·三模)某城市推广垃圾分类,设置智能回收箱(方式)和传统垃圾桶(方式).统计显示,60%的居民选择方式,选择方式,若垃圾被正确分类,则垃圾被回收,不用填埋.智能回收箱的正确分类率为,错误分类后需人工处理,人工处理可将错误分类垃圾的40%重新正确分类,其余直接填埋;传统垃圾桶的正确分类率为75%,错误分类后直接填埋.
(1)求垃圾最终被填埋的概率;
(2)若某吨垃圾被填埋,求其最初通过传统垃圾桶投放的概率;
(3)现有一吨垃圾要整体处理,设为其处理成本(单位:元),正确分类无需成本,人工处理成本为200元,填埋成本为500元.求的分布列及数学期望.
2.(2025·北京朝阳·一模)某高中组织学生研学旅行.现有A,B两地可供选择,学生按照自愿的原则选择一地进行研学旅行.研学旅行结束后,学校从全体学生中随机抽取100名学生进行满意度调查,调查结果如下表:
高一
高二
高三
A地
B地
A地
B地
A地
B地
满意
12
2
18
3
15
6
一般
2
2
6
5
6
8
不满意
1
1
6
2
3
2
假设所有学生的研学旅行地点选择相互独立.用频率估计概率.
(1)估计该校学生对本次研学旅行满意的概率;
(2)分别从高一、高二、高三三个年级中随机抽取1人,估计这3人中至少有2人选择去B地的概率;
(3)对于上述样本,在三个年级去A地研学旅行的学生中,调查结果为满意的学生
人数的方差为,调查结果为不满意的学生人数的方差为,写出和的大小关系.`(结论不要求证明)
1.(25-26高三上·四川南充·月考)近几年,新能源汽车的更新换代越来越引起人们的关注.某新能源车企想了解年轻司机与中老年司机对新能源车和燃油车的喜好程度,随机抽取了1000名司机,得到的列联表如下:
偏好新能源车
偏好燃油车
总计
年轻司机
300
200
500
中老年司机
200
300
500
总计
500
500
1000
(1)若从抽取的年轻司机中任选1人,求此人偏好新能源车的概率;
(2)依据的独立性检验,能否认为司机对两种汽车的偏好与年龄有关联?
附:,其中.
0.01
0.005
0.001
6.635
7.879
10.828
2.(2025·四川德阳·二模)2024年7月26日,第33届夏季奥林匹克运动会在法国巴黎开幕,足球作为其中的一项团队运动项目,风䨾世界,深受大众喜欢,为了解喜爱足球运动是否与性别有关,随机抽取了男性和女性观众各100名进行调查,得到如下列联表.
喜爱足球运动
不喜爱足球运动
合计
男性
60
40
100
女性
30
70
100
合计
90
110
200
(1)判断是否有的把握认为喜爱足球运动与性别有关;
(2)用样本分布的频率估计总体分布的概率,若现在从喜爱足球运动的观众中随机抽取3名,记男性的人数为,求事件的分布列和数学期望;
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
附:.
3.(2025·四川雅安·三模)同城配送是随即时物流发展而出现的非标准化服务,省时省力是消费者使用同城配送服务的主要目的.某同城配送服务公司随机统计了800名消费者的年龄(单位:岁)以及每月使用同城配送服务的次数,得到每月使用同城服务低于5次的有550人,并将每月使用同城配送服务次数不低于5次的消费者按照年龄进行分组,得到如图所示的频率分布直方图.
(1)估计每月使用同城配送服务不低于5次的消费者年龄的平均值和中位数(结果精确到0.1,每组数据用该组区间的中点值代表);
(2)若年龄在内的人位于年龄段,年龄在内的人位于年龄段II,把每月使用同城配送服务低于5次的消费者称为“使用同城配送服务频率低”,否则称为“使用同城配送服务频率高”,若800名消费者中有400名在年龄段I,补全列联表,并判断是否有的把握认为消费者使用同城配送服务频率的高低与年龄段有关?
年龄段I
年龄段II
合计
使用同城配送服务频率高
使用同城配送服务频率低
合计
参考公式:,其中.附:
0.050
0.010
0.001
3.841
6.635
10.828
4.(2025·北京大兴·三模)某地区教育研究部门为了解当前本地区中小学教师在教育教学中运用人工智能的态度、经验、困难等情况,从该地区2000名中小学教师中随机抽取100名进行了访谈.在整理访谈结果的过程中,统计他们对“人工智能助力教学”作用的认识,得到的部分数据如下表所示:
假设用频率估计概率,且每位教师对“人工智能助力教学”作用的认识相互独立.
(1)估计该地区中小学教师中认为人工智能对于教学“没有帮助”的人数;
(2)对受访教师关于“人工智能助力教学”的观点进行赋分:“没有帮助”记0分,“有一些帮助”记2分,“很有帮助”记4分.
①从该地区男教师中抽取4名教师,求这4名教师得分总和为8分的概率;
②统计受访教师的得分,将这100名教师得分的平均值记为,其中年龄在40岁以下(含40岁)教师得分的平均值记为,年龄在40岁以上教师得分的平均值记为,请直接写出的大小关系.(结论不要求证明)
5.(2025·北京平谷·一模)某科研团队研发了一款快速检测某种疾病的试剂盒.为了解该试剂盒检测的准确性,科研团队从某地区(人数众多)随机选取了40位患者和60位非患者,用该试剂盒分别对他们进行了一次检测,结果如下:
抽样人群
阳性人数
阴性人数
患者
36
4
非患者
2
58
(1)试估计使用该试剂盒进行一次检测结果正确的概率;
(2)若从该地区的患者和非患者中分别抽取2人进行一次检测,求恰有一人检测结果错误的概率;
(3)假设该地区有10万人,患病率为0.01.从该地区随机选取一人,用该试剂盒对其检测一次.若检测结果为阳性,能否判断此人患该疾病的概率超过0.2?并说明理由.
6.(2025·北京·三模)2023年山东淄博以烧烤文化火出了圈.为了解游客在淄博吃烧烤的消费情况,某记者随机采访了15位游客,他们分别来自A、、三个地区.现将这15位游客一顿烧烤的人均消费金额数据记录如下表(单位:元).
A
32 68 86
57 70 78 91
66 77 79 80 80 81 83 94
假设所有游客消费金额相互独立.
(1)据人流量监测数据显示,五一假期中的某日有超过16万游客“进淄赶烤”.估计其中来自A地区的游客人数;
(2)从来自A地区和地区的游客中各随机选取一人,记为选出的两人中一顿烧烤的人均消费金额大于70元的人数,估计的数学期望;
(3)从样本中来自A、、三个地区的游客中各随机选取一人,记这三人一顿烧烤的人均消费金额分别为,写出方差的大小关系.(结论不要求证明)
7.(2025·北京昌平·二模)在探索数智技术赋能学科学习的过程中,某中学鼓励学生使用某听说平台进行英语口语自主练习.该中学有初中生1200人,高中生800人.为了解全校学生近一个月内使用此听说平台进行英语口语自主练习的次数,从全校学生中随机抽取200名学生进行问卷调查,将他们的使用次数按照,,,,,五个区间进行分组,所得样本数据如下表:
使用次数分组区间
初中生人
高中生人
4
3
38
29
48
28
17
6
3
假设每个学生是否使用此听说平台进行英语口语自主练习相互独立.用频率估计概率.
(1)估计近一个月内全校学生中使用此听说平台进行英语口语自主练习的次数不低于30次的总人数;
(2)从上面参与问卷调查且使用此听说平台进行英语口语自主练习次数不足10次的学生中随机抽取3人,记为这3人中高中生的人数,求的分布列和数学期望;
(3)从该校初中生和高中生中各随机抽取8名学生进行调查,设其中初中生和高中生使用此听说平台进行英语口语自主练习次数位于的人数分别为和,比较与的大小.(结论不要求证明)
8.(2025·北京通州·一模)某艺术研究中心对春节档6部影片观众满意度进行调查,评分如下
第一部
第二部
第三部
第四部
第五部
第六部
普通观众评分
87.2
85.4
84.9
84.9
84.7
83.6
专业观众评分
88.7
80.0
81.6
77.4
76.1
72.2
(1)从这6部影片中随机选取1部,恰好选到普通观众评分与专业观众评分都低于85分的影片的概率;
(2)现有4名观众,每位观众从这6部影片中各随机选取1部观看.
(ⅰ)若不同观众可选相同影片(假设每位观众的选择相互独立),记X为选到普通观众评分与专业观众评分都低于85分的影片的人数,求X的分布列及数学期望.
(ⅱ)若任意2名观众不能选看相同影片,记Y为选到普通观众评分与专业观众评分都低于85分的影片的人数,试比较这种情况下数学期望与(ⅰ)中的大小关系,(结论不要求证明)
9.(2025·北京石景山·一模)某市在高中阶段举办“环保知识竞赛”,全体高中生参与了此次活动.现从参赛学生中随机抽取了男、女各30名学生,将他们的成绩(单位:分)按,,,,五个分数段进行分组,统计如下:
成绩
男生人数
3
6
11
8
2
女生人数
a
b
12
4
2
(1)在抽取的60名学生中,从成绩在80分及以上的学生中随机抽取2人,求恰好男、女生各1人,且2人分数段不同的概率;
(2)从该市参赛的男生中随机抽取4人,设成绩在80分及以上的人数为X,用频率估计概率,求X的分布列和数学期望;
(3)试确定a,b的值,使得抽取的女生成绩方差最小.(结论不要求证明)
10.(2025·北京·模拟预测)某次测验满分为100分,A组和B组各有10人参加,成绩如下表:
A
76
78
83
84
85
90
92
95
98
99
B
63
72
73
75
80
81
84
85
92
99
对于该次测验,分数时为及格,分数分时为良好,成绩分时为优秀.
(1)从两组中任取1名学生,求该名学生成绩为良好的概率;
(2)从A组中随机抽取1名学生,再从B组中随机抽取1名学生.用随机变量X表示这两人的成绩为优秀的人数,求X的分布列和数学期望;
(3)从A、B两组中均随机抽取3人,A组成绩为76,83,92.已知B组抽出的3人中有2人的成绩为99,92,直接写出B组3人成绩方差比A组3人成绩方差小的概率,
11.(24-25高三下·北京·月考)无人驾驶技术是汽车研发领域的一个重要方向.某学校技术俱乐部研发了一个感知路况障碍的小汽车模型,该模型通过三个传感器共同判断路段是否有路障.在对该模型进行测试中,该俱乐部同学寻找了个不同的路段作为测试样本,数据如下表:
测试
结果真实
路况
传感器1
传感器2
传感器3
有障碍
无障碍
无法识别
有障碍
无障碍
无法识别
有障碍
无障碍
无法识别
无障碍
4
15
1
1
15
4
8
12
0
有障碍
40
10
10
45
5
10
45
10
5
假设用频率估计概率,且三个传感器对路况的判断相互独立.
(1)从这80个路段中随机抽取一个路段,求传感器1对该路况判断正确的概率;
(2)从这80个路段中随机抽取一个有障碍的路段进行测试,设为传感器1和传感器2判断正确的总路段数,求的分布列和数学期望;
(3)现有一辆小汽车同时装载了以上3种传感器.在通过某路段时,只要3个传感器中一个判断有障碍或无法识别,则小汽车减速.那么是否可以通过提高传感器3的判断正确率,使得小汽车在无障碍的道路上减速的概率小于?(结论不要求证明)
1.(2025·北京·高考真题)某次考试中,只有一道单项选择题考查了某个知识点,甲、乙两校的高一年级学生都参加了这次考试.为了解学生对该知识点的掌握情况,随机抽查了甲、乙两校高一年级各100名学生该题的答题数据,其中甲校学生选择正确的人数为80,乙校学生选择正确的人数为75.假设学生之间答题相互独立,用频率估计概率.
(1)估计甲校高一年级学生该题选择正确的概率
(2)从甲、乙两校高一年级学生中各随机抽取1名,设X为这2名学生中该题选择正确的人数,估计的概率及X的数学期望;
(3)假设:如果没有掌握该知识点,学生就从题目给出的四个选项中随机选择一个作为答案;如果掌握该知识点,甲校学生选择正确的概率为,乙校学生选择正确的概率为.设甲、乙两校高一年级学生掌握该知识点的概率估计值分别为,,判断与的大小(结论不要求证明).
2.(2024·北京·高考真题)某保险公司为了了解该公司某种保险产品的索赔情况,从合同险期限届满的保单中随机抽取1000份,记录并整理这些保单的索赔情况,获得数据如下表:
赔偿次数
0
1
2
3
4
单数
假设:一份保单的保费为0.4万元;前3次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.
(1)估计一份保单索赔次数不少于2的概率;
(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.
(i)记为一份保单的毛利润,估计的数学期望;
(ⅱ)如果无索赔的保单的保费减少,有索赔的保单的保费增加,试比较这种情况下一份保单毛利润的数学期望估计值与(i)中估计值的大小.(结论不要求证明)
3.(2023·北京·高考真题)为研究某种农产品价格变化的规律,收集得到了该农产品连续40天的价格变化数据,如下表所示.在描述价格变化时,用“+”表示“上涨”,即当天价格比前一天价格高;用“-”表示“下跌”,即当天价格比前一天价格低;用“0”表示“不变”,即当天价格与前一天价格相同.
时段
价格变化
第1天到第20天
-
+
+
0
-
-
-
+
+
0
+
0
-
-
+
-
+
0
0
+
第21天到第40天
0
+
+
0
-
-
-
+
+
0
+
0
+
-
-
-
+
0
-
+
用频率估计概率.
(1)试估计该农产品价格“上涨”的概率;
(2)假设该农产品每天的价格变化是相互独立的.在未来的日子里任取4天,试估计该农产品价格在这4天中2天“上涨”、1天“下跌”、1天“不变”的概率;
(3)假设该农产品每天的价格变化只受前一天价格变化的影响.判断第41天该农产品价格“上涨”“下跌”和“不变”的概率估计值哪个最大.(结论不要求证明)
4.(2022·北京·高考真题)在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到以上(含)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):
甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;
乙:9.78,9.56,9.51,9.36,9.32,9.23;
丙:9.85,9.65,9.20,9.16.
假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.
(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;
(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);
(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)
5.(2021·北京·高考真题)在核酸检测中, “k合1” 混采核酸检测是指:先将k个人的样本混合在一起进行1次检测,如果这k个人都没有感染新冠病毒,则检测结果为阴性,得到每人的检测结果都为阴性,检测结束:如果这k个人中有人感染新冠病毒,则检测结果为阳性,此时需对每人再进行1次检测,得到每人的检测结果,检测结束.
现对100人进行核酸检测,假设其中只有2人感染新冠病毒,并假设每次检测结果准确.
(I)将这100人随机分成10组,每组10人,且对每组都采用“10合1”混采核酸检测.
(i)如果感染新冠病毒的2人在同一组,求检测的总次数;
(ii)已知感染新冠病毒的2人分在同一组的概率为.设X是检测的总次数,求X的
分布列与数学期望E(X).
(II)将这100人随机分成20组,每组5人,且对每组都采用“5合1”混采核酸检测.设Y是检测的总次数,试判断数学期望E(Y)与(I)中E(X)的大小.(结论不要求证明)
6 / 15
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$