内容正文:
第45讲 二项分布、超几何分布与正态分布
(6类核心考点精讲精练)
1. 5年真题考点分布
5年考情
考题示例
考点分析
2024年北京卷,第18题,13分
求离散型随机变量的均值
2022年北京卷,第18题,13分
求离散型随机变量的均值
2021年北京卷,第18题,13分
离散型随机变量的分布列与均值
2. 命题规律及备考策略
【命题规律】本节内容是北京卷的必考内容,难度中档,常在解答题中考查
【备考策略】
1.理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性;
2.能确定随机变量,求出随机变量发生的概率,正确列出分布列;
3.理解离散型随机变量的数字特征的概念,能根据分布列正确求出期望与方差;
4.能利用n重伯努利试验的模型及二项分布解决一些简单的实际问题;
5.理解超几何分布,并能进行简单的应用;
6.借助直方图认识正态分布曲线的特点及曲线所表示的意义,掌握正态曲线的相关性质,并能进行正确求解.
【命题预测】2025年北京高考命题形式可能会以两点分布、二项分布、超几何分布为基础计算随机变量的分布列、均值与方差,也可能会利用方差进行决策.
知识讲解
知识点1 随机变量的分布列、均值与方差
1、随机变量的有关概念
(1)随机变量:随着试验结果变化而变化的变量,常用字母X,Y,ξ,η,…表示.
(2)离散型随机变量:所有取值可以一一列出的随机变量.
2、离散型随机变量分布列
(1)离散型随机变量分布列的表示:一般地,若离散型随机变量可能取的不同值为,取每一个值的概率,以表格的形式表示如下:
我们将上表称为离散型随机变量的概率分布列,简称为的分布列.有时为了简单起见,也用等式,表示的分布列.
(2)分布列的性质:(1),;(2).
3、离散型随机变量的均值与方差
(1)均值:为随机变量的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(2)均值的性质
①(为常数).
②若,其中为常数,则也是随机变量,且.
③.
④如果相互独立,则.
(3)方差:为随机变量的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,称其算术平方根为随机变量的标准差.
(4)方差的性质
①若,其中为常数,则也是随机变量,且.
②方差公式的变形:.
知识点2 二项分布、超几何分布与正态分布
1、二项分布
(1)次独立重复试验:一般地,在相同条件下重复做的次试验称为次独立重复试验.
【注意】独立重复试验的条件:①每次试验在同样条件下进行;②各次试验是相互独立的;③每次试验都只有两种结果,即事件要么发生,要么不发生.
(2)二项分布的表示:一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,不发生的概率,那么事件恰好发生次的概率是(,,,…,),于是得到的分布列
…
…
…
…
由于表中第二行恰好是二项式展开式各对应项的值,称这样的离散型随机变量服从参数为,的二项分布,记作,并称为成功概率.
(3)二项分布的期望、方差:若,则,.
2、超几何分布:在含有件次品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,,1,2,…,,其中,且,,,,,称分布列为超几何分布列.如果随机变量的分布列为超几何分布列,则称随机变量服从超几何分布.
0
1
…
…
3、正态分布
(1)正态分布:一般地,如果对于任何实数,,随机变量满足,则称随机变量服从正态分布.正态分布完全由参数,确定,因此正态分布常记作.如果随机变量服从正态分布,则记为.
其中,参数是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.
(2)正态曲线的性质
①曲线位于轴上方,与轴不相交;
②曲线是单峰的,它关于直线对称;
③曲线在处达到峰值(最大值);
④曲线与轴之间的面积为1;
⑤当一定时,曲线的位置由确定,曲线随着的变化而沿轴平移;
⑥当一定时,曲线的形状由确定.越小,曲线越“高瘦”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散,
(3)原则
若,可以证明:对给定的,是一个只与有关的定值,特别地,
;;.
在实际应用中,通常认为服从于正态分布的随机变量只取中的值,这在统计学中称为原则.
考点一、分布列的概念及性质
【典例1】下表是离散型随机变量的概率分布,则常数a的值是( )
3
4
5
6
A. B. C. D.
【答案】C
【解析】由,解得,故选:C.
【典例2】(23-24高二下·北京顺义·期中)已知随机变量的分布列如表:(其中为常数)
0
1
2
3
4
5
0.2
0.1
0.3
0.2
0.1
则等于( )
A.0.4 B.0.5 C.0.6 D.0.7
【答案】B
【解析】根据分布列概率和为1,可得,
.故选:B.
1.离散型随机变量的概率分布规律为,其中是常数,则 .
【答案】
【解析】,,解得:,
.
故答案为:.
2.(23-24高三上·江西吉安·阶段练习)已知随机变量X服从两点分布,且,,那么 .
【答案】
【解析】由题意可知,解得.
故答案为:.
考点二、离散型随机变量的均值、方差
【典例1】(24-25高三上·广东·阶段练习)已知随机变量的分布列如下表所示:
若,且,则( )
A. B. C. D.
【答案】C
【解析】由,得,,
则,,
由,得,所以.故选:C
【典例2】(23-24高二下·北京怀柔·期末)若随机变量X的分布列为(如表),
X
1
2
3
则 ;若随机变量Y=2X+1,则随机变量Y的数学期望E(Y)= .(用数字作答)
【答案】/0.5;/
【解析】
Y=2X+1.
故答案为:;.
1.(24-25高三上·天津滨海新·期中)为培养学生体育锻炼的习惯,以及强化科学健身的理念,某校创建了田径类、球类、烹武术类三个体育社团,甲、乙、丙三位同学各自参加其中一个社团,每位同学参加各个社团的可能性相同,则三位同学参加的社团各不相同的概率为 ,记三位同学所参加的社团种类的个数为X,则 .
【答案】
【解析】三位同学选择社团的总数为种,三位同学参加的社团各不相同的种类数是种,
所以三位同学参加的社团各不相同的概率为;
由题意可知,X的所有可能取值为,则
;;,
则.
故答案为:;
2.(23-24高三下·四川南充·一模)某一随机变量X的分布列如下表,且,则 .
X
0
1
2
3
P
0.1
m
0.2
n
【答案】8
【解析】由题意,得,解得,
所以,
所以.
故答案为:8.
考点三、求离散型随机变量的分布列
【典例1】(23-24高三下·北京·开学考试)为了调查居民对垃圾分类的了解程度,某社区居委会从A小区与B小区各随机抽取300名社区居民(分为18-40岁、41岁-70岁及其他人群各100名,假设两个小区中每组人数相等)参与问卷测试,分为比较了解(得分不低于60分)和“不太了解”(得分低于60分),并将问卷得分不低于60分的人数绘制频数分布表如下
分组
A小区频数
B小区频数
18-40岁人群
60
30
41-70岁人群
80
90
其他人群
30
50
假设用频率估计概率,所有居民的问卷测试结果互不影响.
(1)从小区随机抽取一名居民参与问卷测试,估计其对垃圾分类比较了解的概率;
(2)从、小区41-70岁人群中各随机抽取一名居民,记其对垃圾分类比较了解的居民人数为随机变量,求的分布列和数学期望.
【答案】(1);(2)分布列见解析,
【解析】(1)设从小区随机抽取一名居民参与问卷测试其对垃圾分类比较了解为事件,
则.
(2)依题意可知小区比较了解的概率为,小区比较了解的概率为,
则的可取取值为,,,
所以,,
,
则的分布列为
所以.
【典例2】(24-25高三上·北京·阶段练习)某市,两所中学的学生组队参加信息联赛,中学推荐了3名男生、2名女生.中学推荐了3名男生、4名女生.两校所推荐的学生一起参加集训.由于集训后队员水平相当,从参加集训的男生中随机抽取3人、女生中随机抽取3人组成代表队参赛.
(1)求中学至少有1名学生入选代表队的概率;
(2)设表示中学参赛的男生人数,求的分布列和数学期望;
(3)已知3名男生的比赛成绩分别为76,80,84,3名女生的比赛成绩分别为77,,81,若3名男生的比赛成绩的方差大于3名女生的比赛成绩的方差,写出的取值范围(不要求过程).
【答案】(1);(2)分布列见解析,期望为;(3)
【解析】(1)由题意知,参加集训的男、女生各有6名.
参赛学生全部从B中学中抽取(等价于A中学没有学生入选代表队)的概率为.
因此,A中学至少有1名学生入选代表队的概率为.
(2)根据题意得,X的可能取值为0,1,2,3.
则,
,
所以X的分布列为:
X
0
1
2
3
P
因此,X的数学期望.
(3)3名男生的比赛成绩分别为76,80,84,平均值为80,方差为,
3名女生的比赛成绩为77,,81,平均值为,
所以,
即,
代入检验,可知最小为74,最大,故,
即的取值范围.
1.(24-25高三上·北京·期中)在2021年12月9日发布的《北京市义务教育体育与健康考核评价方案》中,义务教育体育与健康考核评价包括过程性考核与现场考试两部分,总分值70分.其中过程性考核40分,现场考试30分.该评价方案从公布之日施行,分学段过渡、逐步推开.现场考试采取分类限选的方式,把内容划分了四类,必考、选考共设置22项考试内容.某区在九年级学生中随机抽取1100名男生和1000名女生作为样本进行统计调查,其中男生和女生选考乒乓球的比例分别为和,选考1分钟跳绳的比例分别为和.假设选考项目中所有学生选择每一项相互独立.
(1)从该区所有九年级学生中随机抽取名学生,估计该学生选考乒乓球的概率;
(2)从该区九年级全体男生中随机抽取人,全体女生中随机抽取人,设为这人中选考分钟跳绳的人数,求随机变量的数学期望;
(3)已知乒乓球考试满分8分.在该区一次九年级模拟考试中,样本中选考乒乓球的男生有60人得8分,40人得7.5分,其余男生得7分;样本中选考乒乓球的女生有40人得8分,其余女生得7分.记这次模拟考试中,选考乒乓球的所有学生的乒乓球平均分的估计值为,其中男生的乒乓球平均分的估计值为,试比较与的大小.(结论不需要证明)
【答案】(1);(2);(3)
【解析】(1)样本中男生选考乒乓球的人数为人,
样本中女生选考乒乓球的人数为人,
设从该区所有九年级学生中随机抽取1名学生,该学生选考乒乓球为事件,
则该学生选考乒乓球的概率;
(2)依题意的可能取值为、、、,
则,
,
,
,
所以
(3),
因为,
,
因为,所以.
2.(24-25高三上·北京·开学考试)每年8月8日为我国的全民健身日;倡导大家健康、文明、快乐的生活方式,为了激发学生的体育运动兴趣,助力全面健康成长,某中学组织全体学生开展以体育锻炼为主题的实践活动,为了解该校学生参与活动的情况,随机抽取100名学生作为样本,统计他们参加体育锻炼活动时间(单位:分钟),得到下表:
(1)从该校随机抽取1名学生,若已知抽到的是女生,估计该学生参加体育锻炼活动时间在的概率;
(2)从参加体育锻炼活动时间在和的学生中各随机抽取1人,其中初中学生的人数记为,求随机变量的分布列和数学期望;
(3)假设同组中每个数据用该组区间中点值代替,样本中的100名学生参加体育锻炼活动时间的平均数记为,初中、高中学生参加体育锻炼活动时间的平均数分别记为,.写出一个的值,使得.(结论不要求证明)
【答案】(1);(2)分布列见解析,;(3)
【解析】(1)从该校随机抽取名学生,若已知抽到的是女生,
估计该学生参加体育实践活动时间在的概率为;
(2)依题意,的所有可能值为0,1,2,
参加体育实践活动时间在的学生总人数为,其中初中生人,
参加体育实践活动时间在的学生总人数为,其中初中生人,
记事件为“从参加体育活动时间在的学生中随机抽取1人,抽到的是初中学生”,
事件为“从参加体育活动时间在的学生中随机抽取1人,抽到的是初中学生”,
事件相互独立,且,
则,
,
,
所以的分布列为:
的数学期望;
(3)根据男女生人数先补全初中学生各区间人数:
性别
男
5
12
13
8
9
8
女
6
9
10
10
6
4
学段
初中
10
高中
13
12
7
5
4
内初中生的总运动时间,
内高中生的总运动时间,
则,
,
,
由,得,解得.
考点四、二项分布及其应用
【典例1】(23-24高三下·北京·开学考试)电灯泡使用时数在1000小时以上的概率为0.8,则3个灯泡在使用1000小时内恰好坏了一个的概率为( )
A.0.384 B. C.0.128 D.0.104
【答案】A
【解析】电灯泡使用时数在1000小时以上的概率为0.8,
1个灯泡在使用1000小时内坏了的概率为,
则3个灯泡在使用1000小时内恰好坏了一个的概率为.故选:A
【典例2】(23-24高三下·北京通州·二模)随着生活水平的不断提高,人们对于身体健康越来越重视.为了解人们的健康情况v某地区一体检机构统计了年岁到岁来体检的人数及年龄在,,,的体检人数的频率分布情况,如下表.该体检机构进一步分析体检数据发现:岁到岁(不含岁)体检人群随着年龄的增长,所需面对的健康问题越多,具体统计情况如图.
组别
年龄(岁)
频率
第一组
第二组
第三组
第四组
注:健康问题是指高血压、糖尿病、高血脂、肥胖、甲状腺结节等余种常见健康问题.
(1)根据上表,求从年该体检机构岁到岁体检人群中随机抽取人,此人年龄不低于岁的频率;
(2)用频率估计概率,从年该地区岁到岁体检人群中随机抽取人,其中不低于岁的人数记为,求的分布列及数学期望;
(3)根据图的统计结果,有人认为“该体检机构年岁到岁(不含岁)体检人群健康问题个数平均值一定大于个,且小于个”.判断这种说法是否正确,并说明理由.
【答案】(1);(2)分布列见解析,数学期望;(3)不正确,理由见解析.
【解析】(1)由表格数据知:从年该体检机构岁到岁体检人群中抽取人,
此人年龄不低于岁的频率为:.
(2)用频率估计概率,从年该地区岁到岁体检人群中随机抽取人,
此人年龄不低于岁的概率为,则;
所有可能的取值为,
;;
;;
的分布列为:
数学期望.
(3)这种说法不正确,理由如下:
假设在体检人群年龄岁到岁(不含岁)中,
、、、体检人群所占频率分别为、、、,
则岁到岁(不含岁)体检人群健康问题平均值为
个,与该说法结论不同,
该说法是不正确的.
1.(23-24高三上·北京海淀·阶段练习)人工智能正在逐渐改变着我们的日常生活,不过,它所涉及的数学知识并非都是遥不可及的高深理论.为了解“拼音输入法”的背后原理,随机选取甲类题材“新闻稿”中1200字作为样本语料库,其中“一”出现了30次,统计“一”与其后面一个字(或标点)的搭配情况,数据如下:
“一”与其后面一个字(或标点)的搭配情况
频数
“一个”
6
“一些”
4
“一穷”
2
“一条”
2
其他
假设用频率估计概率.
(1)求的值,并估计甲类题材中“一”出现的概率;
(2)在甲类题材“新闻稿”中随机抽取2个“一”,其中搭配“一个”出现的次数为,求的分布列和期望;
(3)另外随机选取甲类题材“新闻稿”中800字作为样本语料库进行统计,“一”出现了24次,“一格”出现了2次,若在甲类题材“新闻稿”的撰写中,输入拼音“yige”时,“一个”和“一格”谁在前面更合适?(结论不要求证明)
【答案】(1)16;;(2)分布列见解析;;(3)“一个”在前更合适
【解析】(1)由题意可得;
故甲类题材中“一”出现的概率为;
(2)由题意在甲类题材“新闻稿”中随机抽取2个“一”,搭配“一个”出现的概率为,
则,则,,
,
故X的分布列为:
X
0
1
2
P
则.
(3)由题意知样本语料库中“一格”出现的概率为,
甲类题材中“一个”出现的概率为,
由于,故输入拼音“yige”时,“一个”在前面更合适.
2.(24-25高三上·北京·阶段练习)“稻草很轻,但是他迎着风仍然坚韧,这就是生命的力量,意志的力量”“当你为未来付出踏踏实实努力的时候,那些你觉得看不到的人和遇不到的风景都终将在你生命里出现”……当读到这些话时,你会切身体会到读书破万卷给予我们的力量.为了解某普通高中学生的阅读时间,从该校随机抽取了名学生进行调查,得到了这名学生一周的平均阅读时间(单位:小时),并将样本数据分成九组,绘制成如图所示的频率分布直方图.
(1)求的值;
(2)为进一步了解这名学生阅读时间的分配情况,从周平均阅读时间在,,三组内的学生中,采用分层抽样的方法抽取了人,现从这人中随机抽取人,记周平均阅读时间在内的学生人数为,求的分布列和数学期望;
(3)以样本的频率估计概率,从该校所有学生中随机抽取名学生,用表示这名学生中恰有名学生周平均阅读时间在内的概率,其中.当最大时,写出的值.
【答案】(1);(2)分布列见解析;数学期望;(3)
【解析】(1),.
(2)由频率分布直方图可得:周平均阅读时间在,,三组的频率之比为
,
人中,周平均阅读时间在的人数为人;在的人数为人;
在的人数为人;
则所有可能的取值为,
;;
;;
的分布列为:
数学期望.
(3)用频率估计概率,从该校所有学生中随机抽取名学生,
周平均阅读时间在内的概率;
则,
若最大,则最大,当时,取得最大值.
考点五、超几何分布及其应用
【典例1】(23-24高二下·北京延庆·期中)学校要从名男教师和名女教师中随机选出人去支教,设抽取的人中女教师的人数为,则= .
【答案】
【解析】由题意可得,的取值为,
,,,
.
【典例2】(23-24高二下·北京海淀·期末)某学校组织趣味运动会,一共设置了3个项目(其中只包含1个球类项目),每位教师只能从3个项目中随机选择2个参加,设李老师选择的2个项目中所含球类项目的数量为,则的所有可能取值为 ,数学期望 .
【答案】0,1;.
【解析】X的取值可能为0,1.
依题意可知服从超几何分布,
则,,
所以.
故答案为:0,1;.
1.(22-23高三上·北京·期中)为发展业务,某调研组对A,B两个公司的扫码支付情况进行调查,准备从国内个人口超过1000万的超大城市和8个人口低于100万的小城市中随机抽取若干个进行统计.若一次抽取2个城市,全是小城市的概率为.
(1)求n的值;
(2)若一次抽取4个城市,
①假设抽取出的小城市的个数为X,求X的可能值及相应的概率;
②若抽取的4个城市是同一类城市,求全为超大城市的概率.
【答案】(1);(2)①X的可能取值为0,1,2,3,4,相应概率见解析;②.
【解析】(1)从个城市中一次抽取2个城市,有种情况,
其中全是小城市的有种情况,
则全是小城市的概率为,解得(负值舍去).
(2)①由题意可知,X的可能取值为0,1,2,3,4,
相应的概率分别记为,
,,
,,
.
②若抽取的4个城市全是超大城市,共有种情况;
若抽取的4个城市全是小城市,共有种情况,
所以若抽取的4个城市是同一类城市,则全为超大城市的概率为.
2.(23-24高三下·北京·开学考试)2023年10月17日至18日,第三届“一带一路”国际合作高峰论坛在北京举行,成为纪念“一带一路”倡议十周年最隆重的活动.此次活动主题为“高质量共建‘一带一路’,携手实现共同发展繁荣”,而作为“一带一路”重要交通运输的中欧班列越来越繁忙.下表是从2018年到2022年,每年中欧班列运行的列数(单位:万列).
年份
2018
2019
2020
2021
2022
运行列数
0.63
0.82
1.24
1.5
1.6
(1)计算中欧班列从2018到2022年的平均运行列数;
(2)从2018年到2022年这5年中随机选取3年,运行列数大于1.24(单位:万列)有年,求的分布列和数学期望;
(3)设2018年,2019年,2020年运行列数的方差为,2020年,2021年,2022年运行列数的方差为,从2018年到2022年这5年的运行列数的方差为,试判断,,的大小关系.(结论不要求证明)
【答案】(1)万列;(2)分布列见解析;期望为;(3)
【解析】(1)从2018年到2022年运行列数的平均值为.
所以中欧班列从2018到2022年的平均运行列数为万列.
(2)可能的取值为.
,,.
随机变量的分布列为
随机变量的期望为.
(3).
证明:设2018年,2019年,2020年运行列数的平均数为,
2020年,2021年,2022年运行列数的平均数为,
从2018年到2022年这5年的运行列数的平均数为,
则,,,
,
,
,
所以.
考点六、正态分布及其应用
【典例1】(23-24高二下·北京大兴·期末)随机变量服从正态分布,若,则( )
A. B. C. D.
【答案】A
【解析】因为且,
所以,,
所以.故选:A
【典例2】(24-25高三上·重庆·阶段练习)已知随机变量服从正态分布,,则( )
A.0.1 B.0.2 C.0.3 D.0.4
【答案】C
【解析】因为随机变量服从正态分布,且,
所以,所以.故选:C.
1.(24-25高三上·云南·阶段练习)通过对某校高三年级两个班的排球比赛成绩分析可知,班的成绩,班的成绩,的分布密度曲线如图所示,则在排球决赛中 班获胜的可能性更大.
【答案】B
【解析】从分布密度曲线可以得到如下结论:
(1)B班的平均成绩大于A班的平均成绩;
(2)B的方差小于A的方差,故B发挥较为稳定,
故B班获胜的可能更大.
2.(24-25高三上·浙江·阶段练习)在一次联考中,经统计发现,甲乙两个学校的考生人数都为1000人,数学均分都为94,标准差都为12,并且根据统计密度曲线发现,甲学校的数学分数服从正态分布,乙学校的数学分数不服从正态分布.
(1)甲学校为关注基础薄弱学生的教学,准备从70分及以下的学生中抽取10人进行访问,学生小A考分为68分,求他被抽到的概率大约为多少;
(2)根据统计发现学校乙得分不低于130分的学生有25人,得分不高于58分的有1人,试说明乙学校教学的特点;
参考数据:若,则,,.
【答案】(1);(2)乙校教学高分人数更多,130分以上学生更多,低分人数更少.
【解析】(1)由题意可知甲校学生数学得分,
由,
可得,则,
所以分数在70分及以下的学生有,
所以学生小A被抽到的概率
(2)由,
可得:
所以甲校不低于130分的概率为,
得分不高于58分的概率为,
所以甲校不低于130分有人,得分不高于58分有人,
故乙校教学高分人数更多,130分以上学生更多,低分人数更少.
1.(23-24高二下·北京西城·期末)袋中有5个形状相同的乒乓球,其中3个黄色2个白色,现从袋中随机取出3个球,则恰好有2个黄色乒乓球的概率是( )
A. B. C. D.
【答案】D
【解析】设事件A表示“取出3个球中恰好有2个黄色乒乓球”,
则,故选:D.
2.(24-25高三上·北京·期中)高尔顿(钉)板是在一块竖起的木板上钉上一排排互相平行、水平间隔相等的圆柱形铁钉,并且每一-排铁钉数目都比上一排多一个,一排中各个铁钉恰好对准上面一排两相邻铁钉的正中央.从入口处放入一个直径略小于两颗铁钉间隔的小球,当小球从两钉之间的间隙下落时,由于碰到下一排铁钉,它将以相等的可能性向左或向右落下,接着小球再通过两铁钉的间隙,又碰到下一排铁钉如此继续下去,在最底层的5个出口处各放置一个容器接住小球.理论上,小球落入2号容器的概率是多少( )
A. B. C. D.
【答案】B
【解析】设事件表示“小球落入2号容器”,
若要小球落入2号容器,则需要在通过的四层中有三层向左,一层向右,
所以.故选:B.
2.(23-24高三上·北京·阶段练习)暗箱中有编号为1,2的2个球,现从中随机摸1个球,若摸到2号球,则得2分,并停止摸球;若摸到1号球,则得1分,并将此球放回,重新摸球.记摸球停止时总得分为X,则( )
A.3 B.4 C.5 D.6
【答案】A
【解析】由题意可得的可能取值为2,3,4,5…n,
,,,…,,
,①
则,②
①②得,,
即得.当时,.故选:A.
4.(24-25高三上·北京丰台·开学考试)设离散型随机变量X服从两点分布,若,则 .
【答案】
【解析】因为离散型随机变量X服从两点分布,且
所以
故答案为:
5.(23-24高三下·北京通州·三模)已知随机变量,,且,,则 .
【答案】
【解析】因为且,所以,则,
又且,所以,解得.
故答案为:
1.(23-24高三下·浙江·模拟预测)随着疫情防控政策的优化,国内演唱会市场迅速升温,一众热门歌手的演唱会现场更是“一座难求”.小林是林俊杰的粉丝,他很想参与林俊杰“JJ20”世界巡回演唱会-杭州站.主办方被小林的真诚打动,特为小林开辟了一个抢票通道,共100人从该通道参与抢票,每个人能抢到票的概率均,且抢票结果相互独立
(1)为保证该抢票通道不会出现故障(不存在抢到票却没有座位的人),主办方至少要为该通道预留多少张票;
(2)由于主办方非常喜欢小林创立的数海漫游微信公众号,于是允许多个人帮小林一同抢票,但如果存在两个人都帮小林抢到了票(包括小林自己),则小林因为“一人多票”,无法观看演出.那么,你建议小林额外找几个人帮他一起抢票呢?请说明理由.
【答案】(1)100;(2)18或19
【解析】(1)因为这100人均有可能抢到票,若要保证该抢票通道不会出现故障,
所以主办方至少要为该通道预留100张票.
(2)若小林额外找个人帮他一起抢票,
则抢到票的概率为,
可得,
令,解得;令,解得;令,解得;
即,
所以小林额外找18或19个人帮他一起抢票.
2.(23-24高三上·北京西城·期中)某校设计了一个实验学科的实验考查方案;考生从6道备选题中一次性随机抽取3题,按照题目要求独立完成全部实验操作,规定:至少正确完成两题便可通过,已知6道备选题中甲生有4题能正确完成,2题不能完成;考生乙每题正确完成的概率都是,求:
(1)分别写出甲、乙两考生正确完成题数的概率分布列,并计算数学期望;
(2)试用统计知识分析比较两考生的实验操作能力.
【答案】(1)答案见解析;(2)答案见解析
【解析】(1)设考生甲正确完成实验操作的题数为ξ,则ξ的可能取值是1,2,3,
,
所以ξ的分布列为:
ξ
1
2
2
P
则;
设考生乙正确完成实验操作的题数为η,易知,
所以,
,
所以η的分布列为:
η
0
1
2
3
P
所以.
(2)由(1)知,
,
,
,
所以,,
故从正确完成实验操作的题数的均值方面分析,两人水平相当;
从正确完成实验操作的题数的方差方面分析,甲的水平更稳定;
从至少正确完成2题的概率方面分析,甲通过的可能性更大.
3.(23-24高二下·北京延庆·期中)甲、乙两人练习投篮,每次投篮命中的概率分别为,,假设两人每次投篮是否命中相互之间没有影响.
(1)如果甲、乙两人各投篮次,求两人中至少有人投篮命中的概率;
(2)如果甲投篮次,求甲至多有次投篮命中的概率;
(3)如果乙投篮次,求乙投篮命中几个球的概率最大?直接写出结论.
【答案】(1);(2);(3)
【解析】(1)记“甲投篮1次,且命中”为事件A
记“乙投篮1次,且命中”为事件B
记“甲、乙两人各投篮次,求两人中至少有人投篮命中” 为事件C
由已知,
由已知,
法一:,,
则甲、乙两人各投篮次,两人中至少有人投篮命中概率为
法二:所以,
答:甲、乙两人各投篮次,求两人中至少有人投篮命中的概率
(2)记“甲投篮4次,且至多有2次投篮命中”为事件D
因为甲每次投篮命中的概率为,
记投篮命中次数为,则的取值范围是
,,
所以
答:甲投篮4次,且至多有2次投篮命中的概率为
(3)根据题意,乙投篮10次,命中的次数为Y,则Y~B(10,),
故,
若,解得由于为整数,故
故乙投篮命中个球的概率最大.
4.(24-25高三上·北京东城·阶段练习)为了解某中学高一年级学生身体素质情况,对高一年级的1班~8班进行了抽测,采取如下方式抽样:每班随机各抽10名学生进行身体素质监测.经统计,每班10名学生中身体素质监测成绩达到优秀的人数散点图如下(x轴表示对应的班号,y轴表示对应的优秀人数):
(1)若用散点图预测高一年级学生身体素质情况,从高一年级学生中任意抽测1人,试估计该生身体素质监测成绩达到优秀的概率;
(2)若从高一2班抽测的10人中随机抽取1人,从高一5班抽测的10人中随机抽取1人,设X表示这2人中身体素质监测成绩达到优秀的人数,求X的分布列和数学期望;
(3)假设每个班学生身体素质优秀的概率与该班随机抽到的10名学生的身体素质优秀率相等.现在从每班中分别随机抽取1名同学,用“”表示第k班抽到的这名同学身体素质优秀,“”表示第k班抽到的这名同学身体素质不是优秀.直接写出方差,,,的大小关系(无需过程).
【答案】(1);(2)分布列见解析,数学期望;(3).
【解析】(1)依题意,从高一年级的(1)班~(8)班抽测共80人,
其中身体素质监测成绩达到优秀的共有,
所以估计该生身体素质监测成绩达到优秀的概率为.
(2)依题意,高一2班抽测的10人中优秀的有6人,高一5班抽测的10人中优秀的有7人,
则可取,
,,,
则的分布列为:
0
1
2
的数学期望.
(3)依题意,,服从两点分布,则,
,服从两点分布,则,
,服从两点分布,则,
,服从两点分布,则,
所以.
5.(23-24高三上·北京·阶段练习)2022年冬季奥林匹克运动会主办城市是北京,北京成为第一个举办过夏季奥林匹克运动会和冬季奥林匹克运动会以及亚洲运动会三项国际赛事的城市!为迎接冬奥会的到来,某地很多中小学开展了模拟冬奥会赛事的活动,为了深入了解学生在“自由式滑雪”和“单板滑雪”两项活动的参与情况,在该地随机选取了10所学校进行研究,得到如下数据:
(1)在这10所学校中随机选取3所来调查研究,求这3所学校参与“自由式滑雪”都超过40人的概率;
(2)“单板滑雪”参与人数超过45人的学校可以作为“基地学校”,现在从这10所学校中随机选出3所,记为选出可作“基地学校”的学校个数,求X的分布列和数学期望;
(3)现在有一个“单板滑雪”集训营,对“滑行、转弯、停止”这3个动作技巧进行集训,且在集训中进行了多轮测试.规定:在一轮测试中,这3个动作中至少有2个动作达到“优秀”,则该轮测试记为“优秀”.在集训测试中,小明同学3个动作中每个动作达到“优秀”的概率均为,每个动作互不影响且每轮测试互不影响.如果小明同学在集训测试中要想获得“优秀”的次数的平均值达到不少于5次,那么理论上至少要进行多少轮测试?
【答案】(1);(2)分布列见解析,;(3)至少要进行轮测试.
【解析】(1)记“从10所学校中随机选取3所学校参与“自由式滑雪”都超过40人”为事件A,
参与“自由式滑雪”的人数超过40人的学校共4所,
随机选择3所学校共种,所以.
(2)的所有可能取值为,
参与“单板滑雪”人数在45人以上的学校共4所,
所以,,
,,
所以的分布列如下表:
0
1
2
3
所以.
(3)记“小明同学在一轮测试中要想获得优秀”为事件B,
则,
由题意,小明同学在集训测试中获得“优秀”的次数服从二项分布,
由题意列式,得,
因为,所以的最小值为,
故至少要进行轮测试.
1.(2022·全国·高考真题)已知随机变量X服从正态分布,且,则 .
【答案】/.
【解析】因为,所以,
因此.
2.(2022·浙江·高考真题)现有7张卡片,分别写上数字1,2,2,3,4,5,6.从这7张卡片中随机抽取3张,记所抽取卡片上数字的最小值为,则 , .
【答案】;/
【解析】从写有数字1,2,2,3,4,5,6的7张卡片中任取3张共有种取法,
其中所抽取的卡片上的数字的最小值为2的取法有种,
所以,
由已知可得的取值有1,2,3,4,
,,
所以,
故答案为:,.
3.(2024·全国·高考真题)甲、乙两人各有四张卡片,每张卡片上标有一个数字,甲的卡片上分别标有数字1,3,5,7,乙的卡片上分别标有数字2,4,6,8,两人进行四轮比赛,在每轮比赛中,两人各自从自己持有的卡片中随机选一张,并比较所选卡片上数字的大小,数字大的人得1分,数字小的人得0分,然后各自弃置此轮所选的卡片(弃置的卡片在此后的轮次中不能使用).则四轮比赛后,甲的总得分不小于2的概率为 .
【答案】/0.5
【解析】设甲在四轮游戏中的得分分别为,四轮的总得分为.
对于任意一轮,甲乙两人在该轮出示每张牌的概率都均等,其中使得甲得分的出牌组合有六种,
从而甲在该轮得分的概率,所以.
从而.
记.
如果甲得0分,则组合方式是唯一的:必定是甲出1,3,5,7分别对应乙出2,4,6,8,所以;
如果甲得3分,则组合方式也是唯一的:必定是甲出1,3,5,7分别对应乙出8,2,4,6,所以.
而的所有可能取值是0,1,2,3,故,.
所以,,两式相减即得,故.
所以甲的总得分不小于2的概率为.
故答案为:.
4.(2024·北京·高考真题)某保险公司为了了解该公司某种保险产品的索赔情况,从合同险期限届满的保单中随机抽取1000份,记录并整理这些保单的索赔情况,获得数据如下表:
赔偿次数
0
1
2
3
4
单数
假设:一份保单的保费为0.4万元;前3次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.
(1)估计一份保单索赔次数不少于2的概率;
(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.
(i)记为一份保单的毛利润,估计的数学期望;
(ⅱ)如果无索赔的保单的保费减少,有索赔的保单的保费增加,试比较这种情况下一份保单毛利润的数学期望估计值与(i)中估计值的大小.(结论不要求证明)
【答案】(1);(2)(i)0.122万元;(ii) 这种情况下一份保单毛利润的数学期望估计值大于(i)中估计值
【解析】(1)设为“随机抽取一单,赔偿不少于2次”,
由题设中的统计数据可得.
(2)(ⅰ)设为赔付金额,则可取,
由题设中的统计数据可得,
,,,
故
故(万元).
(ⅱ)由题设保费的变化为,
故(万元),
从而.
5.(2022·北京·高考真题)在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到以上(含)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):
甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;
乙:9.78,9.56,9.51,9.36,9.32,9.23;
丙:9.85,9.65,9.20,9.16.
假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.
(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;
(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);
(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)
【答案】(1)0.4;(2);(3)丙
【解析】(1)由频率估计概率可得
甲获得优秀的概率为0.4,乙获得优秀的概率为0.5,丙获得优秀的概率为0.5,故答案为0.4
(2)设甲获得优秀为事件A1,乙获得优秀为事件A2,丙获得优秀为事件A3
,
,
,
.
∴X的分布列为
X
0
1
2
3
P
∴
(3)丙夺冠概率估计值最大.
因为铅球比赛无论比赛几次就取最高成绩.比赛一次,丙获得9.85的概率为,
甲获得9.80的概率为,乙获得9.78的概率为.
并且丙的最高成绩是所有成绩中最高的,比赛次数越多,对丙越有利.
6.(2021·北京·高考真题)在核酸检测中, “k合1” 混采核酸检测是指:先将k个人的样本混合在一起进行1次检测,如果这k个人都没有感染新冠病毒,则检测结果为阴性,得到每人的检测结果都为阴性,检测结束:如果这k个人中有人感染新冠病毒,则检测结果为阳性,此时需对每人再进行1次检测,得到每人的检测结果,检测结束.
现对100人进行核酸检测,假设其中只有2人感染新冠病毒,并假设每次检测结果准确.
(I)将这100人随机分成10组,每组10人,且对每组都采用“10合1”混采核酸检测.
(i)如果感染新冠病毒的2人在同一组,求检测的总次数;
(ii)已知感染新冠病毒的2人分在同一组的概率为.设X是检测的总次数,求X的
分布列与数学期望E(X).
(II)将这100人随机分成20组,每组5人,且对每组都采用“5合1”混采核酸检测.设Y是检测的总次数,试判断数学期望E(Y)与(I)中E(X)的大小.(结论不要求证明)
【答案】(1)①次;②分布列见解析;期望为;(2).
【解析】(1)①对每组进行检测,需要10次;再对结果为阳性的组每个人进行检测,需要10次;
所以总检测次数为20次;
②由题意,可以取20,30,
,,
则的分布列:
所以;
(2)由题意,可以取25,30,
两名感染者在同一组的概率为,不在同一组的概率为,
则.
原创精品资源学科网独家享有版权,侵权必究!6
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$
第45讲 二项分布、超几何分布与正态分布
(6类核心考点精讲精练)
1. 5年真题考点分布
5年考情
考题示例
考点分析
2024年北京卷,第18题,13分
求离散型随机变量的均值
2022年北京卷,第18题,13分
求离散型随机变量的均值
2021年北京卷,第18题,13分
离散型随机变量的分布列与均值
2. 命题规律及备考策略
【命题规律】本节内容是北京卷的必考内容,难度中档,常在解答题中考查
【备考策略】
1.理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性;
2.能确定随机变量,求出随机变量发生的概率,正确列出分布列;
3.理解离散型随机变量的数字特征的概念,能根据分布列正确求出期望与方差;
4.能利用n重伯努利试验的模型及二项分布解决一些简单的实际问题;
5.理解超几何分布,并能进行简单的应用;
6.借助直方图认识正态分布曲线的特点及曲线所表示的意义,掌握正态曲线的相关性质,并能进行正确求解.
【命题预测】2025年北京高考命题形式可能会以两点分布、二项分布、超几何分布为基础计算随机变量的分布列、均值与方差,也可能会利用方差进行决策.
知识讲解
知识点1 随机变量的分布列、均值与方差
1、随机变量的有关概念
(1)随机变量:随着试验结果变化而变化的变量,常用字母X,Y,ξ,η,…表示.
(2)离散型随机变量:所有取值可以一一列出的随机变量.
2、离散型随机变量分布列
(1)离散型随机变量分布列的表示:一般地,若离散型随机变量可能取的不同值为,取每一个值的概率,以表格的形式表示如下:
我们将上表称为离散型随机变量的概率分布列,简称为的分布列.有时为了简单起见,也用等式,表示的分布列.
(2)分布列的性质:(1),;(2).
3、离散型随机变量的均值与方差
(1)均值:为随机变量的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(2)均值的性质
①(为常数).
②若,其中为常数,则也是随机变量,且.
③.
④如果相互独立,则.
(3)方差:为随机变量的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,称其算术平方根为随机变量的标准差.
(4)方差的性质
①若,其中为常数,则也是随机变量,且.
②方差公式的变形:.
知识点2 二项分布、超几何分布与正态分布
1、二项分布
(1)次独立重复试验:一般地,在相同条件下重复做的次试验称为次独立重复试验.
【注意】独立重复试验的条件:①每次试验在同样条件下进行;②各次试验是相互独立的;③每次试验都只有两种结果,即事件要么发生,要么不发生.
(2)二项分布的表示:一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,不发生的概率,那么事件恰好发生次的概率是(,,,…,),于是得到的分布列
…
…
…
…
由于表中第二行恰好是二项式展开式各对应项的值,称这样的离散型随机变量服从参数为,的二项分布,记作,并称为成功概率.
(3)二项分布的期望、方差:若,则,.
2、超几何分布:在含有件次品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,,1,2,…,,其中,且,,,,,称分布列为超几何分布列.如果随机变量的分布列为超几何分布列,则称随机变量服从超几何分布.
0
1
…
…
3、正态分布
(1)正态分布:一般地,如果对于任何实数,,随机变量满足,则称随机变量服从正态分布.正态分布完全由参数,确定,因此正态分布常记作.如果随机变量服从正态分布,则记为.
其中,参数是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.
(2)正态曲线的性质
①曲线位于轴上方,与轴不相交;
②曲线是单峰的,它关于直线对称;
③曲线在处达到峰值(最大值);
④曲线与轴之间的面积为1;
⑤当一定时,曲线的位置由确定,曲线随着的变化而沿轴平移;
⑥当一定时,曲线的形状由确定.越小,曲线越“高瘦”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散,
(3)原则
若,可以证明:对给定的,是一个只与有关的定值,特别地,
;;.
在实际应用中,通常认为服从于正态分布的随机变量只取中的值,这在统计学中称为原则.
考点一、分布列的概念及性质
【典例1】下表是离散型随机变量的概率分布,则常数a的值是( )
3
4
5
6
A. B. C. D.
【典例2】(23-24高二下·北京顺义·期中)已知随机变量的分布列如表:(其中为常数)
0
1
2
3
4
5
0.2
0.1
0.3
0.2
0.1
则等于( )
A.0.4 B.0.5 C.0.6 D.0.7
1.离散型随机变量的概率分布规律为,其中是常数,则 .
2.(23-24高三上·江西吉安·阶段练习)已知随机变量X服从两点分布,且,,那么 .
考点二、离散型随机变量的均值、方差
【典例1】(24-25高三上·广东·阶段练习)已知随机变量的分布列如下表所示:
若,且,则( )
A. B. C. D.
【典例2】(23-24高二下·北京怀柔·期末)若随机变量X的分布列为(如表),
X
1
2
3
则 ;若随机变量Y=2X+1,则随机变量Y的数学期望E(Y)= .(用数字作答)
1.(24-25高三上·天津滨海新·期中)为培养学生体育锻炼的习惯,以及强化科学健身的理念,某校创建了田径类、球类、烹武术类三个体育社团,甲、乙、丙三位同学各自参加其中一个社团,每位同学参加各个社团的可能性相同,则三位同学参加的社团各不相同的概率为 ,记三位同学所参加的社团种类的个数为X,则 .
2.(23-24高三下·四川南充·一模)某一随机变量X的分布列如下表,且,则 .
X
0
1
2
3
P
0.1
m
0.2
n
考点三、求离散型随机变量的分布列
【典例1】(23-24高三下·北京·开学考试)为了调查居民对垃圾分类的了解程度,某社区居委会从A小区与B小区各随机抽取300名社区居民(分为18-40岁、41岁-70岁及其他人群各100名,假设两个小区中每组人数相等)参与问卷测试,分为比较了解(得分不低于60分)和“不太了解”(得分低于60分),并将问卷得分不低于60分的人数绘制频数分布表如下
分组
A小区频数
B小区频数
18-40岁人群
60
30
41-70岁人群
80
90
其他人群
30
50
假设用频率估计概率,所有居民的问卷测试结果互不影响.
(1)从小区随机抽取一名居民参与问卷测试,估计其对垃圾分类比较了解的概率;
(2)从、小区41-70岁人群中各随机抽取一名居民,记其对垃圾分类比较了解的居民人数为随机变量,求的分布列和数学期望.
【典例2】(24-25高三上·北京·阶段练习)某市,两所中学的学生组队参加信息联赛,中学推荐了3名男生、2名女生.中学推荐了3名男生、4名女生.两校所推荐的学生一起参加集训.由于集训后队员水平相当,从参加集训的男生中随机抽取3人、女生中随机抽取3人组成代表队参赛.
(1)求中学至少有1名学生入选代表队的概率;
(2)设表示中学参赛的男生人数,求的分布列和数学期望;
(3)已知3名男生的比赛成绩分别为76,80,84,3名女生的比赛成绩分别为77,,81,若3名男生的比赛成绩的方差大于3名女生的比赛成绩的方差,写出的取值范围(不要求过程).
1.(24-25高三上·北京·期中)在2021年12月9日发布的《北京市义务教育体育与健康考核评价方案》中,义务教育体育与健康考核评价包括过程性考核与现场考试两部分,总分值70分.其中过程性考核40分,现场考试30分.该评价方案从公布之日施行,分学段过渡、逐步推开.现场考试采取分类限选的方式,把内容划分了四类,必考、选考共设置22项考试内容.某区在九年级学生中随机抽取1100名男生和1000名女生作为样本进行统计调查,其中男生和女生选考乒乓球的比例分别为和,选考1分钟跳绳的比例分别为和.假设选考项目中所有学生选择每一项相互独立.
(1)从该区所有九年级学生中随机抽取名学生,估计该学生选考乒乓球的概率;
(2)从该区九年级全体男生中随机抽取人,全体女生中随机抽取人,设为这人中选考分钟跳绳的人数,求随机变量的数学期望;
(3)已知乒乓球考试满分8分.在该区一次九年级模拟考试中,样本中选考乒乓球的男生有60人得8分,40人得7.5分,其余男生得7分;样本中选考乒乓球的女生有40人得8分,其余女生得7分.记这次模拟考试中,选考乒乓球的所有学生的乒乓球平均分的估计值为,其中男生的乒乓球平均分的估计值为,试比较与的大小.(结论不需要证明)
2.(24-25高三上·北京·开学考试)每年8月8日为我国的全民健身日;倡导大家健康、文明、快乐的生活方式,为了激发学生的体育运动兴趣,助力全面健康成长,某中学组织全体学生开展以体育锻炼为主题的实践活动,为了解该校学生参与活动的情况,随机抽取100名学生作为样本,统计他们参加体育锻炼活动时间(单位:分钟),得到下表:
(1)从该校随机抽取1名学生,若已知抽到的是女生,估计该学生参加体育锻炼活动时间在的概率;
(2)从参加体育锻炼活动时间在和的学生中各随机抽取1人,其中初中学生的人数记为,求随机变量的分布列和数学期望;
(3)假设同组中每个数据用该组区间中点值代替,样本中的100名学生参加体育锻炼活动时间的平均数记为,初中、高中学生参加体育锻炼活动时间的平均数分别记为,.写出一个的值,使得.(结论不要求证明)
考点四、二项分布及其应用
【典例1】(23-24高三下·北京·开学考试)电灯泡使用时数在1000小时以上的概率为0.8,则3个灯泡在使用1000小时内恰好坏了一个的概率为( )
A.0.384 B. C.0.128 D.0.104
【典例2】(23-24高三下·北京通州·二模)随着生活水平的不断提高,人们对于身体健康越来越重视.为了解人们的健康情况v某地区一体检机构统计了年岁到岁来体检的人数及年龄在,,,的体检人数的频率分布情况,如下表.该体检机构进一步分析体检数据发现:岁到岁(不含岁)体检人群随着年龄的增长,所需面对的健康问题越多,具体统计情况如图.
组别
年龄(岁)
频率
第一组
第二组
第三组
第四组
注:健康问题是指高血压、糖尿病、高血脂、肥胖、甲状腺结节等余种常见健康问题.
(1)根据上表,求从年该体检机构岁到岁体检人群中随机抽取人,此人年龄不低于岁的频率;
(2)用频率估计概率,从年该地区岁到岁体检人群中随机抽取人,其中不低于岁的人数记为,求的分布列及数学期望;
(3)根据图的统计结果,有人认为“该体检机构年岁到岁(不含岁)体检人群健康问题个数平均值一定大于个,且小于个”.判断这种说法是否正确,并说明理由.
1.(23-24高三上·北京海淀·阶段练习)人工智能正在逐渐改变着我们的日常生活,不过,它所涉及的数学知识并非都是遥不可及的高深理论.为了解“拼音输入法”的背后原理,随机选取甲类题材“新闻稿”中1200字作为样本语料库,其中“一”出现了30次,统计“一”与其后面一个字(或标点)的搭配情况,数据如下:
“一”与其后面一个字(或标点)的搭配情况
频数
“一个”
6
“一些”
4
“一穷”
2
“一条”
2
其他
假设用频率估计概率.
(1)求的值,并估计甲类题材中“一”出现的概率;
(2)在甲类题材“新闻稿”中随机抽取2个“一”,其中搭配“一个”出现的次数为,求的分布列和期望;
(3)另外随机选取甲类题材“新闻稿”中800字作为样本语料库进行统计,“一”出现了24次,“一格”出现了2次,若在甲类题材“新闻稿”的撰写中,输入拼音“yige”时,“一个”和“一格”谁在前面更合适?(结论不要求证明)
2.(24-25高三上·北京·阶段练习)“稻草很轻,但是他迎着风仍然坚韧,这就是生命的力量,意志的力量”“当你为未来付出踏踏实实努力的时候,那些你觉得看不到的人和遇不到的风景都终将在你生命里出现”……当读到这些话时,你会切身体会到读书破万卷给予我们的力量.为了解某普通高中学生的阅读时间,从该校随机抽取了名学生进行调查,得到了这名学生一周的平均阅读时间(单位:小时),并将样本数据分成九组,绘制成如图所示的频率分布直方图.
(1)求的值;
(2)为进一步了解这名学生阅读时间的分配情况,从周平均阅读时间在,,三组内的学生中,采用分层抽样的方法抽取了人,现从这人中随机抽取人,记周平均阅读时间在内的学生人数为,求的分布列和数学期望;
(3)以样本的频率估计概率,从该校所有学生中随机抽取名学生,用表示这名学生中恰有名学生周平均阅读时间在内的概率,其中.当最大时,写出的值.
考点五、超几何分布及其应用
【典例1】(23-24高二下·北京延庆·期中)学校要从名男教师和名女教师中随机选出人去支教,设抽取的人中女教师的人数为,则= .
【典例2】(23-24高二下·北京海淀·期末)某学校组织趣味运动会,一共设置了3个项目(其中只包含1个球类项目),每位教师只能从3个项目中随机选择2个参加,设李老师选择的2个项目中所含球类项目的数量为,则的所有可能取值为 ,数学期望 .
1.(22-23高三上·北京·期中)为发展业务,某调研组对A,B两个公司的扫码支付情况进行调查,准备从国内个人口超过1000万的超大城市和8个人口低于100万的小城市中随机抽取若干个进行统计.若一次抽取2个城市,全是小城市的概率为.
(1)求n的值;
(2)若一次抽取4个城市,
①假设抽取出的小城市的个数为X,求X的可能值及相应的概率;
②若抽取的4个城市是同一类城市,求全为超大城市的概率.
2.(23-24高三下·北京·开学考试)2023年10月17日至18日,第三届“一带一路”国际合作高峰论坛在北京举行,成为纪念“一带一路”倡议十周年最隆重的活动.此次活动主题为“高质量共建‘一带一路’,携手实现共同发展繁荣”,而作为“一带一路”重要交通运输的中欧班列越来越繁忙.下表是从2018年到2022年,每年中欧班列运行的列数(单位:万列).
年份
2018
2019
2020
2021
2022
运行列数
0.63
0.82
1.24
1.5
1.6
(1)计算中欧班列从2018到2022年的平均运行列数;
(2)从2018年到2022年这5年中随机选取3年,运行列数大于1.24(单位:万列)有年,求的分布列和数学期望;
(3)设2018年,2019年,2020年运行列数的方差为,2020年,2021年,2022年运行列数的方差为,从2018年到2022年这5年的运行列数的方差为,试判断,,的大小关系.(结论不要求证明)
考点六、正态分布及其应用
【典例1】(23-24高二下·北京大兴·期末)随机变量服从正态分布,若,则( )
A. B. C. D.
【典例2】(24-25高三上·重庆·阶段练习)已知随机变量服从正态分布,,则( )
A.0.1 B.0.2 C.0.3 D.0.4
1.(24-25高三上·云南·阶段练习)通过对某校高三年级两个班的排球比赛成绩分析可知,班的成绩,班的成绩,的分布密度曲线如图所示,则在排球决赛中 班获胜的可能性更大.
2.(24-25高三上·浙江·阶段练习)在一次联考中,经统计发现,甲乙两个学校的考生人数都为1000人,数学均分都为94,标准差都为12,并且根据统计密度曲线发现,甲学校的数学分数服从正态分布,乙学校的数学分数不服从正态分布.
(1)甲学校为关注基础薄弱学生的教学,准备从70分及以下的学生中抽取10人进行访问,学生小A考分为68分,求他被抽到的概率大约为多少;
(2)根据统计发现学校乙得分不低于130分的学生有25人,得分不高于58分的有1人,试说明乙学校教学的特点;
参考数据:若,则,,.
1.(23-24高二下·北京西城·期末)袋中有5个形状相同的乒乓球,其中3个黄色2个白色,现从袋中随机取出3个球,则恰好有2个黄色乒乓球的概率是( )
A. B. C. D.
2.(24-25高三上·北京·期中)高尔顿(钉)板是在一块竖起的木板上钉上一排排互相平行、水平间隔相等的圆柱形铁钉,并且每一-排铁钉数目都比上一排多一个,一排中各个铁钉恰好对准上面一排两相邻铁钉的正中央.从入口处放入一个直径略小于两颗铁钉间隔的小球,当小球从两钉之间的间隙下落时,由于碰到下一排铁钉,它将以相等的可能性向左或向右落下,接着小球再通过两铁钉的间隙,又碰到下一排铁钉如此继续下去,在最底层的5个出口处各放置一个容器接住小球.理论上,小球落入2号容器的概率是多少( )
A. B. C. D.
2.(23-24高三上·北京·阶段练习)暗箱中有编号为1,2的2个球,现从中随机摸1个球,若摸到2号球,则得2分,并停止摸球;若摸到1号球,则得1分,并将此球放回,重新摸球.记摸球停止时总得分为X,则( )
A.3 B.4 C.5 D.6
4.(24-25高三上·北京丰台·开学考试)设离散型随机变量X服从两点分布,若,则 .
5.(23-24高三下·北京通州·三模)已知随机变量,,且,,则 .
1.(23-24高三下·浙江·模拟预测)随着疫情防控政策的优化,国内演唱会市场迅速升温,一众热门歌手的演唱会现场更是“一座难求”.小林是林俊杰的粉丝,他很想参与林俊杰“JJ20”世界巡回演唱会-杭州站.主办方被小林的真诚打动,特为小林开辟了一个抢票通道,共100人从该通道参与抢票,每个人能抢到票的概率均,且抢票结果相互独立
(1)为保证该抢票通道不会出现故障(不存在抢到票却没有座位的人),主办方至少要为该通道预留多少张票;
(2)由于主办方非常喜欢小林创立的数海漫游微信公众号,于是允许多个人帮小林一同抢票,但如果存在两个人都帮小林抢到了票(包括小林自己),则小林因为“一人多票”,无法观看演出.那么,你建议小林额外找几个人帮他一起抢票呢?请说明理由.
2.(23-24高三上·北京西城·期中)某校设计了一个实验学科的实验考查方案;考生从6道备选题中一次性随机抽取3题,按照题目要求独立完成全部实验操作,规定:至少正确完成两题便可通过,已知6道备选题中甲生有4题能正确完成,2题不能完成;考生乙每题正确完成的概率都是,求:
(1)分别写出甲、乙两考生正确完成题数的概率分布列,并计算数学期望;
(2)试用统计知识分析比较两考生的实验操作能力.
3.(23-24高二下·北京延庆·期中)甲、乙两人练习投篮,每次投篮命中的概率分别为,,假设两人每次投篮是否命中相互之间没有影响.
(1)如果甲、乙两人各投篮次,求两人中至少有人投篮命中的概率;
(2)如果甲投篮次,求甲至多有次投篮命中的概率;
(3)如果乙投篮次,求乙投篮命中几个球的概率最大?直接写出结论.
4.(24-25高三上·北京东城·阶段练习)为了解某中学高一年级学生身体素质情况,对高一年级的1班~8班进行了抽测,采取如下方式抽样:每班随机各抽10名学生进行身体素质监测.经统计,每班10名学生中身体素质监测成绩达到优秀的人数散点图如下(x轴表示对应的班号,y轴表示对应的优秀人数):
(1)若用散点图预测高一年级学生身体素质情况,从高一年级学生中任意抽测1人,试估计该生身体素质监测成绩达到优秀的概率;
(2)若从高一2班抽测的10人中随机抽取1人,从高一5班抽测的10人中随机抽取1人,设X表示这2人中身体素质监测成绩达到优秀的人数,求X的分布列和数学期望;
(3)假设每个班学生身体素质优秀的概率与该班随机抽到的10名学生的身体素质优秀率相等.现在从每班中分别随机抽取1名同学,用“”表示第k班抽到的这名同学身体素质优秀,“”表示第k班抽到的这名同学身体素质不是优秀.直接写出方差,,,的大小关系(无需过程).
5.(23-24高三上·北京·阶段练习)2022年冬季奥林匹克运动会主办城市是北京,北京成为第一个举办过夏季奥林匹克运动会和冬季奥林匹克运动会以及亚洲运动会三项国际赛事的城市!为迎接冬奥会的到来,某地很多中小学开展了模拟冬奥会赛事的活动,为了深入了解学生在“自由式滑雪”和“单板滑雪”两项活动的参与情况,在该地随机选取了10所学校进行研究,得到如下数据:
(1)在这10所学校中随机选取3所来调查研究,求这3所学校参与“自由式滑雪”都超过40人的概率;
(2)“单板滑雪”参与人数超过45人的学校可以作为“基地学校”,现在从这10所学校中随机选出3所,记为选出可作“基地学校”的学校个数,求X的分布列和数学期望;
(3)现在有一个“单板滑雪”集训营,对“滑行、转弯、停止”这3个动作技巧进行集训,且在集训中进行了多轮测试.规定:在一轮测试中,这3个动作中至少有2个动作达到“优秀”,则该轮测试记为“优秀”.在集训测试中,小明同学3个动作中每个动作达到“优秀”的概率均为,每个动作互不影响且每轮测试互不影响.如果小明同学在集训测试中要想获得“优秀”的次数的平均值达到不少于5次,那么理论上至少要进行多少轮测试?
1.(2022·全国·高考真题)已知随机变量X服从正态分布,且,则 .
2.(2022·浙江·高考真题)现有7张卡片,分别写上数字1,2,2,3,4,5,6.从这7张卡片中随机抽取3张,记所抽取卡片上数字的最小值为,则 , .
3.(2024·全国·高考真题)甲、乙两人各有四张卡片,每张卡片上标有一个数字,甲的卡片上分别标有数字1,3,5,7,乙的卡片上分别标有数字2,4,6,8,两人进行四轮比赛,在每轮比赛中,两人各自从自己持有的卡片中随机选一张,并比较所选卡片上数字的大小,数字大的人得1分,数字小的人得0分,然后各自弃置此轮所选的卡片(弃置的卡片在此后的轮次中不能使用).则四轮比赛后,甲的总得分不小于2的概率为 .
4.(2024·北京·高考真题)某保险公司为了了解该公司某种保险产品的索赔情况,从合同险期限届满的保单中随机抽取1000份,记录并整理这些保单的索赔情况,获得数据如下表:
赔偿次数
0
1
2
3
4
单数
假设:一份保单的保费为0.4万元;前3次索赔时,保险公司每次赔偿0.8万元;第四次索赔时,保险公司赔偿0.6万元.假设不同保单的索赔次数相互独立.用频率估计概率.
(1)估计一份保单索赔次数不少于2的概率;
(2)一份保单的毛利润定义为这份保单的保费与赔偿总金额之差.
(i)记为一份保单的毛利润,估计的数学期望;
(ⅱ)如果无索赔的保单的保费减少,有索赔的保单的保费增加,试比较这种情况下一份保单毛利润的数学期望估计值与(i)中估计值的大小.(结论不要求证明)
5.(2022·北京·高考真题)在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到以上(含)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):
甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;
乙:9.78,9.56,9.51,9.36,9.32,9.23;
丙:9.85,9.65,9.20,9.16.
假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.
(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;
(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);
(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)
6.(2021·北京·高考真题)在核酸检测中, “k合1” 混采核酸检测是指:先将k个人的样本混合在一起进行1次检测,如果这k个人都没有感染新冠病毒,则检测结果为阴性,得到每人的检测结果都为阴性,检测结束:如果这k个人中有人感染新冠病毒,则检测结果为阳性,此时需对每人再进行1次检测,得到每人的检测结果,检测结束.
现对100人进行核酸检测,假设其中只有2人感染新冠病毒,并假设每次检测结果准确.
(I)将这100人随机分成10组,每组10人,且对每组都采用“10合1”混采核酸检测.
(i)如果感染新冠病毒的2人在同一组,求检测的总次数;
(ii)已知感染新冠病毒的2人分在同一组的概率为.设X是检测的总次数,求X的
分布列与数学期望E(X).
(II)将这100人随机分成20组,每组5人,且对每组都采用“5合1”混采核酸检测.设Y是检测的总次数,试判断数学期望E(Y)与(I)中E(X)的大小.(结论不要求证明)
原创精品资源学科网独家享有版权,侵权必究!6
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$