内容正文:
考点12 二项分布及其应用
概率与统计,是历年高考的必考点,尤其是新高考改革后,各卷都有考查,其主要考查内容有:数字特征与概率的计算问题、随机变量的均值与方差、回归分析与独立性检验、二项分布及其应用等。例如:2020年北京高考[18],2022年全国新高考卷Ⅱ[19],2022年全国新高考卷Ⅰ[20],等都对数字特征与概率的计算问题进行了考查。
〔1〕求独立重复试验的概率
求独立重复试验概率的3个步骤
(1)判断:依据次独立重复试验的特征,判断所给试验是否为独立重复试验.
(2)分析:分析所求事件的构成.
(3)计算:对每个事件依据次独立重复试验的概率公式进行求解,最后利用互斥事件的概率加法公式计算。
〔2〕二项分布及其实际应用
1.二项分布的判断:判断一个随机变量是否服从二项分布的关键在于它是否满足以下两个条件:
(1)在一次试验中事件A只有两种试验结果(发生和不发生),而且事件A发生的概率为p,事件A发生的概率为1-p;
(2)试验可以独立重复地进行,即每重复做一次试验,事件A发生的概率都是同一常数p,事件A发生的概率都是1—p.
2.运用二项分布求概率的一般方法
(1)根据题意设出随机变量;
(2)分析出随机变量服从二项分布;
(3)明确参数n,p,写出二项分布的分布列;
(4)将k值代入表达式(公式)求出概率。
〔3〕二项分布与超几何分布辨析
有放回抽样时,每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型.而不放回抽样时,取出一个总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型.因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样。
例1.(2022·全国·新高考卷Ⅱ·19)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间的概率;
(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
例2.(2020·北京·高考·18)某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:
男生
女生
支持
不支持
支持
不支持
方案一
200人
400人
300人
100人
方案二
350人
250人
150人
250人
假设所有学生对活动方案是否支持相互独立.
(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;
(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;
(Ⅲ)将该校学生支持方案二的概率估计值记为,假设该校一年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为,试比较与 的大小.(结论不要求证明)
1.(2022·四川·成都七中模拟预测(理))现有 两所学校的高三学年分别采用甲,乙两种方案进行线上教学, 为观测其教学效果, 分别在两所学校的高三学年各随机抽取 60 名学生, 对每名学生进行综合测试评分, 记综合评分为 80 及以 上的学生为优秀学生, 经统计得到两所学校抽取的学生中共有 72 名优秀学生.
(1)用样本估计总体, 以频率作为概率, 若在 两个学校的高三学年随机抽取 3 名学生, 求所抽取的 学生中的优秀学生数的分布列、数学期望和方差;
(2)已知 A 学校抽出的优秀学生占该校抽取总人数的 , 填写下面的列联表, 并判断能否在犯错误的概率不超过的前提下认为学生综合测试评分优秀与教学方案有关.
优秀学生
非优秀学生
合计
甲方案
乙方案
合计
附:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
, 其中.
2.(2022·湖南永州·一模)我市为了解学生体育运动的时间长度是否与性别因素有关,从某几所学校中随机调查了男、女生各100名的平均每天体育运动时间,得到如下数据:
分钟
性别
(0,40]
(40,60]
(60,90]
(90,120]
女生
10
40
40
10
男生
5
25