内容正文:
专题05 概率、随机变量及其分布与统计(期末复习讲义)
核心考点
复习目标
考情规律
1.条件概率与事件的独立性
1.知识目标:掌握条件概率与独立事件的定义、公式,理清二者区别与联系.
2.能力目标:能识别情境,计算条件概率,判断独立性并求解复杂事件概率.
3.素养目标:提升逻辑推理与数学建模能力.
1.题型:选择、填空为主,偶为解答题铺垫.
2.重点:条件概率计算、独立性判断与概率计算.
3.易错点:混淆条件概率与积事件概率、误判独立性;趋势:贴合实际,侧重概念与公式应用.
2.随机变量及其与事件的联系
1.知识目标:理解随机变量本质,掌握分类与事件的对应关系.
2.能力目标:能定义变量、写出取值与对应事件,为分布列铺垫.
3.素养目标:培养数学抽象与逻辑转化能力.
1.题型:选择、填空小题,或解答题铺垫.
2.重点:变量定义、取值确定、与事件的对应关系.
3.易错点:取值遗漏、事件与变量转化不准确;趋势:结合实际,侧重本质理解.
3.离散型随机变量的分布列
1.知识目标:掌握分布列定义、性质与求解步骤.
2.能力目标:能独立求解分布列,验证性质并计算事件概率.
3.素养目标:培养逻辑推理、运算求解与数据分析能力
1.题型:解答题为主,偶考选择(求参数).
2.重点:分布列求解、性质应用、事件概率计算.
3.易错点:取值遗漏、概率计算错误、忽略性质验证;趋势:结合实际,强调步骤规范
4.二项分布与超几何分布
1.知识目标:掌握两种分布的定义、公式与适用场景,明确核心差异.
2.能力目标:能判断模型,计算概率、写分布列,解决实际问题.
3.素养目标:培养数学建模与逻辑辨析能力.
1.题型:解答题为主,常与期望、方差结合;偶考选择(模型判断).
2.重点:模型判断、概率计算、分布列求解、分布区分.
3.易错点:混淆适用场景、参数判断失误、组合数计算错误;趋势:结合实际,强调模型识别.
5.随机变量的数字特征
1.知识目标:理解期望、方差含义,掌握公式、性质与常见分布特征.
2.能力目标:能计算期望、方差,运用性质简化计算,结合实际决策.
3.素养目标:提升数据分析与数学应用能力
1.题型:选择、填空、解答题均有,常与分布列结合.
2.重点:期望、方差计算与性质应用、决策分析.
3.易错点:公式记忆错误、忽略性质条件;趋势:结合实际,侧重分析与决策.
6.正态分布
1.知识目标:理解正态分布定义与参数意义,掌握曲线性质、3σ原则与计算思路.
2.能力目标:能分析曲线特征,用对称性与3σ原则计算概率、判断异常值.
3.素养目标:培养数学抽象与逻辑推理能力.
4.知识目标:理解正态分布定义与参数意义,掌握曲线性质、3σ原则与计算思路.
5.能力目标:能分析曲线特征,用对称性与3σ原则计算概率、判断异常值.
6.素养目标:培养数学抽象与逻辑推理能力
1.题型:选择、填空为主,偶为解答题小题.
2.重点:正态曲线性质、3σ原则应用、概率计算(对称性).
3.易错点:混淆与的意义、3σ原则概率记忆错误;趋势:结合实际数据,侧重性质与原则应用.
7.一元线性回归模型
1.知识目标:掌握一元线性回归模型的定义、核心性质与系数计算公式.
2.能力目标:能计算回归系数与截距,写出回归方程,利用方程进行合理预测.
3.素养目标:培养数据分析与数学建模能力,体会样本估计总体思想.
1.题型:解答题为主,常结合散点图、数据表格考查;偶考选择(性质判断).
2.重点:回归系数计算、回归方程求解、预测应用.
3.易错点:系数计算公式记忆/计算错误、忽略样本中心点性质;趋势:结合实际数据(如经济、环境、教育数据),侧重模型构建与预测应用.
8.独立性检验
1.知识目标:掌握2×2列联表结构、卡方统计量公式与独立性判断标准.
2.能力目标:能解读列联表,计算卡方值,完成独立性检验并得出结论.
3.素养目标:培养数据分析与逻辑推理能力,体会统计推断思想.
1.题型:选择、填空或解答题小题为主,偶尔单独成解答题.
2.重点:列联表解读、卡方值计算、独立性判断结论表述.
3.易错点:卡方公式记忆错误、数据代入失误、临界值对应概率混淆;趋势:结合实际调查情境(如饮食与健康、学习方法与成绩等),侧重检验流程与结论应用.
考点一:条件概率与事件的独立性
1.核心概念
条件概率:事件B发生的前提下,事件A发生的概率,刻画两事件的关联程度.
相互独立事件:一个事件的发生与否不影响另一个事件发生的概率,是两事件无关联的量化描述.
2.核心公式
条件概率:()
独立事件判定:
独立事件“至少一个发生”:(A、B独立)
3.易错点
①误将等同于,忽略“B发生”的前提条件;②把互斥事件当作独立事件判断,互斥是,独立是概率满足乘法关系,二者无必然联系;③多事件独立判断时,遗漏“任意一个子集都满足独立关系”的条件.
4.常考结论
①若A、B独立,则与B、A与、与均独立;②若,则“A、B独立”等价于;③放回抽样中,各次抽取事件相互独立,不放回抽样中,除特殊总体外,一般不独立.
考点二:随机变量及其与事件的联系
1.核心概念
随机变量:将随机试验的每一个可能结果对应到一个实数的变量,用于量化随机现象.
离散型随机变量:取值可以一一列举的随机变量(如“摸球的个数”“命中的环数”).
2.核心关联
随机变量与事件的转化:若X为随机变量,“”“”等均对应具体随机事件,如X表示“射击命中环数”,则“”对应事件“命中9环或10环”.
3.易错点
①定义随机变量时遗漏部分试验结果,导致取值不完整;②无法准确将文字描述的事件转化为随机变量的取值表达式(如混淆“至少2个”与“大于2个”对应的取值范围).
4.常考结论
①随机变量的取值必须覆盖随机试验的所有可能结果;②同一随机试验可定义多个随机变量,需根据问题需求合理选择.
考点三:离散型随机变量的分布列
1.核心概念
离散型随机变量的分布列:列出离散型随机变量的所有可能取值及对应概率的表格,完整刻画随机变量的取值规律.
2.核心公式与性质
分布列性质:①(所有概率非负);②(所有概率和为1)
指定事件概率:(x取a到b之间的所有可能值)
3.易错点
①求解分布列时遗漏随机变量的部分取值;②计算概率后未验证概率和是否为1,导致结果错误;③直接用古典概型计数时,忽略“等可能”前提条件.
4.常考结论
①利用分布列性质可快速求解未知参数(如已知部分概率,求剩余概率);②分布列中所有概率之和必为1,可作为结果验证的核心依据;③若X为离散型随机变量,则.
考点四:二项分布
1.核心概念
二项分布:n次独立重复试验中,事件A发生的次数X服从的分布,记为,其中n为试验次数,p为每次试验中事件A发生的概率().
核心特征:①每次试验只有两种对立结果(A发生或不发生);②每次试验中事件A发生的概率p恒定;③各次试验相互独立;④试验目的是统计n次试验中A发生的次数.
2.核心公式
概率公式:(),其中为从n个元素中取k个的组合数,.
数字特征公式:期望;方差;标准差.
3.易错点
①误将非独立重复试验判定为二项分布(如不放回抽样且总体有限时,不满足独立性,不可用二项分布);②混淆参数n和p的含义(将“发生次数”当作n,或“概率”当作p的补集);③组合数计算错误(如遗漏,或误将写成);④忽略k的取值范围(k需从0到n的整数,不可取小数或超出范围的整数).
4.常考结论
①若,则,且,;②当n很大、p很小时(通常,),二项分布可近似为泊松分布;③多个相互独立的二项分布变量之和仍为二项分布(若,,且独立,则).
考点五:超几何分布
1.核心概念
超几何分布:从含有M个特殊元素(记为“成功”元素)的N个总体元素中,无放回地抽取n个元素,抽到的特殊元素个数X服从的分布,记为,其中N为总体容量,M为总体中特殊元素个数,n为抽取样本量.
核心特征:①抽样方式为无放回;②总体容量N有限;③各次抽样不独立(前次抽样结果影响后次概率);④试验目的是统计样本中特殊元素的个数.
2.核心公式
概率公式:(),其中为从M个特殊元素中取k个的组合数,为从个非特殊元素中取个的组合数,为从N个总体元素中取n个的组合数.
数字特征公式:期望;方差.
3.易错点
①混淆超几何分布与二项分布的适用场景(将无放回抽样误判为二项分布,仅当(通常)时,可近似为二项分布);②参数N、M、n取值错误(如将样本量当作N,或特殊元素个数当作n);③忽略k的取值上限(k最大为,不可超过M或n);④组合数分子分母混淆(误将写在分子,或遗漏).
4.常考结论
①超几何分布的期望与二项分布期望形式一致(),当时,,超几何分布的方差趋近于二项分布的方差;②当时,超几何分布可近似为二项分布,简化概率计算;③若,则先随k增大而增大,达到最大值后随k增大而减小.
考点六:随机变量的数字特征(期望、方差、标准差)
1.核心概念
期望(均值):随机变量X取值的平均水平,反映X取值的中心位置,记为或.
方差:随机变量X取值偏离其期望的程度,衡量取值的离散性,记为或;方差越小,取值越稳定.
标准差:方差的算术平方根,记为或,其单位与随机变量X的单位一致,更直观反映离散程度.
2.核心公式
离散型随机变量通用公式:①期望(为X的可能取值,为对应概率,);②方差,也可简化为(其中).
性质公式:①期望性质:(c为常数);(a、b为常数);(无论X、Y是否独立);若X、Y独立,则;②方差性质:(c为常数);(a、b为常数);若X、Y独立,则;,当且仅当X为常数时.
常见分布数字特征:①二项分布:,;②超几何分布:,.
3.易错点
①方差公式记忆错误(误写成,遗漏平方项);②误用方差性质(将算成,忽略常数项方差为0且系数需平方);③混淆期望与方差的意义(用期望判断稳定性,用方差判断平均水平);④计算时误写成,导致方差计算错误;⑤忽略“X、Y独立”前提,直接使用或.
4.常考结论
①若两个随机变量期望相同,方差越小,取值越稳定,实际决策中更优;②常数的期望等于其本身,方差为0;③若,则当时,方差最大,最大值为;④对于任意随机变量X,恒成立,可简化方差计算.
考点七:正态分布
1.核心概念
正态分布:连续型随机变量的常见分布,记为,其中为均值(期望),决定正态曲线的对称轴;为标准差(),决定曲线“胖瘦”(越小,曲线越瘦高,取值越集中;越大,曲线越矮胖,取值越分散).
正态曲线:刻画正态分布的光滑曲线,满足“中间高、两边低、关于对称”的特征,曲线与x轴围成的面积为1(对应概率和为1).
2.核心公式与性质
对称性性质:①;②();③.
3σ原则:①;②;③.
标准化变换:若,则令,可转化为标准正态分布(均值为0,方差为1).
3.易错点
①混淆与的意义(误将当作对称轴,或当作离散程度参数);②3σ原则概率值记忆错误(如将记为0.6827);③误将连续型随机变量单点概率当作非零值(连续型随机变量单点概率为0,仅需计算区间概率);④未利用对称性简化计算,导致区间概率求解复杂.
4.常考结论
①非标准正态分布需先标准化为再计算概率;②落在外的事件为小概率事件(概率约0.0027),可视为异常值;③若、且独立,则(线性组合仍为正态分布);④正态曲线在处取得最大值.
考点八:一元线性回归模型
1.核心概念
一元线性回归模型:描述自变量x与因变量y线性相关关系的统计模型,表达式为,其中为y的预测值,为回归系数(斜率),表示x每变化1个单位时y的平均变化量;为截距,表示x=0时y的预测值.
样本中心点:,其中、,回归直线必过样本中心点(核心性质).
线性相关方向:为正相关(x增大,y平均增大);为负相关(x增大,y平均减小).
2.核心公式
回归系数与截距:①;②(利用样本中心点性质).
预测公式:已知时,y的预测值.
3.易错点
①回归系数公式记忆错误(混淆分子分母,或遗漏n);②计算、出错,导致、偏差;③误将回归关系当作因果关系(仅为统计相关,非因果);④颠倒x与y的位置,导致回归系数意义错误;⑤用回归方程外推超出样本x取值范围的预测值(可靠性低).
4.常考结论
①回归直线必过样本中心点,可用于验证回归方程正确性;②的符号反映相关方向,绝对值越大(相同单位下)线性相关程度越强;③所有样本点都在回归直线上时,为完全线性相关,预测值与实际值相等;④回归方程仅适用于样本x的取值范围,外推需谨慎.
考点九:独立性检验
1.核心概念
独立性检验:判断两个分类变量(如“性别”与“是否喜欢运动”)之间是否存在关联的统计方法,核心是通过卡方统计量衡量观测值与期望值的差异程度.
2×2列联表:整理两个分类变量数据的表格(a、b、c、d为观测频数):列联表:整理两个分类变量数据的表格(、、、为观测频数):
,其中n为总样本量.
卡方统计量():值越大,两个变量存在关联的可能性越大.
2.核心公式
卡方统计量:(n为总样本量,a、b、c、d为列联表观测频数).
判断标准:①:有95%把握认为两变量有关联(犯错误概率≤0.05);②:有99%把握认为两变量有关联(犯错误概率≤0.01);③:无足够把握认为两变量有关联.
3.易错点
①卡方公式记忆错误(漏乘n,或误将写成ad-bc);②混淆列联表中a、b、c、d、、、的位置;③误将“关联”当作“因果关系”;④临界值对应概率记忆错误(如将对应0.05);⑤样本量过小(检验可靠性低).
4.常考结论
①值越大,两变量关联可能性越大;②检验前提是样本具有随机性和代表性;③变量独立时,值趋近于0;④列联表期望值,本质是.
题型一 条件概率与事件的独立性
解|题|技|巧
1.选择题(常考:条件概率计算、独立事件概率判断)
答题模板:
步骤1:明确题型考点(判断是条件概率还是独立事件相关问题);
步骤2:回忆对应公式(条件概率:();独立事件判定:,“至少一个发生”概率:);
步骤3:提取题干中已知概率数据(如、、等);
步骤4:代入公式计算,结合选项得出答案.
2.填空题(常考:独立事件“至少一个发生”概率计算)
答题模板:
步骤1:判断事件独立性(题干明确“独立”或“相互独立”);
步骤2:确定对立事件(“至少一个发生”的对立事件是“全部不发生”);
步骤3:计算单个事件不发生的概率(,);
步骤4:利用独立事件概率性质计算对立事件概率,再用对立事件概率得出结果.
3.解答题(常考:全概率公式、贝叶斯公式应用)
答题模板:
步骤1:明确题型考点(判断是全概率公式应用还是贝叶斯公式应用,全概率公式用于求复杂事件的概率,贝叶斯公式用于求后验概率);
步骤2:梳理已知条件,确定样本空间的划分(设是样本空间的一个划分,满足(),,且);
步骤3:代入对应公式计算:
(1)全概率公式:,依次代入和的值,计算求和结果;
(2)贝叶斯公式:,先通过全概率公式求出,再代入和的值计算;
【典例1】【多选题】(25-26高二上·黑龙江哈尔滨·期中)甲、乙两个口袋各装有1个红球和2个白球,这些球除颜色外完全相同,把从甲、乙两个口袋中各任取一个球放入对方口袋中称为一次操作,重复n次操作后,甲口袋中恰有0个红球,1个红球,2个红球分别记为事件,,,则( )
A. B.
C. D.
【典例2】(25-26高三上·四川泸州·开学考试)有两枚硬币A,B.假设抛硬币时所得的结果只能为正面向上的一种,抛硬币A正面向上的概率为,抛硬币B正面向上的概率为p.现在先从两枚硬币中随机选中一枚,然后抛掷若干次.
(1)若,求抛一次硬币,正面向上的概率.
(2)若,在已知抛了一次硬币,正面向上的条件下,求再抛一次硬币得正面向上的概率.
(3)如果当连续抛硬币k次(,)全为正面向上的前提下,可以做出论断“选中的是B硬币”,犯错误的概率不超过,则k的最小值为多少?[提示:用表示不小于x的最小整数.)
【变式1】【多选题】(2025高三上·江苏南通·专题练习)随机事件A,B满足其中和分别指事件A和B的概率,则下列说法中正确的是( )
A. B.
C.事件A与B不独立 D.
【变式2】【多选题】(24-25高二下·湖北黄冈·月考)甲、乙两个口袋各装有1个红球和2个白球,这些球除颜色外完全相同,把从甲、乙两个口袋中各任取一个球放入对方口袋中称为一次操作,重复次操作后,甲口袋中恰有0个红球,1个红球,2个红球分别记为事件,,,则( )
A. B.
C. D.
【变式3】(24-25高二下·湖北省直辖县级单位·期末)已知一批产品是由甲、乙、丙三名工人生产的,三人生产的产品分别占总产量的,.已知三人生产产品的次品率分别为.
(1)现从这批产品中按等比例分层抽样抽出10件产品,再从这10件产品中不放回地任取两件进行检测,记事件“第一次取出的产品是乙生产的”,“第二次抽出的产品是甲生产的产品”,分别求;
(2)现从这批产品中任取一件产品,已知它是次品,求这件产品是由丙生产的概率.
题型二 随机变量及其与事件的联系
答|题|模|板
1.填空题(常考:随机变量与事件的转化、对立事件概率关系)
答题模板:
步骤1:明确随机变量的定义(厘清随机变量所表示的实际意义,如“红球个数”“次品个数”);
步骤2:实现随机变量与事件的转化(将“”“”“”等转化为具体文字描述的事件,如“”对应“至少1个红球”);
步骤3:判断概率关系(利用对立事件性质:,);步骤3:判断概率关系(利用对立事件性质:,);
步骤4:规范书写转化后的事件及概率关系.
【典例1】(24-25高二下·河北邢台·月考)下列是离散型随机变量的是( )
A.种子含水量的测量误差
B.某品牌电视机的使用寿命
C.某网页在24小时内被浏览的次数
D.测量某一零件的长度产生的测量误差
【典例2】(24-25高二下·河南郑州·期末)某人进行投篮训练,最多投篮4次,命中一次就停止投篮,记投篮次数为,则表示的试验结果是( )
A.第2次投篮命中 B.第3次投篮未命中
C.前3次投篮均未命中 D.前2次投篮均未命中,第3次投篮命中
【变式1】【多选题】(24-25高二下·全国·课后作业)(多选)下列叙述中,是离散型随机变量的是( )
A.某座大桥一天经过的车辆数
B.某无线电寻呼台一天内收到的寻呼次数
C.一天之内的温度
D.一位射击手对目标进行射击,击中目标得1分,未击中目标得0分,用表示该射击手在一次射击中的得分
【变式2】【多选题】(24-25高二下·全国·课后作业)将一个骰子掷两次,能作为随机变量的是( )
A.两次掷出的点数之和 B.两次掷出的最大点数
C.第一次与第二次掷出的点数之差 D.两次掷出的点数
【变式3】(24-25高二·全国·课堂例题)下面给出三个随机变量:
①某地110报警台1分钟内接到的求救电话的次数;
②某森林树木的高度在(单位:)这一范围内变化,测得某一树木的高度;
③某人射击2次,击中目标的环数之和.其中离散型随机变量有( )
A.0个 B.1个 C.2个 D.3个
题型三 离散型随机变量的分布列
答|题|模|板
1.解答题(常考:分布列性质应用、指定事件概率计算)
答题模板:
步骤1:利用分布列性质求未知参数(若分布列含未知量,根据“所有概率和为1”列方程求解,注意验证概率非负);
步骤2:计算指定区间的概率(若求,累加对应的概率;若求或,优先用对立事件或计算,简化运算);步骤2:计算指定区间的概率(若求,累加对应的概率;若求或,优先用对立事件或计算,简化运算);
步骤3:规范书写解题过程,明确各步骤依据(如“由分布列性质可知”“根据对立事件概率公式”).
【典例1】(25-26高三上·山西大同·月考)已知随机变量,均服从两点分布,且,,若,则( )
A. B. C. D.
【典例2】(25-26高二上·广东佛山·月考)甲、乙是两名射击运动员,根据历史统计数据,甲一次射击命中10、9、8环的概率分别为、、,乙一次射击命中10、9环的概率分别为、.一轮射击中,甲、乙各射击一次.甲、乙射击相互独立,每次射击也互不影响.
(1)在一轮射击中,求甲命中的环数不高于乙命中的环数的概率;
(2)记一轮射击中,甲、乙命中的环数之和为,求的值,和X对应的概率;
【变式1】(25-26高二上·黑龙江哈尔滨·月考)人工智能(Artificial Intelligence),英文缩写为AI,是新一轮科技革命和产业变革的重要驱动力量,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学.如今利用“人工智能”的场景屡见不鲜,从帮助记忆单词、解答难题、到人机比赛,它的身影无处不在.小明和智能机器人进行一场“网球”比赛,规则为:比赛采用三局两胜制(率先获得两局比赛胜利者获得最终的胜利,且比赛结束),已知小明第一局获胜的概率为.从第二局开始,如果上一局获胜,则本局获胜的概率为;如果上一局失败,则本局获胜的概率为,每局比赛均没有平局.
(1)求小明以获得比赛胜利的概率;
(2)在小明以获得比赛胜利的条件下,求在第二局比赛中小明获胜的概率;
(3)记整场比赛小明的获胜局数为,求的分布列.
【变式2】(25-26高二上·黑龙江哈尔滨·月考)一个不透明的口袋中装有3个红球、3个黄球和2个白球,这些球除颜色外其他完全相同,现从这个口袋中一次性地摸出3个球.
(1)求摸出的白球个数比黄球个数多的概率;
(2)记摸出的球的颜色种类为,求的分布列.
【变式3】(25-26高三上·广东深圳·开学考试)已知随机变量均服从两点分布,且,若,则( )
A. B. C. D.
题型四 二项分布
答|题|模|板
1.解答题(常考:二项分布分布列求解、指定事件概率计算、期望与方差计算)
答题模板:
步骤1:判断分布类型(明确试验满足“n次独立重复、每次两结果、概率恒定”,确定,标注n、p的值);
步骤2:求分布列(根据二项分布概率公式(),依次计算k取不同值时的概率,整理成表格形式);步骤2:求分布列(根据二项分布概率公式(),依次计算k取不同值时的概率,整理成表格形式);
步骤3:计算指定事件概率(如“不少于k次”即累加到的概率,可结合对立事件简化计算);
步骤4:求期望与方差(直接代入二项分布专用公式:,,,无需重复推导);
步骤5:规范书写,标注分布类型、公式依据及计算过程.
【典例1】(25-26高二上·辽宁·期末)某企业对生产设备进行优化升级,升级后的设备控制系统由个相同的元件组成,每个元件正常工作的概率均为,各元件之间相互独立.当控制系统有不少于个元件正常工作时,设备正常运行,否则设备停止运行,记设备正常运行的概率为(例如:表示控制系统由3个元件组成时设备正常运行的概率,表示控制系统由5个元件组成时设备正常运行的概率).
(1)若,当时,求控制系统中正常工作的元件个数的分布列和数学期望,并求;
(2)已知设备升级前,单位时间的产量为件,每件产品的利润为元,设备升级后,在正常运行状态下,单位时间的产量是原来的4倍,且出现了高端产品,每件产品成为高端产品的概率为,每件高端产品的利润是2元.记设备升级后单位时间内的利润为(单位:元).
(i)请用表示;
(ii)设备升级后,已知该企业现有控制系统中有5个元件,若增加2个元件,则单位时间内的利润是否提高.
【典例2】(25-26高三上·贵州贵阳·期中)2025年9月,全国“城超”足球比赛在贵阳举办,比赛期间还开展文旅会客厅、特色市集等活动.其旨为响应国家全民健身战略,契合城市发展,展现贵阳魅力,实现“体育+文旅”多元共赢.为了增进省外观众对贵州文化的了解,从参加配套文旅活动的省外观众中,随机抽取150人,开展贵州文旅知识问答活动,该活动共有,,三道试题,全部答完后,至少答对2道试题,则可获得奖励总决赛门票一张.假设每人答对这3道试题的概率分别为,,,且每人答对各道试题与否互不影响.
(1)求观众甲通过文旅知识问答活动获得总决赛门票的概率;
(2)设通过文旅知识问答活动获得总决赛门票有个人的概率为,求取得最大值时的值.
【变式1】(25-26高三上·宁夏固原·开学考试)甲、乙两名同学进行定点投篮训练,据以往的训练数据可知,甲每次投篮命中的概率为,乙每次投篮命中的概率为,各次投篮互不影响.现甲、乙两人开展多轮次的定点投篮活动,每轮次各投2个球,每投进一个球记1分,不投进记分.
(1)求甲在一个轮次投篮结束后的得分不大于0的概率;
(2)记甲、乙每轮次投篮得分之和为X.
①求;
②若,则称该轮次为一个“成功轮次”.在连续轮次的投篮活动中,记“成功轮次”的数量为Y,当n为何值时,的值最大?
【变式2】(25-26高三上·云南·期中)有一个翻牌游戏,规则如下:每一轮翻牌两次,每次翻出花色牌的概率为,且每次翻牌相互独立.若参与者在一轮翻牌游戏中,翻出的花色牌数不少于1,则获得一份精美礼品(多次参与可获得多份精美礼品).
(1)若甲参与一轮翻牌游戏,求甲获得一份精美礼品的概率;
(2)若乙参与三轮翻牌游戏,设乙获得的精美礼品数量为,求的分布列与期望.
【变式3】(24-25高二下·福建泉州·期末)如图所示,已知一质点在外力的作用下,从原点出发,每次向左移动的概率为,向右移动的概率为.若该质点每次移动一个单位长度,设经过5次移动后,该质点位于的位置,则 .
题型五 超几何分布
答|题|模|板
1.填空题(常考:超几何分布判断、指定概率计算)
答题模板:
步骤1:判断分布类型(明确试验为“无放回抽样、总体有限”,确定,标注N(总体容量)、M(特殊元素个数)、n(抽样个数));
步骤2:计算指定概率(代入超几何分布概率公式,注意k的取值范围为);步骤2:计算指定概率(代入超几何分布概率公式,注意k的取值范围为);
步骤3:规范书写分布类型(含参数)及概率结果.
2.解答题(常考:超几何分布取值范围、概率计算、期望求解)
答题模板:
步骤1:确定随机变量取值(根据和,列出X的所有可能取值);步骤1:确定随机变量取值(根据和,列出X的所有可能取值);
步骤2:计算指定概率(代入超几何概率公式,准确计算组合数,可简化分式后再运算);
步骤3:求期望(代入超几何分布期望公式,直接计算,无需重复推导);
步骤4:规范书写解题过程,明确分布判断依据和公式应用.
【典例1】(25-26高三上·山东潍坊·月考)某地区从高一年级的物理测试中随机抽取了100名学生的物理成绩,整理得到如图所示的频率分布直方图.
(1)估计该地区本次物理测试的平均分(同一组中的数据用该组区间的中点值代替);
(2)该地区某学校建议此次物理测试成绩在本地区前60%的学生选科报物理方向,试估计报物理方向的学生本次成绩不低于多少分?(结果保留整数)
(3)从成绩位于区间和的答卷中,采用分层抽样随机抽取7份,再从这7份中随机抽取3份,设成绩在的答卷份数为随机变量X,求X的分布列及数学期望.
【典例2】(24-25高二下·福建福州·期末)“英才计划”最早开始于2013年,由中国科协、教育部共同组织实施,到2023年已经培养了6000多名具有创新潜质的优秀中学生,为选拔培养对象,某高校在暑假期间从中学里挑选优秀学生参加数学和物理学科夏令营活动.
(1)若参加数学学科夏令营的7名中学生中恰有3人来自中学,从这7名中学生中选取3名中学生,求选取的中学生中来自中学的人数的分布列和数学期望;
(2)在夏令营活动中,物理学科举行了一次学科知识竞答活动,规则如下:两人一组,每一轮竞答中,每人分别答两题,若小组答对题数不小于3,则取得本轮胜利.已知甲乙两位同学组成一组,甲、乙答对每道题的概率分别为,.假设甲、乙两人每次答题相互独立,且互不影响.
(i)求甲、乙两位同学所在组每轮答题中取胜的概率;
(ii)当时,求的最大值.
【变式1】(22-23高三上·海南·月考)全国中学生生物学竞赛隆重举行.为做好考试的评价工作,将本次成绩转化为百分制,现从中随机抽取了50名学生的成绩,经统计,这批学生的成绩全部介于40至100之间,将数据按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分成6组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中的值,并估计这50名学生成绩的中位数;
(2)在这50名学生中用分层抽样的方法从成绩在[70,80),[80,90),[90,100]的三组中抽取了11人,再从这11人中随机抽取3人,记为3人中成绩在[80,90)的人数,求的分布列和数学期望;
【变式2】(24-25高一下·上海·期末)图为某平台向100名观众征集某电影的评分结果的频率分布直方图.
(1)求的值;
(2)估计这100名观众评分的平均数;
(3)从评分在和的观众中按照分层抽样的方法随机抽取7人进行问卷调查,再从这7人中随机抽取3人进行访谈,求被抽到的3人中评分在的人数的分布、期望和方差.
【变式3】【多选题】(24-25高二下·河南商丘·月考)袋中有8个大小相同的球,其中3个黑球、5个白球.现从中任取4个球,记这4个球中黑球的个数为,则( )
A.随机变量服从超几何分布
B.
C.
D.记这4个球中白球的个数为,则
题型六 随机变量的数字特征(期望、方差、标准差)
答|题|模|板
1.选择题(常考:离散型随机变量期望、方差计算)
答题模板:
步骤1:提取分布列数据(明确随机变量的所有可能取值及对应概率);步骤1:提取分布列数据(明确随机变量的所有可能取值及对应概率);
步骤2:计算期望(代入通用公式,依次计算并求和);步骤2:计算期望(代入通用公式,依次计算并求和);
步骤3:计算方差(代入通用公式,或简化公式,优先选简化公式减少运算量);步骤3:计算方差(代入通用公式,或简化公式,优先选简化公式减少运算量);
步骤4:对比选项,得出答案.
2.解答题(常考:利用期望、方差性质计算)
答题模板:
步骤1:明确已知分布类型(如二项分布),求原随机变量的期望和方差和方差(直接用对应分布的专用公式);
步骤2:回忆期望、方差性质(,,常数的期望为自身、方差为0);步骤2:回忆期望、方差性质(,,常数的期望为自身、方差为0);
步骤3:代入性质公式计算目标随机变量(如)的和;步骤3:代入性质公式计算目标随机变量(如)的和;
步骤4:规范书写,标注公式依据(如“由期望性质可知”“由二项分布期望公式可得”).
【典例1】(2026高三·全国·专题练习)某学校拟建立一座教学楼,采取竞标的方式从多家建筑公司选取一家建筑公司,经过层层筛选,甲、乙两家建筑公司进入最后的招标.现从建筑设计院聘请专家设计了一个招标方案:两家公司从6个招标问题中随机抽取3个问题,已知这6个招标问题中,甲公司能正确回答其中4道题目,而乙公司能正确回答每道题目的概率均为 ,甲、乙两家公司对每题的回答都是相互独立,互不影响的.分别求甲、乙两家公司答对题数的分布列,请从期望和方差的角度分析,甲、乙两家哪家公司竞标成功的可能性更大?
【典例2】【多选题】(25-26高二上·全国·课后作业)若随机变量服从两点分布,其中,则下列结论正确的是( )
A. B.
C. D.
【变式1】(23-24高三上·北京海淀·期末)甲、乙、丙三人进行投篮比赛,共比赛10场,规定每场比赛分数最高者获胜,三人得分(单位:分)情况统计如下:
场次
1
2
3
4
5
6
7
8
9
10
甲
8
10
10
7
12
8
8
10
10
13
乙
9
13
8
12
14
11
7
9
12
10
丙
12
11
9
11
11
9
9
8
9
11
(1)从上述10场比赛中随机选择一场,求甲获胜的概率;
(2)在上述10场比赛中,从甲得分不低于10分的场次中随机选择两场,设X表示乙得分大于丙得分的场数,求X的分布列和数学期望;
(3)假设每场比赛获胜者唯一,且各场相互独立,用上述10场比赛中每人获胜的频率估计其获胜的概率.甲、乙、丙三人接下来将进行6场投篮比赛,设为甲获胜的场数,为乙获胜的场数,为丙获胜的场数,直接写出方差,,的大小关系.(结论不要求证明)
【变式2】(2025高三·全国·专题练习)变量的分布列如下:
0
1
其中,若,则的值是 .
【变式3】【多选题】(2025高三·全国·专题练习)(多选)甲、乙两人进行乒乓球比赛,现采用三局两胜制度,规定每局比赛都没有平局(必须分出胜负),且每一局甲赢的概率都是,随机变量表示最终的比赛局数,若,则下列结论可能正确的是( )
A. B. C. D.
题型七 正态分布
答|题|模|板
1.选择题(常考:正态分布对称性应用、概率计算)
答题模板:
步骤1:明确正态分布参数(由,确定对称轴,记住);步骤1:明确正态分布参数(由,确定对称轴,记住);
步骤2:利用对称性转化区间(如,);步骤2:利用对称性转化区间(如,);
步骤3:结合已知概率计算目标概率(如);步骤3:结合已知概率计算目标概率(如);
步骤4:对比选项,得出答案.
2.解答题(常考:正态分布参数识别、3σ原则应用、概率计算)
答题模板:
步骤1:识别和(由直接得出,);步骤1:识别和(由直接得出,);
步骤2:应用3σ原则(明确、等区间,直接套用已知概率值:,);步骤2:应用3σ原则(明确、等区间,直接套用已知概率值:,);
步骤3:计算特殊区间概率(如“超过”,利用对称性和3σ原则,);步骤3:计算特殊区间概率(如“超过”,利用对称性和3σ原则,);
步骤4:规范书写,标注参数含义和3σ原则依据.
【典例1】(2026高三·全国·专题练习)某物理量的测量结果服从正态分布,下列结论中不正确的是( )
A.越小,该物理量在一次测量中在的概率越大
B.越小,该物理量在一次测量中大于10的概率为0.5
C.越小,该物理量在一次测量中小于9.99与大于10.01的概率相等
D.越小,该物理量在一次测量中落在与落在的概率相等
【典例2】(25-26高三上·湖南·期中)已知随机变量,设函数.若,,且,则的最小值为( )
A. B. C. D.
【变式1】(25-26高三上·湖北黄冈·期中)已知随机变量,,且,若,则( )
A.0.09 B.0.82 C.0.91 D.0.21
【变式2】(25-26高三上·湖南长沙·月考)某高中学校计划通过体质测试,了解学生体质健康水平.规定按照成绩由高到低,前的学生测试成绩记为“优秀”.为了了解本次体质测试情况,从中抽取了部分学生的成绩(单位:分,得分取正整数,)作为样本进行统计,将成绩进行整理后,分为六组(如图):
(1)求的值并估计记为“优秀”的最低分数;
(2)如果用按比例分层抽样的方法从样本成绩为和的学生中共抽取8人,再从8人中选4人,记4人中成绩不合格(成绩低于60分)的学生人数为,求的分布列与期望;
(3)经统计,高中生体质测试成绩近似服从正态分布,其中近似为样本平均数,近似为样本的标准差,并已求得.体质监测中心计划从全市抽取名高中生进行体质测试,记这名高中生的体质测试成绩恰好落在区间内的人数为,求的数学期望.
参考数据:若,则.
【变式3】【多选题】(2025·福建三明·模拟预测)已知某精密仪器测量金属薄片的误差服从正态分布,随机抽取10个测量数据,设为这10个数据误差在之外的个数,下列说法正确的是(已知若随机变量,则)( )
A. B.
C. D.
题型八 一元线性回归模型
答|题|模|板
1.解答题(常考:样本中心点计算、回归直线方程求解、预测应用)
答题模板:
步骤1:计算样本中心点(代入均值公式:,,准确计算求和结果);步骤1:计算样本中心点(代入均值公式:,,准确计算求和结果);
步骤2:求解回归系数和截距(代入回归系数公式,或简化公式;再由计算截距);步骤2:求解回归系数和截距(代入回归系数公式,或简化公式;再由计算截距);
步骤3:写出回归直线方程(规范表示为);步骤3:写出回归直线方程(规范表示为);
步骤4:进行预测(将目标代入回归方程,计算,并说明预测意义);
步骤5:规范书写,标注公式依据,保留适当计算精度.
【典例1】(2026高三·全国·专题练习)我国某农业大学植物研究所相关人员为了解仙人掌的植株高度(单位:),与其根茎长度(单位:)之间是否存在线性相关的关系,通过采样和数据记录得到如下数据:
样本编号
1
2
3
4
根茎长度
10
12
14
16
植株高度
62
86
112
132
参考数据:,,.
(1)由上表数据计算相关系数,并说明是否可用线性回归模型拟合与的关系(若,则可用线性回归模型拟合,计算结果精确到0.001);
(2)求y关于x的经验回归方程.
附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计公式,相关系数r的公式分别为,
【典例2】【多选题】(25-26高三上·福建福州·月考)某社会机构统计了某市四所大学年毕业生人数及自主创业人数如表:
A大学
B大学
C大学
D大学
毕业生人数x(千人)
3
4
5
m
自主创业人数y(千人)
根据表中的数据得到自主创业人数关于毕业生人数的经验回归方程为,则( )
A.y与x正相关
B.
C.当时,残差为
D.样本的相关系数r为负数
【变式1】(2025·广西来宾·模拟预测)现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本(单位:万元)和企业利润的数据(单位:万元)如下表所示:
月份
1
2
3
4
5
6
7
8
物流成本
83
83.5
80
86.5
89
84.5
79
86.5
利润
114
116
106
122
132
114
132
残差
0.2
0.6
1.8
-3
-1
-4.6
根据最小二乘法公式求得经验回归方程为.
(1)求的值,并利用已知的经验回归方程求出8月份对应的残差值;
(2)请先求出线性回归模型的决定系数(精确到0.0001),若根据非线性模型求得解释变量(物流成本)对于响应变量(利润)的决定系数,请说明以上两种模型哪种模型拟合效果更好.
参考公式及数据:,,.
【变式2】(2025高二·全国·专题练习)有一种速度叫中国速度,有一种骄傲叫中国高铁.高铁可以说是中国的一张行走的名片.截至2020年,中国高铁运营里程已经达到3.9万千米.2013年至2020年中国高铁每年的运营里程统计如下表,它反映了中国高铁的飞速发展.
年份
2013
2014
2015
2016
2017
2018
2019
2020
年份代码x
1
2
3
4
5
6
7
8
运营里程y/万千米
1.3
1.6
1.9
2.2
2.5
2.9
3.5
3.9
根据以上数据,回答下面的问题.
(1)甲同学用曲线来拟合,并算出相关系数;乙同学用曲线来拟合,并算出转化为线性回归方程所对应的相关系数.请判断哪一个更适合作为y关于x的回归方程类型,并说明理由.
(2)根据(1)的判断结果及表中数据,求y关于x的回归方程.(系数精确到0.1)
(3)请你利用得到的模型,预测2030年中国高铁的运营里程将达到多少万千米.
参考公式:用最小二乘法求线性回归方程的系数,公式为;
参考数据:,令,.
【变式3】【多选题】(24-25高二下·山东枣庄·期末)某地新开了一条夜市街,每晚最多能接纳10万人.主办公司计划通过广告宣传提高客流量.通过调研,发现投入的广告费x与每晚客流量y存在如下关系:
x/万元
1
2
3
4
5
y/千人
5
6
8.1
9
14.5
附,,,,
令,,,.
现用曲线拟合变量x与y的相关关系,并利用一元线性回归模型求参数,的最小二乘估计,依所求回归方程C为预测依据,则( )
A.曲线C经过点
B.
C.若投入广告费9万元,则每晚客流量会超过夜市接纳能力
D.广告费每增加1万元,每晚客流量增加3000人
题型九 独立性检验
答|题|模|板
1.解答题(常考:卡方统计量计算、独立性判断)
答题模板:
步骤1:整理2×2列联表数据(明确a、b、c、d的取值,a为第一行第一列数据,b为第一行第二列,c为第二行第一列,d为第二行第二列,计算总样本量n);
步骤2:计算卡方统计量(代入公式,分步计算分子和分母各因式,再求比值);步骤2:计算卡方统计量(代入公式,分步计算分子和分母各因式,再求比值);
步骤3:进行独立性判断(对比计算结果与临界值,如“若,则有95%的把握认为两变量有关联;否则无足够把握”);
步骤4:规范书写,标注列联表数据对应关系、公式依据,明确判断结论.
【典例1】(25-26高三上·河北·期中)某公司想了解员工对薪资的满意度情况,对该公司的100名员工进行薪资满意度调查,调查结果如表所示:
入职年限
对薪资满意度情况
合计
满意
不满意
入职年限不少于2年
20
20
40
入职年限少于2年
40
20
60
合计
60
40
100
(1)根据小概率值的独立性检验,分析该公司员工对薪资的满意度是否与入职年限有关;
(2)从样本中对薪资满意的员工中随机抽取2人,求这2人的入职年限都少于2年的概率.
附
0.1
0.05
0.01
2.706
3.841
6.635
【典例2】(25-26高三上·湖北武汉·月考)某种疾病分为甲、乙两种类型,为研究该疾病的类型与患者性别是否有关,随机抽取了名患者进行调查,得到如下列联表:
性别
疾病类型
合计
甲型病
乙型病
男
女
合计
(1)根据小概率值的独立性检验,得出了“所患疾病的类型与性别有关”的结论,求的最小值;
(2)现对部分人群接种预防甲型疾病的疫苗,要求每人至多安排2个周期接种疫苗,每人每周期必须接种3次,每次接种后,产生抗体的概率为0.8.如果一个周期内至少2次产生抗体,那么该周期结束后终止接种,否则进入第二个周期.已知每人每周期接种费用为30元,试估计1000人接种疫苗总费用的期望.附,
0.01
0.005
0.001
6.635
7.879
10.828
【变式1】(25-26高三上·河南郑州·期中)已知某市组建了一支300人的志愿者队伍,并由其中200人组成“志愿模范队”.经过一年的实践,全队共有200人的周平均服务时长超过2小时,其中有150人来自“志愿模范队”,如下表所示.
是“志愿模范队”成员
不是“志愿模范队”成员
总计
周平均服务时长超过2小时
150
200
周平均服务时长不超过2小时
总计
200
300
(1)请完成2×2列联表,并根据表中数据回答:根据小概率值的独立性检验,能否认为“是“志愿模范队”成员”与“周平均服务时长超过2小时”有关系?
(2)由于该市志愿者工作成效优异,现向全省推广该市经验,在全省每个市县都成立志愿者队伍,请以该市志愿者队伍的样本频率作为概率的值,在全省的志愿者队伍中任选3人,记周平均服务时长超过2小时且不是“志愿模范队”成员的人数为,求的分布列和数学期望.
附录:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【变式2】【多选题】(2026高三·全国·专题练习)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”做了一次调查,其中被调查的男、女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )
附表:
附:
A.人 B.人 C.人 D.人
【变式3】(24-25高二下·上海·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有 人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
参考公式:,其中.
期末基础通关练(测试时间:30分钟)
1.(24-25高二下·湖南衡阳·期末)一个体育队有4名女运动员和3名男运动员,现从队伍抽样尿检,每次从中抽选1个运动员,抽出的运动员不再检查,则在第1次抽到女运动员的条件下,第2次抽到男运动员的概率为( )
A. B. C. D.
2.(24-25高二下·四川绵阳·期末)现有3箱酸奶,里面都装有水果味和原味两种口味,第一箱内装有10袋,其中有2袋是水果味;第二箱内装有15袋,其中有3袋是水果味;第三箱内装有20袋,其中有5袋是水果味.现从三箱中任意选择一箱,然后从该箱中随机取1袋酸奶.取出的酸奶是水果味的概率为 .
3.(24-25高二下·甘肃临夏·期末)已知事件满足,则下列结论正确的是( )
A.若互斥,则
B.若,则
C.若与相互独立,则
D.若,则与相互独立
4.(22-23高二下·河南周口·期中)下面给出四个随机变量:
①一高速公路上某收费站在十分钟内经过的车辆数;
②一个沿轴进行随机运动的质点,它在轴上的位置;
③某派出所一天内接到的报警电话次数;
④某同学上学路上离开家的距离.
其中是离散型随机变量的个数为( )
A.1 B.2 C.3 D.4
5.【多选题】(24-25高二下·广东江门·期末)已知离数型随机变量X的分布列如下表所示:
X
0
1
2
P
下列说法正确的是( )
A. B. C. D.
6.(24-25高二下·广东广州·期末)如图,一个质点在随机外力的作用下,从原点O处出发,每隔1秒等可能地向左或向右移动一个单位,共移动5次,则质点位于的位置的概率为( )
A. B. C. D.
7.(24-25高二下·广东肇庆·期末)某同学参加招聘考试,笔试部分有三个题目,根据经验他答对每一题的概率均为,至少答对两题才能进入面试,则该同学能进入面试的概率为( )
A. B. C. D.
8.(24-25高二下·全国·课后作业)已知离散型随机变量X的分布列如下,若,则=( )
X
-1
0
a
2
P
b
A. B.1 C. D.
9.(24-25高二下·四川绵阳·期末)一批产品根据质量指标分为正品和次品,且次品率为,随机抽取1件,定义则随机变量的方差( )
A. B. C. D.
10.(24-25高二下·广东江门·期末)从2016年1月1日起全国统一实施全面两孩政策,为了解适龄民众对放开生二孩政策的态度,某市选取80后作为调查对象,随机调查了10人,其中打算生二胎的有4人,不打算生二胎的有6人.
(1)从这10人中随机抽取3人,记打算生二胎的人数为,求随机变量的分布列和数学期望;
(2)若以这10人的样本数据估计该市的总体数据,且以频率作为概率,从该市80后中随机抽取3人,记打算生二胎的人数为,求随机变量的分布列和数学期望,方差.
11.【多选题】(24-25高二下·江苏南京·期末)下列命题中,真命题有( )
A.数据6,2,3,4,5,7,8,9,1,10的70%分位数是8.5
B.若随机变量,则
C.已知两个变量具有线性相关关系,其回归直线方程为;若,则;
D.若,则
12.(24-25高二下·吉林·期末)某厂进行技术改造后,生产产品过程中记录的时间x(单位:天)与相应的生产能耗y(单位:吨)的几组数据,如下表所示.若y与x线性相关,且线性回归方程为,则下列说法不正确的是( )
时间x
1
2
3
4
5
生产能耗y/吨
5
4.5
4
3.5
2.5
A.由题中数据可知,变量y与x负相关 B.线性回归方程中
C.当时,残差为- D.可以预测当时能耗约为2.2吨
13.(24-25高二下·湖北孝感·期末)为研究某新药的疗效,给100名患者服用此药,跟踪调查后得如表所示的数据:
单位:名
性别
疗效
合计
无效
有效
男性患者
15
35
50
女性患者
6
44
50
合计
21
79
100
α
0.100
0.050
0.010
2.706
3.841
6.635
设:服用此药的效果与患者的性别无关,(小数点后保留3位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的概率不大于 .
14.(24-25高二下·江西·期末)某饮品店统计了一天营业时间(单位:小时)与饮品销量(单位:杯)的数据如下表:
营业时间
1
2
3
4
5
饮品销量
17
36
56
77
99
已知与线性相关.
(1)根据以上数据求饮品销量关于营业时间的回归直线方程;
(2)若平均一杯饮品的纯利润为5元,某日该饮品店计划早上9点开始营业,晚上9点结束营业,中间不休息,试预测当日饮品的总利润能否超过1000元?
参考公式:回归直线方程中,,.
期末重难突破练(测试时间:100分钟)
一、单选题
1.(24-25高二下·山东威海·期末)已知随机事件A,B满足,,,则( )
A.0.4 B.0.5 C.0.6 D.0.8
2.(24-25高二下·云南曲靖·期末)某社区开展防疫值班工作,甲乙丙三人轮流参与,规则如下:①第1天安排甲值班;②第2天从乙丙两人中随机选1人值班;③第天,从前一天未值班的2人中随机选1人值班,则第天甲值班的概率为( )
A. B. C. D.
3.(24-25高二下·广东广州·期末)已知连续型随机变量,记函数,则的图象( )
A.关于直线对称 B.关于点对称
C.关于直线对称 D.关于点对称
二、多选题
4.(24-25高二下·重庆沙坪坝·期末)掷2次质地均匀的骰子,记事件为“两次掷出的数字相同”,事件为“两次掷出的数字不同”,事件为“两次掷出的数字之和为奇数”,事件为“两次掷出的数字之和为偶数”,则下列说法正确的有( )
A.和互斥 B.和独立 C. D.
5.(24-25高二下·福建漳州·期末)甲箱中有2个白球和3个黑球,乙箱中有3个白球和2个黑球.先从甲箱中随机取出一球放入乙箱中,以,分别表示由甲箱中取出的是白球和黑球;再从乙箱中随机取出一球,以B表示从乙箱中取出的是白球,则下列结论正确的是( )
A. B.
C. D.
6.(24-25高二下·福建福州·期末)一口袋中有除颜色外完全相同的4个红球和2个白球,从中无放回的随机取两次,每次取1个球,记事件:第一次取出的是红球;事件:第一次取出的是白球;事件B:取出的两球同色;事件C:取出的两球中至少有一个红球,则下列说法中正确的是( )
A.事件,为对立事件 B.
C.事件B,C为独立事件 D.
7.(24-25高二下·山西·期末)如图,一个质点在外力的作用下,从原点0出发,每次等可能地向左或向右移动一个单位,设经过6次移动后,该质点位于的位置,记其概率为,则下列结论正确的是( )
A. B.
C. D.
三、填空题
8.(24-25高二下·福建漳州·期末)一个书包中有标号为“”的张卡片.一个人每次从中拿出一张卡片,并且不放回;如果他拿出一张与已拿出的卡片中有相同标号的卡片,则他将两张卡片都扔掉;如果他手中有3张单张卡片或者书包中卡片全部被拿走,则操作结束,记书包中卡片全部被拿走的概率为,则 ; .
9.(24-25高一下·江西宜春·期末)某校元旦晚会设计了一个抽奖游戏,主持人从编号为四个外观相同的空箱子中随机选择一个,放入奖品,再将四个箱子关闭,即主持人知道奖品在哪个箱子.当抽奖人选择某个箱子后,在箱子打开之前,主持人会随机打开一个没有奖品的箱子,并问抽奖人是否愿意更改选择以便增加中奖概率.已知甲先选择了号箱子,则在主持人打开号箱子的情况下,奖品在号箱子的概率为 .
10.(24-25高三上·河北唐山·期末)某同学进行投篮训练,每次投篮次数为n,,,每次投篮的命中率都为p,随机变量表示投篮命中的次数,服从二项分布,记,当时,可认为服从标准正态分布,已知该同学每次投篮的命中率均为0.5,每次投篮命中得2分,不中得0分.若,则该同学投中次数的期望为 次;若保证该同学n次投篮总得分在区间的概率不低于0.8,则n的最小值为 .
附:,则,.
11.(21-22高二下·上海黄浦·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关“作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为中学生追星与性别有关,则女生至少有 人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
,.
四、解答题
12.(23-24高三上·福建泉州·期末)一个袋子中有10个大小相同的球,其中红球7个,黑球3个.每次从袋中随机摸出1个球,摸出的球不再放回.
(1)求第2次摸到红球的概率;
(2)设第1,2,3次都摸到红球的概率为,第1次摸到红球的概率为,在第1次摸到红球的条件下,第2次摸到红球的概率为,在第1,2次都摸到红球的条件下,第3次摸到红球的概率为,求,,,;
(3)对于事件,试根据(2)写出,,,的等量关系式,并加以证明.
13.(24-25高二下·贵州安顺·期末)甲、乙两选手进行象棋比赛,假设各局比赛的结果相互独立,且每局比赛甲获胜的概率为,乙获胜的概率为,比赛分出胜负时结束.
(1)若,比赛采用三局两胜制,求乙获胜的概率;
(2)若比赛有两种赛制,五局三胜制和三局两胜制,且,试分析哪种赛制下甲获胜的概率更大,并说明理由;
(3)设,已知甲、乙进行了局比赛且甲胜了8局,试给出的估计值(表示局比赛中甲胜的局数,以使得最大的的值作为的估计值).
14.(24-25高二下·江西·期末)盛夏来临,某棋牌室举办为期一周的“消夏”围棋活动,分为趣味赛和积分赛(每局比赛必须决出胜负),规则如下:前2天举办趣味赛,每天仅首局比赛可获得积分,获胜得1分,失败得0分;积分赛在后5天进行,每天只有前两局比赛可获得积分,首局获胜得2分,次局获胜得1分,失败得0分.小张这一周中每天至少参加两局围棋比赛,已知她每天第一局和第二局比赛获胜的概率分别为,,且各局比赛相互独立.
(1)已知趣味赛两天积分不为0的参赛选手可获得精美礼品一份,.
(i)求小张在趣味赛中获得精美礼品的概率;
(ii)在小张获得精美礼品的条件下,求小张2天趣味赛仅积1分的概率;
(2)设小张在后5天的积分赛中,恰有2天每天积分不低于1分的概率为,求的最大值.
15.(24-25高二下·福建泉州·期末)随着中美关税战的不断升级,某企业大大加强科技研发投入的力度,为确定下一年对某产品进行科技升级的研发费用,需了解该产品年研发费用(单位:千万元)对年销售量(单位:千万件)的影响.根据市场调研与模拟,对收集的数据进行初步处理,得到散点图及一些统计量的值如
30.5
15
15
46.5
表中,.
(1)根据散点图判断,与哪一个更适合作为年销售量关于年研发费用的回归方程模型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立关于的回归方程,并估计年研发费用为27千万元时年销售量的值;
(3)科技升级后,该产品的效率大幅提高,经试验统计得大致服从正态分布.企业对科技升级团队的奖励方案如下:若不超过50%,不予奖励;若超过50%,但不超过53%,每件产品奖励2元;若超过53%,每件产品奖励4元.记为每件产品获得的奖励,求(精确到0.01).
附:①对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,.
②若随机变量,则,.
③.
期末综合拓展练(测试时间:100分钟)
一、单选题
1.(24-25高二下·安徽·期末)为测试一种新药的有效性,研究人员对某种动物种群进行试验,从该试验种群中随机抽查了100只,得到如下数据(单位:只):
发病
未发病
合计
使用药物
10
40
50
未使用药物
30
20
50
合计
40
60
100
从该动物种群中任取1只,记事件表示此动物发病,事件表示此动物使用药物,定义的优势,在发生的条件下的优势,则( )
A.可化简为,估计其值为 B.可化简为,估计其值为
C.可化简为,估计其值为 D.可化简为,估计其值为
2.(2025·黑龙江大庆·三模)某商店店庆,每个在店内消费到一定额度的顾客都可以参与抽奖活动.组织方准备了个盲盒,其中有个盲盒内有奖品.抽奖规则为:抽奖者从这个盲盒中随机抽取1个盲盒,兑奖后组织方会再补回一个相同的盲盒,充分混合后,再由下一位抽奖者抽奖.抽奖者甲先拿起了一个盲盒,在犹豫是否打开时,组织方拿走了一个没有奖品的盲盒,最终甲选择了另外一个盲盒打开,记甲中奖的概率为.抽奖者乙在选盲盒时不小心碰掉了一个盲盒,并且发现摔裂的盲盒内没有奖品,随后乙从剩下的盲盒中选定一个盲盒打开,记乙中奖的概率为,则( )
A. B. C. D.无法确定与的大小关系
3.(2023·福建·模拟预测)已知,则,,.今有一批数量庞大的零件.假设这批零件的某项质量指标引单位:毫米)服从正态分布,现从中随机抽取N个,这N个零件中恰有K个的质量指标ξ位于区间.若,试以使得最大的N值作为N的估计值,则N为( )
A.45 B.53 C.54 D.90
二、多选题
4.(24-25高二下·吉林长春·期末)某比赛共进行局,每局比赛没有平局,2n局比赛结束后赢得n局以上的一方获胜.甲、乙进行该比赛,已知甲每局比赛获胜的概率为p,每局比赛的结果相互独立,记甲在该比赛中获胜的概率为,下列结论正确的是( )
A.若,则 B.若,则当时,最大
C.若,则当时,最小 D.若,则当时,最大
5.(23-24高二下·山东菏泽·期末)假设变量与变量的对观测数据为,两个变量满足一元线性回归模型要利用成对样本数据求参数的最小二乘估计,即求使取最小值时的的值,若某汽车品牌从2020~2024年的年销量为(万辆),其中年份对应的代码为,如表,
年份代码
1
2
3
4
5
销量(万辆)
4
9
14
18
25
根据散点图和相关系数判断,它们之间具有较强的线性相关关系,可以用线性回归模型描述
令变量,且变量与变量满足一元线性回归模型则下列结论正确的有( )
A. B.
C. D.2025年的年销售量约为34.4万辆
三、填空题
6.(2024·辽宁·三模)一个书包中有标号为“”的张卡片.一个人每次从中拿出一张卡片,并且不放回;如果他拿出一张与已拿出的卡片中有相同标号的卡片,则他将两张卡片都扔掉;如果他手中有3张单张卡片或者书包中卡片全部被拿走,则操作结束.记书包中卡片全部被拿走的概率为,则 . .
四、解答题
7.(24-25高二下·山东泰安·期末)为备战全国机器人大赛,某高校机器人甲队和乙队进行练习赛,比赛规则为:①每局比赛胜者得1分,负者得0分,没有平局;②总共进行奇数局比赛;③全部比完后,分数高者获胜.假设每局比赛甲队获胜的概率都是,各局比赛之间的结果互不影响.
(1)当时,若两队共进行3局比赛,设甲队得分减去乙队得分的差为X,现在规定:若,则甲队可额外获得一次特殊训练机会,求甲队获得一次特殊训练机会的概率;
(2)若两人共进行局比赛,当且时,记事件表示“在前局比赛中甲赢了局”,事件B表示“甲最终获胜”,求,的值;
(3)若甲队在进行局比赛时获胜的概率记为,在进行局比赛时获胜的概率记为,在进行局比赛时获胜的概率记为,已知,试判断与的大小关系,并说明理由.
8.(24-25高二下·浙江金华·期末)某实验室对某二进制数码串传输进行测试,初始二进制数码串是长度为的且全部由0组成的数码串.传输过程中,每位数码以概率传输记为0,以概率传输记为1,其中,每位数码的传输相互独立,并设事件为“传输结果各位数字之和为偶数”的事件.
(1)当时,求;
(2)证明:对任意的正整数,有;
(3)在传输结果中任取一位数码,记“取到1”的事件为,问:是否存在最大值?若存在,求出使取到最大值的正整数;若不存在,请说明理由.
9.(24-25高二下·内蒙古包头·期末)为缓解学生的压力,某中学组织学生开展了一项有趣的比赛.甲,乙两人参加比赛,比赛规则为:共进行奇数局比赛,全部比完后,所赢局数多者获胜.假设每局比赛甲赢的概率都是,各局比赛之间的结果互不影响且没有平局.
(1)若两人共进行5局比赛且,设两人所赢局数之差的绝对值为X.求X的分布列和数学期望;
(2)若两人共进行局比赛且,记事件表示“在前局比赛中甲赢了局”.事件B表示“甲最终获胜”,请写出,,,的值(直接写出结果即可);
(3)若两人共进行了局比赛,甲获胜的概率记为.证明:当时,.
10.(23-24高二下·江苏·期末)《中华人民共和国国民经济和社会发展第十四个五年规划和2023年远景目标纲要》指出:要加强原创性、引领性科技攻关,坚决打赢关键核心技术攻坚战.某企业集中科研骨干力量,攻克系列关键技术,已成功实现离子注入机全谱系产品国产化,工艺段覆盖至,为我国芯片制造产业链补上重要一环.该企业使用新技术对某款芯片制造工艺进行改进.
(1)该款芯片生产有四道工序,前三道工序的生产互不影响,第四道是检测评估工序,包括智能自动检测与人工抽检.已知该款芯片在改进生产工艺前,前三道工序的次品率分别为.
①求改进生产工艺前,该款芯片的次品率;
②在第四道工序中,部分芯片由智能检测系统进行筛选,其中部分次品芯片会被淘汰,筛选后的芯片及未经筛选的芯片进入流水线由工人进行抽样检验.记表示事件“某芯片经过智能检测系统筛选”,表示事件“某芯片经人工抽检后合格”,求证:;
(2)改进生产工艺后,该款芯片的某项质量指标服从正态分布,现从中随机抽取个,这个芯片中恰有个的质量指标位于区间.
①若,以使得的最大值作为的估计值,求;
②记这个芯片的质量指标的标准差为,其中个芯片的质量指标的平均数为,标准差为,剩余芯片的质量指标的平均数为,标准差为,试写出的计算式.
参考数据:.
2 / 41
学科网(北京)股份有限公司
$
专题05 概率、随机变量及其分布与统计(期末复习讲义)
核心考点
复习目标
考情规律
1.条件概率与事件的独立性
1.知识目标:掌握条件概率与独立事件的定义、公式,理清二者区别与联系.
2.能力目标:能识别情境,计算条件概率,判断独立性并求解复杂事件概率.
3.素养目标:提升逻辑推理与数学建模能力.
1.题型:选择、填空为主,偶为解答题铺垫.
2.重点:条件概率计算、独立性判断与概率计算.
3.易错点:混淆条件概率与积事件概率、误判独立性;趋势:贴合实际,侧重概念与公式应用.
2.随机变量及其与事件的联系
1.知识目标:理解随机变量本质,掌握分类与事件的对应关系.
2.能力目标:能定义变量、写出取值与对应事件,为分布列铺垫.
3.素养目标:培养数学抽象与逻辑转化能力.
1.题型:选择、填空小题,或解答题铺垫.
2.重点:变量定义、取值确定、与事件的对应关系.
3.易错点:取值遗漏、事件与变量转化不准确;趋势:结合实际,侧重本质理解.
3.离散型随机变量的分布列
1.知识目标:掌握分布列定义、性质与求解步骤.
2.能力目标:能独立求解分布列,验证性质并计算事件概率.
3.素养目标:培养逻辑推理、运算求解与数据分析能力
1.题型:解答题为主,偶考选择(求参数).
2.重点:分布列求解、性质应用、事件概率计算.
3.易错点:取值遗漏、概率计算错误、忽略性质验证;趋势:结合实际,强调步骤规范
4.二项分布与超几何分布
1.知识目标:掌握两种分布的定义、公式与适用场景,明确核心差异.
2.能力目标:能判断模型,计算概率、写分布列,解决实际问题.
3.素养目标:培养数学建模与逻辑辨析能力.
1.题型:解答题为主,常与期望、方差结合;偶考选择(模型判断).
2.重点:模型判断、概率计算、分布列求解、分布区分.
3.易错点:混淆适用场景、参数判断失误、组合数计算错误;趋势:结合实际,强调模型识别.
5.随机变量的数字特征
1.知识目标:理解期望、方差含义,掌握公式、性质与常见分布特征.
2.能力目标:能计算期望、方差,运用性质简化计算,结合实际决策.
3.素养目标:提升数据分析与数学应用能力
1.题型:选择、填空、解答题均有,常与分布列结合.
2.重点:期望、方差计算与性质应用、决策分析.
3.易错点:公式记忆错误、忽略性质条件;趋势:结合实际,侧重分析与决策.
6.正态分布
1.知识目标:理解正态分布定义与参数意义,掌握曲线性质、3σ原则与计算思路.
2.能力目标:能分析曲线特征,用对称性与3σ原则计算概率、判断异常值.
3.素养目标:培养数学抽象与逻辑推理能力.
4.知识目标:理解正态分布定义与参数意义,掌握曲线性质、3σ原则与计算思路.
5.能力目标:能分析曲线特征,用对称性与3σ原则计算概率、判断异常值.
6.素养目标:培养数学抽象与逻辑推理能力
1.题型:选择、填空为主,偶为解答题小题.
2.重点:正态曲线性质、3σ原则应用、概率计算(对称性).
3.易错点:混淆与的意义、3σ原则概率记忆错误;趋势:结合实际数据,侧重性质与原则应用.
7.一元线性回归模型
1.知识目标:掌握一元线性回归模型的定义、核心性质与系数计算公式.
2.能力目标:能计算回归系数与截距,写出回归方程,利用方程进行合理预测.
3.素养目标:培养数据分析与数学建模能力,体会样本估计总体思想.
1.题型:解答题为主,常结合散点图、数据表格考查;偶考选择(性质判断).
2.重点:回归系数计算、回归方程求解、预测应用.
3.易错点:系数计算公式记忆/计算错误、忽略样本中心点性质;趋势:结合实际数据(如经济、环境、教育数据),侧重模型构建与预测应用.
8.独立性检验
1.知识目标:掌握2×2列联表结构、卡方统计量公式与独立性判断标准.
2.能力目标:能解读列联表,计算卡方值,完成独立性检验并得出结论.
3.素养目标:培养数据分析与逻辑推理能力,体会统计推断思想.
1.题型:选择、填空或解答题小题为主,偶尔单独成解答题.
2.重点:列联表解读、卡方值计算、独立性判断结论表述.
3.易错点:卡方公式记忆错误、数据代入失误、临界值对应概率混淆;趋势:结合实际调查情境(如饮食与健康、学习方法与成绩等),侧重检验流程与结论应用.
考点一:条件概率与事件的独立性
1.核心概念
条件概率:事件B发生的前提下,事件A发生的概率,刻画两事件的关联程度.
相互独立事件:一个事件的发生与否不影响另一个事件发生的概率,是两事件无关联的量化描述.
2.核心公式
条件概率:()
独立事件判定:
独立事件“至少一个发生”:(A、B独立)
3.易错点
①误将等同于,忽略“B发生”的前提条件;②把互斥事件当作独立事件判断,互斥是,独立是概率满足乘法关系,二者无必然联系;③多事件独立判断时,遗漏“任意一个子集都满足独立关系”的条件.
4.常考结论
①若A、B独立,则与B、A与、与均独立;②若,则“A、B独立”等价于;③放回抽样中,各次抽取事件相互独立,不放回抽样中,除特殊总体外,一般不独立.
考点二:随机变量及其与事件的联系
1.核心概念
随机变量:将随机试验的每一个可能结果对应到一个实数的变量,用于量化随机现象.
离散型随机变量:取值可以一一列举的随机变量(如“摸球的个数”“命中的环数”).
2.核心关联
随机变量与事件的转化:若X为随机变量,“”“”等均对应具体随机事件,如X表示“射击命中环数”,则“”对应事件“命中9环或10环”.
3.易错点
①定义随机变量时遗漏部分试验结果,导致取值不完整;②无法准确将文字描述的事件转化为随机变量的取值表达式(如混淆“至少2个”与“大于2个”对应的取值范围).
4.常考结论
①随机变量的取值必须覆盖随机试验的所有可能结果;②同一随机试验可定义多个随机变量,需根据问题需求合理选择.
考点三:离散型随机变量的分布列
1.核心概念
离散型随机变量的分布列:列出离散型随机变量的所有可能取值及对应概率的表格,完整刻画随机变量的取值规律.
2.核心公式与性质
分布列性质:①(所有概率非负);②(所有概率和为1)
指定事件概率:(x取a到b之间的所有可能值)
3.易错点
①求解分布列时遗漏随机变量的部分取值;②计算概率后未验证概率和是否为1,导致结果错误;③直接用古典概型计数时,忽略“等可能”前提条件.
4.常考结论
①利用分布列性质可快速求解未知参数(如已知部分概率,求剩余概率);②分布列中所有概率之和必为1,可作为结果验证的核心依据;③若X为离散型随机变量,则.
考点四:二项分布
1.核心概念
二项分布:n次独立重复试验中,事件A发生的次数X服从的分布,记为,其中n为试验次数,p为每次试验中事件A发生的概率().
核心特征:①每次试验只有两种对立结果(A发生或不发生);②每次试验中事件A发生的概率p恒定;③各次试验相互独立;④试验目的是统计n次试验中A发生的次数.
2.核心公式
概率公式:(),其中为从n个元素中取k个的组合数,.
数字特征公式:期望;方差;标准差.
3.易错点
①误将非独立重复试验判定为二项分布(如不放回抽样且总体有限时,不满足独立性,不可用二项分布);②混淆参数n和p的含义(将“发生次数”当作n,或“概率”当作p的补集);③组合数计算错误(如遗漏,或误将写成);④忽略k的取值范围(k需从0到n的整数,不可取小数或超出范围的整数).
4.常考结论
①若,则,且,;②当n很大、p很小时(通常,),二项分布可近似为泊松分布;③多个相互独立的二项分布变量之和仍为二项分布(若,,且独立,则).
考点五:超几何分布
1.核心概念
超几何分布:从含有M个特殊元素(记为“成功”元素)的N个总体元素中,无放回地抽取n个元素,抽到的特殊元素个数X服从的分布,记为,其中N为总体容量,M为总体中特殊元素个数,n为抽取样本量.
核心特征:①抽样方式为无放回;②总体容量N有限;③各次抽样不独立(前次抽样结果影响后次概率);④试验目的是统计样本中特殊元素的个数.
2.核心公式
概率公式:(),其中为从M个特殊元素中取k个的组合数,为从个非特殊元素中取个的组合数,为从N个总体元素中取n个的组合数.
数字特征公式:期望;方差.
3.易错点
①混淆超几何分布与二项分布的适用场景(将无放回抽样误判为二项分布,仅当(通常)时,可近似为二项分布);②参数N、M、n取值错误(如将样本量当作N,或特殊元素个数当作n);③忽略k的取值上限(k最大为,不可超过M或n);④组合数分子分母混淆(误将写在分子,或遗漏).
4.常考结论
①超几何分布的期望与二项分布期望形式一致(),当时,,超几何分布的方差趋近于二项分布的方差;②当时,超几何分布可近似为二项分布,简化概率计算;③若,则先随k增大而增大,达到最大值后随k增大而减小.
考点六:随机变量的数字特征(期望、方差、标准差)
1.核心概念
期望(均值):随机变量X取值的平均水平,反映X取值的中心位置,记为或.
方差:随机变量X取值偏离其期望的程度,衡量取值的离散性,记为或;方差越小,取值越稳定.
标准差:方差的算术平方根,记为或,其单位与随机变量X的单位一致,更直观反映离散程度.
2.核心公式
离散型随机变量通用公式:①期望(为X的可能取值,为对应概率,);②方差,也可简化为(其中).
性质公式:①期望性质:(c为常数);(a、b为常数);(无论X、Y是否独立);若X、Y独立,则;②方差性质:(c为常数);(a、b为常数);若X、Y独立,则;,当且仅当X为常数时.
常见分布数字特征:①二项分布:,;②超几何分布:,.
3.易错点
①方差公式记忆错误(误写成,遗漏平方项);②误用方差性质(将算成,忽略常数项方差为0且系数需平方);③混淆期望与方差的意义(用期望判断稳定性,用方差判断平均水平);④计算时误写成,导致方差计算错误;⑤忽略“X、Y独立”前提,直接使用或.
4.常考结论
①若两个随机变量期望相同,方差越小,取值越稳定,实际决策中更优;②常数的期望等于其本身,方差为0;③若,则当时,方差最大,最大值为;④对于任意随机变量X,恒成立,可简化方差计算.
考点七:正态分布
1.核心概念
正态分布:连续型随机变量的常见分布,记为,其中为均值(期望),决定正态曲线的对称轴;为标准差(),决定曲线“胖瘦”(越小,曲线越瘦高,取值越集中;越大,曲线越矮胖,取值越分散).
正态曲线:刻画正态分布的光滑曲线,满足“中间高、两边低、关于对称”的特征,曲线与x轴围成的面积为1(对应概率和为1).
2.核心公式与性质
对称性性质:①;②();③.
3σ原则:①;②;③.
标准化变换:若,则令,可转化为标准正态分布(均值为0,方差为1).
3.易错点
①混淆与的意义(误将当作对称轴,或当作离散程度参数);②3σ原则概率值记忆错误(如将记为0.6827);③误将连续型随机变量单点概率当作非零值(连续型随机变量单点概率为0,仅需计算区间概率);④未利用对称性简化计算,导致区间概率求解复杂.
4.常考结论
①非标准正态分布需先标准化为再计算概率;②落在外的事件为小概率事件(概率约0.0027),可视为异常值;③若、且独立,则(线性组合仍为正态分布);④正态曲线在处取得最大值.
考点八:一元线性回归模型
1.核心概念
一元线性回归模型:描述自变量x与因变量y线性相关关系的统计模型,表达式为,其中为y的预测值,为回归系数(斜率),表示x每变化1个单位时y的平均变化量;为截距,表示x=0时y的预测值.
样本中心点:,其中、,回归直线必过样本中心点(核心性质).
线性相关方向:为正相关(x增大,y平均增大);为负相关(x增大,y平均减小).
2.核心公式
回归系数与截距:①;②(利用样本中心点性质).
预测公式:已知时,y的预测值.
3.易错点
①回归系数公式记忆错误(混淆分子分母,或遗漏n);②计算、出错,导致、偏差;③误将回归关系当作因果关系(仅为统计相关,非因果);④颠倒x与y的位置,导致回归系数意义错误;⑤用回归方程外推超出样本x取值范围的预测值(可靠性低).
4.常考结论
①回归直线必过样本中心点,可用于验证回归方程正确性;②的符号反映相关方向,绝对值越大(相同单位下)线性相关程度越强;③所有样本点都在回归直线上时,为完全线性相关,预测值与实际值相等;④回归方程仅适用于样本x的取值范围,外推需谨慎.
考点九:独立性检验
1.核心概念
独立性检验:判断两个分类变量(如“性别”与“是否喜欢运动”)之间是否存在关联的统计方法,核心是通过卡方统计量衡量观测值与期望值的差异程度.
2×2列联表:整理两个分类变量数据的表格(a、b、c、d为观测频数):列联表:整理两个分类变量数据的表格(、、、为观测频数):
,其中n为总样本量.
卡方统计量():值越大,两个变量存在关联的可能性越大.
2.核心公式
卡方统计量:(n为总样本量,a、b、c、d为列联表观测频数).
判断标准:①:有95%把握认为两变量有关联(犯错误概率≤0.05);②:有99%把握认为两变量有关联(犯错误概率≤0.01);③:无足够把握认为两变量有关联.
3.易错点
①卡方公式记忆错误(漏乘n,或误将写成ad-bc);②混淆列联表中a、b、c、d、、、的位置;③误将“关联”当作“因果关系”;④临界值对应概率记忆错误(如将对应0.05);⑤样本量过小(检验可靠性低).
4.常考结论
①值越大,两变量关联可能性越大;②检验前提是样本具有随机性和代表性;③变量独立时,值趋近于0;④列联表期望值,本质是.
题型一 条件概率与事件的独立性
解|题|技|巧
1.选择题(常考:条件概率计算、独立事件概率判断)
答题模板:
步骤1:明确题型考点(判断是条件概率还是独立事件相关问题);
步骤2:回忆对应公式(条件概率:();独立事件判定:,“至少一个发生”概率:);
步骤3:提取题干中已知概率数据(如、、等);
步骤4:代入公式计算,结合选项得出答案.
2.填空题(常考:独立事件“至少一个发生”概率计算)
答题模板:
步骤1:判断事件独立性(题干明确“独立”或“相互独立”);
步骤2:确定对立事件(“至少一个发生”的对立事件是“全部不发生”);
步骤3:计算单个事件不发生的概率(,);
步骤4:利用独立事件概率性质计算对立事件概率,再用对立事件概率得出结果.
3.解答题(常考:全概率公式、贝叶斯公式应用)
答题模板:
步骤1:明确题型考点(判断是全概率公式应用还是贝叶斯公式应用,全概率公式用于求复杂事件的概率,贝叶斯公式用于求后验概率);
步骤2:梳理已知条件,确定样本空间的划分(设是样本空间的一个划分,满足(),,且);
步骤3:代入对应公式计算:
(1)全概率公式:,依次代入和的值,计算求和结果;
(2)贝叶斯公式:,先通过全概率公式求出,再代入和的值计算;
【典例1】【多选题】(25-26高二上·黑龙江哈尔滨·期中)甲、乙两个口袋各装有1个红球和2个白球,这些球除颜色外完全相同,把从甲、乙两个口袋中各任取一个球放入对方口袋中称为一次操作,重复n次操作后,甲口袋中恰有0个红球,1个红球,2个红球分别记为事件,,,则( )
A. B.
C. D.
【答案】ABD
【分析】对于A项,1次操作后甲、乙两个口袋中各取一个红球或各取一个白球即可求解;对于B项,1次操作后甲口袋中恰有0个红球且2次操作后甲口袋中恰有1个红球且3次操作后甲口袋中恰有2个红球即可求解;对于C项,先求,,再利用条件概率公式求解即可;对于D项,先求出,再利用并事件的概率公式求解即可.
【详解】因在操作前,甲袋中:1红2白,乙袋中:1红2白.
对于A项,要求,则1次操作后甲、乙两个口袋中各取一个红球或各取一个白球即可,
则,故A项正确;
对于B项,要求,则1次操作后甲口袋中恰有0个红球且2次操作后甲口袋中恰有1个红球且3次操作后甲口袋中恰有2个红球,
所以,故B项正确;
对于C项,要求,则1次操作后甲口袋中恰有0个红球且2次操作后甲口袋中恰有1个红球,
或1次操作后甲口袋中恰有1个红球且2次操作后甲口袋中恰有1个红球,
或1次操作后甲口袋中恰有2个红球且2次操作后甲口袋中恰有1个红球,
所以,
要求,则1次操作后甲口袋中恰有0个红球且2次操作后甲口袋中恰有1个红球,
所以,则,故C错误;
对于D项,由,,,
所以,故D项正确.
故选:ABD.
【典例2】(25-26高三上·四川泸州·开学考试)有两枚硬币A,B.假设抛硬币时所得的结果只能为正面向上的一种,抛硬币A正面向上的概率为,抛硬币B正面向上的概率为p.现在先从两枚硬币中随机选中一枚,然后抛掷若干次.
(1)若,求抛一次硬币,正面向上的概率.
(2)若,在已知抛了一次硬币,正面向上的条件下,求再抛一次硬币得正面向上的概率.
(3)如果当连续抛硬币k次(,)全为正面向上的前提下,可以做出论断“选中的是B硬币”,犯错误的概率不超过,则k的最小值为多少?[提示:用表示不小于x的最小整数.)
【答案】(1)
(2)
(3)
【分析】(1)抛一次硬币,正面向上的概率受到选择那个硬币的影响,可根据选择的硬币,将样本空间表示为“选中硬币A”和“选中硬币B”两个互斥时间的并,利用全概率公式求解;
(2)先通过贝叶斯公式确定选中硬币A或B的概率,再结合各自的正面概率,利用全概率公式算出第二次正面向上的总概率;
(3)通过贝叶斯公式明确 “犯错误的概率” 的表达式,再通过不等式变形和对数运算求解k的最小值.
【详解】(1)设事件H表示抛一次硬币正面向上,事件A表示选中硬币A,事件B表示选中硬币B,
则且与互斥,根据题意得,,,.
由全概率公式得.
因此抛一次硬币正面向上的概率为.
(2)设表示第一次正面向上,表示第二次正面向上,
则用贝叶斯公式结合(1)得,.
又,.
给定硬币类型,抛掷独立,故.
因此,所求概率为.
(3)事件F:“连续抛k次全为正面向上”,
则 “犯错误的概率” 即为,
硬币A连续k次正面向上的概率,
硬币B连续k次正面向上的概率.
根据贝叶斯公式.
此值不超过,即.即,,
由,得,所以,得.
取自然对数并由于,.
因此,k的最小值为不小于该值的最小整数:.
【变式1】【多选题】(2025高三上·江苏南通·专题练习)随机事件A,B满足其中和分别指事件A和B的概率,则下列说法中正确的是( )
A. B.
C.事件A与B不独立 D.
【答案】BC
【分析】根据已知联立方程求出,,然后根据概率的相关公式逐一判断即可.
【详解】对于选项A: , ,
,
, ,
联立
,
解得 , 选项A错误;
对于选项B: ,
, 选项B正确;
对于选项C: , ,
, ,
事件A与B不独立, 选项C正确;
对于选项D: ,
而 , 选项D错误.
故选:BC.
【变式2】【多选题】(24-25高二下·湖北黄冈·月考)甲、乙两个口袋各装有1个红球和2个白球,这些球除颜色外完全相同,把从甲、乙两个口袋中各任取一个球放入对方口袋中称为一次操作,重复次操作后,甲口袋中恰有0个红球,1个红球,2个红球分别记为事件,,,则( )
A. B.
C. D.
【答案】ABD
【分析】对于A项,重复一次操作,甲袋中有1红的情况有两种,运用互斥事件的概率加法公式计算即得;对于B、C,运用积事件的概率公式计算即得;对于D项,运用和事件的概率公式计算即得.
【详解】因在操作前,甲袋中:1红2白,乙袋中:1红2白.
对于项,要求,则1次操作后甲、乙两个口袋中各取一个红球或各取一个白球即可,
则,故项正确;
对于项,要求,则1次操作后甲口袋中恰有0个红球,
且2次操作后甲口袋中恰有1个红球,且3次操作后甲口袋中恰有2个红球,
所以,故项正确;
对于C项,要求,则1次操作后甲口袋中恰有0个红球,
且2次操作后甲口袋中恰有1个红球,
所以,故C错误;
对于D项,由,,,
所以,故D项正确.
故选:.
【变式3】(24-25高二下·湖北省直辖县级单位·期末)已知一批产品是由甲、乙、丙三名工人生产的,三人生产的产品分别占总产量的,.已知三人生产产品的次品率分别为.
(1)现从这批产品中按等比例分层抽样抽出10件产品,再从这10件产品中不放回地任取两件进行检测,记事件“第一次取出的产品是乙生产的”,“第二次抽出的产品是甲生产的产品”,分别求;
(2)现从这批产品中任取一件产品,已知它是次品,求这件产品是由丙生产的概率.
【答案】(1);
(2)
【分析】(1)根据条件概率公式及全概率公式计算求解;
(2)应用全概率公式及贝叶斯公式计算求解.
【详解】(1)抽出的10件产品中,甲、乙、丙三名工人分别生产了3,4和3件,
事件“第一次取出的产品是乙生产的”,“第二次抽出的产品是甲生产的产品”,
所以;
(2)分别记事件A、B、C表示抽取的一个零件为甲、乙、丙生产的,记事件:抽取的一个零件为次品,
由题意可得,,
由全概率公式可得,
所以,
即任取一个零件,已知它是次品,这件产品是由丙生产的概率为.
题型二 随机变量及其与事件的联系
答|题|模|板
1.填空题(常考:随机变量与事件的转化、对立事件概率关系)
答题模板:
步骤1:明确随机变量的定义(厘清随机变量所表示的实际意义,如“红球个数”“次品个数”);
步骤2:实现随机变量与事件的转化(将“”“”“”等转化为具体文字描述的事件,如“”对应“至少1个红球”);
步骤3:判断概率关系(利用对立事件性质:,);步骤3:判断概率关系(利用对立事件性质:,);
步骤4:规范书写转化后的事件及概率关系.
【典例1】(24-25高二下·河北邢台·月考)下列是离散型随机变量的是( )
A.种子含水量的测量误差
B.某品牌电视机的使用寿命
C.某网页在24小时内被浏览的次数
D.测量某一零件的长度产生的测量误差
【答案】C
【分析】根据离散型随机变量的概念逐项判断即可.
【详解】因为离散型随机变量是可能取值为有限个或可以一一列举的随机变量,
对于A,种子含水量的测量误差不能一一列举,故不是离散型随机变量;
对于B,某品牌电视机的使用寿命不能一一列举,故不是离散型随机变量;
对于C,某网页在24小时内被浏览的次数能一一列举,是离散型随机变量;
对于D,测量某一零件的长度产生的测量误差不能一一列举,故不是离散型随机变量.
故选:C.
【典例2】(24-25高二下·河南郑州·期末)某人进行投篮训练,最多投篮4次,命中一次就停止投篮,记投篮次数为,则表示的试验结果是( )
A.第2次投篮命中 B.第3次投篮未命中
C.前3次投篮均未命中 D.前2次投篮均未命中,第3次投篮命中
【答案】D
【分析】根据随机变量的意义即可判断.
【详解】根据变量的意义可知:表示前2次投篮均未命中,第3次投篮命中.
故选:D.
【变式1】【多选题】(24-25高二下·全国·课后作业)(多选)下列叙述中,是离散型随机变量的是( )
A.某座大桥一天经过的车辆数
B.某无线电寻呼台一天内收到的寻呼次数
C.一天之内的温度
D.一位射击手对目标进行射击,击中目标得1分,未击中目标得0分,用表示该射击手在一次射击中的得分
【答案】ABD
【分析】根据已知条件,结合离散型随机变量的定义,即可求解.
【详解】A,B,D中的可以取的值可以一一列举出来,可以作为离散型随机变量,
而C中的可以取某一区间内的一切值,属于连续型,不能作为离散型随机变量.
故选:ABD.
【变式2】【多选题】(24-25高二下·全国·课后作业)将一个骰子掷两次,能作为随机变量的是( )
A.两次掷出的点数之和 B.两次掷出的最大点数
C.第一次与第二次掷出的点数之差 D.两次掷出的点数
【答案】ABC
【分析】由随机变量的概念逐项判断即可;
【详解】将一个骰子掷两次,两次掷出的点数之和是一个变量,且随试验结果的变化而变化,所以是一个随机变量,A正确;
两次掷出的最大点数,为随机变量,B正确;
第一次与第二次掷出的点数之差也都是随机变量, C正确;
两次掷出的点数不是一个变量,是一个数对,D错;
故选:ABC
【变式3】(24-25高二·全国·课堂例题)下面给出三个随机变量:
①某地110报警台1分钟内接到的求救电话的次数;
②某森林树木的高度在(单位:)这一范围内变化,测得某一树木的高度;
③某人射击2次,击中目标的环数之和.其中离散型随机变量有( )
A.0个 B.1个 C.2个 D.3个
【答案】C
【分析】根据离散型随机变量的定义判断即可.
【详解】由离散型随机变量的定义可知①③中的随机变量都是可以一一列举出来的,
故均匀离散型随机变量,而②中的随机变量可以取内的任意值,无法一一列举,
故它不是离散型随机变量.
故选:C.
题型三 离散型随机变量的分布列
答|题|模|板
1.解答题(常考:分布列性质应用、指定事件概率计算)
答题模板:
步骤1:利用分布列性质求未知参数(若分布列含未知量,根据“所有概率和为1”列方程求解,注意验证概率非负);
步骤2:计算指定区间的概率(若求,累加对应的概率;若求或,优先用对立事件或计算,简化运算);步骤2:计算指定区间的概率(若求,累加对应的概率;若求或,优先用对立事件或计算,简化运算);
步骤3:规范书写解题过程,明确各步骤依据(如“由分布列性质可知”“根据对立事件概率公式”).
【典例1】(25-26高三上·山西大同·月考)已知随机变量,均服从两点分布,且,,若,则( )
A. B. C. D.
【答案】D
【分析】利用全概率公式,由的值,得到的值,再由条件概率计算公式即可.
【详解】由于 服从两点分布,且 ,
因此.
由全概率公式得,
即,
所以,
由条件概率计算公式得.
故选:D
【典例2】(25-26高二上·广东佛山·月考)甲、乙是两名射击运动员,根据历史统计数据,甲一次射击命中10、9、8环的概率分别为、、,乙一次射击命中10、9环的概率分别为、.一轮射击中,甲、乙各射击一次.甲、乙射击相互独立,每次射击也互不影响.
(1)在一轮射击中,求甲命中的环数不高于乙命中的环数的概率;
(2)记一轮射击中,甲、乙命中的环数之和为,求的值,和X对应的概率;
【答案】(1)
(2)答案见解析
【分析】(1)设一次射击后,甲命中的环数为,乙命中的环数为,由题意可,结合独立事件的概率乘法公式与互斥事件的概率公式可求得所求事件的概率;
(2)由题意可知随机变量的可能取值有17、18、19、20,利用独立事件的概率乘法公式可计算得出随机变量在不同取值下的概率.
【详解】(1)设一次射击后,甲命中的环数为,乙命中的环数为,
则甲命中的环数不高于乙命中的环数为
;
(2)题意可知随机变量的可能取值有17、18、19、20,
,,
,.
【变式1】(25-26高二上·黑龙江哈尔滨·月考)人工智能(Artificial Intelligence),英文缩写为AI,是新一轮科技革命和产业变革的重要驱动力量,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学.如今利用“人工智能”的场景屡见不鲜,从帮助记忆单词、解答难题、到人机比赛,它的身影无处不在.小明和智能机器人进行一场“网球”比赛,规则为:比赛采用三局两胜制(率先获得两局比赛胜利者获得最终的胜利,且比赛结束),已知小明第一局获胜的概率为.从第二局开始,如果上一局获胜,则本局获胜的概率为;如果上一局失败,则本局获胜的概率为,每局比赛均没有平局.
(1)求小明以获得比赛胜利的概率;
(2)在小明以获得比赛胜利的条件下,求在第二局比赛中小明获胜的概率;
(3)记整场比赛小明的获胜局数为,求的分布列.
【答案】(1)
(2)
(3)分布列见解析
【分析】(1)令事件表示“小明以获得比赛胜利”,利用独立事件的乘法公式和互斥事件概率公式即可求解;
(2)令事件表示“在第二局比赛中小明获胜”,求,利用条件概率公式即可求解;
(3)先求的可能取值,再求对应的概率即可求解.
【详解】(1)令事件表示“小明以获得比赛胜利”,
所以;
(2)令事件表示“在第二局比赛中小明获胜”,
所以,
所以;
(3)由题意有的可能取值为,
所以,
,
,
所以的分布列为:
【变式2】(25-26高二上·黑龙江哈尔滨·月考)一个不透明的口袋中装有3个红球、3个黄球和2个白球,这些球除颜色外其他完全相同,现从这个口袋中一次性地摸出3个球.
(1)求摸出的白球个数比黄球个数多的概率;
(2)记摸出的球的颜色种类为,求的分布列.
【答案】(1)
(2)
【分析】(1)根据互斥事件的概率加法公式和古典概率公式计算即可;
(2)确定的所有可能取值为1,2,3,分别求出对应事件的概率,列出分布列即可.
【详解】(1)由摸出的白球个数比黄球个数多,可知摸出的球可能为2个白球和1个黄球(或1个红球),可能为1个白球和2个红球,
其中摸出2个白球和1个黄球(或1个红球)的概率为,
摸出1个白球和2个红球的概率为,
故摸出的白球个数比黄球个数多的概率为.
(2)由题可知,的所有可能取值为1,2,3,
,,
,
则的分布列为
1
2
3
【变式3】(25-26高三上·广东深圳·开学考试)已知随机变量均服从两点分布,且,若,则( )
A. B. C. D.
【答案】D
【分析】由两点分布分别求得的概率,再,由求出,由条件概率公式计算.
【详解】随机变量均服从两点分布,
,,
又,
,由条件概率公式,
故选:D.
题型四 二项分布
答|题|模|板
1.解答题(常考:二项分布分布列求解、指定事件概率计算、期望与方差计算)
答题模板:
步骤1:判断分布类型(明确试验满足“n次独立重复、每次两结果、概率恒定”,确定,标注n、p的值);
步骤2:求分布列(根据二项分布概率公式(),依次计算k取不同值时的概率,整理成表格形式);步骤2:求分布列(根据二项分布概率公式(),依次计算k取不同值时的概率,整理成表格形式);
步骤3:计算指定事件概率(如“不少于k次”即累加到的概率,可结合对立事件简化计算);
步骤4:求期望与方差(直接代入二项分布专用公式:,,,无需重复推导);
步骤5:规范书写,标注分布类型、公式依据及计算过程.
【典例1】(25-26高二上·辽宁·期末)某企业对生产设备进行优化升级,升级后的设备控制系统由个相同的元件组成,每个元件正常工作的概率均为,各元件之间相互独立.当控制系统有不少于个元件正常工作时,设备正常运行,否则设备停止运行,记设备正常运行的概率为(例如:表示控制系统由3个元件组成时设备正常运行的概率,表示控制系统由5个元件组成时设备正常运行的概率).
(1)若,当时,求控制系统中正常工作的元件个数的分布列和数学期望,并求;
(2)已知设备升级前,单位时间的产量为件,每件产品的利润为元,设备升级后,在正常运行状态下,单位时间的产量是原来的4倍,且出现了高端产品,每件产品成为高端产品的概率为,每件高端产品的利润是2元.记设备升级后单位时间内的利润为(单位:元).
(i)请用表示;
(ii)设备升级后,已知该企业现有控制系统中有5个元件,若增加2个元件,则单位时间内的利润是否提高.
【答案】(1)分布列见解析,,
(2)(i);(ii)若,增加2个元件后利润提高;
若时,增加2个元件后利润没有提高.
【分析】(1)由题意可知,利用二项分布求解即可求得期望,根据互斥事件的和事件的概率公式求解;
(2)(i)先写出升级改造后单位时间内产量的分布列,求出设备升级后单位时间内的利润,即为;
(ii)分以下三种情况讨论:①原系统中至少有4个元件正常工作;②原系统中恰好有3个元件正常工作,新增2个元件中至少有1个正常工作;③原系统中恰好有2个元件正常工作,新增2个元件全部正常工作,再对三种情况进行求和,得到,计算,与作比较,再根据判断即可.
【详解】(1)因为,所以控制系统中正常工作的元件个数的可能取值为,
因为每个元件的工作相互独立,且正常工作的概率均为,所以,
所以,
,
,
,
所以控制系统中正常工作的元件个数的分布列为
0
1
2
3
控制系统中正常工作的元件个数的数学期望为,
(2)(i)升级改造后单位时间内产量的分布列为
产量
0
设备运行概率
所以升级改造后单位时间内产量的期望为,
所以
产品类型
高端产品
一般产品
产量(单位:件)
利润(单位:元)
2
1
设备升级后单位时间内的利润为,即.
(ii)若增加2个元件,则第一类:原系统中至少有4个元件正常工作,其概率为;
第二类:原系统中恰好有3个元件正常工作,新增2个元件中至少有1个正常工作,
其概率为;
第三类:原系统中恰好有2个元件正常工作,新增2个元件全部正常工作,
其概率为.
所以 ,
则,
所以当时,,即增加2个元件设备正常工作的概率变大;
当时,,即增加2个元件设备正常工作的概率没有变大.
又因为,
所以当时,增加2个元件后利润提高;当时,增加2个元件后利润没有提高.
【典例2】(25-26高三上·贵州贵阳·期中)2025年9月,全国“城超”足球比赛在贵阳举办,比赛期间还开展文旅会客厅、特色市集等活动.其旨为响应国家全民健身战略,契合城市发展,展现贵阳魅力,实现“体育+文旅”多元共赢.为了增进省外观众对贵州文化的了解,从参加配套文旅活动的省外观众中,随机抽取150人,开展贵州文旅知识问答活动,该活动共有,,三道试题,全部答完后,至少答对2道试题,则可获得奖励总决赛门票一张.假设每人答对这3道试题的概率分别为,,,且每人答对各道试题与否互不影响.
(1)求观众甲通过文旅知识问答活动获得总决赛门票的概率;
(2)设通过文旅知识问答活动获得总决赛门票有个人的概率为,求取得最大值时的值.
【答案】(1)
(2)
【分析】(1)根据古典概型的知识进行求解即可.
(2)根据二项分布的概率公式列出不等式方程组,求出最值.
【详解】(1)设“观众甲通过文旅知识问答活动获得总决赛门票”为事件,则
因此,观众甲通过文旅知识问答活动获得总决赛门票的概率为.
(2)由(1)知,则,,
由题意:,即
解得,
故时,取到最大值为.
【变式1】(25-26高三上·宁夏固原·开学考试)甲、乙两名同学进行定点投篮训练,据以往的训练数据可知,甲每次投篮命中的概率为,乙每次投篮命中的概率为,各次投篮互不影响.现甲、乙两人开展多轮次的定点投篮活动,每轮次各投2个球,每投进一个球记1分,不投进记分.
(1)求甲在一个轮次投篮结束后的得分不大于0的概率;
(2)记甲、乙每轮次投篮得分之和为X.
①求;
②若,则称该轮次为一个“成功轮次”.在连续轮次的投篮活动中,记“成功轮次”的数量为Y,当n为何值时,的值最大?
【答案】(1);
(2)①;②或或.
【分析】(1)将问题转化成甲在一轮投篮中至多命中一次,再利用对立事件和相互独立事件同时发生的概率公式,即可求解;
(2)①由条件可得,再结合独立重复试验概率公式及互斥事件概率加法公式求结论;
②根据条件,得到,再由为不等式组的解,即可求.
【详解】(1)甲在一轮投篮结束后的得分不大于,即甲在一轮投篮中至多命中一次,
所以甲在一轮投篮结束后的得分不大于的概率为.
(2)①.
②由①知,由题知,
所以,
由,
得到且,
整理得到,即,
得到,所以,
由题有,所以,得到,又,
所以或或.
【变式2】(25-26高三上·云南·期中)有一个翻牌游戏,规则如下:每一轮翻牌两次,每次翻出花色牌的概率为,且每次翻牌相互独立.若参与者在一轮翻牌游戏中,翻出的花色牌数不少于1,则获得一份精美礼品(多次参与可获得多份精美礼品).
(1)若甲参与一轮翻牌游戏,求甲获得一份精美礼品的概率;
(2)若乙参与三轮翻牌游戏,设乙获得的精美礼品数量为,求的分布列与期望.
【答案】(1)
(2)分布列见解析,
【分析】(1)应用独立事件概率乘积公式及对立事件概率公式计算求解;
(2)应用二项分布写出概率,再写出分布列,最后应用公式计算数学期望即可.
【详解】(1)甲获得一份精美礼品的概率为.
(2)由题意得,
则,
,
,
,
所以的分布列为
0
1
2
3
.
【变式3】(24-25高二下·福建泉州·期末)如图所示,已知一质点在外力的作用下,从原点出发,每次向左移动的概率为,向右移动的概率为.若该质点每次移动一个单位长度,设经过5次移动后,该质点位于的位置,则 .
【答案】
【分析】首先设该质点向右移动的次数为,则,然后根据已知找到满足条件的的取值,进而根据二项分布求解概率即可.
【详解】设该质点向右移动的次数为,则,,
若,则满足条件的的值为,对应的取值分别为.
所以
.
故答案为:.
题型五 超几何分布
答|题|模|板
1.填空题(常考:超几何分布判断、指定概率计算)
答题模板:
步骤1:判断分布类型(明确试验为“无放回抽样、总体有限”,确定,标注N(总体容量)、M(特殊元素个数)、n(抽样个数));
步骤2:计算指定概率(代入超几何分布概率公式,注意k的取值范围为);步骤2:计算指定概率(代入超几何分布概率公式,注意k的取值范围为);
步骤3:规范书写分布类型(含参数)及概率结果.
2.解答题(常考:超几何分布取值范围、概率计算、期望求解)
答题模板:
步骤1:确定随机变量取值(根据和,列出X的所有可能取值);步骤1:确定随机变量取值(根据和,列出X的所有可能取值);
步骤2:计算指定概率(代入超几何概率公式,准确计算组合数,可简化分式后再运算);
步骤3:求期望(代入超几何分布期望公式,直接计算,无需重复推导);
步骤4:规范书写解题过程,明确分布判断依据和公式应用.
【典例1】(25-26高三上·山东潍坊·月考)某地区从高一年级的物理测试中随机抽取了100名学生的物理成绩,整理得到如图所示的频率分布直方图.
(1)估计该地区本次物理测试的平均分(同一组中的数据用该组区间的中点值代替);
(2)该地区某学校建议此次物理测试成绩在本地区前60%的学生选科报物理方向,试估计报物理方向的学生本次成绩不低于多少分?(结果保留整数)
(3)从成绩位于区间和的答卷中,采用分层抽样随机抽取7份,再从这7份中随机抽取3份,设成绩在的答卷份数为随机变量X,求X的分布列及数学期望.
【答案】(1)74分
(2)72分
(3)分布列见解析,
【分析】(1)将每个矩形底边中点值与各矩形面积相乘,再将所得数据相加即可得出结果;
(2)根据频率分布直方图估计数据的第40百分位数即可;
(3)利用分层抽样原理,求得、两区间内分别抽取了多少份,再结合超几何分布即可求解.
【详解】(1)由题意,解得,
则平均分
,所以该地区本次物理测试的平均分为74分.
(2)成绩在的频率为0.1,
在的频率为0.25,在的频率为0.3,
因为,,
所以选报物理方向的最低分x在内,则,解得,所以估计报物理方向的学生本次成绩不低于72分.
(3)由题可知,成绩在区间的频数为,
成绩在区间的频数为,
利用分层抽样,从中抽取7份,成绩在的频数为,
成绩在的频数为,
再从这7份答卷中随机抽取3份,X的所有可能取值为0,1,2,
,,
,
故X的分布列为:
X
0
1
2
P
所以X的数学期望为:.
【典例2】(24-25高二下·福建福州·期末)“英才计划”最早开始于2013年,由中国科协、教育部共同组织实施,到2023年已经培养了6000多名具有创新潜质的优秀中学生,为选拔培养对象,某高校在暑假期间从中学里挑选优秀学生参加数学和物理学科夏令营活动.
(1)若参加数学学科夏令营的7名中学生中恰有3人来自中学,从这7名中学生中选取3名中学生,求选取的中学生中来自中学的人数的分布列和数学期望;
(2)在夏令营活动中,物理学科举行了一次学科知识竞答活动,规则如下:两人一组,每一轮竞答中,每人分别答两题,若小组答对题数不小于3,则取得本轮胜利.已知甲乙两位同学组成一组,甲、乙答对每道题的概率分别为,.假设甲、乙两人每次答题相互独立,且互不影响.
(i)求甲、乙两位同学所在组每轮答题中取胜的概率;
(ii)当时,求的最大值.
【答案】(1)分布列见解析,
(2)(i);(ii)
【分析】(1)由题意知,的可能取值有,,,,根据超几何分布列列出分布列计算期望即可;
(2)(i)由题知甲、乙两人每次答题相互独立,设甲答对题数为,则,设乙答对题数为,则,然后计算取胜的概率;
(ii)由,令,,然后求最值即可.
【详解】(1)由题意知,的可能取值有,,,,
,,
,
所以的分布列为:
0
1
2
3
(2)(i)因为甲、乙两人每次答题相互独立,设甲答对题数为,则,
设乙答对题数为,则,
设“甲、乙两位同学在每轮答题中取胜”,
则
(ii)因为,所以
由,又,所以,
则,又,所以,
设,所以,因,
由二次函数的性质可知,当时取最大值,
故甲、乙两位同学在每轮答题中取胜的概率的最大值为.
【变式1】(22-23高三上·海南·月考)全国中学生生物学竞赛隆重举行.为做好考试的评价工作,将本次成绩转化为百分制,现从中随机抽取了50名学生的成绩,经统计,这批学生的成绩全部介于40至100之间,将数据按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分成6组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中的值,并估计这50名学生成绩的中位数;
(2)在这50名学生中用分层抽样的方法从成绩在[70,80),[80,90),[90,100]的三组中抽取了11人,再从这11人中随机抽取3人,记为3人中成绩在[80,90)的人数,求的分布列和数学期望;
【答案】(1),中位数;
(2)分布列见解析,.
【分析】(1)根据频率分布直方图中所有小矩形的面积之和为1,结合中位数的定义进行求解即可;
(2)根据分层抽样的性质,结合古典概型公式、数学期望公式进行求解即可.
【详解】(1)由频率分布直方图的性质可得,,
解得,
由频率分布直方图可知:
前两组频率之和为,
前三组频率之和为,
设中位数为,则.
,
解得.
所以,估计这50名学生成绩中位数为68.
(2)的三组频率之比为,
又在[70,80),[80,90),[90,100]的三组中总共抽取了11人,
从中分别抽取7人,3人,1人.
由题知,从这11人中随机抽取3人,记为3人中成绩在[80,90)的人数,所有可能取值为0,1,2,3;
且,,
,.
故的分布列为:
0
1
2
3
数学期望
【变式2】(24-25高一下·上海·期末)图为某平台向100名观众征集某电影的评分结果的频率分布直方图.
(1)求的值;
(2)估计这100名观众评分的平均数;
(3)从评分在和的观众中按照分层抽样的方法随机抽取7人进行问卷调查,再从这7人中随机抽取3人进行访谈,求被抽到的3人中评分在的人数的分布、期望和方差.
【答案】(1)
(2)
(3)分布列见解析,,
【分析】(1)利用所有小长方形的面积和为1可得答案.
(2)将每个矩形的中点乘以每个矩形的高再乘以10后相加可估计平均数.
(3)求出的可能取值及对应的概率可得分布列,再由期望公式计算可得答案.
【详解】(1)由题意可得:,
解得:.
(2)估计这100名观众评分的平均数为:
.
(3)评分在的观众人数为:,
评分在的观众人数为:.
按照分层抽样的方法,从评分在和的观众中抽取7人,则评分在的观众人数为3人,在的观众人数为4人.
所以的值可能为:0,1,2,3.
且,,,.
所以的分布列如下:
0
1
2
3
所以:.
.
【变式3】【多选题】(24-25高二下·河南商丘·月考)袋中有8个大小相同的球,其中3个黑球、5个白球.现从中任取4个球,记这4个球中黑球的个数为,则( )
A.随机变量服从超几何分布
B.
C.
D.记这4个球中白球的个数为,则
【答案】ABD
【分析】对于A,根据超几何分布的定义即可求解;对于B,求出和即可求解;对于C,根据即可求解;对于D,根据即可求解.
【详解】对于A,超几何分布的定义为从含个成功元素中无放回抽取个,成功次数服从超几何分布,符合定义,故A正确;
对于B,,
,所以,故B正确;
对于C,因为,所以,所以,故C错误;
对于D,因为,故D正确.
故选:ABD.
题型六 随机变量的数字特征(期望、方差、标准差)
答|题|模|板
1.选择题(常考:离散型随机变量期望、方差计算)
答题模板:
步骤1:提取分布列数据(明确随机变量的所有可能取值及对应概率);步骤1:提取分布列数据(明确随机变量的所有可能取值及对应概率);
步骤2:计算期望(代入通用公式,依次计算并求和);步骤2:计算期望(代入通用公式,依次计算并求和);
步骤3:计算方差(代入通用公式,或简化公式,优先选简化公式减少运算量);步骤3:计算方差(代入通用公式,或简化公式,优先选简化公式减少运算量);
步骤4:对比选项,得出答案.
2.解答题(常考:利用期望、方差性质计算)
答题模板:
步骤1:明确已知分布类型(如二项分布),求原随机变量的期望和方差和方差(直接用对应分布的专用公式);
步骤2:回忆期望、方差性质(,,常数的期望为自身、方差为0);步骤2:回忆期望、方差性质(,,常数的期望为自身、方差为0);
步骤3:代入性质公式计算目标随机变量(如)的和;步骤3:代入性质公式计算目标随机变量(如)的和;
步骤4:规范书写,标注公式依据(如“由期望性质可知”“由二项分布期望公式可得”).
【典例1】(2026高三·全国·专题练习)某学校拟建立一座教学楼,采取竞标的方式从多家建筑公司选取一家建筑公司,经过层层筛选,甲、乙两家建筑公司进入最后的招标.现从建筑设计院聘请专家设计了一个招标方案:两家公司从6个招标问题中随机抽取3个问题,已知这6个招标问题中,甲公司能正确回答其中4道题目,而乙公司能正确回答每道题目的概率均为 ,甲、乙两家公司对每题的回答都是相互独立,互不影响的.分别求甲、乙两家公司答对题数的分布列,请从期望和方差的角度分析,甲、乙两家哪家公司竞标成功的可能性更大?
【答案】答案见详解
【分析】甲公司利用超几何分布进行求解,乙公司利用二项分布进行求解即可.
【详解】设甲公司答对题数为,则的取值为,
,,,
的分布列为
则,
;
设乙公司答对题数为,则的取值为,
,,,,
的分布列为
则,
;
,,
甲公司竞标成功的可能性更大.
【典例2】【多选题】(25-26高二上·全国·课后作业)若随机变量服从两点分布,其中,则下列结论正确的是( )
A. B.
C. D.
【答案】AB
【分析】根据两点分布得,再根据期望和方差公式以及性质,即可求解.
【详解】由题意可知,,
所以,故A正确;
,故D错误;
,故B正确;
, 故C错误.
故选:AB
【变式1】(23-24高三上·北京海淀·期末)甲、乙、丙三人进行投篮比赛,共比赛10场,规定每场比赛分数最高者获胜,三人得分(单位:分)情况统计如下:
场次
1
2
3
4
5
6
7
8
9
10
甲
8
10
10
7
12
8
8
10
10
13
乙
9
13
8
12
14
11
7
9
12
10
丙
12
11
9
11
11
9
9
8
9
11
(1)从上述10场比赛中随机选择一场,求甲获胜的概率;
(2)在上述10场比赛中,从甲得分不低于10分的场次中随机选择两场,设X表示乙得分大于丙得分的场数,求X的分布列和数学期望;
(3)假设每场比赛获胜者唯一,且各场相互独立,用上述10场比赛中每人获胜的频率估计其获胜的概率.甲、乙、丙三人接下来将进行6场投篮比赛,设为甲获胜的场数,为乙获胜的场数,为丙获胜的场数,直接写出方差,,的大小关系.(结论不要求证明)
【答案】(1)
(2)分布列见解析,期望;
(3)
【分析】(1)从表格中可以发现甲获胜的场数为3场,从而得到甲获胜的概率;
(2)从表格中可以发现在10场比赛中,甲得分不低于10分的场次有6场,分别是第2场,第3场,第5场,第8场,第9场,第10场。乙得分大于丙得分的场数的取值为0,1,2,通过超几何分布的知识点,得到的分布列及数学期望.
(3)通过题目条件得到10场比赛甲获胜的概率为,乙获胜的概率为,丙获胜的概率为,因为甲、乙、丙获胜的场数符合二项分布,从而得到方差,,的大小关系.
【详解】(1)根据三人投篮得分统计数据,在10场比赛中,甲共获胜3场,分别是第3场,第8场,第10场.
设表示“从10场比赛中随机选择一场,甲获胜”,则.
(2)根据三人投篮得分统计数据,在10场比赛中,甲得分不低于10分的场次有6场,
分别是第2场,第3场,第5场,第8场,第9场,第10场,其中乙得分大于丙得分的场次有4场,
分别是第2场、第5场、第8场、第9场.
所以的所有可能取值为0,1,2.
,,.
所以的分布列为
0
1
2
所以.
(3)由题意,每场比赛甲获胜的概率为,乙获胜的概率为,丙获胜的概率为,还需要进行6场比赛,
而甲、乙、丙获胜的场数服从二项分布,
所以,,,
故.
【变式2】(2025高三·全国·专题练习)变量的分布列如下:
0
1
其中,若,则的值是 .
【答案】
【分析】根据概率和为1、、列方程组求解a、b、c的值,再根据方差的定义求解即可.
【详解】依题意,解得,,,
所以.
故答案为:.
【变式3】【多选题】(2025高三·全国·专题练习)(多选)甲、乙两人进行乒乓球比赛,现采用三局两胜制度,规定每局比赛都没有平局(必须分出胜负),且每一局甲赢的概率都是,随机变量表示最终的比赛局数,若,则下列结论可能正确的是( )
A. B. C. D.
【答案】AD
【分析】先求的分布列,利用数学期望公式得即可判断AB,利用方差公式得进而判断CD.
【详解】随机变量可能的取值为2,3.
.
.
故的分布列为:
2
3
故,
因为,故,故A正确,B错误.
而,
令,因为,
故,此时,
必成立,故C错误,D正确.
故选:AD.
题型七 正态分布
答|题|模|板
1.选择题(常考:正态分布对称性应用、概率计算)
答题模板:
步骤1:明确正态分布参数(由,确定对称轴,记住);步骤1:明确正态分布参数(由,确定对称轴,记住);
步骤2:利用对称性转化区间(如,);步骤2:利用对称性转化区间(如,);
步骤3:结合已知概率计算目标概率(如);步骤3:结合已知概率计算目标概率(如);
步骤4:对比选项,得出答案.
2.解答题(常考:正态分布参数识别、3σ原则应用、概率计算)
答题模板:
步骤1:识别和(由直接得出,);步骤1:识别和(由直接得出,);
步骤2:应用3σ原则(明确、等区间,直接套用已知概率值:,);步骤2:应用3σ原则(明确、等区间,直接套用已知概率值:,);
步骤3:计算特殊区间概率(如“超过”,利用对称性和3σ原则,);步骤3:计算特殊区间概率(如“超过”,利用对称性和3σ原则,);
步骤4:规范书写,标注参数含义和3σ原则依据.
【典例1】(2026高三·全国·专题练习)某物理量的测量结果服从正态分布,下列结论中不正确的是( )
A.越小,该物理量在一次测量中在的概率越大
B.越小,该物理量在一次测量中大于10的概率为0.5
C.越小,该物理量在一次测量中小于9.99与大于10.01的概率相等
D.越小,该物理量在一次测量中落在与落在的概率相等
【答案】D
【分析】越小,正态密度曲线越“高瘦”,可知选项A正确;根据正态密度曲线的对称性,可判断BCD正误.
【详解】对于选项A:因为为数据的方差,所以越小,数据在均值附近越集中,
所以测量结果落在内的概率越大,故A正确;
对于选项B:由正态分布密度曲线的对称性可知该物理量一次测量大于10的概率为0.5,故B正确;
对于选项C:由正态分布密度曲线的对称性可知该物理量一次测量结果大于10.01的概率与小于9.99的概率相等,故C正确;
对于选项D:因为,
,
若越小,数据在均值附近越集中,则,
即,
所以该物理量在一次测量中落在与落在的概率不相等,故D错误.
故选:D.
【典例2】(25-26高三上·湖南·期中)已知随机变量,设函数.若,,且,则的最小值为( )
A. B. C. D.
【答案】B
【分析】由正态分布对称性可得,进而得到,再利用换元法结合二次函数最值即可求解.
【详解】因为,易知单调递增,
由正态分布的对称性可知,
所以,
由,得,
所以,
即的最小值为,
故选:B.
【变式1】(25-26高三上·湖北黄冈·期中)已知随机变量,,且,若,则( )
A.0.09 B.0.82 C.0.91 D.0.21
【答案】B
【分析】利用二项分布的性质求出,再结合正态分布的对称性求解即可.
【详解】由题意得,则,
因为,所以,
即,解得,
由题意得,
由对称性可得,
则,故B正确.
故选:B
【变式2】(25-26高三上·湖南长沙·月考)某高中学校计划通过体质测试,了解学生体质健康水平.规定按照成绩由高到低,前的学生测试成绩记为“优秀”.为了了解本次体质测试情况,从中抽取了部分学生的成绩(单位:分,得分取正整数,)作为样本进行统计,将成绩进行整理后,分为六组(如图):
(1)求的值并估计记为“优秀”的最低分数;
(2)如果用按比例分层抽样的方法从样本成绩为和的学生中共抽取8人,再从8人中选4人,记4人中成绩不合格(成绩低于60分)的学生人数为,求的分布列与期望;
(3)经统计,高中生体质测试成绩近似服从正态分布,其中近似为样本平均数,近似为样本的标准差,并已求得.体质监测中心计划从全市抽取名高中生进行体质测试,记这名高中生的体质测试成绩恰好落在区间内的人数为,求的数学期望.
参考数据:若,则.
【答案】(1),88分
(2)分布列见解析,
(3)
【分析】(1)利用频率分布直方图的性质,即可求出,进而可求出“优秀”的最低分数;
(2)先求出每一层的分数,再求出的可能取值及对应的概率,即可求出分布列,再利用期望的计算公式或超几何的期望公式,即可求出期望;
(3)利用正态分布的性质得,根据题设有,再由二项分布的期望计算公式,即可求解.
【详解】(1)由图可知,
解得.
因为,
则成绩由高到低的前分数线必在之间,
设分数线为,则,得,
则记为“优秀”的最低分数为88分.
(2)样本成绩位于和的比例为,
故所抽取的个人中,来自的人数为,来自的人数为,来自的人数为,
则的所有可能取值为1,2,3,4.
,
,
所以的分布列为
1
2
3
4
方法一:.
方法二:服从参数的超几何分布,故.
(3)由题意得,,
由,所以,
所以
,
所以高中生的体质测试成绩恰好落在区间内的概率约为0.8186,
故,所以.
【变式3】【多选题】(2025·福建三明·模拟预测)已知某精密仪器测量金属薄片的误差服从正态分布,随机抽取10个测量数据,设为这10个数据误差在之外的个数,下列说法正确的是(已知若随机变量,则)( )
A. B.
C. D.
【答案】ACD
【分析】由题意得,进而求即可判断A,根据二项分布即可判断B,根据二项分布的数学期望公式即可判断C,利用二项分布计算即可判断D.
【详解】由题意有,
所以,故A正确;
又为这10个数据误差在之外的个数,则服从二项分布,
即,故B错误;
由二项分布的数学期望公式可得,故C正确;
由二项分布的概率公式可得,故D正确.
故选:ACD.
题型八 一元线性回归模型
答|题|模|板
1.解答题(常考:样本中心点计算、回归直线方程求解、预测应用)
答题模板:
步骤1:计算样本中心点(代入均值公式:,,准确计算求和结果);步骤1:计算样本中心点(代入均值公式:,,准确计算求和结果);
步骤2:求解回归系数和截距(代入回归系数公式,或简化公式;再由计算截距);步骤2:求解回归系数和截距(代入回归系数公式,或简化公式;再由计算截距);
步骤3:写出回归直线方程(规范表示为);步骤3:写出回归直线方程(规范表示为);
步骤4:进行预测(将目标代入回归方程,计算,并说明预测意义);
步骤5:规范书写,标注公式依据,保留适当计算精度.
【典例1】(2026高三·全国·专题练习)我国某农业大学植物研究所相关人员为了解仙人掌的植株高度(单位:),与其根茎长度(单位:)之间是否存在线性相关的关系,通过采样和数据记录得到如下数据:
样本编号
1
2
3
4
根茎长度
10
12
14
16
植株高度
62
86
112
132
参考数据:,,.
(1)由上表数据计算相关系数,并说明是否可用线性回归模型拟合与的关系(若,则可用线性回归模型拟合,计算结果精确到0.001);
(2)求y关于x的经验回归方程.
附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计公式,相关系数r的公式分别为,
【答案】(1),可用线性回归模型拟合与的关系;
(2)
【分析】(1)求出,,,,根据,可判断出可用线性回归模型拟合与的关系;
(2)求出和,从而得到关于的经验回归方程.
【详解】(1),,
,
,
,可用线性回归模型拟合与的关系;
(2),,
故关于的经验回归方程为.
【典例2】【多选题】(25-26高三上·福建福州·月考)某社会机构统计了某市四所大学年毕业生人数及自主创业人数如表:
A大学
B大学
C大学
D大学
毕业生人数x(千人)
3
4
5
m
自主创业人数y(千人)
根据表中的数据得到自主创业人数关于毕业生人数的经验回归方程为,则( )
A.y与x正相关
B.
C.当时,残差为
D.样本的相关系数r为负数
【答案】AB
【分析】根据经验回归方程的性质,结合已知条件逐一分析各选项,对相关性、相关系数、残差等进行判断.
【详解】经验回归方程为,斜率为,函数单调递增,
y随着x的增大而增大,即y与x正相关,故A正确;
样本中心点必在回归线方程上,
,将代入回归方程,得,解得,
,解得,故B正确;
当时,预测值,实际值为,
残差,故C错误;
经验回归方程为,斜率为,
样本的相关系数,故D错误.
故选:AB.
【变式1】(2025·广西来宾·模拟预测)现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本(单位:万元)和企业利润的数据(单位:万元)如下表所示:
月份
1
2
3
4
5
6
7
8
物流成本
83
83.5
80
86.5
89
84.5
79
86.5
利润
114
116
106
122
132
114
132
残差
0.2
0.6
1.8
-3
-1
-4.6
根据最小二乘法公式求得经验回归方程为.
(1)求的值,并利用已知的经验回归方程求出8月份对应的残差值;
(2)请先求出线性回归模型的决定系数(精确到0.0001),若根据非线性模型求得解释变量(物流成本)对于响应变量(利润)的决定系数,请说明以上两种模型哪种模型拟合效果更好.
参考公式及数据:,,.
【答案】(1),;
(2),拟合程度更好.
【分析】(1)根据经验回归方程过样本中心点,先由经验回归方程和的平均数,求出的平均数,再根据平均数的定义求出;然后根据残差定义计算8月份的残差.
(2)先求出残差平方和,再代入公式计算,最后与非线性回归模型的比较大小,即可判断.
【详解】(1)因为,,,
则,解得;
8月份对应的残差值.
(2)因为,
所以,
所以,
所以线性回归模型拟合程度更好.
【变式2】(2025高二·全国·专题练习)有一种速度叫中国速度,有一种骄傲叫中国高铁.高铁可以说是中国的一张行走的名片.截至2020年,中国高铁运营里程已经达到3.9万千米.2013年至2020年中国高铁每年的运营里程统计如下表,它反映了中国高铁的飞速发展.
年份
2013
2014
2015
2016
2017
2018
2019
2020
年份代码x
1
2
3
4
5
6
7
8
运营里程y/万千米
1.3
1.6
1.9
2.2
2.5
2.9
3.5
3.9
根据以上数据,回答下面的问题.
(1)甲同学用曲线来拟合,并算出相关系数;乙同学用曲线来拟合,并算出转化为线性回归方程所对应的相关系数.请判断哪一个更适合作为y关于x的回归方程类型,并说明理由.
(2)根据(1)的判断结果及表中数据,求y关于x的回归方程.(系数精确到0.1)
(3)请你利用得到的模型,预测2030年中国高铁的运营里程将达到多少万千米.
参考公式:用最小二乘法求线性回归方程的系数,公式为;
参考数据:,令,.
【答案】(1)乙同学的更适合作为y关于x的回归方程类型,理由见解析
(2)
(3)17.25
【分析】(1)比较已知的相关系数的大小;
(2)由已知数据求出,结合回归方程变形为,求出d和,从而可求出回归方程;
(3)利用非线性回归方程进行估计.
【详解】(1)因为,所以乙同学的更适合作为y关于x的回归方程类型.
(2),
由得,即.
则,
,
所以.
(3)2030年对应的年份代码,代入(2)中的y关于x的回归方程,
得.故预测2030年中国高铁运营里程将达到17.25万千米.
【变式3】【多选题】(24-25高二下·山东枣庄·期末)某地新开了一条夜市街,每晚最多能接纳10万人.主办公司计划通过广告宣传提高客流量.通过调研,发现投入的广告费x与每晚客流量y存在如下关系:
x/万元
1
2
3
4
5
y/千人
5
6
8.1
9
14.5
附,,,,
令,,,.
现用曲线拟合变量x与y的相关关系,并利用一元线性回归模型求参数,的最小二乘估计,依所求回归方程C为预测依据,则( )
A.曲线C经过点
B.
C.若投入广告费9万元,则每晚客流量会超过夜市接纳能力
D.广告费每增加1万元,每晚客流量增加3000人
【答案】BC
【分析】利用题目的数据,得出,的最小二乘估计,即可得出回归方程,逐个逐项判断即可.
【详解】由题可知,令,,,
,
所以,
,故B正确;
所以,
令,,
所以曲线C不经过点,故A错误;
当时,千人,
所以若投入广告费9万元,则每晚客流量为万人,
因为每晚最多能接纳10万人,所以会超过夜市接纳能力,故C正确;
由可知,当时,,
所以当广告费从5万元增加到6万元,客流量增加千人,故D错误.
故选:BC
题型九 独立性检验
答|题|模|板
1.解答题(常考:卡方统计量计算、独立性判断)
答题模板:
步骤1:整理2×2列联表数据(明确a、b、c、d的取值,a为第一行第一列数据,b为第一行第二列,c为第二行第一列,d为第二行第二列,计算总样本量n);
步骤2:计算卡方统计量(代入公式,分步计算分子和分母各因式,再求比值);步骤2:计算卡方统计量(代入公式,分步计算分子和分母各因式,再求比值);
步骤3:进行独立性判断(对比计算结果与临界值,如“若,则有95%的把握认为两变量有关联;否则无足够把握”);
步骤4:规范书写,标注列联表数据对应关系、公式依据,明确判断结论.
【典例1】(25-26高三上·河北·期中)某公司想了解员工对薪资的满意度情况,对该公司的100名员工进行薪资满意度调查,调查结果如表所示:
入职年限
对薪资满意度情况
合计
满意
不满意
入职年限不少于2年
20
20
40
入职年限少于2年
40
20
60
合计
60
40
100
(1)根据小概率值的独立性检验,分析该公司员工对薪资的满意度是否与入职年限有关;
(2)从样本中对薪资满意的员工中随机抽取2人,求这2人的入职年限都少于2年的概率.
附
0.1
0.05
0.01
2.706
3.841
6.635
【答案】(1)有关
(2)
【分析】(1)利用公式求出,利用临界值表进行判定;
(2)将组合数思想与古典概型相结合即可得结果.
【详解】(1)零假设为:该公司员工对薪资的满意度与入职年限无关.
经计算得,
依据小概率值的独立性检验,推断零假设不成立,
即公司员工对薪资的满意度与入职年限有关,此推断犯错误的概率不大于0.1;
(2)对薪资满意的员工共60人,其中不少于2年:20人,少于2年:40人,
抽取2人均为少于2年概率:.
【典例2】(25-26高三上·湖北武汉·月考)某种疾病分为甲、乙两种类型,为研究该疾病的类型与患者性别是否有关,随机抽取了名患者进行调查,得到如下列联表:
性别
疾病类型
合计
甲型病
乙型病
男
女
合计
(1)根据小概率值的独立性检验,得出了“所患疾病的类型与性别有关”的结论,求的最小值;
(2)现对部分人群接种预防甲型疾病的疫苗,要求每人至多安排2个周期接种疫苗,每人每周期必须接种3次,每次接种后,产生抗体的概率为0.8.如果一个周期内至少2次产生抗体,那么该周期结束后终止接种,否则进入第二个周期.已知每人每周期接种费用为30元,试估计1000人接种疫苗总费用的期望.附,
0.01
0.005
0.001
6.635
7.879
10.828
【答案】(1)18;
(2)33120.
【分析】(1)根据列联表中的数据求得的值,根据小概率值的独立性检验可得,求解得答案;
(2)设每人接种疫苗的费用为,其可能的取值为,求出取值对应的概率,分布列,得到每人接种疫苗的费用的均值,进而求得1000人接种疫苗总费用的期望.
【详解】(1)根据列联表中的数据,得到,
因为根据小概率值的独立性检验,认为“所患疾病的类型与性别”有关,
所以,解得,
因为,结合列联表中各式均为整数,
所以的最小整数值为18.
(2)设每人接种疫苗的费用为,其可能的取值为,
所以,,
所以的分布列为
30
60
所以的期望,
估计1000人接种疫苗总费用的期望为元.
【变式1】(25-26高三上·河南郑州·期中)已知某市组建了一支300人的志愿者队伍,并由其中200人组成“志愿模范队”.经过一年的实践,全队共有200人的周平均服务时长超过2小时,其中有150人来自“志愿模范队”,如下表所示.
是“志愿模范队”成员
不是“志愿模范队”成员
总计
周平均服务时长超过2小时
150
200
周平均服务时长不超过2小时
总计
200
300
(1)请完成2×2列联表,并根据表中数据回答:根据小概率值的独立性检验,能否认为“是“志愿模范队”成员”与“周平均服务时长超过2小时”有关系?
(2)由于该市志愿者工作成效优异,现向全省推广该市经验,在全省每个市县都成立志愿者队伍,请以该市志愿者队伍的样本频率作为概率的值,在全省的志愿者队伍中任选3人,记周平均服务时长超过2小时且不是“志愿模范队”成员的人数为,求的分布列和数学期望.
附录:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)列联表见解析,认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关
(2)分布列见解析,数学期望为
【分析】(1)根据卡方公式,结合列联表进行求解即可;
(2)写出二项分布的性质写出其分布列,利用二项分布的期望公式即可求解.
【详解】(1)由题可得如下列联表:
是“志愿模范队”成员
不是“志愿模范队”成员
总计
周平均服务时长超过2小时
150
50
200
周平均服务时长不超过2小时
50
50
100
总计
200
100
300
设零假设“是“志愿模范队”成员”与“周平均服务时长超过2小时”无关,
可得,
所以根据小概率值的独立性检验,可以认为不成立,
即认为“是‘志愿模范队’成员”与“周平均服务时长超过2小时”有关.
(2)依题意,的可能取值为0,1,2,3,从全省的志愿者队伍中随机抽取一位志愿者,取到周平均服务时长超过2小时且不是“志愿模范队”成员的志愿者的概率为
故,
故的分布列为
0
1
2
3
,则数学期望.
【变式2】【多选题】(2026高三·全国·专题练习)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”做了一次调查,其中被调查的男、女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )
附表:
附:
A.人 B.人 C.人 D.人
【答案】BCD
【分析】设男生可能有人,作出列联表并计算得到,由可求得的范围,结合是的正整数倍可得结果.
【详解】设男生可能有人,依题意可得列联表如下:
喜欢抖音
不喜欢抖音
总计
男生
女生
总计
,
有的把握认为是否喜欢抖音和性别有关,,
解得:,又是的正整数倍,
,和都满足题意.
故选:BCD.
【变式3】(24-25高二下·上海·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有 人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
参考公式:,其中.
【答案】
【分析】设男生人数为,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论.
【详解】因为抽取个学生,女生人数是男生人数的,
所以抽取个男生,个女生,为了便于计算,我们令,
设男生人数为,依题意可得列联表如下:
喜欢追星
不喜欢追星
总计
男生
女生
总计
根据小概率值的独立性检验,判断中学生追星与性别有关,
则,由,解得,
由题知应为6的整数倍,
而根据小概率值的独立性检验,判断中学生追星与性别有关,
则男生至少有30人,
故答案为:30.
期末基础通关练(测试时间:30分钟)
1.(24-25高二下·湖南衡阳·期末)一个体育队有4名女运动员和3名男运动员,现从队伍抽样尿检,每次从中抽选1个运动员,抽出的运动员不再检查,则在第1次抽到女运动员的条件下,第2次抽到男运动员的概率为( )
A. B. C. D.
【答案】C
【分析】利用条件概率的概率公式结合排列组合知识求解.
【详解】用事件表示“第1次抽到女运动员”,事件表示“第2次抽到男运动员”,
第1次抽到女运动员包括第1次女第2次男:种,两次均为女种,
共种,
从所有运动员中依次取2名共有种,
则,,则,
则在第1次抽到女运动员的条件下,第2次抽到男运动员的概率为.
故选:C
2.(24-25高二下·四川绵阳·期末)现有3箱酸奶,里面都装有水果味和原味两种口味,第一箱内装有10袋,其中有2袋是水果味;第二箱内装有15袋,其中有3袋是水果味;第三箱内装有20袋,其中有5袋是水果味.现从三箱中任意选择一箱,然后从该箱中随机取1袋酸奶.取出的酸奶是水果味的概率为 .
【答案】
【分析】设任取1袋酸奶来自第一箱为事件、来自第二箱为事件、来自第二箱为事件,根据题意求出各自的概率,然后利用全概率公式可求解.
【详解】设任取1袋酸奶来自第一箱为事件、来自第二箱为事件、来自第二箱为事件,
则彼此互斥,且,.
设随机取1袋酸奶,取出的酸奶是水果味为事件,则.
故答案为:.
3.(24-25高二下·甘肃临夏·期末)已知事件满足,则下列结论正确的是( )
A.若互斥,则
B.若,则
C.若与相互独立,则
D.若,则与相互独立
【答案】D
【分析】由互斥事件、独立事件定义和性质以及互斥概率加法公式、独立概率乘法公式、条件概率公式即可逐一计算判断各选项.
【详解】对于A,若互斥,则,故A错误;
对于B,若,则,故B错误;
对于C,若与相互独立,则与相互独立,所以,故C错误;
对于D,若,则,所以与相互独立,故D正确.
故选:D
4.(22-23高二下·河南周口·期中)下面给出四个随机变量:
①一高速公路上某收费站在十分钟内经过的车辆数;
②一个沿轴进行随机运动的质点,它在轴上的位置;
③某派出所一天内接到的报警电话次数;
④某同学上学路上离开家的距离.
其中是离散型随机变量的个数为( )
A.1 B.2 C.3 D.4
【答案】B
【分析】根据离散型随机变量的定义判断即可.
【详解】对于①,十分钟内经过的车辆数可以一一列举出来,①是离散型随机变量;
对于②,沿轴进行随机运动的质点,质点在直线上的位置不能一一列举出来,②不是离散型随机变量;
对于③,一天内接到的报警电话次数可以一一列举出来,③是离散型随机变量;
对于④,某同学上学路上离开家的距离可为某一区间内的任意值,不能一一列举出来,④不是离散型随机变量,
所以给定的随机变量是离散型随机变量的有①③.
故选:B.
5.(24-25高二下·广东江门·期末)已知离数型随机变量X的分布列如下表所示:
X
0
1
2
P
下列说法正确的是( )
A. B. C. D.
【答案】BCD
【分析】根据分布列的性质求出q的值即可判断A、B选项,再求出期望和方差即可判断C、D选项.
【详解】根据分布列的性质可知,解得或,
因为,所以,故A错误,B正确;
根据期公式可得,故C正确;
根据方差公式可得:
,故D正确.
故选:.
6.(24-25高二下·广东广州·期末)如图,一个质点在随机外力的作用下,从原点O处出发,每隔1秒等可能地向左或向右移动一个单位,共移动5次,则质点位于的位置的概率为( )
A. B. C. D.
【答案】B
【分析】分析可知向左移动3次,向右移动2次,结合独立充分性实验的概率公式运算求解.
【详解】若移动5次质点位于的位置,则向左移动3次,向右移动2次,
所以质点位于的位置的概率为.
故选:B.
7.(24-25高二下·广东肇庆·期末)某同学参加招聘考试,笔试部分有三个题目,根据经验他答对每一题的概率均为,至少答对两题才能进入面试,则该同学能进入面试的概率为( )
A. B. C. D.
【答案】A
【分析】由题可知,,再利用二项分布求概率即可.
【详解】设答对的题目数量为,则,
.
故选:A.
8.(24-25高二下·全国·课后作业)已知离散型随机变量X的分布列如下,若,则=( )
X
-1
0
a
2
P
b
A. B.1 C. D.
【答案】C
【分析】根据概率之和等于建立等式求解出,再利用期望的性质及算法建立等式求解,即可求解.
【详解】由题意知,
解得,
因为,所以,即,
则,
解得,所以,
故选:C.
9.(24-25高二下·四川绵阳·期末)一批产品根据质量指标分为正品和次品,且次品率为,随机抽取1件,定义则随机变量的方差( )
A. B. C. D.
【答案】D
【分析】先由两点分布求出随机变量的均值,然后求出方差即可.
【详解】由题意,所以.
故选:D
10.(24-25高二下·广东江门·期末)从2016年1月1日起全国统一实施全面两孩政策,为了解适龄民众对放开生二孩政策的态度,某市选取80后作为调查对象,随机调查了10人,其中打算生二胎的有4人,不打算生二胎的有6人.
(1)从这10人中随机抽取3人,记打算生二胎的人数为,求随机变量的分布列和数学期望;
(2)若以这10人的样本数据估计该市的总体数据,且以频率作为概率,从该市80后中随机抽取3人,记打算生二胎的人数为,求随机变量的分布列和数学期望,方差.
【答案】(1)分布列见解析,期望为
(2)分布列见解析,期望为,方差为
【分析】由题可知服从超几何分布,c的取值为0,1,2,则易求的分布列和数学期望;
由题意可知服从二项分布,且,计算即可求得随机变量的分布列和数学期望.
【详解】(1)由题意知,的值为0,1,2,3,
,
,
,
,
所以的分布列为:
0
1
2
3
P
;
(2)由题意可知,全市70后打算生二胎的概率为,,1,2,3,且,
,
的分布列为:
0
1
2
3
P
.
11.(24-25高二下·江苏南京·期末)下列命题中,真命题有( )
A.数据6,2,3,4,5,7,8,9,1,10的70%分位数是8.5
B.若随机变量,则
C.已知两个变量具有线性相关关系,其回归直线方程为;若,则;
D.若,则
【答案】BC
【分析】对于A利用百分位数的定义即可判断,对于B利用二项分布即可求方差,进而判断,对于C利用回归方程必过样本中心点即可判断,对于D利用条件概率公式即可判断.
【详解】对于A:由,所以70%分位数是,故A错误;
对于B:由,所以,故B正确;
对于C:由,所以,故C正确;
对于D:,,所以,故D错误.
故选:BC.
12.(24-25高二下·吉林·期末)某厂进行技术改造后,生产产品过程中记录的时间x(单位:天)与相应的生产能耗y(单位:吨)的几组数据,如下表所示.若y与x线性相关,且线性回归方程为,则下列说法不正确的是( )
时间x
1
2
3
4
5
生产能耗y/吨
5
4.5
4
3.5
2.5
A.由题中数据可知,变量y与x负相关 B.线性回归方程中
C.当时,残差为- D.可以预测当时能耗约为2.2吨
【答案】D
【分析】对于A,由回归方程可判断变量y与x的负相关;对于B,利用回归方程过可判断选项正误;对于C,由回归方程及残差定义可判断选项正误;对于D,由回归方程可得预测值.
【详解】对于A,因回归方程斜率为负值,则变量y与x负相关,故A正确;
对于B,,,
因回归方程过,则,故B正确;
对于C,当时,由B分析,,则残差为:
故C正确;
对于D,当,由B分析,,故D错误.
故选:D
13.(24-25高二下·湖北孝感·期末)为研究某新药的疗效,给100名患者服用此药,跟踪调查后得如表所示的数据:
单位:名
性别
疗效
合计
无效
有效
男性患者
15
35
50
女性患者
6
44
50
合计
21
79
100
α
0.100
0.050
0.010
2.706
3.841
6.635
设:服用此药的效果与患者的性别无关,(小数点后保留3位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的概率不大于 .
【答案】0.05
【分析】计算卡方,再由独立性检验比较可得.
【详解】由公式计算得,根据小概率值的独立性检验,认为服用此药的效果与患者的性别有关,判断出错的概率不大于0.05.
故答案为:0.05.
14.(24-25高二下·江西·期末)某饮品店统计了一天营业时间(单位:小时)与饮品销量(单位:杯)的数据如下表:
营业时间
1
2
3
4
5
饮品销量
17
36
56
77
99
已知与线性相关.
(1)根据以上数据求饮品销量关于营业时间的回归直线方程;
(2)若平均一杯饮品的纯利润为5元,某日该饮品店计划早上9点开始营业,晚上9点结束营业,中间不休息,试预测当日饮品的总利润能否超过1000元?
参考公式:回归直线方程中,,.
【答案】(1)
(2)能,理由见详解
【分析】(1)根据回归方程相关参数的计算公式计算即可;
(2)根据(1)中的回归方程,先估计销量即可判断总利润是否超过1000元.
【详解】(1)根据题意,,
,,
,
,
所以回归直线方程为.
(2)由(1)知,回归方程为,
早上9点开始营业,晚上9点结束营业,共营业12小时,
所以估计共销售杯,盈利元,
所以试预测当日饮品的总利润能超过1000元.
期末重难突破练(测试时间:100分钟)
一、单选题
1.(24-25高二下·山东威海·期末)已知随机事件A,B满足,,,则( )
A.0.4 B.0.5 C.0.6 D.0.8
【答案】C
【分析】应用条件概率及全概率公式计算求解.
【详解】随机事件A,B满足,,
则
又,
则 .
故选:C.
2.(24-25高二下·云南曲靖·期末)某社区开展防疫值班工作,甲乙丙三人轮流参与,规则如下:①第1天安排甲值班;②第2天从乙丙两人中随机选1人值班;③第天,从前一天未值班的2人中随机选1人值班,则第天甲值班的概率为( )
A. B. C. D.
【答案】C
【分析】设事件:甲第天值班,,则,设,则,构造等比数列即可求解.
【详解】设事件:甲第天值班,,则,
设,则,,
又,
是首项为,公比为的等比数列,
,
故选:C.
3.(24-25高二下·广东广州·期末)已知连续型随机变量,记函数,则的图象( )
A.关于直线对称 B.关于点对称
C.关于直线对称 D.关于点对称
【答案】B
【分析】利用正态分布曲线的对称性,结合函数的单调性,和必过的点,再通过函数的中心对称性进行证明,即可作出判断.
【详解】由连续型随机变量,根据正态分布密度函数曲线关于直线对称,
但函数,即表示正态分布密度函数与及轴围成的面积,
显然有,且函数是递增函数,故AC错误;
由于,可猜想的图象关于点对称,
再进行证明,即证,
所以的图象关于点对称,故B正确,D错误;
故选:B.
二、多选题
4.(24-25高二下·重庆沙坪坝·期末)掷2次质地均匀的骰子,记事件为“两次掷出的数字相同”,事件为“两次掷出的数字不同”,事件为“两次掷出的数字之和为奇数”,事件为“两次掷出的数字之和为偶数”,则下列说法正确的有( )
A.和互斥 B.和独立 C. D.
【答案】ACD
【分析】根据互斥事件的定义即可判断A;根据相互独立事件的定义判断B;根据条件概率的公式即可判断C;根据古典概型即可判断D.
【详解】对于A,由题可知,和互斥,故A正确;
对于B,,,,
,故B错误;
对于C,,,故C正确;
对于D,,,故D正确;
故选:ACD.
5.(24-25高二下·福建漳州·期末)甲箱中有2个白球和3个黑球,乙箱中有3个白球和2个黑球.先从甲箱中随机取出一球放入乙箱中,以,分别表示由甲箱中取出的是白球和黑球;再从乙箱中随机取出一球,以B表示从乙箱中取出的是白球,则下列结论正确的是( )
A. B.
C. D.
【答案】BC
【分析】对于A,由古典概型可得结果;对于B,由样本空间点可得结果;对于C,先求出,
再由条件概率的定义可得;对于D,由全概率公式可算得.
【详解】对于A,由古典概型可知,故A错误;
对于B,由条件概率可知表示在由甲箱中取出的是白球的条件下,从乙箱中取出的是白球的概率,
当甲箱中取出的是白球放入乙箱后,乙箱中有4个白球和2个黑球,由古典概型可知;
对于C,由B选项分析同理可得,
由条件概率的定义可知,故C正确;
对于D,由全概率公式可得,故D错误.
故选:BC.
6.(24-25高二下·福建福州·期末)一口袋中有除颜色外完全相同的4个红球和2个白球,从中无放回的随机取两次,每次取1个球,记事件:第一次取出的是红球;事件:第一次取出的是白球;事件B:取出的两球同色;事件C:取出的两球中至少有一个红球,则下列说法中正确的是( )
A.事件,为对立事件 B.
C.事件B,C为独立事件 D.
【答案】ABD
【分析】根据独立事件和互斥、对立事件的概念,判断事件之间的关系,通过古典概型概率公式和条件概率公式求事件概率.
【详解】对A,事件:第一次取出的是红球;事件:第一次取出的是白球,因为一次只取一个球,事件,,不可能同时发生且必有一个发生,所以为对立事件,A正确.
对B,取出的两球同色分为都是红色和都是白色,则,所以B正确.
对C,已知事件C:取出的两球中至少有一个红球,则对立事件为两个球没有红色,则概率,积事件为两个红色球,则,可知,所以C错误
对D,由题意知,积事件为第一次取白球,第二次取红球,则,根据条件概率公式可知,所以D正确.
故选:ABD.
7.(24-25高二下·山西·期末)如图,一个质点在外力的作用下,从原点0出发,每次等可能地向左或向右移动一个单位,设经过6次移动后,该质点位于的位置,记其概率为,则下列结论正确的是( )
A. B.
C. D.
【答案】AC
【分析】根据相互独立事件的概率乘法公式,即可结合选项逐一求解.
【详解】对于A,,则需要向右移动2次,向左移动4次,故,A正确,
对于B,, 则需要向右移动3次,向左移动3次,故,B错误
对于C,, 则需要向右移动5次,向左移动1次,故,C正确,
对于D, ,故D错误,
故选:AC
三、填空题
8.(24-25高二下·福建漳州·期末)一个书包中有标号为“”的张卡片.一个人每次从中拿出一张卡片,并且不放回;如果他拿出一张与已拿出的卡片中有相同标号的卡片,则他将两张卡片都扔掉;如果他手中有3张单张卡片或者书包中卡片全部被拿走,则操作结束,记书包中卡片全部被拿走的概率为,则 ; .
【答案】 /0.6
【分析】先求出他手中3张单张卡片含有张相同卡片的概率,进而得出和间的递推关系,用累乘方法求解即可.
【详解】张卡片选取张卡片的选法共有:种,
事件“手中这张单张卡片中含有张相同卡片”的选法共有:种;
由古典概型的计算公式得其概率为:,
若书包中张卡片全部被拿走的概率为,
将这两张相同的卡片拿掉以后,相当于从对相同的卡片中已拿出一张卡片,
事件“书包中张卡片全部被拿走”发生需保证事件“书包中卡片全部被拿走”发生,
而书包中卡片全部被拿走概率为,因此,且,
所以,,
故答案为:;
9.(24-25高一下·江西宜春·期末)某校元旦晚会设计了一个抽奖游戏,主持人从编号为四个外观相同的空箱子中随机选择一个,放入奖品,再将四个箱子关闭,即主持人知道奖品在哪个箱子.当抽奖人选择某个箱子后,在箱子打开之前,主持人会随机打开一个没有奖品的箱子,并问抽奖人是否愿意更改选择以便增加中奖概率.已知甲先选择了号箱子,则在主持人打开号箱子的情况下,奖品在号箱子的概率为 .
【答案】
【分析】用表示号箱有奖品,用表示主持人打开号箱子,根据条件求出,,,,利用全概率公式,即可求解,再利用贝叶斯公式,即可求解.
【详解】用表示号箱有奖品,用表示主持人打开号箱子,
由题知,,,
又,
所以,
又.
故答案为:.
10.(24-25高三上·河北唐山·期末)某同学进行投篮训练,每次投篮次数为n,,,每次投篮的命中率都为p,随机变量表示投篮命中的次数,服从二项分布,记,当时,可认为服从标准正态分布,已知该同学每次投篮的命中率均为0.5,每次投篮命中得2分,不中得0分.若,则该同学投中次数的期望为 次;若保证该同学n次投篮总得分在区间的概率不低于0.8,则n的最小值为 .
附:,则,.
【答案】
【分析】利用二项分布的期望公式求解即可;利用公式把二项分布转化为标准的正态分布,然后利用正态分布的概率公式求解即可.
【详解】①根据题意:投篮命中的次数服从二项分布,
所以(次),
故该同学投中次数的期望为20次;
②由该同学n次投篮总得分在区间,
则该同学n次投篮命中次数在区间,
,
又因为,所以,
根据服从标准正态分布,可知,所以,
则n需满足,
故n的最小值为,
故答案为:;.
11.(21-22高二下·上海黄浦·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关“作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为中学生追星与性别有关,则女生至少有 人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
,.
【答案】20
【分析】设男生人数为x,可得列联表,由此计算的表达式,根据有的把握认为中学生追星与性别有关,可得不等式,结合,可求得答案.
【详解】设男生人数为x,则可得列联表如下:
喜欢追星
不喜欢追星
合计
男生
女生
合计
则计算 ,
若有的把握认为中学生追星与性别有关,则需,
解得,
又,故x至少为60,则女生至少有20人,
即有 的把握认为中学生追星与性别有关时,女生至少有20人,
故答案为︰20.
四、解答题
12.(23-24高三上·福建泉州·期末)一个袋子中有10个大小相同的球,其中红球7个,黑球3个.每次从袋中随机摸出1个球,摸出的球不再放回.
(1)求第2次摸到红球的概率;
(2)设第1,2,3次都摸到红球的概率为,第1次摸到红球的概率为,在第1次摸到红球的条件下,第2次摸到红球的概率为,在第1,2次都摸到红球的条件下,第3次摸到红球的概率为,求,,,;
(3)对于事件,试根据(2)写出,,,的等量关系式,并加以证明.
【答案】(1)
(2),,,
(3),证明见解析
【分析】(1)根据全概率公式求解即可;
(2)根据相互独立事件乘法公式、条件概率公式及排列数公式求解;
(3)根据(2)猜想,由条件概率公式证明即可.
【详解】(1)记事件“第次摸到红球”为,则第2次摸到红球的事件为,
,,,,
由全概率公式,得.
(2)由已知得,,
,,
.
(3)由(2)可得,即,
可猜想:
证明如下:由条件概率及,,
得,,
所以.
13.(24-25高二下·贵州安顺·期末)甲、乙两选手进行象棋比赛,假设各局比赛的结果相互独立,且每局比赛甲获胜的概率为,乙获胜的概率为,比赛分出胜负时结束.
(1)若,比赛采用三局两胜制,求乙获胜的概率;
(2)若比赛有两种赛制,五局三胜制和三局两胜制,且,试分析哪种赛制下甲获胜的概率更大,并说明理由;
(3)设,已知甲、乙进行了局比赛且甲胜了8局,试给出的估计值(表示局比赛中甲胜的局数,以使得最大的的值作为的估计值).
【答案】(1)
(2)采用五局三胜制甲获胜的概率更大,理由见解析
(3)10
【分析】(1)根据独立事件的概率计算公式进行计算.
(2)根据题意,分别求出采用五局三胜制和三局两胜制甲最终获胜的概率,列式运算得解.
(3)根据二项分布得,,记,分析的单调性,可得最大时,对应的值.
【详解】(1)设事件为“比赛采用三局两胜制乙获胜”.
因为每局比赛乙获胜的概率为,
所以.
(2)在五局三胜制中甲获胜的概率.
在三局两胜制中甲获胜的概率.
.
当时,,故采用五局三胜制甲获胜的概率更大.
(3)根据二项分布得,可知.
令,则.
令,解得,当时,可得;
令,解得,当时,可得.
故当时,最大,即时,的值最大,所以的估计值为10.
14.(24-25高二下·江西·期末)盛夏来临,某棋牌室举办为期一周的“消夏”围棋活动,分为趣味赛和积分赛(每局比赛必须决出胜负),规则如下:前2天举办趣味赛,每天仅首局比赛可获得积分,获胜得1分,失败得0分;积分赛在后5天进行,每天只有前两局比赛可获得积分,首局获胜得2分,次局获胜得1分,失败得0分.小张这一周中每天至少参加两局围棋比赛,已知她每天第一局和第二局比赛获胜的概率分别为,,且各局比赛相互独立.
(1)已知趣味赛两天积分不为0的参赛选手可获得精美礼品一份,.
(i)求小张在趣味赛中获得精美礼品的概率;
(ii)在小张获得精美礼品的条件下,求小张2天趣味赛仅积1分的概率;
(2)设小张在后5天的积分赛中,恰有2天每天积分不低于1分的概率为,求的最大值.
【答案】(1);
(2)
【分析】(1)(i)计算两天积分不为0的概率,利用对立事件求概率即可;
(ii)根据条件概率公式求概率即可;
(2)先确定每天积分不为0的概率,后5天中积分不低于1的天数,,根据二项分布得出,再利用导数分析单调性,根据单调性确定最值即可.
【详解】(1)(i)设小张在趣味赛中获得精美礼品事件为,
则,
所以小张在趣味赛中获得精美礼品的概率为.
(ii)设小张2天趣味赛仅积1分事件为B,
则,所以,
在小张获得精美礼品的条件下,求小张2天趣味赛仅积1分的概率为.
(2)设小张在后5天的积分赛中,一天中积分不低于1分事件为C,
则,
即在后5天中积分不低于1的天数,,
则,令,
则,
,
所以在单调递增,单调递减,
即,
所以当,即时,的最大值为.
15.(24-25高二下·福建泉州·期末)随着中美关税战的不断升级,某企业大大加强科技研发投入的力度,为确定下一年对某产品进行科技升级的研发费用,需了解该产品年研发费用(单位:千万元)对年销售量(单位:千万件)的影响.根据市场调研与模拟,对收集的数据进行初步处理,得到散点图及一些统计量的值如
30.5
15
15
46.5
表中,.
(1)根据散点图判断,与哪一个更适合作为年销售量关于年研发费用的回归方程模型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立关于的回归方程,并估计年研发费用为27千万元时年销售量的值;
(3)科技升级后,该产品的效率大幅提高,经试验统计得大致服从正态分布.企业对科技升级团队的奖励方案如下:若不超过50%,不予奖励;若超过50%,但不超过53%,每件产品奖励2元;若超过53%,每件产品奖励4元.记为每件产品获得的奖励,求(精确到0.01).
附:①对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,.
②若随机变量,则,.
③.
【答案】(1)更适合
(2),8.1千万件
(3)
【分析】(1)根据散点图可判断,更适合;
(2)对两边取对数可得,再结合表中数据,即可求解;
(3)由正态分布的概率公式代入计算,再由期望的计算公式即可得到结果.
【详解】(1)根据散点图可判断,更适合作为关于的回归方程模型.
(2)由得:,即,
由表中数据得:,
所以,
所以,所以,
所以关于的回归方程为.
当时,,即年研发费用为27千万元时年销售量为8.1千万件.
(3)因为,,
所以
,
所以,
所以(元).
期末综合拓展练(测试时间:100分钟)
一、单选题
1.(24-25高二下·安徽·期末)为测试一种新药的有效性,研究人员对某种动物种群进行试验,从该试验种群中随机抽查了100只,得到如下数据(单位:只):
发病
未发病
合计
使用药物
10
40
50
未使用药物
30
20
50
合计
40
60
100
从该动物种群中任取1只,记事件表示此动物发病,事件表示此动物使用药物,定义的优势,在发生的条件下的优势,则( )
A.可化简为,估计其值为 B.可化简为,估计其值为
C.可化简为,估计其值为 D.可化简为,估计其值为
【答案】A
【分析】利用条件概率公式化简.
【详解】1.化简.
已知,
则,
由条件概率公式,
所以
,
2.根据列联表计算概率
由列联表可知,,
所以
2.(2025·黑龙江大庆·三模)某商店店庆,每个在店内消费到一定额度的顾客都可以参与抽奖活动.组织方准备了个盲盒,其中有个盲盒内有奖品.抽奖规则为:抽奖者从这个盲盒中随机抽取1个盲盒,兑奖后组织方会再补回一个相同的盲盒,充分混合后,再由下一位抽奖者抽奖.抽奖者甲先拿起了一个盲盒,在犹豫是否打开时,组织方拿走了一个没有奖品的盲盒,最终甲选择了另外一个盲盒打开,记甲中奖的概率为.抽奖者乙在选盲盒时不小心碰掉了一个盲盒,并且发现摔裂的盲盒内没有奖品,随后乙从剩下的盲盒中选定一个盲盒打开,记乙中奖的概率为,则( )
A. B. C. D.无法确定与的大小关系
【答案】A
【分析】根据给定条件,利用全概率公式求出,利用古典概率求出,再比较大小即可.
【详解】设事件为“抽奖者甲中奖”,事件为“甲最初选中的盲盒有奖”,则,
在组织方拿走无奖的盲盒后,若先选中的有奖,则剩余个盲盒中有个奖品,
甲更换盲盒后,
若甲先选中的盲盒无奖,则剩余个盲盒中有个奖品,则更换盲盒后,
因此,
由乙碰掉的盲盒无奖,则所有个盲盒中有个奖品,且每个盲盒被抽到的可能性相同,则,
于是,所以.
故选:A.
3.(2023·福建·模拟预测)已知,则,,.今有一批数量庞大的零件.假设这批零件的某项质量指标引单位:毫米)服从正态分布,现从中随机抽取N个,这N个零件中恰有K个的质量指标ξ位于区间.若,试以使得最大的N值作为N的估计值,则N为( )
A.45 B.53 C.54 D.90
【答案】B
【分析】由已知可推得,,根据已知以及正态分布的对称性,可求得.则,,设,求出函数的最大整数值,即可得出答案.
【详解】由已知可得,.
又,
所以,,.
设,
则,
所以,,所以.
,
所以,,所以.
所以,以使得最大的N值作为N的估计值,则N为.
故选:B.
【点睛】思路点睛:由正态分布求出概率,然后根据已知,可得,得出,利用函数求出的最大值.
二、多选题
4.(24-25高二下·吉林长春·期末)某比赛共进行局,每局比赛没有平局,2n局比赛结束后赢得n局以上的一方获胜.甲、乙进行该比赛,已知甲每局比赛获胜的概率为p,每局比赛的结果相互独立,记甲在该比赛中获胜的概率为,下列结论正确的是( )
A.若,则 B.若,则当时,最大
C.若,则当时,最小 D.若,则当时,最大
【答案】ABC
【分析】利用独立重复试验的概率公式,结合互斥事件的概率性质判断A;利用条件概率、全概率公式探讨的关系,再赋值计算判断B,C,D即可.
【详解】对于A,,,,故A正确;
当时,记事件“甲在该比赛中获胜”,“第一局甲赢”,“第二局甲赢”,
,
当事件和发生时,要使得甲在该比赛中获胜,
则在后续的局比赛中至少要赢局,则;
当事件发生时,要使得甲在该比赛中获胜,
则在后续的局比赛中赢的局数大于或恰好赢了局,
所以;
当事件发生时,要使得甲在该比赛中获胜,
则在后续的局比赛中赢的局数大于,
可看成事件“在后续的局比赛中赢的局数大于”,
与事件“在后续的局比赛中恰好赢了局”的差事件,
所以,
则
,
即,
易得,则我们讨论的正负即可,
对于B,若,则,当时,,
即,则当时,最大,故B正确,
对于C,若,则,当时,,
即,则当时,最小,故C正确,
对于D,若,则,
当时,,此时,
当时,,此时,
则当时,最大,故D错误.
故选:ABC
5.(23-24高二下·山东菏泽·期末)假设变量与变量的对观测数据为,两个变量满足一元线性回归模型要利用成对样本数据求参数的最小二乘估计,即求使取最小值时的的值,若某汽车品牌从2020~2024年的年销量为(万辆),其中年份对应的代码为,如表,
年份代码
1
2
3
4
5
销量(万辆)
4
9
14
18
25
根据散点图和相关系数判断,它们之间具有较强的线性相关关系,可以用线性回归模型描述
令变量,且变量与变量满足一元线性回归模型则下列结论正确的有( )
A. B.
C. D.2025年的年销售量约为34.4万辆
【答案】AC
【分析】利用线性回归方程待定系数公式,再由变量的线性代换关系进行计算,最后恒过样本点,就可得到线性回归方程.
【详解】由可得:,
同理由,可得,
根据公式,故A正确;B错误;
由表格中数据可得:,
,
,
所以,
由于,所以与的回归方程必过原点,,
又由于,代入得:
,整理得:,故C正确;
当,即表示2025年,此时,
所以2025年的年销售量约为万辆,故D错误;
故选:AC.
三、填空题
6.(2024·辽宁·三模)一个书包中有标号为“”的张卡片.一个人每次从中拿出一张卡片,并且不放回;如果他拿出一张与已拿出的卡片中有相同标号的卡片,则他将两张卡片都扔掉;如果他手中有3张单张卡片或者书包中卡片全部被拿走,则操作结束.记书包中卡片全部被拿走的概率为,则 . .
【答案】 /
【分析】先求出他手中3张单张卡片含有张相同卡片的概率,进而得出和间的递推关系,用累乘方法求解即可.
【详解】张卡片选取张卡片的选法共有:种,
事件“手中这张单张卡片中含有张相同卡片”的选法共有:种;
由古典概型的计算公式可得其概率为:,
若书包中张卡片全部被拿走的概率为,
将这两张相同的卡片拿掉以后,相当于从对相同的卡片中已拿出一张卡,
事件“书包中张卡片全部被拿走”发生需保证事件“书包中卡片全部被拿走”发生,
且书包中卡片全部被拿走概率为,
因而,且,
则,
,
故答案是:(或),.
【点睛】思路点睛:本题主要考查递推数列与概率知识的交汇问题,解决该类问题应该注意的事项有:
(1)做好互斥事件的划分,正确进行独立事件概率的计算;
(2)借助待定系数方法建立不同事件概率间的递推关系,即构建递推数列;
(3)正确运用数列求通项公式或求和的方法解决问题.
四、解答题
7.(24-25高二下·山东泰安·期末)为备战全国机器人大赛,某高校机器人甲队和乙队进行练习赛,比赛规则为:①每局比赛胜者得1分,负者得0分,没有平局;②总共进行奇数局比赛;③全部比完后,分数高者获胜.假设每局比赛甲队获胜的概率都是,各局比赛之间的结果互不影响.
(1)当时,若两队共进行3局比赛,设甲队得分减去乙队得分的差为X,现在规定:若,则甲队可额外获得一次特殊训练机会,求甲队获得一次特殊训练机会的概率;
(2)若两人共进行局比赛,当且时,记事件表示“在前局比赛中甲赢了局”,事件B表示“甲最终获胜”,求,的值;
(3)若甲队在进行局比赛时获胜的概率记为,在进行局比赛时获胜的概率记为,在进行局比赛时获胜的概率记为,已知,试判断与的大小关系,并说明理由.
【答案】(1);
(2),;
(3),理由见解析.
【分析】(1)应用独立重复试验的概率求法及互斥加法公式求概率;
(2)由题设前局后剩余2局比赛,设前局甲队赢局,则剩余2局的赢局数,总分满足,应用二项分布的概率及对立事件概率求法求,;
(3)由全概率公式得,即,再应用作商、基本不等式得,即可得结论.
【详解】(1),
∴甲队获得一次特殊训练机会的概率为;
(2)由题设,前局后剩余2局比赛,设前局甲队赢局,
则剩余2局的赢局数,总分满足,
所以对应,即,又,故,
对于对应,即,又,所以;
(3)由全概率公式得
,
∴,
当时,,
,
∵,
∴,
∴.
8.(24-25高二下·浙江金华·期末)某实验室对某二进制数码串传输进行测试,初始二进制数码串是长度为的且全部由0组成的数码串.传输过程中,每位数码以概率传输记为0,以概率传输记为1,其中,每位数码的传输相互独立,并设事件为“传输结果各位数字之和为偶数”的事件.
(1)当时,求;
(2)证明:对任意的正整数,有;
(3)在传输结果中任取一位数码,记“取到1”的事件为,问:是否存在最大值?若存在,求出使取到最大值的正整数;若不存在,请说明理由.
【答案】(1)
(2)证明见解析
(3)答案见解析
【分析】(1)由条件可知这3个0都传输为0,或传输为2个1和1个0,再按照独立重复概率公式,列式求解;
(2)首先根据题意求和,再根据和根据二项式定理计算,联立方程求解,即可证明;
(3)根据(2)的过程计算和,联立后计算,再代入条件概率公式求,从而构造,根据,讨论的取值,判断函数的单调性,从而确定最大值.
【详解】(1).
(2)传输结果各位数字之和为奇数的概率为,
传输结果的数码个数为偶数的概率为,
由,
.
(3)
记,
则
①当时,,
②当时,,,即单调递增,不存在最大值.
③当时,正负无法确定,
当为奇数时,,当为偶数时,,
要使取到最大值,应取偶数,记,,
,
,
单调递减,,
综上所述:
当时,不存在最大值:
当时,恒为常数;
当时,在时取到最大值.
9.(24-25高二下·内蒙古包头·期末)为缓解学生的压力,某中学组织学生开展了一项有趣的比赛.甲,乙两人参加比赛,比赛规则为:共进行奇数局比赛,全部比完后,所赢局数多者获胜.假设每局比赛甲赢的概率都是,各局比赛之间的结果互不影响且没有平局.
(1)若两人共进行5局比赛且,设两人所赢局数之差的绝对值为X.求X的分布列和数学期望;
(2)若两人共进行局比赛且,记事件表示“在前局比赛中甲赢了局”.事件B表示“甲最终获胜”,请写出,,,的值(直接写出结果即可);
(3)若两人共进行了局比赛,甲获胜的概率记为.证明:当时,.
【答案】(1)分布列见解析,
(2),,,.
(3)证明见解析
【分析】(1)由题意可知X的可能取值为1,3,5,分别计算其概率,求出X的分布列和数学期望;
(2)根据给定信息直接写出结果;
(3)利用全概率公式求出和,再利用作商法结合不等式推理证明.
【详解】(1)X的可能取值为1,3,5
;
;
.
所以X的分布列为
X
1
3
5
P
.
(2),,,.
(3)由题意可得
.
所以.
当时,.
.
因为,所以.
10.(23-24高二下·江苏·期末)《中华人民共和国国民经济和社会发展第十四个五年规划和2023年远景目标纲要》指出:要加强原创性、引领性科技攻关,坚决打赢关键核心技术攻坚战.某企业集中科研骨干力量,攻克系列关键技术,已成功实现离子注入机全谱系产品国产化,工艺段覆盖至,为我国芯片制造产业链补上重要一环.该企业使用新技术对某款芯片制造工艺进行改进.
(1)该款芯片生产有四道工序,前三道工序的生产互不影响,第四道是检测评估工序,包括智能自动检测与人工抽检.已知该款芯片在改进生产工艺前,前三道工序的次品率分别为.
①求改进生产工艺前,该款芯片的次品率;
②在第四道工序中,部分芯片由智能检测系统进行筛选,其中部分次品芯片会被淘汰,筛选后的芯片及未经筛选的芯片进入流水线由工人进行抽样检验.记表示事件“某芯片经过智能检测系统筛选”,表示事件“某芯片经人工抽检后合格”,求证:;
(2)改进生产工艺后,该款芯片的某项质量指标服从正态分布,现从中随机抽取个,这个芯片中恰有个的质量指标位于区间.
①若,以使得的最大值作为的估计值,求;
②记这个芯片的质量指标的标准差为,其中个芯片的质量指标的平均数为,标准差为,剩余芯片的质量指标的平均数为,标准差为,试写出的计算式.
参考数据:.
【答案】(1)①;②证明见解析.
(2)①;②
【分析】(1)①根据相互独立事件及对立事件求解即可;
②利用条件概率公式及性质证明即可.
(2)①由已知可推得,,
根据已知以及正态分布的对称性,可求得.则,,设,
求出函数的最大整数值,即可得出答案.
②利用样本平均数及方差公式化简即可求解.
【详解】(1)①改进生产工艺前,该款芯片的次品率为
.
②由题意,所以,所以,
又,
所以,即,
所以,即,所以.
(2)①由已知可得,.
又,
所以,.
设,
令,
所以,所以.
令,
所以,所以.
所以使得最大的M值作为M的估计值,则M为.
②记,这个芯片的质量指标的平均数为:,则
又
同理,
所以
,
所以.
2 / 96
学科网(北京)股份有限公司
$