内容正文:
第08讲 统计与概率
【题型归纳】
· 题型一:用样本估计总体
· 题型二:变量间的相关关系
· 题型三:概型
· 题型四:条件概率
· 题型五:全概率公式
· 题型六:事件的独立性
· 题型七:离散型随机分布及其分布列问题
· 题型八:二项分布及其应用
· 题型九:正态分布问题
· 题型十:回归分析与独立性检验
· 题型十一:统计概率高考新题型
【题型统计】
题型一:用样本估计总体
【典例1】.(2026·河南濮阳·模拟预测)下列说法正确的是( )
A.数据5,7,8,8,9,10,13,14,16,16的80%分位数是14
B.若数据的平均数为4,则数据的平均数为16
C.若数据的平均数为6,方差为9,现又加入3个数据5,6,7,则这10个数据的方差为6.5
D.若数据的平均数为,则的方差为
【变式1】.(25-26高三下·云南·阶段检测)如图,这是全国2025年下半年商品零售额和餐饮收入同比增长速度图,则全国2025年下半年( )
A.商品零售额同比增长速度的极差为 B.商品零售额同比增长速度逐渐降低
C.餐饮收入同比增长速度的分位数为 D.餐饮收入同比增长速度的平均数小于
【变式2】.(2026·辽宁抚顺·二模)是空气中的细小污染物,其浓度(单位:)越高,空气质量越差,浓度越低,空气质量越好.我国现行国家标准规定:若日平均浓度不超过35,则当天空气质量等级为“优”;若日平均浓度超过35但不超过75,则当天空气质量等级为“良”.某城市一周内日平均浓度如下表,则( )
星期
一
二
三
四
五
六
日
日平均浓度
34
27
43
23
45
26
19
A.该城市这周共有5天的空气质量等级为“优”
B.该城市这周日平均浓度数值的40%分位数为27
C.该城市这周日平均浓度数值的极差为28
D.该城市这周日平均浓度数值的平均数为31
题型二:变量间的相关关系
【典例2】.(2026·江苏南通·三模)某科研团队研发新一代硫化物固态锂电池,测试了5块同批次电池的循环次数x(次)与剩余容量y(单位:),得到如下数据:
x(次)
100
200
300
400
500
y(Ah)
9.8
9.5
9.2
8.9
8.6
(1)求y关于x的线性回归方程,预测当循环次数为1000次时电池的剩余容量;并计算样本相关系数r,据此说明线性回归模型拟合x与y关系的合理性.
(2)该团队另有10块同批次电池,其中改性优化电池6块,普通电池4块;改性优化电池中有4块循环寿命超过1000次,普通电池循环寿命均未超过1000次,规定循环寿命超过1000次为达标.现从这10块电池中随机抽取3块进行破坏性安全测试,记抽取的3块中达标的电池数为,求的分布列和数学期望.
参考公式:回归直线的斜率和截距的最小二乘估计分别为
,,
相关系数
【变式1】.(2026·陕西榆林·模拟预测)飞机与高铁是人们远距离出行的两种方式,交通大学某班学生为了调查人们选择的远距离出行方式是否与年龄相关,随机抽取该市1000名市民进行调查,得到如下列联表:
低于40岁
不低于40岁
总计
选择飞机出行
100
选择高铁出行
300
总计
500
1000
(1)补全表中数据,依据小概率值的独立性检验,是否能够认为市民选择的远距离出行方式与年龄有关联?
(2)调查小组统计高铁站某处今天的客流量,从7:00开始,每小时作为一个时间段(为第1个时间段,为第2个时间段,……),得到如下数据:
时间段
1
2
3
4
5
客流量(千人)
1
1.5
2.5
3
3.5
若与线性相关,建立每个时间段客流量与时间段的经验回归方程,并预测的客流量.
附:,其中.
0.010
0.001
6.635
10.828
对于一组数据,,…,,其经验回归方程的斜率,.
【变式2】.(2026·江苏南京·模拟预测)为推进双碳目标,我国西北某地区自2017年起开展生态修复碳汇造林工程,统计了2017--2021年治理经费投入与新增碳汇造林面积数据如下表,单位:亿元、万亩.
年份
2017
2018
2019
2020
2021
治理经费x
1
2
3
4
5
新增碳汇造林面积y
12
17
21
25
30
(1)根据表中数据,求y关于x的线性回归方程,并预测该地区2026年的新增碳汇造林面积;
(2)统计该地区治理项目相关数据,将治理经费分为低投入、高投入两类,新增碳汇造林面积分为未达标、达标两类,得到如下列联表:
未达标
达标
合计
低投入
420
80
500
高投入
30
470
500
合计
450
550
1000
有无的把握认为新增碳汇造林面积是否达标与治理经费有关?
(3)经统计,前n年该地区造林项目总数量为3n个,其中未达标项目数量为n个,达标项目数量为个.
①由题意判断数列为何种数列,并说明理由;
②现从前n年的所有造林项目中随机抽取3个,记抽取的达标项目个数为随机变量X,求X的数学期望;已知抽取的3个项目中至少有1个达标,求这3个项目全部达标的概率.
附:对于一组数据,,...,,的斜率和截距的最小二乘估计分别为, ,卡方统计量:.
小概率值a
0.05
0.01
0.001
3.841
6.635
10.828
题型三:概型
【典例3】.(2026·安徽淮北·二模)某同学制作了一个质地均匀的正四面体形骰子,在其中三个面分别写上一个数字1、2、3,第四个面写了三个数字1,2,3,随机抛掷一次,事件表示向下的面上有数字1,事件表示向下的面上有数字2,事件表示向下的面上有数字3,则( )
A.事件与事件互斥 B.事件与事件相互独立
C.事件与事件互斥 D.事件与事件相互独立
【变式1】.(2026·山西吕梁·二模)某快递分拣中心待处理的5件包裹中,3件为“普通件”,2件为“优先件”.分拣员按随机顺序不放回逐一扫描分拣,若未分拣的“优先件”数量不少于“普通件”数量,则系统自动暂停当前批次处理.记为暂停时已完成分拣的包裹数,则( )
A. B. C. D.
【变式2】.(2026·四川成都·二模)已知5张奖券中只有2张有奖,甲、乙、丙3名同学依次不放回地各随机抽取1张,设甲、乙、丙中奖的概率分别为,则( )
A.最大 B.最大 C.最大 D.
题型四:条件概率
【典例4】.(2026·福建漳州·三模)甲、乙、丙三人到三个景点旅游,每人只去一个景点,且三人的选择相互独立.设事件“三个人去的景点各不相同”,事件“甲去了第1个景点”,事件“乙去了第1个景点”,则下列说法错误的是( )
A.与互斥 B.与相互独立
C. D.
【变式1】.(2026·河北沧州·模拟预测)现有甲、乙、丙三个车间生产某种产品,其中甲车间每日生产400件,乙车间每日生产600件,丙车间每日生产200件,产品的合格率分别为.现随机抽取1件产品送去检验,若抽取的该件产品经检验为不合格品,则该产品来自乙车间的概率为( )
A. B. C. D.
【变式2】.(2026·山西临汾·二模)将5名实习生分配到A,B,C三个班开展实习工作.要求每个班都要有实习生,当实习生甲不去A班时,B班恰有3名实习生的概率为( )
A. B. C. D.
题型五:全概率公式
【典例5】.(2026·河南开封·二模)某同学每周进行两次游泳训练,每次游趟或趟,第一次游趟或趟的概率均为,若第一次游趟,则第二次游趟的概率为,游趟的概率为;若第一次游趟,则第二次游趟的概率为,游趟的概率为.若一周至少游趟为训练量达标,则该同学一周训练量达标的概率为( )
A. B. C. D.
【变式1】.(2025·四川成都·一模)三个相同的盒子里分别放有两个黑球,一个黑球一个红球,两个红球,现从任意的盒子里随机取出一球,若该球为红色,则该盒剩下的另一球也是红色的概率为( )
A. B. C. D.
【变式2】.(2025·广西河池·二模)一家银行有VIP客户和普通客户,VIP客户占客户总数的,普通客户占客户总数的.已知VIP客户的信用卡欺诈概率为,而普通客户的信用卡欺诈概率为.现在随机抽取一个发生信用卡欺诈的客户,请问这个客户是VIP客户的概率是( )
A. B. C. D.
题型六:事件的独立性
【典例6】.(2026·上海·二模)已知和分别表示事件和事件发生的概率,且 ,则在下列各项中,“和独立”的充分条件是( ).
A. B.
C. D.
【变式1】.(2026·广东·模拟预测)将4个黑球和6个红球随机排成一列,事件“第k个球是黑球”,则下列正确的是( ).
A. B.
C. D.
【变式2】.(2025·河北石家庄·三模)已知随机事件,表示事件的对立事件,,则下面结论正确的是( )
A.事件与一定是对立事件 B.
C. D.若事件A,B互相独立,则
题型七:离散型随机分布及其分布列问题
【典例7】.(2026·山东威海·二模)把4个形状大小相同的球等可能地放入编号为1,2,3,4的四个盒子中,记放入1号,2号,3号,4号盒子中的球的个数分别为.
(1)求的概率;
(2)求且的概率;
(3)设函数,记,求的分布列与数学期望.
【变式1】.(2026·河北保定·二模)某农家乐园为增加客流量,计划在五一期间举行农产品的团购活动,每位参与团购且购买金额不低于100元的顾客均可以参加抽奖活动.抽奖方案如下:开始时箱子中放有除颜色外完全相同的4个红球与12个白球,每位参与抽奖的顾客均可抽取2次,每次从箱子中随机取1个球,第1次顾客从箱子中随机取出1个球,确定颜色后放回箱子,同时往箱子中放入2个与第1次取出的球颜色相同的球,然后进行第2次抽取.已知顾客每次取出白球没有奖励,取出红球奖励20元.
(1)求顾客第2次取出红球的概率.
(2)记每位参与抽奖的顾客获得奖励的总金额为X元,求E(X).
(3)该农家乐园计划增加一种抽奖方案,此方案要求参与抽奖的顾客通过扫描二维码进入小程序回答问题,每位顾客最少回答 2个问题,最多回答 3个问题,若前 2个问题至少回答正确 1个,则不再回答第 3个问题,若前2个问题都回答错误,则需回答第 3个问题,且第 1个问题回答正确奖励 6元,第 2个和第3个问题回答正确均奖励 12元.已知顾客甲正确回答这 3个问题的概率依次为 且这3个问题回答正确与否相互独立.为使顾客甲获得奖励的总金额的数学期望最大,顾客甲应该选择原抽奖方案还是新增抽奖方案?请说明理由.
【变式2】.(2026·河南·二模)中国航天“十五五”规划核心是从航天大国迈向航天强国、从大国重器转向万亿级支柱产业、从近地领先走向深空领跑.为实现发动机科研突破,我国某航天研究院对甲、乙、丙三款新型发动机关键部件进行可靠性测试,单次测试中,部件连续稳定工作时长达到1200小时及以上,即可判定为“一级可靠性部件”.为预测本次测试中获评“一级可靠性部件”的数量及最优部件型号,收集了三款部件过往的测试数据(单位:小时),如下所示:
甲部件:
乙部件:
丙部件:
(1)求收集到的甲部件测试数据的第分位数;
(2)假设用频率估计概率,且甲、乙、丙三款部件的测试结果相互独立.设为甲、乙、丙三款部件中获评“一级可靠性部件”的总数量,求的概率分布列和数学期望.
题型八:二项分布及其应用
【典例8】.(2026·重庆·三模)某工厂生产一种零件,其标准尺寸参数,计划生产每种尺寸零件的概率相等,实际生产过程中有10%的概率发生工艺缺陷,无缺陷时,生产出来的零件为标准尺寸,若发生工艺缺陷,则生产出来的零件尺寸会缩减为标准尺寸的一半,且每次生产过程独立进行.
(1)连续生产10个该种零件,记有X个零件有工艺缺陷,求X最有可能的取值;
(2)求实际生产一个零件的尺寸的分布列和期望.
【变式1】.(2026·河南新乡·三模)2026年的春晚舞台上,机器人的出色表现,展示了中国智造的魅力.某公司在对某型号机器人研发测试的过程中,工程师发现该型号机器人成功完成动作指令的概率为,但工程师对机器人下达的动作指令分为两类,一类表述清晰,另一类表述模糊.若对机器人下达的动作指令表述清晰,则机器人成功完成动作指令的概率为;若对机器人下达的动作指令表述模糊,则机器人成功完成动作指令的概率为.每次测试该型号机器人能否成功完成动作指令相互独立.
(1)求工程师下达的动作指令表述模糊的概率;
(2)现对一台该型号机器人完成动作指令的情况进行次测试,记这次测试中恰有2次未成功完成动作指令的概率为,求取得最大值时的值.
【变式2】.(2026·福建宁德·二模)把学生考试中解答题结果正确、无明显逻辑错误,但书写步骤不规范、缺少必要文字说明、卷面潦草、得分要点缺失的解答定义为“拙解”.为优化考试阅卷效率,某市教育学院引入AI智能阅卷系统,对数学试卷采用两台初评+人工仲裁的方式阅卷.按扣分评分:“拙解”扣1分、2分、3分.初评与人工仲裁扣分概率均相同,且相互独立,各扣分概率如下表:
扣分
1
2
3
概率
记系统的扣分分别为,仲裁扣分为,扣分规则如下:
①若,取的平均数为最终扣分;
②若,启动人工仲裁,取中与更接近者,与计算平均数为最终扣分,若,则取中较小者与计算平均数为最终扣分.
根据以上材料,解决如下问题:
(1)设某同学一道“拙解”的最终扣分为随机变量,求;
(2)该同学本次考试5道解答题全部为“拙解”,各题扣分相互独立.
(i)记单题扣2分的题目数为,求;
(ii)记单题扣分不高于2分的题目数为,若该同学通过规范书写,可将单题扣分不高于2分的概率提升至,为使,求的最小值(结果保留两位小数).
(参考数据:)
题型九:正态分布问题
【典例9】.(2026·辽宁锦州·二模)高尔顿钉板是英国统计学家高尔顿设计的一种概率模型,其结构如下,在一块竖直木板上钉有若干排等间距的钉子,每排钉子的数量比上一排多一枚,且相邻的两排钉子的位置相互错开,木板底部有若干个等宽的凹槽,用于收集下落的小球,小球从木板顶端的入口处自由下落,在下落过程中,小球每次遇到钉子时,向左或向右下落的概率均为0.5,且每次下落是相互独立的.现有一个高尔顿钉板,其设置排钉子,第排钉子下方有个凹槽.从左至右依次记为凹槽0,凹槽1,…,凹槽,当时,钉板如图所示.进行次独立重复试验,每次试验投放一个小球.设小球从入口下落最终落入凹槽的个数为.
(1)若,
(ⅰ)当时,求;
(ⅱ)当时,求的数学期望与方差;
(2)当足够大时,可以认为小球最终落入的凹槽标号服从正态分布,其中为的数学期望,为的方差.若,,试估计落在凹槽15到凹槽21(含15和21)内的小球总数.
参考数据:若随机变量,,,.
【变式1】.(2026·上海·二模)班主任小明查阅了某大学发表的一项本市高三学生手机使用情况的研究报告.报告指出,高三学生每周手机使用时长(单位:小时)总体上服从正态分布.
(1)小明老师将自己所带班级(共50名学生)视为从本市高三学生总体中随机抽取的一个样本,能以此正态分布模型估算出全班每周平均手机使用时长超过16小时的人数,在此估算基础上若在全班任选3位同学,则至少有2位同学的每周手机使用时长超过16小时的概率是多少?(结果用最简分数表示)
参考数据:若,则.
(2)小明老师发现小虹同学每周手机使用时长超过16小时,对其进行疏导劝解,并跟进统计出之后5周小虹每周手机使用时长与该周数学练习得分(每周练习的难度相同且满分均为150分),制成表1.以这5组数据建立回归方程.请求出实数的值
表1
第1周
第2周
第3周
第4周
第5周
手机使用时长
20
18
22
16
14
练习得分
80
88
73
92
m
(3)受到鼓励的小虹制定了寒假复习计划表递交给小明老师,严格控制手机使用时长.小明老师统计发现该计划表中若第n天能复习时长超过5小时(记为“高效复习”),则第天也能“高效复习”的概率为;若第天不能“高效复习”,则第天还能“高效复习”的概率为.设(,为正整数)表示第天能“高效复习”的概率,,若表示复习计划表第天有效.求证:数列是等比数列,并说明小虹的该复习计划表是否在寒假每一天均有效.
【变式2】.(2026·浙江·三模)信息安全是互联网时代最重要的安全之一,我国自主研发的量子通信保密传输系统,依靠量子密钥分发实现信息安全传输,该系统采用量子信道和经典信道协同工作,某量子通信保密传输系统在单次密钥分发过程中,量子信道成功密钥生成的概率为,经典信道完成信息匹配的概率为,且两个信道工作相互独立.只有当量子信道密钥生成成功,且经典信道信息匹配成功,则本次有效密钥分发成功,否则本次有效密钥分发失败.
(1)求该系统单次有效密钥分发成功的概率;
(2)若该系统独立进行次密钥分发,记为有效分发成功的次数,求的数学期望;
(3)科研人员对该系统连续传输的密钥准确率进行检测,发现密钥准确率(单位:)服从正态分布.若准确率不低于为“最优传输”,估算次密钥分发中,可用于“最优传输”的次数.
附:若,则,,.
题型十:回归分析与独立性检验
【典例10】.(2026·四川泸州·模拟预测)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数与天数的情况,对统计得到的样本数据作了初步处理,得到下面的散点图及一些统计量的值.
5.5
8.7
1.9
301
385
79.75
表中,.
(1)依据散点图推断,与哪一个更适合作为未佩戴头盔人数与天数的回归方程类型?(给出判断即可,不必说明理由),并求出所选类型的回归方程.
(2)为了解佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车市民进行调查,得到如下列联表:
性别
佩戴头盔
合计
不佩戴
佩戴
女性
8
12
20
男性
14
6
20
合计
22
18
40
依据的独立性检验,能否认为市民骑电动摩托车佩戴头盔与性别有关联?
参考公式:,,,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【变式1】.(2026·上海静安·二模)下表是某品牌净化器的年销售量与年份的统计表.
年份
2021
2022
2023
2024
2025
年份代码x
1
2
3
4
5
年销售量у(万台)
2
3.5
2.5
8
9
(1)用计算器计算净化器的年销售量y关于年份代码x的线性回归方程;(回归系数计算结果保留两位小数)
(2)为了调查A、B两地区人群对该品牌净化器的了解情况,调查机构在A、B两地区的人群中分别进行品牌知晓情况的问卷调查.统计知晓与不知晓的人数,得到如下2×2列联表.
知晓
不知晓
合计
A地区
80
20
100
B地区
40
60
100
合计
120
80
200
试根据表中数据判断A、B两地区的人群对该品牌净化器的知晓情况是否有显著差异.(规定显著水平)
附:关于回归方程,回归系数的计算公式,其中为样本点的中心;的计算公式;
0.05
0.01
0.001
k
3.841
6.635
10.828
【变式2】.(2026·河南开封·模拟预测)某团队为探究大语言模型参数量与模型性能之间的关系,训练了6个不同参数量的模型,并在同一验证集上评估性能得分,得到如下统计数据:
参数量x(亿)
2
4
6
8
10
12
性能得分y(分)
1.8
2.8
3.4
3.6
3.8
4.0
(1)求y关于x的线性回归方程(系数用分数表示),并预测参数量为14亿时,模型的性能得分;
(2)该团队比较了100次实验的实际性能与预测性能,得到“高效”(实际得分≥预测得分)和“低效”(实际得分<预测得分)两种效率组别.同时,他们记录了每次实验所用的训练数据质量等级(优质/普通),得到如下列联表:
训练数据质量等级
训练效率
总计
高效
低效
优质
42
18
60
普通
18
22
40
总计
60
40
100
请依据小概率值的独立性检验,分析训练效率是否与训练数据质量有关.
附:,,,.
.
0.05
0.01
0.001
3.841
6.635
10.828
题型十一:统计概率高考新题型
【典例11】.(2026·河南濮阳·模拟预测)某商场开展购物抽奖活动,消费超过88元的顾客可以参与抽奖,抽奖规则如下:抽奖箱中有大小形状相同的抽奖券张,分别印着1元,2元,…,元字样,顾客从抽奖箱中有放回地任取次,每次取1张抽奖券,记取出的张抽奖券中最小面额为随机变量,则顾客可以获得元的现金奖励.
(1)若,,求;
(2)若,且,求的最小值;
(3)若,证明:对且,.
【变式1】.(2026·江苏南通·三模)某企业生产的芯片独立出厂,每件芯片出现故障的概率为,正常的概率为.现对一批芯片开展批量抽样检测,连续抽取件芯片,记其中故障芯片的件数为随机变量.
(1)连续抽取4件芯片,在至少出现2件故障芯片的条件下,求恰好出现3件故障芯片的概率;
(2)当时,记恰好出现2件故障芯片的概率为.若对任意,恒有,求实数的最小整数值;
(3)若始终满足,求证:对任意正整数,都有.
【变式2】.(25-26高三上·广西·期末)为促进消费,某电商平台和生产商在本周联合推出“有奖闯关”活动.活动规则如下:消费者成功闯过第一关获得基础券(获得元基础券的概率为,获得元基础券的概率为).闯过第一关后,可进行第二关闯关,成功闯过第二关后可获得进阶券元,且这两种优惠券可叠加使用抵扣支付金额.已知消费者闯过第一关的概率为,闯过第二关的概率为.某生产商将商品定价元,成本元;优惠券成本由生产商承担基础券面额的,进阶券面额的.
(1)若,,记消费者购买一件该商品的实际支付金额为(单位:元),求的分布列和数学期望;
(2)设所有消费者均闯过第一关获得了基础券,推出活动后商品购买概率为,记生产商销售一件该商品的期望利润为(单位:元).(期望利润购买概率(支付金额的期望商品成本)优惠券成本的期望)
(i)求关于的函数表达式;
(ii)证明:在内存在唯一极大值点,并求当为何值时,商家期望利润最大?最大期望利润是多少?(结果保留位小数)
【高考达标】
一、单选题
1.(2026·内蒙古赤峰·三模)一袋中装有7个盲盒,已知其中3个是玩具盲盒,4个是文具盲盒,甲、乙两个小孩从中先后任取一个盲盒,则乙取到的是玩具盲盒的概率为( )
A. B. C. D.
2.(2026·四川泸州·模拟预测)某导航机器人团队,调研5组不同避障阈值(单位:灵敏度)与路径规划耗时(单位:)得到的数据如下表:
避障阈值
9
9.5
10
10.5
11
规划耗时
8
6
5
由表中数据可知,规划耗时与避障阈值之间存在较强的线性相关关系,其经验回归方程是,则规划耗时数据5,6,8,,的第百分位数为( )
A.8 B.9 C. D.
3.(2026·山东德州·二模)一组不全相等的数据的平均数为,方差为;设新数据的平均数为,方差为,则( )
A. B.
C. D.
4.(2026·四川达州·二模)“本福特定律”又称“首位数字定律”,是一条关于自然界和人类社会中大量数据的首位数字分布概率的统计规律:一个数的首位数字是的概率为,据此可知,一个数的首位数字是3的概率与首位数字是5的概率之差约为(参考数据:)( )
A.0.046 B.0.023 C.0.262 D.0.131
5.(2026·黑龙江哈尔滨·三模)下列结论正确的是( )
A.数据7,27,24,5,8,30,9,10,20,23的分位数是23
B.随机变量服从二项分布,则
C.一组样本数据的方差,若,则这组样本数据的方差为1
D.将总体划分为2层,通过分层随机抽样,得到两层的样本平均数和样本方差分别为,和,若,则总体方差
6.(2026·安徽·模拟预测)某新能源汽车企业为优化电池续航算法,抽取了10000辆同型号车辆在标准工况下的单次充电实际行驶里程(单位:公里).统计数据经整理得到频率分布直方图(图中部分数据缺失).已知行驶里程在的频率为0.34,在的频率为0.34,且该数据近似服从正态分布.该企业计划对续航表现优异的车辆颁发“超长续航认证”,要求行驶里程不低于m公里,且认证比例控制在2.28%左右.根据正态分布模型(参考数据:,),则m的估计值最接近( )
A.450 B.475 C.500 D.525
7.(2026·广东·模拟预测)在正方体中,E,F,G分别为,,的中点,若从正方体的八个顶点中任取两个不同的顶点,记事件M为“所取两个顶点的连线与平面平行”,则事件M发生的概率为( )
A. B. C. D.
8.(2026·天津南开·二模)下列说法中,正确的是( )
A.将一组数据中的每一个数据加上同一个正数后,方差变大
B.在回归分析中,为0.98的模型比为0.99的模型拟合的效果更好
C.残差图中,残差点所在的水平带状区域越窄,则回归方程的预报精确度越低
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断与有关联,此推断犯错误的概率不超过0.05
二、多选题
9.(2026·陕西西安·模拟预测)下列说法正确的是( )
A.样本相关系数越接近0,则成对样本数据的线性相关性越强
B.1,2,4,5,6,12,18,20的上四分位数是15
C.某班30个男生的数学平均分为90,方差为4,20个女生的数学平均分为85,方差为6,则全班50个学生的数学成绩的方差为10.8
D.随机变量的方差,期望,则
10.(2026·山东聊城·模拟预测)某企业有员工600人,其中男员工400人,女员工200人.该企业按性别用比例分配的分层随机抽样方法抽取60人参加专业技术技能测试,在测试后统计成绩的结果如下:男员工的平均成绩为87分,方差为148,女员工的平均成绩为93分,所有参加专业技术技能测试的60人成绩的方差为196,则下列结论正确的有( )
A.参加专业技术技能测试的60人中有女员工30人
B.所有参加专业技术技能测试的60人成绩的均值为89分
C.400名男员工中能被抽到参加测试的概率为
D.所有参加专业技术技能测试的60人中女员工成绩的标准差为
11.(2026·山东威海·二模)已知随机变量,则( )
A.
B.
C.若,则
D.若,则
12.(2026·江苏南京·模拟预测)有甲、乙两个不透明的盒子,甲盒中装有2个红球和2个白球,乙盒中装有1个红球和3个白球,先随机选择一个盒子(选甲盒的概率,选乙盒的概率为),再从选中的盒子里不放回依次取出2个记事件A为“第一次摸到红球”,事件B为“第二次摸到红球”,其中X表示摸出的2个球中红球的个数.则下列说法正确的是( )
A. B.
C.X的数学期望 D.X的方差
13.(2026·海南省直辖县级单位·模拟预测)在某电商平台上,用户获取商品信息的途径有两种,一种是系统推荐,一种是用户自主搜索.根据大数据,用户在该平台获取的商品信息中有来自系统推荐.若商品由系统推荐,则用户购买的概率为,若商品由用户自主搜索,则用户购买的概率为.从该平台随机抽取一件商品,设事件为“该商品被用户购买”,事件为“该商品由系统推荐”,则( )
A. B. C. D.
14.(2026·重庆沙坪坝·模拟预测)现有四个不透明的袋子,每个袋子中均有标号为的个球,其中袋中全是红球,袋中全是白球,袋中全是黄球,袋中全是黑球.若甲、乙、丙、丁四人随机从四个袋中选取一个(可多人选同一个袋子),并从中随机取出一个球, 则( )
A.取出的四个球颜色互不相同的概率为
B.取出的四个球中红球比白球恰好多2个的概率为
C.当时,取出的四个球既不同色也不同号码的概率为
D.若甲、乙、丙、丁分别取到红、白、黄、黑球,则甲、乙、丙三人取到的号码之和等于丁取到的号码的概率为
三、填空题
15.(2026·云南·模拟预测)盒子中有2个红球,5个黑球,每次随机地从中取出一个球,观察其颜色后放回,并放入3个同色球,则前三次取出球的颜色不完全相同的概率为________.
16.(2026·天津东丽·二模)某AI对话系统的对话轮次分配规则如下:若当前大模型生成的回答符合要求(回答合格),则下一轮继续由该模型生成;若回答不合格,则切换为另一个模型生成.已知模型A每次回答合格的概率为0.6,模型B每次回答合格的概率为0.7,两次回答相互独立.若第1轮生成回答的是模型A,则第1轮A回答不合格且第2轮B回答合格的概率为______;若第1轮生成回答的是模型A、B的概率各为0.5,则第2轮生成回答的是模型A的概率为______.
17(2026·江苏南通·三模)为研究课后整理错题习惯与数学成绩达标之间的关联性,经独立性检验计算得,临界值,.记事件为“学生成绩达标”,事件为“学生坚持整理错题”;已知,,,则有________的把握认为二者存在关联;随机抽取一名学生,其成绩达标的概率为________.
18.(2026·山东临沂·二模)今有一批数量庞大的瓶装饮用水,假设这批水的某项矿物质含量偏差值(单位:毫克/升),,,现从中随机抽取n瓶,这n瓶水中恰有K瓶的矿物质含量偏差值位于区间.当时,试以使得最大的n值作为n的估计值,则n为________.
四、解答题
19.(2026·山东济南·三模)国内某摩托车企2025年3月—9月新车月销售量y(单位:百台)的数据如下表:
月份
3月
4月
5月
6月
7月
8月
9月
月份代号x
1
2
3
4
5
6
7
月销售量y
11
16
18
21
24
28
29
计算得.
(1)求y关于x的线性回归方程;
(2)现从这7个月的月销售量数据中随机抽取3个,记抽取的数据中不低于20(单位:百台)的数据个数为随机变量X,求X的分布列与数学期望.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:
,.
20.(2026·四川绵阳·模拟预测)流行病学调查表明某种疾病是由致病菌和致病菌共同引起的,且至少杀灭其中一种致病菌即可痊愈.
(1)若有某种治疗方案,有的概率能杀灭致病菌.若这种治疗方案能杀灭致病菌,则它有的概率能杀灭致病菌.若这种治疗方案不能杀灭致病菌,则它有的概率能杀灭致病菌.求使用治疗方案痊愈的概率;
(2)若市面上仅有两款药物和药物对疾病有疗效,且这两种药物的疗程各均为天(假定药物使用时,均按疗程服用天),超过天无效时需换药进行治疗.若使用完两种药物仍不见效,依靠自身的免疫能力再经过天也能痊愈已知药物杀灭致病菌和致病菌的概率分别为、,且对于同一种药物,杀灭两种致病菌的事件相互独立,药物杀灭致病菌和致病菌的概率均为.请问应先使用哪种药物可使得痊愈的平均天数更短?
21.(2026·广东江门·二模)某用户只在某外卖平台的甲、乙两家餐厅点餐,根据历史数据,选择甲餐厅的概率为,选择乙餐厅的概率为,甲餐厅的准时送达率为,乙餐厅的准时送达率为.已知该用户每次外卖点餐准时送达与否相互独立.
(1)求该用户每次外卖点餐准时送达的概率.
(2)在该用户的次外卖点餐中,记准时送达的次数为,若的方差大于,求的最小值.
(3)平台推出“准时保”,每单需支付元的服务费,若外卖未准时送达,则平台赔付3元;若外卖准时送达,则平台不赔付.该用户愿意购买“准时保”的条件是亏损期望不超过元,试问他是否愿意购买“准时保”?说明你的理由.
23.(2026·湖南郴州·模拟预测)某兴趣小组设计一种“量子通信模拟”实验:盒中装有大小、形状完全相同的红球4个和白球2个,每次从盒中随机摸出1个球,记录颜色后放回.规定:摸到红球记为发送红球信息,摸到白球记为发送白球信息.发送者甲每次摸球后,随机选择两种编码方式A,B中的一种发送信息;接收者乙收到信息后,也随机选择A,B中的一种方式进行解码,且二者选择A,B的概率均为.已知:若甲、乙采用相同编码方式,则乙正确得到该次球颜色的概率为1;若甲、乙采用不同编码方式,则乙正确得到颜色的概率为.
(1)求乙正确得到该次球颜色的概率p;
(2)独立进行3次通信,记随机变量X为这3次中乙显示为红球的次数,求X的概率分布列及数学期望;
(3)现加入窃听者丙,每次通信时,丙先接收到甲的信息,并随机选择A,B中的一种方式进行“窃听”,再将自己的结果发送给乙;乙仍按原规则随机选择方式解码.设无窃听者时,乙正确得到信息的概率为,有窃听者时为.
(i)求,;
(ii)为判断通信过程中是否存在窃听,独立重复进行n次通信,记乙正确得到信息的次数为Y.规定统计量,当时,判断通信过程中存在窃听;否则暂不判断存在窃听.现进行了64次通信,乙正确得到信息40次,请根据上述标准判断通信过程中是否存在窃听,并说明理由.
24.(2026·河北沧州·三模)2025年11月5日,第八届中国国际进口博览会在国家会展中心(上海)举办,某企业参展的产品有甲、乙两款机器人,为调查消费者喜爱程度与产品的类型是否有关,在展览期间设置投票箱,随机抽取了部分观众进行现场投票,得到如下列联表:
类型
是否喜爱
合计
喜爱
不喜爱
甲
2m
4m
6m
乙
9m
3m
12m
合计
11m
7m
18m
并根据小概率值的独立性检验,得出了“消费者喜爱程度与产品的类型有关”的结论.
附:.
0.01
0.005
0.001
6.635
7.879
10.828
(1)求正整数m的最小值.
(2)为感谢现场参与的观众,主办方设置了一个挑战机器人对抗赛活动.每人挑战局,每局比赛只有胜和负两种情况,无平局,若每局比赛参与者战胜机器人的概率为,胜者记3分,负者记1分.每局胜负不受其他因素的影响.
(ⅰ)若参与者甲与机器人共对抗4局,求其得分不少于10分的概率.
(ⅱ)记参与者的得分恰好比对抗的局数n多4分的概率为,若,求.
(
1
)
学科网(北京)股份有限公司
$
第08讲 统计与概率
【题型归纳】
· 题型一:用样本估计总体
· 题型二:变量间的相关关系
· 题型三:概型
· 题型四:条件概率
· 题型五:全概率公式
· 题型六:事件的独立性
· 题型七:离散型随机分布及其分布列问题
· 题型八:二项分布及其应用
· 题型九:正态分布问题
· 题型十:回归分析与独立性检验
· 题型十一:统计概率高考新题型
【题型统计】
题型一:用样本估计总体
【典例1】.(2026·河南濮阳·模拟预测)下列说法正确的是( )
A.数据5,7,8,8,9,10,13,14,16,16的80%分位数是14
B.若数据的平均数为4,则数据的平均数为16
C.若数据的平均数为6,方差为9,现又加入3个数据5,6,7,则这10个数据的方差为6.5
D.若数据的平均数为,则的方差为
【答案】BCD
【详解】对于A项,因为,所以 80% 分位数为,故 A 错误;
对于B项,因为数据的平均数为4,
则数据的平均数为,故B正确;
对于C项,原7个数据:,方差,
加入数据 5,6,7 后,新平均数为:,
,故C正确,
对于D项,因为,则方差为,故D正确.
【变式1】.(25-26高三下·云南·阶段检测)如图,这是全国2025年下半年商品零售额和餐饮收入同比增长速度图,则全国2025年下半年( )
A.商品零售额同比增长速度的极差为 B.商品零售额同比增长速度逐渐降低
C.餐饮收入同比增长速度的分位数为 D.餐饮收入同比增长速度的平均数小于
【答案】BC
【详解】商品零售额同比增长速度的极差为,A错误.
商品零售额同比增长速度逐渐降低,B正确.
因为,所以由图可知餐饮收入同比增长速度的分位数为,C正确.
因为,所以餐饮收入同比增长速度的平均数大于,D错误.
【变式2】.(2026·辽宁抚顺·二模)是空气中的细小污染物,其浓度(单位:)越高,空气质量越差,浓度越低,空气质量越好.我国现行国家标准规定:若日平均浓度不超过35,则当天空气质量等级为“优”;若日平均浓度超过35但不超过75,则当天空气质量等级为“良”.某城市一周内日平均浓度如下表,则( )
星期
一
二
三
四
五
六
日
日平均浓度
34
27
43
23
45
26
19
A.该城市这周共有5天的空气质量等级为“优”
B.该城市这周日平均浓度数值的40%分位数为27
C.该城市这周日平均浓度数值的极差为28
D.该城市这周日平均浓度数值的平均数为31
【答案】AD
【详解】由题可知,该城市这周共有5天的空气质量等级为“优”,A正确.
该城市这周日平均浓度的数值按从小到大的顺序排列为19,23,26,27,34,43,45,因为,所以该城市这周日平均浓度数值的40%分位数为26,极差为,B不正确,C不正确.
该城市这周日平均浓度数值的平均数为,D正确.
题型二:变量间的相关关系
【典例2】.(2026·江苏南通·三模)某科研团队研发新一代硫化物固态锂电池,测试了5块同批次电池的循环次数x(次)与剩余容量y(单位:),得到如下数据:
x(次)
100
200
300
400
500
y(Ah)
9.8
9.5
9.2
8.9
8.6
(1)求y关于x的线性回归方程,预测当循环次数为1000次时电池的剩余容量;并计算样本相关系数r,据此说明线性回归模型拟合x与y关系的合理性.
(2)该团队另有10块同批次电池,其中改性优化电池6块,普通电池4块;改性优化电池中有4块循环寿命超过1000次,普通电池循环寿命均未超过1000次,规定循环寿命超过1000次为达标.现从这10块电池中随机抽取3块进行破坏性安全测试,记抽取的3块中达标的电池数为,求的分布列和数学期望.
参考公式:回归直线的斜率和截距的最小二乘估计分别为
,,
相关系数
【答案】(1)线性回归方程为:;当循环次数为1000次时电池的剩余容量为;相关系数,用线性回归模型拟合二者关系是完全合理的.
(2)分布列如下:
数学期望为.
【详解】(1)由题意得:
,,
,,所以,
则,所以线性回归方程为:,
将代入得:,即:当循环次数为1000次时电池的剩余容量为.
又因为,所以相关系数,
,表示完全负线性相关,说明循环次数与剩余容量之间存在极强的负线性关系,因此用线性回归模型拟合二者关系是完全合理的。
(2)由题意可知:10块同批次电池中,4块达标,6块未达标,抽取的3块中达标的电池数为,则可能取值为0,1,2,3.
,,,,
所以达标的电池数的分布列为:
数学期望.
【变式1】.(2026·陕西榆林·模拟预测)飞机与高铁是人们远距离出行的两种方式,交通大学某班学生为了调查人们选择的远距离出行方式是否与年龄相关,随机抽取该市1000名市民进行调查,得到如下列联表:
低于40岁
不低于40岁
总计
选择飞机出行
100
选择高铁出行
300
总计
500
1000
(1)补全表中数据,依据小概率值的独立性检验,是否能够认为市民选择的远距离出行方式与年龄有关联?
(2)调查小组统计高铁站某处今天的客流量,从7:00开始,每小时作为一个时间段(为第1个时间段,为第2个时间段,……),得到如下数据:
时间段
1
2
3
4
5
客流量(千人)
1
1.5
2.5
3
3.5
若与线性相关,建立每个时间段客流量与时间段的经验回归方程,并预测的客流量.
附:,其中.
0.010
0.001
6.635
10.828
对于一组数据,,…,,其经验回归方程的斜率,.
【答案】(1)表格见解析,与年龄有关联
(2),客流量约为4.25千人
【分析】(1)根据数据完成表格,求出的值即可判断;
(2)根据数据求出回归方程,再代入,即可得答案.
【详解】(1)列联表如下:
低于40岁
不低于40岁
总计
选择飞机出行
100
200
300
选择高铁出行
400
300
700
总计
500
500
1000
零假设为:市民选择的远距离出行方式与年龄没有关联.
由列联表中的数据,
得.
依据小概率值的独立性检验,我们推断不成立,
所以能够认为市民选择的远距离出行方式与年龄有关联.
(2),,
所以,
,
所以每个时间段客流量与时间段的经验回归方程为.
当时,,
所以预测12:00~13:00的客流量约为4.25千人.
【变式2】.(2026·江苏南京·模拟预测)为推进双碳目标,我国西北某地区自2017年起开展生态修复碳汇造林工程,统计了2017--2021年治理经费投入与新增碳汇造林面积数据如下表,单位:亿元、万亩.
年份
2017
2018
2019
2020
2021
治理经费x
1
2
3
4
5
新增碳汇造林面积y
12
17
21
25
30
(1)根据表中数据,求y关于x的线性回归方程,并预测该地区2026年的新增碳汇造林面积;
(2)统计该地区治理项目相关数据,将治理经费分为低投入、高投入两类,新增碳汇造林面积分为未达标、达标两类,得到如下列联表:
未达标
达标
合计
低投入
420
80
500
高投入
30
470
500
合计
450
550
1000
有无的把握认为新增碳汇造林面积是否达标与治理经费有关?
(3)经统计,前n年该地区造林项目总数量为3n个,其中未达标项目数量为n个,达标项目数量为个.
①由题意判断数列为何种数列,并说明理由;
②现从前n年的所有造林项目中随机抽取3个,记抽取的达标项目个数为随机变量X,求X的数学期望;已知抽取的3个项目中至少有1个达标,求这3个项目全部达标的概率.
附:对于一组数据,,...,,的斜率和截距的最小二乘估计分别为, ,卡方统计量:.
小概率值a
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)回归直线方程为,预测该地区2026年的新增碳汇造林面积为万亩;
(2)有的把握认为新增碳汇造林面积是否达标与治理经费有关;
(3)①是首项为2,公差为2的等差数列;②,.
【分析】(1)根据已知数据计算出系数得回归直线方程,用代入回归方程可得预测值;
(2)计算出后与临界值比较可得;
(3)①求出后,根据等差数列的定义判断;②利用抽取的3项至少有一项达标和三项都达标的个数计算概率可得.
【详解】(1)设回归方程为,
由已知,,
,,
所以回归直线方程为,
2026年,,,
所以预测该地区2026年的新增碳汇造林面积为万亩;
(2)由已知,
所以有的把握认为新增碳汇造林面积是否达标与治理经费有关;
(3)①由题意,,,
所以是首项为2,公差为2的等差数列;
②随机抽取3个项目,达标项目个数X服从超几何分布,期望为,
抽取3个项目,至少有一个达标,3个全部达标的概率为
.
题型三:概型
【典例3】.(2026·安徽淮北·二模)某同学制作了一个质地均匀的正四面体形骰子,在其中三个面分别写上一个数字1、2、3,第四个面写了三个数字1,2,3,随机抛掷一次,事件表示向下的面上有数字1,事件表示向下的面上有数字2,事件表示向下的面上有数字3,则( )
A.事件与事件互斥 B.事件与事件相互独立
C.事件与事件互斥 D.事件与事件相互独立
【答案】B
【详解】由题意可得,,,
对于A,表示向下的面同时有数字1和2,即面4,所以,故A错误;
对于B,的情况只有面4,故,
又,满足,故B正确;
对于C,表示同时有数字1、2和3,即面4,所以,故C错误;
对于D,表示向下的面有数字2或3,包含面2、面3、面4,共3个面,
故,表示向下的面有数字1,且有数字2或3,即面4,
故,所以,
不满足独立事件定义,故D错误.
【变式1】.(2026·山西吕梁·二模)某快递分拣中心待处理的5件包裹中,3件为“普通件”,2件为“优先件”.分拣员按随机顺序不放回逐一扫描分拣,若未分拣的“优先件”数量不少于“普通件”数量,则系统自动暂停当前批次处理.记为暂停时已完成分拣的包裹数,则( )
A. B. C. D.
【答案】A
【详解】当时,只有一种情况,即分拣了1件“普通件”,此时未分拣的“普通件”与“优先件”均为2件,;
当时,第一件分拣的包裹必为“优先件”,第二件无论是“普通件”还是“优先件”,都不可能暂停处理;
当时,只有一种情况,即第一件分拣的包裹为“优先件”,第二件和第三件包裹均为“普通件”, ;
当时,第一件分拣的包裹必为“优先件”,若第二件是“普通件”则第三件为“优先件”第四件为“普通件”,此时分拣不可能暂停处理,若第二件是“优先件”则第三件是“普通件”第四件是“普通件”,此时分拣不可能暂停,故.
所以.
【变式2】.(2026·四川成都·二模)已知5张奖券中只有2张有奖,甲、乙、丙3名同学依次不放回地各随机抽取1张,设甲、乙、丙中奖的概率分别为,则( )
A.最大 B.最大 C.最大 D.
【答案】D
【分析】计算甲中奖的概率,直接利用古典概型,乙中奖的情况,全概率公式,丙中奖的情况用全概率公式分多种情况计算.
【详解】计算甲中奖概率:甲第一个抽取,5张奖券共2张有奖,因此;
计算乙中奖概率,乙中奖分两种情况:
甲中奖后乙中奖:概率为;
甲未中奖后乙中奖:概率为;
;
计算丙中奖概率,分情况计算丙中奖情况:
甲中、乙中、丙中:;
甲中、乙不中、丙中:;
甲不中、乙中、丙中:;
甲不中、乙不中、丙中:;
;
因此.
题型四:条件概率
【典例4】.(2026·福建漳州·三模)甲、乙、丙三人到三个景点旅游,每人只去一个景点,且三人的选择相互独立.设事件“三个人去的景点各不相同”,事件“甲去了第1个景点”,事件“乙去了第1个景点”,则下列说法错误的是( )
A.与互斥 B.与相互独立
C. D.
【答案】A
【详解】对于A:因为甲乙有可能都去第1个景点,即与能同时发生,所以与不互斥,所以A错误;
对于C:由题意得,所以C正确;
对于B:因为,
所以,所以与相互独立,所以B正确;
对于D:因为,所以,所以D正确.
【变式1】.(2026·河北沧州·模拟预测)现有甲、乙、丙三个车间生产某种产品,其中甲车间每日生产400件,乙车间每日生产600件,丙车间每日生产200件,产品的合格率分别为.现随机抽取1件产品送去检验,若抽取的该件产品经检验为不合格品,则该产品来自乙车间的概率为( )
A. B. C. D.
【答案】D
【详解】记事件分别表示产品来自甲、乙、丙车间,
则,,;
记事件为抽到不合格品,
则,,;
.
【变式2】.(2026·山西临汾·二模)将5名实习生分配到A,B,C三个班开展实习工作.要求每个班都要有实习生,当实习生甲不去A班时,B班恰有3名实习生的概率为( )
A. B. C. D.
【答案】D
【详解】不考虑甲是否去班,所有实习生分配方案总数为,
甲去班的概率相等,所以甲去或班的总数为,
甲不去班,B班恰有3名实习生的情形一,甲去班且班有3名实习生共有种;
情形二,甲去班,班有3名实习生共有种,
当实习生甲不去A班时,B班恰有3名实习生的共有种,
设实习生甲不去A班为事件,设B班恰有3名实习生为事件,
当实习生甲不去A班时,B班恰有3名实习生的概率为.
题型五:全概率公式
【典例5】.(2026·河南开封·二模)某同学每周进行两次游泳训练,每次游趟或趟,第一次游趟或趟的概率均为,若第一次游趟,则第二次游趟的概率为,游趟的概率为;若第一次游趟,则第二次游趟的概率为,游趟的概率为.若一周至少游趟为训练量达标,则该同学一周训练量达标的概率为( )
A. B. C. D.
【答案】D
【详解】由题意知:一周训练量达标即为游趟或趟,设第一次游趟为事件,
第一次游趟为事件,第二次游趟为事件,第二次游趟为事件,
可分为以下三种情况:
情况:第一次游趟,第二次游趟,共游趟,训练量达标.
则由条件概率可得;
情况:第一次游趟,第二次游趟,共游趟,训练量达标.
则由条件概率可得;
情况:第一次游趟,第二次游趟,共游趟,训练量达标. 则由条件概率可得,
由三种情况为互斥事件,因此,该同学一周训练量达标的概率.
【变式1】.(2025·四川成都·一模)三个相同的盒子里分别放有两个黑球,一个黑球一个红球,两个红球,现从任意的盒子里随机取出一球,若该球为红色,则该盒剩下的另一球也是红色的概率为( )
A. B. C. D.
【答案】D
【分析】根据全概率公式和条件概率的计算公式,即可得到答案.
【详解】记从 “放有两个黑球盒子”, “放有一个黑球一个红球盒子”,
“放有两个红球盒子”中取出一球分别为事件,,,
则事件,,两两互斥,,
记“取出的球为红色”为事件B,则所求概率即为,
得到
,
则,
故若该球为红色,则该盒剩下的另一球也是红色的概率为.
故选:D.
【变式2】.(2025·广西河池·二模)一家银行有VIP客户和普通客户,VIP客户占客户总数的,普通客户占客户总数的.已知VIP客户的信用卡欺诈概率为,而普通客户的信用卡欺诈概率为.现在随机抽取一个发生信用卡欺诈的客户,请问这个客户是VIP客户的概率是( )
A. B. C. D.
【答案】A
【分析】设事件E为“客户发生信用卡欺诈”,由全概率公式得,再由条件概率公式即可求解.
【详解】记事件A为“客户是VIP客户”,事件B为“客户是普通客户”,事件E为“客户发生信用卡欺诈”,则,,,,
由全概率计算公式得,
由条件概率公式得,
故选:A.
题型六:事件的独立性
【典例6】.(2026·上海·二模)已知和分别表示事件和事件发生的概率,且 ,则在下列各项中,“和独立”的充分条件是( ).
A. B.
C. D.
【答案】B
【分析】事件和独立的定义是,根据每个选项的条件,结合条件概率公式以及概率的基本性质,判断是否能推出.
【详解】选项A,,则,并不能推出,所以事件和不一定独立,A错误.
选项B,,,.
,.
.
,即和独立,B选项正确.
选项C,,又,,和不一定独立,C错误.
选项D,,,.
又,,可得,也不能推出和独立,D错误.
【变式1】.(2026·广东·模拟预测)将4个黑球和6个红球随机排成一列,事件“第k个球是黑球”,则下列正确的是( ).
A. B.
C. D.
【答案】C
【详解】由题意知,事件“第k个球是黑球”,可得,
对于A,事件表示第1和第2个球是黑球,可得,
因为,所以,所以A错误;
对于B,事件表示第1或第2个球是黑球,
可得,
因为,所以,所以B错误;
对于C,由B项知:,所以C正确;
对于D,由条件概率的计算公式,可得,所以D错误.
【变式2】.(2025·河北石家庄·三模)已知随机事件,表示事件的对立事件,,则下面结论正确的是( )
A.事件与一定是对立事件 B.
C. D.若事件A,B互相独立,则
【答案】D
【分析】举例判断A、B,由于不确定事件A、B的关系,故不能求解即可判断C,结合对立事件概率公式和相互独立事件乘法公式求解即可判断D.
【详解】对于A和B,假设从一个装有标号为1,2,3,4,5的5个小球的密封盒子中任取1球,
记事件:从中取出球的标号为1或2,事件:从中取出球的标号为1或2或3,
则,满足,但不是对立事件,故A错误;
由上例可知,故B错误;
对于C,只有事件A、B相互独立时,才有成立,
由题设不知道事件A、B的关系,故不能确定的值,故C错误;
对于D,若事件A、B相互独立,则事件A、也相互独立,
所以,故D正确.
故选:D.
题型七:离散型随机分布及其分布列问题
【典例7】.(2026·山东威海·二模)把4个形状大小相同的球等可能地放入编号为1,2,3,4的四个盒子中,记放入1号,2号,3号,4号盒子中的球的个数分别为.
(1)求的概率;
(2)求且的概率;
(3)设函数,记,求的分布列与数学期望.
【答案】(1) (2)
(3)
X
1
2
3
4
P
【详解】(1)由题意可知每个球放入每个盒子中的概率为,
当时,放入1号盒子中球的个数恰好为2,所以的概率为.
(2)当且时,放入1号盒子中球的个数恰好为1,
放入2号盒子中球的个数恰好为2,所以且的概率为.
(3)由题意可知X所有可能取值为1、2、3、4,
,
,
,
,
因此X的分布列为
X
1
2
3
4
P
则.
【变式1】.(2026·河北保定·二模)某农家乐园为增加客流量,计划在五一期间举行农产品的团购活动,每位参与团购且购买金额不低于100元的顾客均可以参加抽奖活动.抽奖方案如下:开始时箱子中放有除颜色外完全相同的4个红球与12个白球,每位参与抽奖的顾客均可抽取2次,每次从箱子中随机取1个球,第1次顾客从箱子中随机取出1个球,确定颜色后放回箱子,同时往箱子中放入2个与第1次取出的球颜色相同的球,然后进行第2次抽取.已知顾客每次取出白球没有奖励,取出红球奖励20元.
(1)求顾客第2次取出红球的概率.
(2)记每位参与抽奖的顾客获得奖励的总金额为X元,求E(X).
(3)该农家乐园计划增加一种抽奖方案,此方案要求参与抽奖的顾客通过扫描二维码进入小程序回答问题,每位顾客最少回答 2个问题,最多回答 3个问题,若前 2个问题至少回答正确 1个,则不再回答第 3个问题,若前2个问题都回答错误,则需回答第 3个问题,且第 1个问题回答正确奖励 6元,第 2个和第3个问题回答正确均奖励 12元.已知顾客甲正确回答这 3个问题的概率依次为 且这3个问题回答正确与否相互独立.为使顾客甲获得奖励的总金额的数学期望最大,顾客甲应该选择原抽奖方案还是新增抽奖方案?请说明理由.
【答案】(1)
(2)10
(3)顾客甲应该选择新增抽奖方案,理由见解析.
【详解】(1)设"第1次取出红球"为事件 ,则 ,
设"第2次取出红球"为事件 ,
若第1次取出红球,则箱子中有 6 红 12 白,共 18 个球,此时 ,
若第1次取出白球,则箱子中有4红14白,共18个球,此时 ,
由全概率公式得:
答:顾客第2次取出红球的概率为 .
(2)由题意知, 的可能取值为0,20,40;
,
,
所以 的分布列为:
0
20
40
,
(3)设顾客甲获得奖励的总金额为 元。
由题意, 的可能取值为。
,
,
,
,
所以 的分布列为:
0
6
12
18
,
因为 ,
所以顾客甲应该选择新增抽奖方案.
【变式2】.(2026·河南·二模)中国航天“十五五”规划核心是从航天大国迈向航天强国、从大国重器转向万亿级支柱产业、从近地领先走向深空领跑.为实现发动机科研突破,我国某航天研究院对甲、乙、丙三款新型发动机关键部件进行可靠性测试,单次测试中,部件连续稳定工作时长达到1200小时及以上,即可判定为“一级可靠性部件”.为预测本次测试中获评“一级可靠性部件”的数量及最优部件型号,收集了三款部件过往的测试数据(单位:小时),如下所示:
甲部件:
乙部件:
丙部件:
(1)求收集到的甲部件测试数据的第分位数;
(2)假设用频率估计概率,且甲、乙、丙三款部件的测试结果相互独立.设为甲、乙、丙三款部件中获评“一级可靠性部件”的总数量,求的概率分布列和数学期望.
【答案】(1)
(2)
X
0
1
2
3
P
【详解】(1)将甲部件测试数据从小到大排列,得:
又为整数,所以数据的第80%分位数为第8个数据和第9个数据的平均数.
所以收集到的甲部件测试数据的第分位数为.
(2)甲部件:数据共个,大于等于小时的是,共6个,频率为.
乙部件:数据共个,大于等于小时的是,共4个,频率为.
丙部件:数据共个,大于等于小时的是,共2个,频率为.
由频率估计概率得,甲部件获得优秀的概率为,乙部件获得优秀的概率为,丙部件获得优秀的概率为.
设甲部件获得优秀为事件,乙部件获得优秀为事件,丙部件获得优秀为事件,甲、乙、丙三款部件的测试结果相互独立.
,
,
,
.
所以X的分布列为
X
0
1
2
3
P
所以X的数学期望.
题型八:二项分布及其应用
【典例8】.(2026·重庆·三模)某工厂生产一种零件,其标准尺寸参数,计划生产每种尺寸零件的概率相等,实际生产过程中有10%的概率发生工艺缺陷,无缺陷时,生产出来的零件为标准尺寸,若发生工艺缺陷,则生产出来的零件尺寸会缩减为标准尺寸的一半,且每次生产过程独立进行.
(1)连续生产10个该种零件,记有X个零件有工艺缺陷,求X最有可能的取值;
(2)求实际生产一个零件的尺寸的分布列和期望.
【答案】(1)最有可能为1.
(2)
Y
0.5
1
1.5
2
2.5
3
4
5
P
.
【详解】(1)由题意,,
故,
令其大于1,得,解得,
所以最有可能为1.
(2)设生产一个零件的尺寸为,则的可能取值有
其分布列为:
Y
0.5
1
1.5
2
2.5
3
4
5
P
所以期望.
【变式1】.(2026·河南新乡·三模)2026年的春晚舞台上,机器人的出色表现,展示了中国智造的魅力.某公司在对某型号机器人研发测试的过程中,工程师发现该型号机器人成功完成动作指令的概率为,但工程师对机器人下达的动作指令分为两类,一类表述清晰,另一类表述模糊.若对机器人下达的动作指令表述清晰,则机器人成功完成动作指令的概率为;若对机器人下达的动作指令表述模糊,则机器人成功完成动作指令的概率为.每次测试该型号机器人能否成功完成动作指令相互独立.
(1)求工程师下达的动作指令表述模糊的概率;
(2)现对一台该型号机器人完成动作指令的情况进行次测试,记这次测试中恰有2次未成功完成动作指令的概率为,求取得最大值时的值.
【答案】(1)
(2)或
【详解】(1)设事件“工程师下达的动作指令表述模糊”,
事件“工程师下达的动作指令表述清晰”,事件“机器人成功完成动作指令”,
根据题意得.
设,则.
由全概率公式,得,
所以,解得.
即工程师下达的动作指令表述模糊的概率为.
(2)由题意知,
则.
所以当时,,当时,,当时,.
所以当或时,取得最大值.
【变式2】.(2026·福建宁德·二模)把学生考试中解答题结果正确、无明显逻辑错误,但书写步骤不规范、缺少必要文字说明、卷面潦草、得分要点缺失的解答定义为“拙解”.为优化考试阅卷效率,某市教育学院引入AI智能阅卷系统,对数学试卷采用两台初评+人工仲裁的方式阅卷.按扣分评分:“拙解”扣1分、2分、3分.初评与人工仲裁扣分概率均相同,且相互独立,各扣分概率如下表:
扣分
1
2
3
概率
记系统的扣分分别为,仲裁扣分为,扣分规则如下:
①若,取的平均数为最终扣分;
②若,启动人工仲裁,取中与更接近者,与计算平均数为最终扣分,若,则取中较小者与计算平均数为最终扣分.
根据以上材料,解决如下问题:
(1)设某同学一道“拙解”的最终扣分为随机变量,求;
(2)该同学本次考试5道解答题全部为“拙解”,各题扣分相互独立.
(i)记单题扣2分的题目数为,求;
(ii)记单题扣分不高于2分的题目数为,若该同学通过规范书写,可将单题扣分不高于2分的概率提升至,为使,求的最小值(结果保留两位小数).
(参考数据:)
【答案】(1) (2)(i);(ii)
【详解】(1)某同学一道 “拙解”的最终扣分为分,包括以下四种可能:
扣1分,扣2分;
扣2分,扣1分;
扣1分,扣3分,仲裁扣2分;
扣3分,扣1分,仲裁扣2分,
故
;
(2)因为
,
,,
单题扣分的概率为,,,,
,故,;
(ii)原本单题扣分不高于分的概率为,则,
由,有,得,
令,,
故在单调递增,
又,
,
所以的最小值为.
题型九:正态分布问题
【典例9】.(2026·辽宁锦州·二模)高尔顿钉板是英国统计学家高尔顿设计的一种概率模型,其结构如下,在一块竖直木板上钉有若干排等间距的钉子,每排钉子的数量比上一排多一枚,且相邻的两排钉子的位置相互错开,木板底部有若干个等宽的凹槽,用于收集下落的小球,小球从木板顶端的入口处自由下落,在下落过程中,小球每次遇到钉子时,向左或向右下落的概率均为0.5,且每次下落是相互独立的.现有一个高尔顿钉板,其设置排钉子,第排钉子下方有个凹槽.从左至右依次记为凹槽0,凹槽1,…,凹槽,当时,钉板如图所示.进行次独立重复试验,每次试验投放一个小球.设小球从入口下落最终落入凹槽的个数为.
(1)若,
(ⅰ)当时,求;
(ⅱ)当时,求的数学期望与方差;
(2)当足够大时,可以认为小球最终落入的凹槽标号服从正态分布,其中为的数学期望,为的方差.若,,试估计落在凹槽15到凹槽21(含15和21)内的小球总数.
参考数据:若随机变量,,,.
【答案】(1)(ⅰ);(ⅱ); (2)6827
【详解】(1)(ⅰ).
(ⅱ)由(ⅰ)知小球落入3号槽的概率为,由题意知,
所以,
.
(2)一个小球最终落入的凹槽标号满足,
,,
由题可知小球最终落入的凹槽标号服从正态分布,
所以估计落在凹槽15到凹槽21(含15和21)内的小球总数为6827.
【变式1】.(2026·上海·二模)班主任小明查阅了某大学发表的一项本市高三学生手机使用情况的研究报告.报告指出,高三学生每周手机使用时长(单位:小时)总体上服从正态分布.
(1)小明老师将自己所带班级(共50名学生)视为从本市高三学生总体中随机抽取的一个样本,能以此正态分布模型估算出全班每周平均手机使用时长超过16小时的人数,在此估算基础上若在全班任选3位同学,则至少有2位同学的每周手机使用时长超过16小时的概率是多少?(结果用最简分数表示)
参考数据:若,则.
(2)小明老师发现小虹同学每周手机使用时长超过16小时,对其进行疏导劝解,并跟进统计出之后5周小虹每周手机使用时长与该周数学练习得分(每周练习的难度相同且满分均为150分),制成表1.以这5组数据建立回归方程.请求出实数的值
表1
第1周
第2周
第3周
第4周
第5周
手机使用时长
20
18
22
16
14
练习得分
80
88
73
92
m
(3)受到鼓励的小虹制定了寒假复习计划表递交给小明老师,严格控制手机使用时长.小明老师统计发现该计划表中若第n天能复习时长超过5小时(记为“高效复习”),则第天也能“高效复习”的概率为;若第天不能“高效复习”,则第天还能“高效复习”的概率为.设(,为正整数)表示第天能“高效复习”的概率,,若表示复习计划表第天有效.求证:数列是等比数列,并说明小虹的该复习计划表是否在寒假每一天均有效.
【详解】(1)由题意知,因为.
所以任取1人使用手机超过16小时的概率为,
50名同学中有位超过16小时,
那么至少2位同学使用手机超过16小时的概率为.
(2)由题意得,.
代入回归方程有,解得.
(3)证明:由题意知,
所以
所以是以为公比的等比数列.
所以.
因为时,恒成立,所以.
所以小虹的该复习计划表在寒假每一天均有效.
【变式2】.(2026·浙江·三模)信息安全是互联网时代最重要的安全之一,我国自主研发的量子通信保密传输系统,依靠量子密钥分发实现信息安全传输,该系统采用量子信道和经典信道协同工作,某量子通信保密传输系统在单次密钥分发过程中,量子信道成功密钥生成的概率为,经典信道完成信息匹配的概率为,且两个信道工作相互独立.只有当量子信道密钥生成成功,且经典信道信息匹配成功,则本次有效密钥分发成功,否则本次有效密钥分发失败.
(1)求该系统单次有效密钥分发成功的概率;
(2)若该系统独立进行次密钥分发,记为有效分发成功的次数,求的数学期望;
(3)科研人员对该系统连续传输的密钥准确率进行检测,发现密钥准确率(单位:)服从正态分布.若准确率不低于为“最优传输”,估算次密钥分发中,可用于“最优传输”的次数.
附:若,则,,.
【详解】(1)设 “量子信道成功密钥生成”为事件,“经典信道完成信息匹配” 为事件,
由题意得,,且与相互独立,
所以该系统单次有效密钥分发成功的概率;
(2)由题意得,,所以;
(3)由题意得,,则,,
因为“最优传输”要求,即,
所以,
,
所以次密钥分发中,“最优传输”的次数约为.
题型十:回归分析与独立性检验
【典例10】.(2026·四川泸州·模拟预测)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数与天数的情况,对统计得到的样本数据作了初步处理,得到下面的散点图及一些统计量的值.
5.5
8.7
1.9
301
385
79.75
表中,.
(1)依据散点图推断,与哪一个更适合作为未佩戴头盔人数与天数的回归方程类型?(给出判断即可,不必说明理由),并求出所选类型的回归方程.
(2)为了解佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车市民进行调查,得到如下列联表:
性别
佩戴头盔
合计
不佩戴
佩戴
女性
8
12
20
男性
14
6
20
合计
22
18
40
依据的独立性检验,能否认为市民骑电动摩托车佩戴头盔与性别有关联?
参考公式:,,,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)更适合, (2)不能
【详解】(1)由图可以判断,更适合作为未佩戴头盔人数与天数的回归方程类型,
由,得到,因为,则,
则,所以,则.
(2)零假设:市民佩戴头盔与性别无关联.
根据列联表中的数据,经计算得到:
,
根据小概率值的独立性检验,我们没有理由认为不成立,即认为市民佩戴头盔与性别没有关联.
【变式1】.(2026·上海静安·二模)下表是某品牌净化器的年销售量与年份的统计表.
年份
2021
2022
2023
2024
2025
年份代码x
1
2
3
4
5
年销售量у(万台)
2
3.5
2.5
8
9
(1)用计算器计算净化器的年销售量y关于年份代码x的线性回归方程;(回归系数计算结果保留两位小数)
(2)为了调查A、B两地区人群对该品牌净化器的了解情况,调查机构在A、B两地区的人群中分别进行品牌知晓情况的问卷调查.统计知晓与不知晓的人数,得到如下2×2列联表.
知晓
不知晓
合计
A地区
80
20
100
B地区
40
60
100
合计
120
80
200
试根据表中数据判断A、B两地区的人群对该品牌净化器的知晓情况是否有显著差异.(规定显著水平)
附:关于回归方程,回归系数的计算公式,其中为样本点的中心;的计算公式;
0.05
0.01
0.001
k
3.841
6.635
10.828
【答案】(1)
【详解】(1)由表可知,样本中心 为:
.
.则 .
所以,净化器的年销售量 关于年份代码 的线性回归方程为:.
(2)根据 列联表中的数据,计算 的观测值:
.
因为 ,
所以,在犯错误的概率不超过 0.05 的前提下,认为 A、B 两地区的人群对该品牌净化器的知晓情况有显著差异.
【变式2】.(2026·河南开封·模拟预测)某团队为探究大语言模型参数量与模型性能之间的关系,训练了6个不同参数量的模型,并在同一验证集上评估性能得分,得到如下统计数据:
参数量x(亿)
2
4
6
8
10
12
性能得分y(分)
1.8
2.8
3.4
3.6
3.8
4.0
(1)求y关于x的线性回归方程(系数用分数表示),并预测参数量为14亿时,模型的性能得分;
(2)该团队比较了100次实验的实际性能与预测性能,得到“高效”(实际得分≥预测得分)和“低效”(实际得分<预测得分)两种效率组别.同时,他们记录了每次实验所用的训练数据质量等级(优质/普通),得到如下列联表:
训练数据质量等级
训练效率
总计
高效
低效
优质
42
18
60
普通
18
22
40
总计
60
40
100
请依据小概率值的独立性检验,分析训练效率是否与训练数据质量有关.
附:,,,.
.
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)线性回归方程为,预测性能得分约为分
(2)依据的独立性检验,训练效率与训练数据质量有关
【详解】(1)由题意可得,n=6,,,
又因为,,所以根据公式计算回归系数可得:
,
,
所以,关于的线性回归方程为: ,
当参数量亿时,代入可得: ,
即预测参数量为14亿时,模型性能得分约为分(或分).
(2)零假设:训练效率与训练数据质量无关,根据列联表可得:
,,,,,
所以卡方统计量为,
因为对应的临界值为,,所以拒绝,
依据的独立性检验,认为训练效率与训练数据质量有关.
题型十一:统计概率高考新题型
【典例11】.(2026·河南濮阳·模拟预测)某商场开展购物抽奖活动,消费超过88元的顾客可以参与抽奖,抽奖规则如下:抽奖箱中有大小形状相同的抽奖券张,分别印着1元,2元,…,元字样,顾客从抽奖箱中有放回地任取次,每次取1张抽奖券,记取出的张抽奖券中最小面额为随机变量,则顾客可以获得元的现金奖励.
(1)若,,求;
(2)若,且,求的最小值;
(3)若,证明:对且,.
【答案】(1); (2)2; (3)见解析.
【详解】(1),,即为从3张抽奖券,有放回地任取2次,共有种取法;即
最小面额为2元,则两次取的抽奖券可能都是2元,或第一次取到2元、第二次取到3元,
或第一次取到3元、第二次取到2元,共有种取法,所以.
(2)当,则的可能取值是1,2,3,4,
当时,,
,不满足;
当时,, ,,
,满足,
所以的最小值是2.
(3)当,则的可能取值是1,2,…,,
当抽到的抽奖券是1元,2元,3元,…,或元时,共有种;
当抽到的抽奖券是2元,3元,…,或元时,共有种,所以;
当抽到的抽奖券是3元,4元,…,或元时,共有种,所以;
递推可得,1,2,…,.
所以
设函数,,则,所以在上单调递减,
所以,所以,即
令,1,2,…,,则,所以,
即,从而,所以
.
.
所以对且,.
【变式1】.(2026·江苏南通·三模)某企业生产的芯片独立出厂,每件芯片出现故障的概率为,正常的概率为.现对一批芯片开展批量抽样检测,连续抽取件芯片,记其中故障芯片的件数为随机变量.
(1)连续抽取4件芯片,在至少出现2件故障芯片的条件下,求恰好出现3件故障芯片的概率;
(2)当时,记恰好出现2件故障芯片的概率为.若对任意,恒有,求实数的最小整数值;
(3)若始终满足,求证:对任意正整数,都有.
【详解】(1)解:因为连续取件芯片,故障芯片的件数为随机变量,芯片独立出厂,
所以服从二项分布,即,故当连续抽取4件芯片时,
所以
且,
所以
.
(2)解:当时,
故恰好出现2件故障芯片的概率为,,
所以,
故当时,,单调递增;当时,,单调递减;
所以,
若对任意,恒有,则实数的最小整数值为1.
(3)证明:因为,,所以,,
所以
令,则,,
故要证,只需证,
只需证,只需证
只需证,
令,,
则在上恒成立,
所以在上单调递增,
所以,即,
又,
所以,,
因为,,
所以,
所以
,
因为,所以,
所以,即,
所以成立,证毕.
【变式2】.(25-26高三上·广西·期末)为促进消费,某电商平台和生产商在本周联合推出“有奖闯关”活动.活动规则如下:消费者成功闯过第一关获得基础券(获得元基础券的概率为,获得元基础券的概率为).闯过第一关后,可进行第二关闯关,成功闯过第二关后可获得进阶券元,且这两种优惠券可叠加使用抵扣支付金额.已知消费者闯过第一关的概率为,闯过第二关的概率为.某生产商将商品定价元,成本元;优惠券成本由生产商承担基础券面额的,进阶券面额的.
(1)若,,记消费者购买一件该商品的实际支付金额为(单位:元),求的分布列和数学期望;
(2)设所有消费者均闯过第一关获得了基础券,推出活动后商品购买概率为,记生产商销售一件该商品的期望利润为(单位:元).(期望利润购买概率(支付金额的期望商品成本)优惠券成本的期望)
(i)求关于的函数表达式;
(ii)证明:在内存在唯一极大值点,并求当为何值时,商家期望利润最大?最大期望利润是多少?(结果保留位小数)
【详解】(1)实际支付金额的所有可能取值为,
,
,
,
,
,
的分布列为:
.
(2)(i)求的函数表达式已知所有消费者都闯过第一关,按题目期望利润公式分步计算:
支付金额期望:,商品成本,
优惠券成本期望:基础券成本,
进阶券成本,
总成本期望,
购买概率,
代入公式:.
(ii)对求导得:
令,整理得,解得根为,(舍去,不在内),
当时,,单调递增;
当时,,单调递减;
因此在内存在唯一极大值点,且该点为最大值点,
计算最大期望利润:.
【高考达标】
一、单选题
1.(2026·内蒙古赤峰·三模)一袋中装有7个盲盒,已知其中3个是玩具盲盒,4个是文具盲盒,甲、乙两个小孩从中先后任取一个盲盒,则乙取到的是玩具盲盒的概率为( )
A. B. C. D.
【答案】A
【详解】①当甲取到玩具盲盒且乙也取到玩具盲盒时,;
②当甲取到文具盲盒且乙取到玩具盲盒时,.
所以乙取到玩具盲盒的概率为.
2.(2026·四川泸州·模拟预测)某导航机器人团队,调研5组不同避障阈值(单位:灵敏度)与路径规划耗时(单位:)得到的数据如下表:
避障阈值
9
9.5
10
10.5
11
规划耗时
8
6
5
由表中数据可知,规划耗时与避障阈值之间存在较强的线性相关关系,其经验回归方程是,则规划耗时数据5,6,8,,的第百分位数为( )
A.8 B.9 C. D.
【答案】C
【详解】,代入回归方程得,
,解得,
规划耗时数据升序排列为:5,6,8,,,
第百分位数位置为:,
当不是整数时,向上取整,为第4个数据,即为.
3.(2026·山东德州·二模)一组不全相等的数据的平均数为,方差为;设新数据的平均数为,方差为,则( )
A. B.
C. D.
【答案】C
【详解】由题意得的平均数为,故,故AB错误;
又
,而不全相等,故,
所以,故C正确,D错误.
4.(2026·四川达州·二模)“本福特定律”又称“首位数字定律”,是一条关于自然界和人类社会中大量数据的首位数字分布概率的统计规律:一个数的首位数字是的概率为,据此可知,一个数的首位数字是3的概率与首位数字是5的概率之差约为(参考数据:)( )
A.0.046 B.0.023 C.0.262 D.0.131
【答案】A
【详解】一个数的首位数字是的概率为,
一个数的首位数字是3的概率为,
首位数字是5的概率为
,
一个数的首位数字是3的概率与首位数字是5的概率之差约为
,
故选项A正确.
5.(2026·黑龙江哈尔滨·三模)下列结论正确的是( )
A.数据7,27,24,5,8,30,9,10,20,23的分位数是23
B.随机变量服从二项分布,则
C.一组样本数据的方差,若,则这组样本数据的方差为1
D.将总体划分为2层,通过分层随机抽样,得到两层的样本平均数和样本方差分别为,和,若,则总体方差
【答案】C
【详解】对于选项A,数据由小到大排序为5,7,8,9,10,20,23,24,27,30,共10个数,
第分位数是第7个数和8个数的平均数,即23.5,所以A错误;
对于选项B,二项分布,可知,
则,所以B错误;
对于选项C,由,化简得
易知,则,所以C正确;
对于选项D,设第一层有样本,第二层有样本,总体共有个样本,
当时,总体均值,
可知2层分层随机抽样,总体方差,
当且仅当时,有,所以D错误;
6.(2026·安徽·模拟预测)某新能源汽车企业为优化电池续航算法,抽取了10000辆同型号车辆在标准工况下的单次充电实际行驶里程(单位:公里).统计数据经整理得到频率分布直方图(图中部分数据缺失).已知行驶里程在的频率为0.34,在的频率为0.34,且该数据近似服从正态分布.该企业计划对续航表现优异的车辆颁发“超长续航认证”,要求行驶里程不低于m公里,且认证比例控制在2.28%左右.根据正态分布模型(参考数据:,),则m的估计值最接近( )
A.450 B.475 C.500 D.525
【答案】C
【分析】先解出的估计值,再求解即可
【详解】行驶里程在的频率为0.34,在的频率为0.34,说明数据在这两个区间的分布对称,得.
区间的频率为,而,故近似有,解得.
认证比例,所以,因此最接近的选项是C.
7.(2026·广东·模拟预测)在正方体中,E,F,G分别为,,的中点,若从正方体的八个顶点中任取两个不同的顶点,记事件M为“所取两个顶点的连线与平面平行”,则事件M发生的概率为( )
A. B. C. D.
【答案】C
【详解】
如图所示,作的中点,连接,
可知,可知,
所以点在同一平面上,
可知面平行的对角线有共6条,
所有从正方体的八个顶点中任取两个不同的顶点的连线有条,
则.
8.(2026·天津南开·二模)下列说法中,正确的是( )
A.将一组数据中的每一个数据加上同一个正数后,方差变大
B.在回归分析中,为0.98的模型比为0.99的模型拟合的效果更好
C.残差图中,残差点所在的水平带状区域越窄,则回归方程的预报精确度越低
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断与有关联,此推断犯错误的概率不超过0.05
【答案】D
【详解】将一组数据中的每一个数据加上同一个正数后,数据相对平均值的波动情况无变化,方差不变,故A错误;
由越接近1,模型拟合效果越好,知B错误;
若残差点所在的水平带状区域越窄,说明残差的波动越小,回归方程对数据的拟合精度越高,进而回归方程的预报精确度也越高(而非越低),故C错误;
因为,所以判断与有关联,此推断犯错误的概率不超过0.05,故D正确.
二、多选题
9.(2026·陕西西安·模拟预测)下列说法正确的是( )
A.样本相关系数越接近0,则成对样本数据的线性相关性越强
B.1,2,4,5,6,12,18,20的上四分位数是15
C.某班30个男生的数学平均分为90,方差为4,20个女生的数学平均分为85,方差为6,则全班50个学生的数学成绩的方差为10.8
D.随机变量的方差,期望,则
【答案】BC
【详解】A:两个相关变量的线性相关系数越接近0,这两个变量的相关性越弱,则A错误;
B:该组数据共8个数据,又,
因此上四分位数为第6个数和第7个数的平均数,即,因此B正确;
C:易知全班50个学生的数学成绩的平均值为,
因此方差为,即C正确.
D:因为,由方差,期望,
可得,即D错误.
10.(2026·山东聊城·模拟预测)某企业有员工600人,其中男员工400人,女员工200人.该企业按性别用比例分配的分层随机抽样方法抽取60人参加专业技术技能测试,在测试后统计成绩的结果如下:男员工的平均成绩为87分,方差为148,女员工的平均成绩为93分,所有参加专业技术技能测试的60人成绩的方差为196,则下列结论正确的有( )
A.参加专业技术技能测试的60人中有女员工30人
B.所有参加专业技术技能测试的60人成绩的均值为89分
C.400名男员工中能被抽到参加测试的概率为
D.所有参加专业技术技能测试的60人中女员工成绩的标准差为
【答案】BD
【分析】由分层抽样可判断A;利用抽样比可求得抽取的男、女员工人数,进而可得到男员工被抽到的概率,判断C,再结合分层抽样的均值、方差公式可判断B、D.
【详解】设参加专业技术技能测试的60人中,女员工有人,则,解得,故A错误.
设60人中男员工的平均成绩为,方差为,女员工的平均成绩为,方差为,所有参加测试的60人的平均成绩为,方差为,则
所有参加专业技术技能测试的60人成绩的均值,故B正确.
名男员工中被抽到参加测试的人数为,则名男员工中能被抽到参加测试的概率为,故C错误.
,解得
所有参加专业技术技能测试的60人中女员工成绩的标准差为,故D正确.
11.(2026·山东威海·二模)已知随机变量,则( )
A.
B.
C.若,则
D.若,则
【答案】ABC
【分析】根据正态分布的标准化公式,对称性以及概率计算规则求解即可.
【详解】对于A:对于任意正态分布,将其进行标准化处理,即令,
则服从标准正态分布,故A正确;
对于B:对于正态分布,其概率密度曲线关于对称,,,故B正确;
对于C:若,则,,
定义标准正态分布的累积分布函数为,
,
由于和均服从标准正态分布,根据标准正态分布的对称性,,
所以
所以成立,故C正确;
对于D:定义标准正态分布的累积分布函数为
因,故,
,已知,所以,
因为标准正态分布的累积分布函数是单调递增的,所以,故D错误.
12.(2026·江苏南京·模拟预测)有甲、乙两个不透明的盒子,甲盒中装有2个红球和2个白球,乙盒中装有1个红球和3个白球,先随机选择一个盒子(选甲盒的概率,选乙盒的概率为),再从选中的盒子里不放回依次取出2个记事件A为“第一次摸到红球”,事件B为“第二次摸到红球”,其中X表示摸出的2个球中红球的个数.则下列说法正确的是( )
A. B.
C.X的数学期望 D.X的方差
【答案】ABCD
【详解】选项A,设事件为“选甲盒”,事件为“选乙盒”,则,
由题意选甲盒时,第一次摸到红球的概率为,即,选乙盒时,第一次摸到红球的概率为,即,
由全概率公式得,A正确;
选项B,为两次摸到红球的概率,
选甲盒时,不放回摸两次红球的概率为,选乙盒时,由于乙盒中只有一个红球,因此,
所以,
,B正确;
选项C,的可能值为,
由选项B知,
选甲盒时,两次摸到白球的概率是,选乙盒时,两次摸到白球的概率是,
所以,
,
所以,C正确;
选项D,,
,D正确.
13.(2026·海南省直辖县级单位·模拟预测)在某电商平台上,用户获取商品信息的途径有两种,一种是系统推荐,一种是用户自主搜索.根据大数据,用户在该平台获取的商品信息中有来自系统推荐.若商品由系统推荐,则用户购买的概率为,若商品由用户自主搜索,则用户购买的概率为.从该平台随机抽取一件商品,设事件为“该商品被用户购买”,事件为“该商品由系统推荐”,则( )
A. B. C. D.
【答案】AD
【详解】由已知得,,.
对于A,因为,所以,故A正确;
对于B,由全概率公式可得,故B错误;
对于C,,所以,故C错误;
对于D,,故D正确.
14.(2026·重庆沙坪坝·模拟预测)现有四个不透明的袋子,每个袋子中均有标号为的个球,其中袋中全是红球,袋中全是白球,袋中全是黄球,袋中全是黑球.若甲、乙、丙、丁四人随机从四个袋中选取一个(可多人选同一个袋子),并从中随机取出一个球, 则( )
A.取出的四个球颜色互不相同的概率为
B.取出的四个球中红球比白球恰好多2个的概率为
C.当时,取出的四个球既不同色也不同号码的概率为
D.若甲、乙、丙、丁分别取到红、白、黄、黑球,则甲、乙、丙三人取到的号码之和等于丁取到的号码的概率为
【答案】ABD
【详解】对于A,四个人选出球颜色互不相同的概率为,A正确;
对于B,取出的四个球中红球比白球恰好多2个,有两种情况,
即红球2个,白球0个,概率为,
或者红球3个,白球1个,概率为,
所以取出的四个球中红球比白球恰好多2个的概率为,B正确;
对于C,四个球既不同色也不同号码的概率为,C错误;
对于D,设甲、乙、丙、丁取到球的号码分别为,
则所求概率转化为求的整数解的个数,
当时,由隔板法可得方程的解的组数为,
当时,方程的解的组数为,,
当时,方程的解的组数为,
故满足条件的取法有
,
故所求概率为,D正确.
三、填空题
15.(2026·云南·模拟预测)盒子中有2个红球,5个黑球,每次随机地从中取出一个球,观察其颜色后放回,并放入3个同色球,则前三次取出球的颜色不完全相同的概率为________.
【答案】
【详解】由"前三次取出球的颜色不完全相同"的对立事件是"三次取出的球全为红球或全为黑球",因此(不完全相同)(三次全红)(三次全黑);
每次取球后增加3个同色球,总球数逐次加3个,
所以(三次全红) ,
(三次全黑),
则所求概率为:.
16.(2026·天津东丽·二模)某AI对话系统的对话轮次分配规则如下:若当前大模型生成的回答符合要求(回答合格),则下一轮继续由该模型生成;若回答不合格,则切换为另一个模型生成.已知模型A每次回答合格的概率为0.6,模型B每次回答合格的概率为0.7,两次回答相互独立.若第1轮生成回答的是模型A,则第1轮A回答不合格且第2轮B回答合格的概率为______;若第1轮生成回答的是模型A、B的概率各为0.5,则第2轮生成回答的是模型A的概率为______.
【答案】 / /
【分析】借助相互独立事件的概率公式以及全概率公式计算即可得.
【详解】;.
17(2026·江苏南通·三模)为研究课后整理错题习惯与数学成绩达标之间的关联性,经独立性检验计算得,临界值,.记事件为“学生成绩达标”,事件为“学生坚持整理错题”;已知,,,则有________的把握认为二者存在关联;随机抽取一名学生,其成绩达标的概率为________.
【答案】 /
【详解】由,且,即有的把握认为二者存在关联,
由题设,则,
所以随机抽取一名学生,其成绩达标的概率为.
18.(2026·山东临沂·二模)今有一批数量庞大的瓶装饮用水,假设这批水的某项矿物质含量偏差值(单位:毫克/升),,,现从中随机抽取n瓶,这n瓶水中恰有K瓶的矿物质含量偏差值位于区间.当时,试以使得最大的n值作为n的估计值,则n为________.
【答案】35
【详解】计算矿物质含量偏差值位于区间的概率:
已知,则,,
因为,,
所以.
根据正态分布的性质,
,可得:
.
计算:从瓶水中随机抽取,每瓶水的矿物质含量偏差值位于区间的概率为0.84,
不位于该区间的概率为,
这是一个二项分布问题,,根据二项分布的概率公式,
可得,
要使最大,则需满足,
由可得:,
即,
化简可得:,即,
,,解得.
由可得:,
即,化简可得:,
即,,,解得.
因为为正整数,所以.
四、解答题
19.(2026·山东济南·三模)国内某摩托车企2025年3月—9月新车月销售量y(单位:百台)的数据如下表:
月份
3月
4月
5月
6月
7月
8月
9月
月份代号x
1
2
3
4
5
6
7
月销售量y
11
16
18
21
24
28
29
计算得.
(1)求y关于x的线性回归方程;
(2)现从这7个月的月销售量数据中随机抽取3个,记抽取的数据中不低于20(单位:百台)的数据个数为随机变量X,求X的分布列与数学期望.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:
,.
【详解】(1),,,根据参考数据可得,
,
所以,故y关于x的线性回归方程为;
(2)数据中不低于20(百台)的月份:6月、7月、8月、9月,共4个;
低于20(百台)的有3个,随机变量X的可能取值为0,1,2,3,
;;
;;
故X的分布列为:
X
0
1
2
3
P
数学期望为.
20.(2026·四川绵阳·模拟预测)流行病学调查表明某种疾病是由致病菌和致病菌共同引起的,且至少杀灭其中一种致病菌即可痊愈.
(1)若有某种治疗方案,有的概率能杀灭致病菌.若这种治疗方案能杀灭致病菌,则它有的概率能杀灭致病菌.若这种治疗方案不能杀灭致病菌,则它有的概率能杀灭致病菌.求使用治疗方案痊愈的概率;
(2)若市面上仅有两款药物和药物对疾病有疗效,且这两种药物的疗程各均为天(假定药物使用时,均按疗程服用天),超过天无效时需换药进行治疗.若使用完两种药物仍不见效,依靠自身的免疫能力再经过天也能痊愈已知药物杀灭致病菌和致病菌的概率分别为、,且对于同一种药物,杀灭两种致病菌的事件相互独立,药物杀灭致病菌和致病菌的概率均为.请问应先使用哪种药物可使得痊愈的平均天数更短?
【详解】(1)设使用治疗方案能杀灭致病菌为事件,使用治疗方案能杀灭致病菌为事件,使用治疗方案痊愈为事件
则,,
不能杀灭致病菌的概率为,
不能杀灭致病菌的条件下,不能杀灭致病菌的概率为,
因此,既不能杀灭致病菌也不能杀灭致病菌的概率为,
所以,
即使用治疗方案痊愈的概率为.
(2)设表示药物能治愈疾病的概率,表示药物能治愈疾病的概率,
则有,,
设先用药物再用药物来治愈疾病所需的天数为,先用药物再用药物来治愈疾病所需的天数为,
则,,,
所以,
同理得,,,
则有,
从而有,因此需先使用药物可使得痊愈的平均天数更短.
21.(2026·广东江门·二模)某用户只在某外卖平台的甲、乙两家餐厅点餐,根据历史数据,选择甲餐厅的概率为,选择乙餐厅的概率为,甲餐厅的准时送达率为,乙餐厅的准时送达率为.已知该用户每次外卖点餐准时送达与否相互独立.
(1)求该用户每次外卖点餐准时送达的概率.
(2)在该用户的次外卖点餐中,记准时送达的次数为,若的方差大于,求的最小值.
(3)平台推出“准时保”,每单需支付元的服务费,若外卖未准时送达,则平台赔付3元;若外卖准时送达,则平台不赔付.该用户愿意购买“准时保”的条件是亏损期望不超过元,试问他是否愿意购买“准时保”?说明你的理由.
【答案】(1)0.93;
(2)11;
(3)他愿意购买“准时保”.
【分析】(1)根据给定条件,利用全概率公式列式求解.
(2)由(1)的结论,利用二项分布的方差公式列式求解.
(3)由(1)的结论,求出购买“准时保”的期望,与给定条件比对即可.
【详解】(1)令事件“外卖点餐准时送达”,“选择甲餐厅”,“选择乙餐厅”,
依题意,,,
由全概率公式得,
所以该用户每次外卖点餐准时送达的概率为0.93.
(2)依题意,的所有可能取值为,,
则,由的方差大于,得,
解得,所以的最小值为11.
(3)他愿意购买“准时保”.
设他购买“准时保”的净收益为元,则的所有可能取值为,
,,
显然,即亏损期望不超过元,
所以他愿意购买“准时保”.
23.(2026·湖南郴州·模拟预测)某兴趣小组设计一种“量子通信模拟”实验:盒中装有大小、形状完全相同的红球4个和白球2个,每次从盒中随机摸出1个球,记录颜色后放回.规定:摸到红球记为发送红球信息,摸到白球记为发送白球信息.发送者甲每次摸球后,随机选择两种编码方式A,B中的一种发送信息;接收者乙收到信息后,也随机选择A,B中的一种方式进行解码,且二者选择A,B的概率均为.已知:若甲、乙采用相同编码方式,则乙正确得到该次球颜色的概率为1;若甲、乙采用不同编码方式,则乙正确得到颜色的概率为.
(1)求乙正确得到该次球颜色的概率p;
(2)独立进行3次通信,记随机变量X为这3次中乙显示为红球的次数,求X的概率分布列及数学期望;
(3)现加入窃听者丙,每次通信时,丙先接收到甲的信息,并随机选择A,B中的一种方式进行“窃听”,再将自己的结果发送给乙;乙仍按原规则随机选择方式解码.设无窃听者时,乙正确得到信息的概率为,有窃听者时为.
(i)求,;
(ii)为判断通信过程中是否存在窃听,独立重复进行n次通信,记乙正确得到信息的次数为Y.规定统计量,当时,判断通信过程中存在窃听;否则暂不判断存在窃听.现进行了64次通信,乙正确得到信息40次,请根据上述标准判断通信过程中是否存在窃听,并说明理由.
【答案】(1)
(2)分布列见解析,
(3)(i);(ii)存在窃听,理由见解析
【分析】(1)利用全概率公式计算即可;
(2)利用上问结论结合全概率公式、二项分布的分布列与期望公式计算即可;
(3)(i)根据第一问结论及互斥事件的概率公式计算即可;(ii)代入统计量公式判定即可.
【详解】(1)记事件“甲、乙采用相同编码方式”,“乙正确得到该次球颜色”.
因为甲、乙独立随机选择编码方式,且选择A,B的概率均为,
所以,.
又由题意可知,
由全概率公式,得
所以;
(2)记事件“摸到红球”,“乙显示为红球”.
由题意可知,,
由第(1)问可知,乙正确得到颜色的概率为,
因此乙判断错误的概率为,所以,.
由全概率公式,得
而独立进行3次通信,故.
于是,.
概率分布列为:
X
0
1
2
3
数学期望为;
(3)(i)无窃听者时,由第(1)问可知,
有窃听者时,记D=“丙正确得到甲发送的信息”,E=“乙正确得到丙转发的信息”.
由题意可知,,
乙最终正确得到甲发送的信息,有两种互斥情形:,.
因此
,所以,;
(ii)由题意,,,且.
代入统计量,得,
因为,所以根据题中判断标准,应判断通信过程中存在窃听.
故结论为通信过程中存在窃听.
24.(2026·河北沧州·三模)2025年11月5日,第八届中国国际进口博览会在国家会展中心(上海)举办,某企业参展的产品有甲、乙两款机器人,为调查消费者喜爱程度与产品的类型是否有关,在展览期间设置投票箱,随机抽取了部分观众进行现场投票,得到如下列联表:
类型
是否喜爱
合计
喜爱
不喜爱
甲
2m
4m
6m
乙
9m
3m
12m
合计
11m
7m
18m
并根据小概率值的独立性检验,得出了“消费者喜爱程度与产品的类型有关”的结论.
附:.
0.01
0.005
0.001
6.635
7.879
10.828
(1)求正整数m的最小值.
(2)为感谢现场参与的观众,主办方设置了一个挑战机器人对抗赛活动.每人挑战局,每局比赛只有胜和负两种情况,无平局,若每局比赛参与者战胜机器人的概率为,胜者记3分,负者记1分.每局胜负不受其他因素的影响.
(ⅰ)若参与者甲与机器人共对抗4局,求其得分不少于10分的概率.
(ⅱ)记参与者的得分恰好比对抗的局数n多4分的概率为,若,求.
【答案】(1)
(2)(ⅰ);(ⅱ)
【分析】(1)根据公式计算结合临界表值进行解不等式即可得出结果;
(2)(ⅰ)将“得分不少于10分”转化为“胜利局数”利用二项分布的概率公式计算即可;(ⅱ)将“得分比局数多4分”转化为“胜利局数”,利用二项分布写出(),化简,用错位相减法求和,即可得出结果.
【详解】(1)由题意可知,,
已知时,,且得出有关的结论,故:
,解得:.
因为为正整数,故.
(2)(ⅰ)设4局中胜利局,则失败局,得分为.
得分不少于10分,即:,,
故:.
所以得分不少于10分的概率为.
(ⅱ)设局比赛中获胜局,则总得分为.
得分恰好比局数多4分,即:,解得:,
,()
()
所以,
设
则
两式相减得:
.
所以.
(
1
)
学科网(北京)股份有限公司
$