专题20 随机变量分布列与统计案例(选择题篇)-2026届高考数学三轮冲刺专项训练
2026-05-22
|
2份
|
50页
|
202人阅读
|
5人下载
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | - |
| 年级 | 高三 |
| 章节 | - |
| 类型 | 题集-专项训练 |
| 知识点 | 统计案例,随机变量及其分布 |
| 使用场景 | 高考复习-三轮冲刺 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 3.44 MB |
| 发布时间 | 2026-05-22 |
| 更新时间 | 2026-05-22 |
| 作者 | 热爱数学者 |
| 品牌系列 | - |
| 审核时间 | 2026-05-22 |
| 下载链接 | https://m.zxxk.com/soft/57990259.html |
| 价格 | 1.50储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
**基本信息**
聚焦概率统计核心模块,以题型为载体构建"概念理解-模型应用-数据分析"的递进式训练体系,强化数学思维与数据观念。
**专项设计**
|模块|题量/典例|题型特征|知识逻辑|
|----|-----------|----------|----------|
|条件概率|10题|结合实际情境考查定义应用,含多选辨析|从基础概率到条件概率,构建概率计算逻辑链|
|全概率公式|10题|多情境概率综合,涉及分层抽样思想|承接条件概率,培养复杂问题分解能力|
|分布列与期望方差|10题|含实际应用与性质探究,覆盖离散型变量|实现概率向随机变量的转化,强化模型意识|
|二项分布与正态分布|10题|结合图表与性质应用,突出统计特征|特殊分布模型的应用拓展,深化统计思维|
|回归分析|10题|线性与非线性回归,注重残差分析|从相关关系到回归建模,培养数据解读能力|
|独立性检验|10题|列联表分析与假设检验,强调实际推断|完成统计推断闭环,提升决策能力|
内容正文:
专题20 随机变量分布列与统计案例
题型1:条件概率
题型2:全概率公式
题型3:离散型随机变量分布列及其期望和方差
题型4:二项分布与正态分布
题型5:回归分析
题型6:独立性检验
题型1:条件概率
1.(2026·山东济宁·模拟预测)五一期间,某市文旅部门打造了“儒家文化,运河风情,水浒江湖,湖光山色”四大主题文旅产品,甲、乙、丙3名游客每人从中至少选择一个主题体验,且每个主题都恰有1人体验,记事件“甲体验儒家文化”,“乙体验湖光山色”,则( )
A. B. C. D.
2.(2026·湖北随州·模拟预测)已知随机事件A,B,,,,则=( )
A. B. C. D.
3.(2026·安徽合肥·三模)盒中有6个相同的小球,分别标有数字1,2,3,4,5,6,从中不放回地随机取两次,每次取1个球.记事件A为“取出2个小球的数字之和大于6”,事件B为“第二次取出小球的数字为5”,则( )
A. B. C. D.
4.(2026·山东菏泽·二模)已知甲袋中有3个红球和2个白球,乙袋中有2个红球和3个白球.从甲袋中随机摸出一个球放入乙袋,再从乙袋中摸出一个球,则从乙袋中摸到红球的概率为( )
A. B. C. D.
5.(2026·福建泉州·模拟预测)(多选)已知随机事件,均包含于必然事件,若,,则( )
A. B.
C. D.
6.(2026·河南安阳·模拟预测)(多选)投掷一枚正方体骰子3次,所得点数依次为.设事件“”,事件“”,事件“”,则( )
A. B.
C.事件和相互独立 D.
7.(2026·辽宁大连·三模)(多选)已知随机事件A,B,C满足,,,,则下列说法正确的是( )
A.事件A,B相互独立
B.
C.若,则
D.若,则
8.(2026·河北邯郸·三模)(多选)一个箱子里有6件产品,其中4件甲类品,2件乙类品.现从中依次不放回取出2件,记第一次取得乙类品为事件,第二次取得乙类品为事件,取出的2件产品中有乙类品为事件,则下列说法正确的是( )
A. B.
C. D.
9.(2026·天津滨海新区·三模)某塘沽中学团委组织团的知识竞赛,作为入团积极分子能否被批准入团的考核环节.题库中共有10道题,其中2道“团章知识”题,3道“团史知识”题,5道“时事团情”题.苏同学对“团章知识”题正确率为100,对“团史知识”题答对的概率为90,对“时事团情”题答对的概率为80,且答对不同题目的结果相互独立.规定不放回地抽取两道题,只有两次均答对才能被录取为团员.苏同学两次均抽到“时事团情”题的概率为__________,若苏同学第一次抽到了“团史知识”题,则他被录取为团员的概率为__________.
10.(2026·天津红桥·二模)一个袋子里放有除颜色外完全相同的个白球、个红球,若采取有放回的抽样方式,从中依次摸出两个小球,则两个小球颜色不同的概率为______;若采取不放回的抽样方式,从中依次摸出两个小球,则在第一次摸到的是红球的条件下,第二次摸到的是红球的概率为______.
题型2:全概率公式
11.(2026·甘肃嘉峪关·三模)小明在某不透明的盒子中放入4红5黑共9个球,随机摇晃后,小明从中取出一个小球丢掉(未看被丢掉小球的颜色),现从剩下8个小球中取出两个小球,则这两个小球都是黑球的概率为( )
A. B. C. D.
12.(2026·河北沧州·模拟预测)现有甲、乙、丙三个车间生产某种产品,其中甲车间每日生产400件,乙车间每日生产600件,丙车间每日生产200件,产品的合格率分别为.现随机抽取1件产品送去检验,若抽取的该件产品经检验为不合格品,则该产品来自乙车间的概率为( )
A. B. C. D.
13.(2026·福建南平·二模)某智能助手回答问题数据统计如下:理学类占总提问的40%,回答正确率为90%;文史类占总提问的60%,回答正确率为80%,用频率估计概率,则该助手回答问题正确的概率为( )
A.0.72 B.0.8 C.0.84 D.0.9
14.(2026·河南开封·二模)某同学每周进行两次游泳训练,每次游趟或趟,第一次游趟或趟的概率均为,若第一次游趟,则第二次游趟的概率为,游趟的概率为;若第一次游趟,则第二次游趟的概率为,游趟的概率为.若一周至少游趟为训练量达标,则该同学一周训练量达标的概率为( )
A. B. C. D.
15.(2026·浙江宁波·二模)某地区的公共卫生部门为了调查本地区男大学生的吸烟情况,对随机抽出的400名学生进行了调查,调查中使用了两个问题,问题A:你的手机尾号是否是偶数?问题B:你是否经常吸烟?调查者设计了一个随机化装置,这是一个装有大小、形状和质量完全一样的50个白球和50个红球的袋子,每个学生随机从袋中摸取1个球(摸出的球再放回袋中),摸到白球的学生如实回答问题A,摸到红球的学生如实回答问题B,每个学生只需回答“是”或“否”,无人知道他回答的是哪一个问题.已知手机尾号为偶数的概率为0.5,若在400名学生中共有150人回答“是”,则估计该地区男大学生吸烟的比例约为( )
A.0.15 B.0.2 C.0.25 D.0.3
16.(2026·浙江·模拟预测)一个知识问答竞赛每题有3个选项.甲参加该竞赛有以下情况:若甲掌握该知识,则一定回答正确;若甲未掌握该知识,则从3个选项中随机选择一个作答.已知甲回答正确的概率为,则甲掌握该知识的概率为( )
A. B. C. D.
17.(2026·海南省直辖县级单位·模拟预测)(多选)在某电商平台上,用户获取商品信息的途径有两种,一种是系统推荐,一种是用户自主搜索.根据大数据,用户在该平台获取的商品信息中有来自系统推荐.若商品由系统推荐,则用户购买的概率为,若商品由用户自主搜索,则用户购买的概率为.从该平台随机抽取一件商品,设事件为“该商品被用户购买”,事件为“该商品由系统推荐”,则( )
A. B. C. D.
18.(2026·安徽安庆·三模)(多选)已知A,B是概率均不为0的随机事件,下列说法正确的是( )
A.若,则事件A与B为对立事件
B.若,则
C.若,则
D.若,,则
19.(2026·广东·一模)(多选)英国数学家贝叶斯在概率论研究方面成就显著,根据贝叶斯定理,随机事件存在如下关系:.张同学每天的运动计划包括两种主要方式:室内健身和户外运动.张同学第一天选择室内健身的概率为,选择户外运动的概率为.如果第一天选择室内健身,那么第二天继续选择室内健身的概率为;如果第一天选择户外运动,那么第二天选择室内健身的概率为.则张同学( )
A.第二天去室内健身的概率为
B.第二天去户外运动的概率为
C.若第二天去了室内健身,则第一天去户外运动的概率为
D.若第二天去了户外运动,则第一天去室内健身的概率为
20.(2026·天津·二模)甲、乙两人进行多轮猜谜比赛,每轮比赛两人各答一题,已知每轮比赛中,甲、乙猜对的概率分别为和,每轮比赛中两人猜对与否互不影响,每轮结果互不影响,在一轮比赛中,恰有一人猜对的概率为__________;若两轮比赛中只有两次猜对,则这两次都是乙猜对的概率为__________.
题型3:离散型随机变量分布列及其期望和方差
21.(2026·福建厦门·模拟预测)随机变量X的分布列为,.若,则( )
A. B. C. D.
22.(2026·广东惠州·二模)已知随机变量的分布列为
0
1
2
3
0.3
0.3
0.2
0.1
设函数,若,则函数的值域为( )
A. B. C. D.
23.(2026·安徽合肥·二模)已知随机变量的所有可能取值为0,1,2,且,则( )
A.0.48 B.0.54 C.0.76 D.0.92
24.(2026·重庆沙坪坝·模拟预测)某模型在验证集中有4个样本:1个“正确分类”,1个“错误分类”,2个“不确定样本”, 系统随机打乱顺序后不放回地逐个测试,直到遇到第一个正确分类样本时停止,设在此过程中测试到的 “不确定样本” 个数为,则( )
A. B.1 C. D.2
25.(2026·重庆·模拟预测)设<<1,随机变量X的分布列是
X
1
P
b
则当a在内增大时,( )
A.增大 B.减小
C.先增大再减小 D.先减小再增大
26.(2026·河北·模拟预测)(多选)若离散型随机变量X的分布列如下表所示,则( )
X
1
3
5
7
P
0.4
0.3
0.2
m
A. B. C. D.
27.(2026·重庆北碚·模拟预测)(多选)抛掷一枚均匀的骰子两次,将两次朝上的点数分别记为随机变量和,则下列说法正确的是( )
A. B.
C. D.
28.(2026·陕西榆林·模拟预测)(多选)已知随机变量,则( )
A. B.
C. D.
29.(2026·天津北辰·二模)2026年教育部全面推进“人工智能+教育”,某科技馆开展AI助手体验活动.三人一组,每人可向AI助手提问.甲、乙、丙三人体验AI问答系统.活动分两环节,第一环节“抢麦提问”,只有一人能抢到麦克风,三人抢到麦克风的概率均为,抢到者向AI提问,AI给出正确答案的概率分别为甲是,乙、丙均是.第二环节“独立测试”,三人各自在平板电脑上完成一道必答题,他们各自答对的概率分别为甲是,乙、丙均是,且甲、乙、丙三人各题是否答对互不影响.则在第一环节提问中得到正确答案的概率______;记在第二环节独立测试中得到正确答案的人数为X,则X的数学期望为_______.
30.(2026·贵州贵阳·二模)在一个袋子中装有4个大小相同的小球,小球上的编号依次为1,2,3,4,现在有放回的抽取n次,每次只取一个小球,记这n次取到的小球的最大编号为X,则______,______.
题型4:二项分布与正态分布
31.(2026·贵州贵阳·模拟预测)已知随机变量,则它对应的频率分布条形图是( )
A. B.
C. D.
32.(2026·天津武清·模拟预测)下列命题中
①一组数据10,11,11,12,13,14,16,18,20,22的第60百分位数为14
②若,则
③根据经验回归方程所得到的预报值就是响应变量的精确值
④用简单随机抽样的方法从10个个体中抽取3个个体,则每个个体被抽到的概率都是
其中错误命题的个数为( )
A.4 B.3 C.2 D.1
33.(2026·山西大同·三模)为了调查某梨园中梨的生长情况,在梨园中随机采摘了个梨.经整理分析后发现,梨的重量(单位:kg)近似服从正态分布,且,.若从该梨园中随机采摘个梨,则该梨的重量在内的概率为( )
A. B. C. D.
34.(2026·浙江·三模)若随机变量,随机变量且,则( )
A. B. C.2 D.4
35.(2026·上海徐汇·二模)已知甲、乙两班在某次数学测验中成绩近似服从正态分布,甲班成绩,乙班成绩,其密度曲线如图所示,则有( )
A.且
B.且
C.
D.
36.(2026·山东枣庄·三模)(多选)下列命题正确的是( )
A.随机变量,当最大,则的取值为3
B.以模型去拟合一组数据时,为求出回归方程,设,将其变换后得到线性方程,则,的值分别是,0.3
C.已知关于的回归方程为,则样本数据点的残差为2.2
D.若,,则事件,相互独立
37.(2026·广东深圳·模拟预测)(多选)下列说法正确的是( )
A.样本相关系数越大,则线性相关性越强
B.的上四分位数是15
C.若随机变量服从正态分布,且,则
D.若随机变量的方差,期望,则
38.(2026·江苏苏州·模拟预测)某汽车制造厂生产一种用于发动机的活塞销,其设计标准直径为,该活塞销的实际直径服从正态分布,方差为.根据生产规定:活塞销的直径在到之间为合格品,则从该汽车制造厂生产的活塞销中随机抽取一个,其为合格品的概率为______.
参考数据:若随机变量,则,,.
39.(2026·山东临沂·二模)今有一批数量庞大的瓶装饮用水,假设这批水的某项矿物质含量偏差值(单位:毫克/升),,,现从中随机抽取n瓶,这n瓶水中恰有K瓶的矿物质含量偏差值位于区间.当时,试以使得最大的n值作为n的估计值,则n为________.
40.(2026·河北张家口·二模)有5道题,5名女生中有2人每题都不能答对,其余3人每题都能答对,3名男生每人对每题答对的概率均为.现从上述5名女生中选择2名女生和3名男生答题,每人答一题,答对得2分,答错得0分,记得分之和为,则的数学期望为__________.
题型5:回归分析
41.(2026·四川·模拟预测)对于变量有观测数据,得散点图1;对于变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法不正确的是( )
A. B.
C. D.
42.(2026·上海浦东新·三模)下列命题中不正确的是( )
A.线性回归方程对应的直线一定经过样本点的中心
B.线性回归方程对应的直线至少经过其样本数据点中的一个点
C.线性回归方程为时,变量与具有负的线性相关关系
D.用最小二乘法求回归方程是为了使最小
43.(2026·河北沧州·二模)某校研究性学习小组收集了某地区近几年的某种经济指标与年份的数据,经计算得经验回归方程为.若年该经济指标的实际值为,则残差为( )
A. B. C. D.
44.(2026·广东深圳·二模)(多选)某公司统计了去年1月份到5月份某种产品的销售额如下表:
月份
1
2
3
4
5
销售额万元
1.8
2.2
2.8
3.1
根据表中数据,通过最小二乘法求得的经验回归方程为,则( )
A.变量与正相关
B.
C.样本数据的下四分位数为1.8
D.当时,的预测值为4.1万元
45.(2026·辽宁铁岭·模拟预测)(多选)已知样本点的回归直线l的方程为,相关系数为r,样本均值分别为,.现令,.设新样本点的回归直线为,则( )
附:相关系数;回归直线方程中斜率和截距的最小二乘估计公式分别为,.
A.过点 B.的斜率为
C.u与v的相关系数为 D.的截距为
46.(2026·吉林延边·三模)(多选)某奶茶店统计了六天每天天气平均气温t(℃)和每天凉茶的销售数量n(单位:杯),得到以下数据:
t(℃)
3
0
5
7
9
12
n(单位:杯)
23
17
27
29
36
42
若t与n线性相关,且回归直线方程为,则( )
A.t和n正相关 B.点在回归直线上
C. D.
47.(2026·新疆·二模)(多选)某电子商城统计了最近5个月某品牌电脑的实际销量,如下表所示:
时间x(月份)
1
2
3
4
5
销量y(百台)
0.3
0.4
0.6
0.7
0.9
若y与x线性相关,且经验回归方程为:,则下列说法正确的是( )
A.变量x,y正相关
B.
C.可以预测当时,商城内该电脑的销量为1百台
D.当时,残差为
48.(2026·陕西渭南·模拟预测)在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围.令,求得经验回归方程为,则该模型的回归方程为__________.
49.(2026·山东滨州·二模)已知变量和变量的一组成对样本数据为,其中,其回归直线方程为,当增加两个样本数据和后,经重新计算得到新回归直线的斜率为3,则在新的回归直线方程的估计下,样本数据所对应的残差为__________.(残差观测值预测值)
50.(2026·福建南平·二模)用函数拟合一组数据,则观测数据的残差为________.
题型6:独立性检验
51.(2026·天津和平·三模)以下说法不正确的是( )
A.样本数据1,1,1,3,3,3的极差为2,标准差为1
B.对具有线性相关关系的变量,,其经验回归方程为,若样本数据的中心点为,则实数的值为2
C.对一个容量为的总体,抽取容量为的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,三种方法的总体中每个个体被抽中的概率均相等
D.根据分类变量与的成对样本数据,计算得到,则依据的独立性检验,可以认为“与无关联”
52.(2026·天津河西·一模)下列说法中错误的有( )
①回归直线恒过点,且至少过一个样本点;
②根据列联表中的数据计算得出,而,则“两个分类变量有关联”此推断犯错误的概率不大于0.01;
③回归分析时,可以用决定系数刻画模型的回归效果,越大,则拟合的效果越好;
④若随机变量服从正态分布,若则实数
A.1个 B.2个 C.3个 D.4个
53.(2026·天津·一模)近年中国新能源汽车进入高速发展时期,为了了解消费者的购车类型与地域是否具有相关性,某品牌汽车商随机调查了甲、乙两地各200名消费者,并用等高堆积条形图直观地展示调查结果如下图所示,经计算得到.
车型与地区
下表是独立性检验中几个常用的小概率值和相应的临界值.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
下列说法正确的是( )
A.在所调查的甲地购车者中,若按比例分层随机抽样抽取20人,则新能源车主有8人
B.在所调查的乙地购车者中,购买燃油车的人数比新能源车的多20人
C.依据的独立性检验,即消费者的购车类型与地域有关联,此推断犯错误的概率不大于0.001
D.依据的独立性检验,即消费者的购车类型与地域无关联,此推断犯错误的概率不大于0.001
54.(2026·天津河北·一模)以下结论错误的是( )
A.根据列联表中的数据计算得出,而,则根据小概率值的独立性检验,认为两个分类变量有关系
B.在回归直线中,变量时,变量y的值一定是15
C.的值越大,两个事件的相关性的可能性就越大
D.在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好
55.(2026·浙江绍兴·模拟预测)(多选)下列说法正确的是( )
A.一组数据1,2,4,5,5,6,7,8的第70百分位数为5
B.若随机变量,则的正态曲线关于直线对称
C.根据分类变量与的成对数据,计算得到,根据小概率值的独立性检验:,可判断与有关联,此推断犯错误的概率不超过
D.数据组成一个样本,其回归直线方程为,其中,则
56.(2026·江苏·模拟预测)(多选)下列结论正确的是( )
A.一组样本数据通过计算得到线性回归方程为,若,则
B.一组数据的第80百分位数是11.5
C.已知随机变量,若,则
D.在列联表中,若每个数据均变成原来的2倍,则不变(,其中)
57.(2026·江西抚州·二模)(多选)某校团委对“学生性别和是否喜欢运动的关联性”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢运动的人数占男生人数的,女生中喜欢运动的人数占女生人数的,若有的把握,但没有的把握认为“学生性别和是否喜欢运动有关”,则被调查的男生人数可能为( )
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.25 B.45 C.60 D.75
性别
是否喜欢运动
合计
喜欢
不喜欢
男生
女生
合计
58.(2026·山东聊城·二模)(多选)某医学研究团队为探究新型降压药的疗效与患者年龄的关联,将120名高血压患者按年龄分为“中青年组(<60岁)”和“老年组(岁)”,记录用药后的疗效(“有效”“无效”),得到如下列联表:
患者
疗效
总计
有效
无效
中青年组
10
40
50
老年组
40
30
70
总计
50
70
120
附:,其中.
0.10
0.05
0.025
0.01
2.706
3.841
5.024
6.635
则下列说法中正确的有( )
A.若在“老年组”中按疗效分层抽样抽取7人,再从这7人中随机抽取2人,则至少抽到1名“无效”患者的概率为
B.从所有患者中随机抽取1人,设事件“该人在中青年组”,事件“该药对此人有效”,则事件A与B相互独立
C.根据小概率值的独立性检验,认为“降压药疗效与患者年龄有关”,且该推断犯错误的概率不超过
D.若将列联表中“中青年组有效”的人数改为15,“中青年组无效”的人数改为35,则所得值比原值大
59.(2026·江苏南通·三模)为研究课后整理错题习惯与数学成绩达标之间的关联性,经独立性检验计算得,临界值,.记事件为“学生成绩达标”,事件为“学生坚持整理错题”;已知,,,则有________的把握认为二者存在关联;随机抽取一名学生,其成绩达标的概率为________.
60.(2026·上海·二模)某工厂为判断两种不同的操作方法是否对生产某种零件的合格个数有影响,收集了相关数据,绘制了列联表,设原假设:两种不同的操作方法对生产该种零件的合格个数没有影响,计算出统计量,已知,则在显著性水平下,推断的结论为________.(用“拒绝”或“接受”填空)
1 / 1
学科网(北京)股份有限公司
$
专题20 随机变量分布列与统计案例
题型1:条件概率
题型2:全概率公式
题型3:离散型随机变量分布列及其期望和方差
题型4:二项分布与正态分布
题型5:回归分析
题型6:独立性检验
题型1:条件概率
1.(2026·山东济宁·模拟预测)五一期间,某市文旅部门打造了“儒家文化,运河风情,水浒江湖,湖光山色”四大主题文旅产品,甲、乙、丙3名游客每人从中至少选择一个主题体验,且每个主题都恰有1人体验,记事件“甲体验儒家文化”,“乙体验湖光山色”,则( )
A. B. C. D.
【答案】C
【分析】分类讨论甲、乙是否选择两个主题体验,求得,,结合条件概率公式即可得结果.
【详解】若甲体验儒家文化,则有:
当甲只选择一个主题体验,则不同的选法种数为;
当甲选择两个主题体验,则不同的选法种数为;
综上所述:不同的选法种数为,即;
若甲体验儒家文化且乙体验湖光山色,则有:
当甲、乙均只选择一个主题体验,则不同的选法种数为1;
当甲选择两个主题体验,乙只选择一个主题体验,则不同的选法种数为;
当甲只选择一个主题体验,乙选择两个主题体验,则不同的选法种数为;
综上所述:不同的选法种数为,即;
所以.
2.(2026·湖北随州·模拟预测)已知随机事件A,B,,,,则=( )
A. B. C. D.
【答案】D
【分析】根据条件概率公式计算判断各个选项.
【详解】因为,,,
所以,则,
所以.
3.(2026·安徽合肥·三模)盒中有6个相同的小球,分别标有数字1,2,3,4,5,6,从中不放回地随机取两次,每次取1个球.记事件A为“取出2个小球的数字之和大于6”,事件B为“第二次取出小球的数字为5”,则( )
A. B. C. D.
【答案】C
【详解】由已知条件,,,所以.
4.(2026·山东菏泽·二模)已知甲袋中有3个红球和2个白球,乙袋中有2个红球和3个白球.从甲袋中随机摸出一个球放入乙袋,再从乙袋中摸出一个球,则从乙袋中摸到红球的概率为( )
A. B. C. D.
【答案】A
【分析】考虑从甲袋中取出的球是白球还是红球,根据全概率公式,即可求得答案.
【详解】设事件表示“从甲袋取出又放入乙袋中的球是红球”,则事件表示“从甲袋中取出又放入乙袋中的球是白球”,
事件表示“最后从乙袋中取出的球是红球”,
所以,故,,
故,故A正确.
5.(2026·福建泉州·模拟预测)(多选)已知随机事件,均包含于必然事件,若,,则( )
A. B.
C. D.
【答案】BC
【分析】根据条件概率公式,变形求解,可判断A、D的正误;根据概率加法公式,可判断B的正误,根据概率的范围,结合二次函数的性质,可判断C的正误;
【详解】选项A:由条件概率公式得,故A错误;
选项B:由概率加法公式得,
因为,所以,
则,故B正确;
选项C:,
所以,则,
令,,
则,
因为,,
所以,
当且仅当时取等号,故C正确;
选项D:,
当或时,才有,
但,,
无法确定是否为0及是否等于,故D错误.
6.(2026·河南安阳·模拟预测)(多选)投掷一枚正方体骰子3次,所得点数依次为.设事件“”,事件“”,事件“”,则( )
A. B.
C.事件和相互独立 D.
【答案】AD
【分析】由古典概率及条件概率的知识进行判断.
【详解】投掷一枚正方体骰子3次,所得点数依次为的基本事件的总数有种,
对于选项A,事件“”包含:
当时,有6种,
当时,有种,
共有种,
则,故A项正确;
对于B项,事件“”包含:
当时,有6种,
当时,有种,
当时,有种,
当时,有种,
共有种,所以,故B项错误;
对于C项,因为,,
则,故事件和不相互独立,故C项错误;
对于D项,,
事件“且”包含:对每个,有都,有种,
求和:种,
所以,
事件“且”包含:对每个,有都,有种,
求和:种,
所以,
因此且相同,故,故D项正确.
7.(2026·辽宁大连·三模)(多选)已知随机事件A,B,C满足,,,,则下列说法正确的是( )
A.事件A,B相互独立
B.
C.若,则
D.若,则
【答案】ACD
【分析】利用条件概率公式,相互独立事件概率公式,并事件概率公式来进行求解即可.
【详解】利用概率加法公式: 由,
代入,,得: ,
又,所以算,
所以事件相互独立,故A正确;
根据条件概率公式计算:,
则,故B错误;
由,且,得,
因为,所以,
即 ,故C正确;
由可得:,
代入,,可得,
又因为,两式消元解得:
,故D正确.
8.(2026·河北邯郸·三模)(多选)一个箱子里有6件产品,其中4件甲类品,2件乙类品.现从中依次不放回取出2件,记第一次取得乙类品为事件,第二次取得乙类品为事件,取出的2件产品中有乙类品为事件,则下列说法正确的是( )
A. B.
C. D.
【答案】BCD
【分析】依题意::第一次取乙类品,
:第二次取乙类品(抽签原理,不放回先后概率相等),
:两件中至少1件乙类品,对立事件全是甲类,
:两次都取乙类品,逐个判断选项.
【详解】选项A,,二者相等A错误;
选项B,左边:右边:,
,不等式成立B正确;
选项C,条件概率公式:,
发生则一定发生,故;同理,
,
又,所以二者条件概率相等C正确;
选项D,事件就是(至少一次抽到乙类),根据概率加法公式:
,
代入验证:,D正确.
9.(2026·天津滨海新区·三模)某塘沽中学团委组织团的知识竞赛,作为入团积极分子能否被批准入团的考核环节.题库中共有10道题,其中2道“团章知识”题,3道“团史知识”题,5道“时事团情”题.苏同学对“团章知识”题正确率为100,对“团史知识”题答对的概率为90,对“时事团情”题答对的概率为80,且答对不同题目的结果相互独立.规定不放回地抽取两道题,只有两次均答对才能被录取为团员.苏同学两次均抽到“时事团情”题的概率为__________,若苏同学第一次抽到了“团史知识”题,则他被录取为团员的概率为__________.
【答案】 /
【分析】将第一次抽到“时事团情”题的概率与在第一次抽到该类题的条件下第二次抽到该类题的概率相乘,即可求出两次均抽到“时事团情”题的概率;利用条件概率公式求解苏同学第一次抽到了“团史知识”题,则他被录取为团员的概率即可.
【详解】由题意苏同学两次均抽到“时事团情”题的概率为,
设苏同学第一次抽到“团史知识”题为事件,苏同学被录取为团员为事件,
则,
,
所以,
即苏同学第一次抽到了“团史知识”题,则他被录取为团员的概率为.
10.(2026·天津红桥·二模)一个袋子里放有除颜色外完全相同的个白球、个红球,若采取有放回的抽样方式,从中依次摸出两个小球,则两个小球颜色不同的概率为______;若采取不放回的抽样方式,从中依次摸出两个小球,则在第一次摸到的是红球的条件下,第二次摸到的是红球的概率为______.
【答案】 / /
【分析】第一空分先白后红和先红后白两种情况,由概率公式计算;第二空利用条件概率公式即可求解.
【详解】第一空:
令事件表示用放回抽样方式摸出两个颜色不同的小球,
所以每次摸一个白球的概率为,每一次摸一个红球的概率为,
所以,
第二空:
令事件表示不放回的抽样方式第次摸到红球,,
,,
所以在第一次摸到红球的条件下,第二次摸到红球的概率为
.
题型2:全概率公式
11.(2026·甘肃嘉峪关·三模)小明在某不透明的盒子中放入4红5黑共9个球,随机摇晃后,小明从中取出一个小球丢掉(未看被丢掉小球的颜色),现从剩下8个小球中取出两个小球,则这两个小球都是黑球的概率为( )
A. B. C. D.
【答案】D
【分析】第一次丢掉球有红、黑两种可能,分别计算剩余球中取两个黑球的概率,再利用全概率公式计算即可.
【详解】用表示丢掉一个小球后任取两个小球均为黑球,用表示丢掉的小球为红球,表示丢掉的小球为黑球,
则,
由全概率公式可得.
12.(2026·河北沧州·模拟预测)现有甲、乙、丙三个车间生产某种产品,其中甲车间每日生产400件,乙车间每日生产600件,丙车间每日生产200件,产品的合格率分别为.现随机抽取1件产品送去检验,若抽取的该件产品经检验为不合格品,则该产品来自乙车间的概率为( )
A. B. C. D.
【答案】D
【详解】记事件分别表示产品来自甲、乙、丙车间,
则,,;
记事件为抽到不合格品,
则,,;
.
13.(2026·福建南平·二模)某智能助手回答问题数据统计如下:理学类占总提问的40%,回答正确率为90%;文史类占总提问的60%,回答正确率为80%,用频率估计概率,则该助手回答问题正确的概率为( )
A.0.72 B.0.8 C.0.84 D.0.9
【答案】C
【详解】设“理学类提问”为事件,“文史类提问”为事件,“回答正确”为事件,
则,
所以.
14.(2026·河南开封·二模)某同学每周进行两次游泳训练,每次游趟或趟,第一次游趟或趟的概率均为,若第一次游趟,则第二次游趟的概率为,游趟的概率为;若第一次游趟,则第二次游趟的概率为,游趟的概率为.若一周至少游趟为训练量达标,则该同学一周训练量达标的概率为( )
A. B. C. D.
【答案】D
【分析】本题主要考查全概率公式的应用,根据题干条件进行分类,然后求出每种情况的概率,最后由互斥事件,将所有概率相加即可得到达标概率.
【详解】由题意知:一周训练量达标即为游趟或趟,设第一次游趟为事件,
第一次游趟为事件,第二次游趟为事件,第二次游趟为事件,
可分为以下三种情况:
情况:第一次游趟,第二次游趟,共游趟,训练量达标.
则由条件概率可得;
情况:第一次游趟,第二次游趟,共游趟,训练量达标.
则由条件概率可得;
情况:第一次游趟,第二次游趟,共游趟,训练量达标. 则由条件概率可得,
由三种情况为互斥事件,因此,该同学一周训练量达标的概率.
15.(2026·浙江宁波·二模)某地区的公共卫生部门为了调查本地区男大学生的吸烟情况,对随机抽出的400名学生进行了调查,调查中使用了两个问题,问题A:你的手机尾号是否是偶数?问题B:你是否经常吸烟?调查者设计了一个随机化装置,这是一个装有大小、形状和质量完全一样的50个白球和50个红球的袋子,每个学生随机从袋中摸取1个球(摸出的球再放回袋中),摸到白球的学生如实回答问题A,摸到红球的学生如实回答问题B,每个学生只需回答“是”或“否”,无人知道他回答的是哪一个问题.已知手机尾号为偶数的概率为0.5,若在400名学生中共有150人回答“是”,则估计该地区男大学生吸烟的比例约为( )
A.0.15 B.0.2 C.0.25 D.0.3
【答案】C
【分析】先确定回答“是”的150人中,吸烟的人数,再利用古典概型估计吸烟的比例.
【详解】因为摸到白球和红球的概率均为 ,
回答A问题“是”的学生人数为人,
所以回答B问题“是”的学生人数为人,
所以男大学生吸烟人数的比例约为.
16.(2026·浙江·模拟预测)一个知识问答竞赛每题有3个选项.甲参加该竞赛有以下情况:若甲掌握该知识,则一定回答正确;若甲未掌握该知识,则从3个选项中随机选择一个作答.已知甲回答正确的概率为,则甲掌握该知识的概率为( )
A. B. C. D.
【答案】A
【分析】根据题干可列出,,结合全概率公式列出等式即可求解.
【详解】设甲掌握该知识的概率为,记“甲回答正确”为事件,
根据题意,,,.
根据全概率公式,,代入已知,
得:,解得.
17.(2026·海南省直辖县级单位·模拟预测)(多选)在某电商平台上,用户获取商品信息的途径有两种,一种是系统推荐,一种是用户自主搜索.根据大数据,用户在该平台获取的商品信息中有来自系统推荐.若商品由系统推荐,则用户购买的概率为,若商品由用户自主搜索,则用户购买的概率为.从该平台随机抽取一件商品,设事件为“该商品被用户购买”,事件为“该商品由系统推荐”,则( )
A. B. C. D.
【答案】AD
【详解】由已知得,,.
对于A,因为,所以,故A正确;
对于B,由全概率公式可得,故B错误;
对于C,,所以,故C错误;
对于D,,故D正确.
18.(2026·安徽安庆·三模)(多选)已知A,B是概率均不为0的随机事件,下列说法正确的是( )
A.若,则事件A与B为对立事件
B.若,则
C.若,则
D.若,,则
【答案】CD
【分析】利用和事件与积事件的关系可得,再利用互斥事件与对立事件性质可得A;利用条件概率公式计算可得B;利用全概率公式计算可得C;利用对立事件的性质及概率的乘法公式与和事件与积事件的关系计算可得D.
【详解】对A:由,故,
则、互斥,但不能得到、对立,故A错误;
对B:由,则,
故或,故B错误,
对C:,,
若则,故C正确;
对D:,则,
所以.
19.(2026·广东·一模)(多选)英国数学家贝叶斯在概率论研究方面成就显著,根据贝叶斯定理,随机事件存在如下关系:.张同学每天的运动计划包括两种主要方式:室内健身和户外运动.张同学第一天选择室内健身的概率为,选择户外运动的概率为.如果第一天选择室内健身,那么第二天继续选择室内健身的概率为;如果第一天选择户外运动,那么第二天选择室内健身的概率为.则张同学( )
A.第二天去室内健身的概率为
B.第二天去户外运动的概率为
C.若第二天去了室内健身,则第一天去户外运动的概率为
D.若第二天去了户外运动,则第一天去室内健身的概率为
【答案】ACD
【详解】设表示张同学第一天选择室内健身,表示张同学第二天选择室内健身,
表示张同学第一天选择户外运动,表示张同学第二天选择户外运动.
则,,,,
因为,所以,
因为,所以,
对于A,,故A正确;
对于B,因为,故B错误;
对于C,因为,故C正确;
对于D,因为,故D正确.
20.(2026·天津·二模)甲、乙两人进行多轮猜谜比赛,每轮比赛两人各答一题,已知每轮比赛中,甲、乙猜对的概率分别为和,每轮比赛中两人猜对与否互不影响,每轮结果互不影响,在一轮比赛中,恰有一人猜对的概率为__________;若两轮比赛中只有两次猜对,则这两次都是乙猜对的概率为__________.
【答案】 /0.5
【分析】根据独立事件的乘法公式计算可得第一空,利用全概率及贝叶斯公式可求第二空.
【详解】解:设每轮比赛中,甲猜对为事件,乙猜对为事件,
则,
在一轮比赛中,恰有一人猜对为事件,
,
设两轮比赛中只有两次猜对为事件,
则,
则这两次都是乙猜对的概率为.
题型3:离散型随机变量分布列及其期望和方差
21.(2026·福建厦门·模拟预测)随机变量X的分布列为,.若,则( )
A. B. C. D.
【答案】A
【详解】因为随机变量X的分布列为,,
所以,即,又因为,
所以,解得.
22.(2026·广东惠州·二模)已知随机变量的分布列为
0
1
2
3
0.3
0.3
0.2
0.1
设函数,若,则函数的值域为( )
A. B. C. D.
【答案】C
【详解】由分布列的性质可知,,所以.
因为函数,.
当时,;
当时,;
当时,.
所以.
所以函数的值域为.
23.(2026·安徽合肥·二模)已知随机变量的所有可能取值为0,1,2,且,则( )
A.0.48 B.0.54 C.0.76 D.0.92
【答案】C
【分析】利用期望和方差公式求解即可.
【详解】设,则,所以,解得:,
所以,
则
24.(2026·重庆沙坪坝·模拟预测)某模型在验证集中有4个样本:1个“正确分类”,1个“错误分类”,2个“不确定样本”, 系统随机打乱顺序后不放回地逐个测试,直到遇到第一个正确分类样本时停止,设在此过程中测试到的 “不确定样本” 个数为,则( )
A. B.1 C. D.2
【答案】B
【详解】记1个“正确分类”为,1个“错误分类”为,2个“不确定样本”为,
已知测试到就停止,为测试到的的个数,则的可能取值为:,
时有两种情况:①第一个是;②第一个是,第二个是,即
;
时有三种情况:①第一个是或,第二个是;
②第一个是或,第二个是,第三个是;
③第一个是,第二个是或,第三个是;
;
时有三种情况:①前两个是和,第三个是;
②前两个是或和,第三个是或,第四个是;
③第一个是,第二个和第三个是和,第四个是;
;
.
25.(2026·重庆·模拟预测)设<<1,随机变量X的分布列是
X
1
P
b
则当a在内增大时,( )
A.增大 B.减小
C.先增大再减小 D.先减小再增大
【答案】D
【详解】由题意得,则,故,,
所以,
故当a在时,增大减小;当a在时,增大增大.
26.(2026·河北·模拟预测)(多选)若离散型随机变量X的分布列如下表所示,则( )
X
1
3
5
7
P
0.4
0.3
0.2
m
A. B. C. D.
【答案】ABD
【分析】根据概率之和为1求出判断A;然后结合均值和方差的概念计算判断B,C,应用均值性质求解新的离散型随机变量的均值判断D.
【详解】由题意得,解得,A正确;
由,B选项正确;
,故D选项正确;
因为,故C选项错误;
27.(2026·重庆北碚·模拟预测)(多选)抛掷一枚均匀的骰子两次,将两次朝上的点数分别记为随机变量和,则下列说法正确的是( )
A. B.
C. D.
【答案】AC
【详解】选项A:为第一次抛掷骰子的点数,共6种等可能结果,即取3、4、5、6,共4种结果,故,A正确;
选项B:的情况为 ,共6种基本事件,故,B错误;
选项C: 即 ,符合的事件为 ,共4种基本事件,故,C正确;
选项D:服从1到6的均匀分布,期望 ,D错误.
28.(2026·陕西榆林·模拟预测)(多选)已知随机变量,则( )
A. B.
C. D.
【答案】ABC
【详解】因为随机变量,所以正态曲线关于直线对称,所以,故A正确;
因为,且,
所以,故B正确;
,故C正确;
,故D错误.
29.(2026·天津北辰·二模)2026年教育部全面推进“人工智能+教育”,某科技馆开展AI助手体验活动.三人一组,每人可向AI助手提问.甲、乙、丙三人体验AI问答系统.活动分两环节,第一环节“抢麦提问”,只有一人能抢到麦克风,三人抢到麦克风的概率均为,抢到者向AI提问,AI给出正确答案的概率分别为甲是,乙、丙均是.第二环节“独立测试”,三人各自在平板电脑上完成一道必答题,他们各自答对的概率分别为甲是,乙、丙均是,且甲、乙、丙三人各题是否答对互不影响.则在第一环节提问中得到正确答案的概率______;记在第二环节独立测试中得到正确答案的人数为X,则X的数学期望为_______.
【答案】
【分析】应用全概率公式计算求解,先写出可以取的概率,再应用数学期望公式计算求解.
【详解】在第一环节提问中得到正确答案的概率;
在第二环节独立测试中得到正确答案的人数为X,可以取,
,
,
,
,
则X的数学期望为.
30.(2026·贵州贵阳·二模)在一个袋子中装有4个大小相同的小球,小球上的编号依次为1,2,3,4,现在有放回的抽取n次,每次只取一个小球,记这n次取到的小球的最大编号为X,则______,______.
【答案】
【分析】根据古典概型概率公式,独立事件的概率乘法公式,以及数学期望的公式计算即得.
【详解】由题意,有放回的抽取n次,每次只取一个小球,取得每个编号的概率都是,
易得;
因,,2,3,4,
故.
题型4:二项分布与正态分布
31.(2026·贵州贵阳·模拟预测)已知随机变量,则它对应的频率分布条形图是( )
A. B.
C. D.
【答案】B
【分析】由二项分布的性质进行判断.
【详解】,则的取值可能是0,1,2,3,,9.
又,所以频率分布条形图应是右偏的,
故选:B.
32.(2026·天津武清·模拟预测)下列命题中
①一组数据10,11,11,12,13,14,16,18,20,22的第60百分位数为14
②若,则
③根据经验回归方程所得到的预报值就是响应变量的精确值
④用简单随机抽样的方法从10个个体中抽取3个个体,则每个个体被抽到的概率都是
其中错误命题的个数为( )
A.4 B.3 C.2 D.1
【答案】A
【分析】由百分位数计算方式,正态分布概念,预报值与精确值定义,古典概率知识可判断命题正误.
【详解】命题①:该组数据共10个,已按从小到大排序,计算,根据百分位数计算规则,当为整数时,第百分位数为第项与第项数据的平均数,即第分位数为,故①为假命题;
命题②:若,其正态分布密度曲线对称轴为,故;
若,对称轴为,故,因此,故②为假命题;
命题③:经验回归方程得到的预报值是响应变量的估计值,受随机误差影响,并非响应变量的精确值,故③为假命题。
命题④:因共有10个个体,从中抽取3个,则每个个体被抽中概率为,故④为假命题.
综上,错误命题共4个.
33.(2026·山西大同·三模)为了调查某梨园中梨的生长情况,在梨园中随机采摘了个梨.经整理分析后发现,梨的重量(单位:kg)近似服从正态分布,且,.若从该梨园中随机采摘个梨,则该梨的重量在内的概率为( )
A. B. C. D.
【答案】C
【分析】利用正态分布曲线的对称性即可求解.
【详解】因为,所以,
又,所以.故C正确.
34.(2026·浙江·三模)若随机变量,随机变量且,则( )
A. B. C.2 D.4
【答案】B
【详解】由题意得,,
因为,所以,则,则
35.(2026·上海徐汇·二模)已知甲、乙两班在某次数学测验中成绩近似服从正态分布,甲班成绩,乙班成绩,其密度曲线如图所示,则有( )
A.且
B.且
C.
D.
【答案】C
【详解】正态密度曲线关于对称,对称轴位置对应均值;且越大,曲线越矮胖,越小曲线越瘦高
从图中可知:的对称轴为,的对称轴为,因此;曲线更矮胖,因此,故选项A、B错误;
由正态分布的对称性:,,C正确;
,而,所以,因此,D错误
36.(2026·山东枣庄·三模)(多选)下列命题正确的是( )
A.随机变量,当最大,则的取值为3
B.以模型去拟合一组数据时,为求出回归方程,设,将其变换后得到线性方程,则,的值分别是,0.3
C.已知关于的回归方程为,则样本数据点的残差为2.2
D.若,,则事件,相互独立
【答案】ABD
【分析】使用二项分布概率公式分析选项,使用线性回归方程及残差的定义分析选项,使用全概率公式和条件概率公式分析选项.
【详解】,
由,解得,
由,解得,
又因为,且,所以,选项正确;
已知,两边取自然对数得,令,则,
因为变换后的线性方程为,所以,,即,选项正确;
已知关于的回归方程为,当时,,
而样本数据点为,则残差,选项错误;
已知,,由条件概率公式,
则,即,
所以,即,
则事件,相互独立,选项正确.
37.(2026·广东深圳·模拟预测)(多选)下列说法正确的是( )
A.样本相关系数越大,则线性相关性越强
B.的上四分位数是15
C.若随机变量服从正态分布,且,则
D.若随机变量的方差,期望,则
【答案】BC
【详解】A:样本相关系数越接近1线性相关性越强,并非越大越强,A错误.
B:数据共8个,上四分位数位置为,取第6项与第7项均值,即,B正确.
C:由题意,,则,,C正确.
D:由,得,D错误.
38.(2026·江苏苏州·模拟预测)某汽车制造厂生产一种用于发动机的活塞销,其设计标准直径为,该活塞销的实际直径服从正态分布,方差为.根据生产规定:活塞销的直径在到之间为合格品,则从该汽车制造厂生产的活塞销中随机抽取一个,其为合格品的概率为______.
参考数据:若随机变量,则,,.
【答案】
【分析】先确定正态分布的均值与标准差,将合格品区间转化为均值加减若干倍标准差的形式,利用正态分布的对称性结合参考数据计算概率.
【详解】依题意,设活塞销的直径为随机变量,则,
其中,,即
合格品直径范围为,将端点变形为,,
即求
由正态分布的对称性可得:
,
所以.
39.(2026·山东临沂·二模)今有一批数量庞大的瓶装饮用水,假设这批水的某项矿物质含量偏差值(单位:毫克/升),,,现从中随机抽取n瓶,这n瓶水中恰有K瓶的矿物质含量偏差值位于区间.当时,试以使得最大的n值作为n的估计值,则n为________.
【答案】35
【分析】本题考查正态分布的性质以及概率的计算,解题的关键在于根据正态分布的性质求出矿物质含量偏差值位于区间的概率,再结合概率的计算求出的值.
【详解】计算矿物质含量偏差值位于区间的概率:
已知,则,,
因为,,
所以.
根据正态分布的性质,
,可得:
.
计算:从瓶水中随机抽取,每瓶水的矿物质含量偏差值位于区间的概率为0.84,
不位于该区间的概率为,
这是一个二项分布问题,,根据二项分布的概率公式,
可得,
要使最大,则需满足,
由可得:,
即,
化简可得:,即,
,,解得.
由可得:,
即,化简可得:,
即,,,解得.
因为为正整数,所以.
40.(2026·河北张家口·二模)有5道题,5名女生中有2人每题都不能答对,其余3人每题都能答对,3名男生每人对每题答对的概率均为.现从上述5名女生中选择2名女生和3名男生答题,每人答一题,答对得2分,答错得0分,记得分之和为,则的数学期望为__________.
【答案】/5.4
【分析】列出所有取值,根据古典概型求解选出女生的概率,根据二项分布求解男生答题情况对应的概率,进而根据独立事件乘法公式求解每种取值对应的概率,再结合期望公式求解即可.
【详解】的可能取值为,
,
,
,
所以的数学期望.
题型5:回归分析
41.(2026·四川·模拟预测)对于变量有观测数据,得散点图1;对于变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法不正确的是( )
A. B.
C. D.
【答案】A
【分析】根据散点图及相关系数的性质,逐一分析各个选项,即可得答案.
【详解】由图1和图2可得,随的增大而增大,随的增大而减小,
所以,所以,故B正确;
因为图1的数据点比图2的更集中,所以,
所以,,故A错误,C正确;
,故D正确.
42.(2026·上海浦东新·三模)下列命题中不正确的是( )
A.线性回归方程对应的直线一定经过样本点的中心
B.线性回归方程对应的直线至少经过其样本数据点中的一个点
C.线性回归方程为时,变量与具有负的线性相关关系
D.用最小二乘法求回归方程是为了使最小
【答案】B
【分析】利用线性回归直线的性质逐个分析判断即可.
【详解】对于A,线性回归直线一定经过样本点的中心,故A正确;
对于B,线性回归直线是样本点的‘最佳’拟合直线,可能不经过任何一个样本点,故B错误;
对于C,线性回归直线中的系数为,
则变量与具有负的线性相关关系,故C正确:
对于D,最小二乘法的核心思想就是通过寻找最佳的回归系数,
使得所有的观测值与回归直线上的预测值之间的残差平方和达到最小,
数学表达式是,故D正确.
43.(2026·河北沧州·二模)某校研究性学习小组收集了某地区近几年的某种经济指标与年份的数据,经计算得经验回归方程为.若年该经济指标的实际值为,则残差为( )
A. B. C. D.
【答案】D
【详解】由经验回归方程为得:
预测值,
残差实际值预测值.
44.(2026·广东深圳·二模)(多选)某公司统计了去年1月份到5月份某种产品的销售额如下表:
月份
1
2
3
4
5
销售额万元
1.8
2.2
2.8
3.1
根据表中数据,通过最小二乘法求得的经验回归方程为,则( )
A.变量与正相关
B.
C.样本数据的下四分位数为1.8
D.当时,的预测值为4.1万元
【答案】ABD
【分析】根据回归系数,可判定A正确;根据回归直线方程经过样本中心,列出方程,求得的值,可判定B正确;根据百分位数的计算方法,可判定C错误;根据回归直线方程,求得预测值,可判定D正确.
【详解】对于A,由回归直线方程,可得,
所以变量与正相关,所以A正确;
对于B,因为回归直线方程经过样本中心,
因为,所以,
又由,解得,所以B正确;
对于C,将样本数据的数据排序为:,
由,则样本数据的下四分位数为第个数据,所以C不正确;
对于D,当时,,所以的预测值为万元,所以D正确.
45.(2026·辽宁铁岭·模拟预测)(多选)已知样本点的回归直线l的方程为,相关系数为r,样本均值分别为,.现令,.设新样本点的回归直线为,则( )
附:相关系数;回归直线方程中斜率和截距的最小二乘估计公式分别为,.
A.过点 B.的斜率为
C.u与v的相关系数为 D.的截距为
【答案】ACD
【详解】对于A,由已知样本均值性质可得新样本均值分别为与,
因为回归直线必过样本中心点,所以新回归直线过点,故A正确;
对于B,因为且,代入公式可得新回归直线方程的斜率
,故B错误;
对于C,代入公式可得新样本的相关系数
,故C正确;
对于D,由截距公式可得新回归直线的截距
,故D正确.
46.(2026·吉林延边·三模)(多选)某奶茶店统计了六天每天天气平均气温t(℃)和每天凉茶的销售数量n(单位:杯),得到以下数据:
t(℃)
3
0
5
7
9
12
n(单位:杯)
23
17
27
29
36
42
若t与n线性相关,且回归直线方程为,则( )
A.t和n正相关 B.点在回归直线上
C. D.
【答案】ABD
【分析】根据表格中的数据,求得样本中心,结合选项,逐项分析、计算,即可求解.
【详解】根据表格中的数据,可得,
即数据的样本中心为,
对于A,由表格中的数据得,当气温从0到12时,从17增加到42,
所以随着气温的升高,凉茶的销售数量总体呈上升趋势,所以t和n正相关,故A正确;
对于B,根据回归直线过样本中心,所以点在回归直线上,所以B正确;
对于C,由气温t和销售数量总体上正相关,所以,所以C不正确;
对于D,由表格中的数据得:
第一组:;第二组:;
第三组:;第四组:;
第五组:;第六组:;
所以,所以D正确.
47.(2026·新疆·二模)(多选)某电子商城统计了最近5个月某品牌电脑的实际销量,如下表所示:
时间x(月份)
1
2
3
4
5
销量y(百台)
0.3
0.4
0.6
0.7
0.9
若y与x线性相关,且经验回归方程为:,则下列说法正确的是( )
A.变量x,y正相关
B.
C.可以预测当时,商城内该电脑的销量为1百台
D.当时,残差为
【答案】ABD
【分析】求出样本中心点,进而求出经验回归方程,再逐项求解判断.
【详解】对于A,由,得变量x,y正相关,A正确;
对于B,,
因此,B正确;
对于C,,当时,(百台),C错误;
对于D,当时,,残差为,D正确.
48.(2026·陕西渭南·模拟预测)在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围.令,求得经验回归方程为,则该模型的回归方程为__________.
【答案】
【分析】由回归直线方程可得:,解出即可求解.
【详解】因为,,所以,
则
49.(2026·山东滨州·二模)已知变量和变量的一组成对样本数据为,其中,其回归直线方程为,当增加两个样本数据和后,经重新计算得到新回归直线的斜率为3,则在新的回归直线方程的估计下,样本数据所对应的残差为__________.(残差观测值预测值)
【答案】/
【分析】将样本中心点代入回归方程中求出,即可得出,进而得出新数据的样本中心点和回归方程,代入计算即可.
【详解】由题意得,,
则,,
当增加两个样本数据和后,
变量的平均数为,变量的平均数为,
因为新回归直线的斜率为3,所以可设其方程为,
将代入得,则,
令,则,则样本数据所对应的残差为.
50.(2026·福建南平·二模)用函数拟合一组数据,则观测数据的残差为________.
【答案】
【详解】当时,,
所以残差为
题型6:独立性检验
51.(2026·天津和平·三模)以下说法不正确的是( )
A.样本数据1,1,1,3,3,3的极差为2,标准差为1
B.对具有线性相关关系的变量,,其经验回归方程为,若样本数据的中心点为,则实数的值为2
C.对一个容量为的总体,抽取容量为的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,三种方法的总体中每个个体被抽中的概率均相等
D.根据分类变量与的成对样本数据,计算得到,则依据的独立性检验,可以认为“与无关联”
【答案】D
【详解】对于A,在样本数据1,1,1,3,3,3中,最大值是3,最小值是1,所以极差为.
样本数据的平均数为,则标准差,所以选项A正确.
对于B,已知经验回归方程为,样本数据的中心点为,
因为样本数据的中心点为一定在经验回归方程上,所以,则,所以选项B正确.
对于C,简单随机抽样、系统抽样和分层抽样都是等概率抽样,即总体中每个个体被抽中的概率均为,所以选项C正确.
对于D,已知,依据的独立性检验,
当时,我们有的把握认为“与有关联”,所以选项D错误.
52.(2026·天津河西·一模)下列说法中错误的有( )
①回归直线恒过点,且至少过一个样本点;
②根据列联表中的数据计算得出,而,则“两个分类变量有关联”此推断犯错误的概率不大于0.01;
③回归分析时,可以用决定系数刻画模型的回归效果,越大,则拟合的效果越好;
④若随机变量服从正态分布,若则实数
A.1个 B.2个 C.3个 D.4个
【答案】A
【分析】利用回归直线的特点可判断①;利用独立性检验可判断②;利用决定系数与模型拟合效果的关系可判断③;利用正态分布对称性和性质可判断④.
【详解】对于①,回归直线恒过点,不一定过样本点,故①错误;
对于②,根据列联表中的数据计算得出,而,
则有的把握认为两个分类变量有关系,则“两个分类变量有关联”此推断犯错误的概率不大于0.01,故②正确;
对于③,在做回归分析时,可以用决定系数刻画模型的回归效果,若越大,则说明模型拟合的效果越好,故③正确;
对于④,由随机变量,其正态曲线关于直线对称,
由,若,则,即得,
所以,故④正确.
综上,错误的只有①.
53.(2026·天津·一模)近年中国新能源汽车进入高速发展时期,为了了解消费者的购车类型与地域是否具有相关性,某品牌汽车商随机调查了甲、乙两地各200名消费者,并用等高堆积条形图直观地展示调查结果如下图所示,经计算得到.
车型与地区
下表是独立性检验中几个常用的小概率值和相应的临界值.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
下列说法正确的是( )
A.在所调查的甲地购车者中,若按比例分层随机抽样抽取20人,则新能源车主有8人
B.在所调查的乙地购车者中,购买燃油车的人数比新能源车的多20人
C.依据的独立性检验,即消费者的购车类型与地域有关联,此推断犯错误的概率不大于0.001
D.依据的独立性检验,即消费者的购车类型与地域无关联,此推断犯错误的概率不大于0.001
【答案】C
【分析】借助分层随机抽样定义计算可得A;分别计算出购买燃油车的人数与购买新能源车的人数可得B;利用独立性检验定义可得C、D.
【详解】对A:,故新能源车主有人,故A错误;
对B:购买燃油车的人数为,
购买新能源车的人数为,
则购买燃油车的人数比新能源车的多人,故B错误;
对C、D:依据的独立性检验,即消费者的购车类型与地域有关联,
由,故此推断犯错误的概率不大于,故C正确、D错误.
54.(2026·天津河北·一模)以下结论错误的是( )
A.根据列联表中的数据计算得出,而,则根据小概率值的独立性检验,认为两个分类变量有关系
B.在回归直线中,变量时,变量y的值一定是15
C.的值越大,两个事件的相关性的可能性就越大
D.在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好
【答案】B
【分析】对于AC,根据独立性检验的定义和性质进行求解;对于BD,根据回归直线的概念和性质进行求解.
【详解】对于选项A:,故根据小概率值的独立性检验,认为两个分类变量有关系,即A正确:
对于选项B,回归直线方程中,当变量等于200时,的值平均是15,不能说一定是15,故B错误;
对于选项C:越大,“与有关系”可信程度越大,即相关性的可能性就越大,即C正确;
对于选项D:在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好,即D正确.
55.(2026·浙江绍兴·模拟预测)(多选)下列说法正确的是( )
A.一组数据1,2,4,5,5,6,7,8的第70百分位数为5
B.若随机变量,则的正态曲线关于直线对称
C.根据分类变量与的成对数据,计算得到,根据小概率值的独立性检验:,可判断与有关联,此推断犯错误的概率不超过
D.数据组成一个样本,其回归直线方程为,其中,则
【答案】BCD
【详解】对于A,该组数据共8个,由不是整数,应取从小到大排列的第6项数据,即6,故A错误;
对于B,由正态分布及正态曲线知,随机变量的正态曲线关于直线对称,故B正确;
对于C,由独立性检验的判断,,所以与有关联,此推断犯错误的概率不超过,故C正确;
对于D,回归直线方程为,其中,则故D正确.
56.(2026·江苏·模拟预测)(多选)下列结论正确的是( )
A.一组样本数据通过计算得到线性回归方程为,若,则
B.一组数据的第80百分位数是11.5
C.已知随机变量,若,则
D.在列联表中,若每个数据均变成原来的2倍,则不变(,其中)
【答案】AB
【分析】将样本中心代入回归方程,求出a值,可判断A的正误,根据百分位数的求法,可判断B的正误;根据二项分布的方差公式,可得,根据变量间的关系,计算求解,可判断C的正误;根据计算公式,代入求解,可判断D的正误.
【详解】选项A:将代入回归方程,得,解得,故A正确;
选项B:,则该组数据的第80百分位数为,故B正确;
选项C:由,得,
所以,解得,故C错误;
选项D:若每个数据均变成原来的2倍,
则
,则改变,故D错误.
57.(2026·江西抚州·二模)(多选)某校团委对“学生性别和是否喜欢运动的关联性”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢运动的人数占男生人数的,女生中喜欢运动的人数占女生人数的,若有的把握,但没有的把握认为“学生性别和是否喜欢运动有关”,则被调查的男生人数可能为( )
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.25 B.45 C.60 D.75
【答案】BC
【详解】设男生人数为,则女生人数也为,列出列联表如表所示:
性别
是否喜欢运动
合计
喜欢
不喜欢
男生
女生
合计
由题意得,解得,
故A,D错误,B,C正确.
58.(2026·山东聊城·二模)(多选)某医学研究团队为探究新型降压药的疗效与患者年龄的关联,将120名高血压患者按年龄分为“中青年组(<60岁)”和“老年组(岁)”,记录用药后的疗效(“有效”“无效”),得到如下列联表:
患者
疗效
总计
有效
无效
中青年组
10
40
50
老年组
40
30
70
总计
50
70
120
附:,其中.
0.10
0.05
0.025
0.01
2.706
3.841
5.024
6.635
则下列说法中正确的有( )
A.若在“老年组”中按疗效分层抽样抽取7人,再从这7人中随机抽取2人,则至少抽到1名“无效”患者的概率为
B.从所有患者中随机抽取1人,设事件“该人在中青年组”,事件“该药对此人有效”,则事件A与B相互独立
C.根据小概率值的独立性检验,认为“降压药疗效与患者年龄有关”,且该推断犯错误的概率不超过
D.若将列联表中“中青年组有效”的人数改为15,“中青年组无效”的人数改为35,则所得值比原值大
【答案】AC
【分析】选项A,用分层抽样先确定抽出的“有效”和“无效”人数,再做组合概率;选项B,用独立事件定义检验是否等于;选项C,计算列联表的值,与临界值比较;选项D分别计算修改前后的值大小.
【详解】选项A,老年组中有效与无效的人数比为
按疗效分层抽样抽取7人,则应抽到:4人有效,3人无效,
再从这 7 人中随机抽取 2 人,至少抽到 1 名无效患者的概率为所以 A 正确;
选项B,设事件:表示“该人在中青年组”,事件:表示“该药对此人有效”,
则而
若相互独立,则应有
显然所以事件与不相互独立,B 错误;
选项C,由题中列联表,
所以
即
因为所以根据小概率值的独立性检验,
可以认为“降压药疗效与患者年龄有关”,且该推断犯错误的概率不超过,所以C正确;
选项D,若将“中青年组有效”改为 15,“中青年组无效”改为 35,
则新列联表中
此时
即,而原来的
所以修改后的值比原来的小,D 错误.
59.(2026·江苏南通·三模)为研究课后整理错题习惯与数学成绩达标之间的关联性,经独立性检验计算得,临界值,.记事件为“学生成绩达标”,事件为“学生坚持整理错题”;已知,,,则有________的把握认为二者存在关联;随机抽取一名学生,其成绩达标的概率为________.
【答案】 /
【详解】由,且,即有的把握认为二者存在关联,
由题设,则,
所以随机抽取一名学生,其成绩达标的概率为.
60.(2026·上海·二模)某工厂为判断两种不同的操作方法是否对生产某种零件的合格个数有影响,收集了相关数据,绘制了列联表,设原假设:两种不同的操作方法对生产该种零件的合格个数没有影响,计算出统计量,已知,则在显著性水平下,推断的结论为________.(用“拒绝”或“接受”填空)
【答案】拒绝
【详解】在独立性检验中,当计算出的统计量大于给定显著性水平对应的临界值时,样本数据出现的概率小于,
属于小概率事件,根据小概率原理,我们拒绝原假设,认为两个变量之间存在显著关联,
本题中,所以拒绝,即认为两种操作方法对合格个数有影响.
1 / 1
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。