内容正文:
第12讲 统计概率小题:
排列组合、二项式、统计概率、百分位数、条形统计
知识核心
一、二项式定理
(1)二项式定理:(a+b)n=Can+Can-1b+…+ Can-kbk+…+Cbn(n∈N*);
(2)通项公式:Tk+1=Can-kbk,它表示第k+1项;
(3)二项式系数:二项展开式中各项的系数为C,C,…,C.
(4)(a+b)n的展开式的二项式系数和等于2n,即C+C+C+…+C+…+C=2n.
偶数项的二项式系数的和等于奇数项的二项式系数的和=C+C+C+…=C+C+C+…=
(5)若,则使用赋值法
①常数项:令,得;②各项系数和:令,得
二、条件概率
1、互斥事件:不可能同时发生;P(A+B)=P(A)+P(B).
2、对立事件:不可能同时发生,且必有一个发生
3、独立事件:一个事件的发生对另一个事件发生没有影响,两个事件相互独立不一定互斥;P(AB)= P(A)·P(B)
独立事件的性质:如果事件A与事件B相互独立,则与,与,与也都相互独立
4、条件概率定义:发生的条件下,发生的概率:(定义法、样本点数法)
5、解释:(1)表示事件和同时发生的概率;
(2)条件概率的乘法公式:
(3)设和互为对立事件,则
(4)如果和是两个互斥事件,则;
6、全概率公式:设,,是一组两两互斥的事件,,则对任意的事件,有,我们称此公式为全概率公式
三、离散型随机变量的分布列
(1)分布列的定义:①解析式法:i,;②表格法:
…
…
…
…
(2)分布列的性质:①,; ②
(3)均值、期望:
(4)均值的性质:若,则由与之间分布列的关系可知
(5)方差
(6)随机变量的标准差:;
(7)方差的性质:
(8)方差与期望:
四、四种分布列
(一)两点分布或者0-1分布:只有2种情况的实验
0
1
用表示“成功”,表示“失败”,如果,则,那么的分布列如上:
;
(二)二项分布,记作:两点分布重复多次的实验
设事件发生的概率为,用表示发生的次数,则的分布列为:
,
(三)超几何分布:一批产品共有件,其中有件次品,从件产品中随机抽取件(不放回),用表示抽取的件产品中的次品数,则的分布列为
二项分布与超几何分布的区别
若有放回抽样的抽取,则服从二项分布;若不放回抽样的抽取,则服从超几何分布.
超几何分布需要知道总体容量,二项分布不需要知道总体容量,但需要知道成功率
(四)正态曲线,记为
(1)正态曲线的特点
①曲线位于轴上方,与轴不相交;②关于直线对称;
③曲线与轴之间的面积为1;④确定曲线的形状;
当一定时,曲线的形状由确定。越小,曲线越高瘦,表示总体的分布越集中;越大,曲线越矮胖,表示总体的分布越分散
(2)正态分布定义:若的概率密度函数为,称随机变量服从正态分布
(3)标准正态分布:当,时,称随机变量服从标准正态分布,密度函数
(4)正态分布的原则:正态分布在三个特殊区间的概率值
假设,可以证明:对给定的是一个只与有关的定值
特别地,
在一次试验中,的值几乎总是落在区间内,而在此区间以外取值的概率大约只有0.0027,通常认为这种情况几乎不可能发生.这在统计学中称为原则.
五、数字样本特征
(1)中位数:将一组数据按从小到大(或从大到小)的顺序排列,如果为奇数个,中位数为中间数;若为偶数个,中位数为中间两个数的平均数
(2)平均数:,反映样本的平均水平
(3)方差:
(4)标准差:,标准差等于方差的算术平方根
六、用样本估计总体
1、频率分布直方图
①×组距=频率;②频率分布直方图中各个小方形的面积总和等于
③最高的小长方形底边中点的横坐标即是众数
④中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于
⑤平均数是频率分布直方图的重心
2、计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据
②计算
③若不是整数而大于的比邻整数,则第百分位数为第项数据;
若是整数,则第百分位数为第项与第项数据的平均数.
常见的四分位数:第百分位数是中位数;第百分位数,第百分位数
3、平均数、方差的性质:如果数据的平均数为,方差为,那么
①一组新数据的平均数为,方差是
②一新数据的平均数为,方差是
③一组新数据的平均数为,方差是
定义样本方差为;
简化公式:=(原数据平方的平均数-平均数的平方)(证明)
七、成对数据的统计分析
1、回归方程:数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为
其中,,,(,)称为样本点的中心.
2、相关系数
若相应于变量的取值,变量的观测值为,
则变量与的相关系数,
通常用来衡量与之间的线性关系的强弱,的范围为.
①当时,表示两个变量正相关;当时,表示两个变量负相关.
②越接近,表示两个变量的线性相关性越强;
越接近,表示两个变量间几乎不存在线性相关关系;
当时,所有数据点都在一条直线上
③通常当时,认为两个变量具有很强的线性相关关系
3、残差分析
(1)对于观测值,通过回归方程得到的称为预测值,观测值减去预测值等于残差,即有.
(2)残差平方和,如果越小,则拟合效果越好
(3)相关指数:.越接近于,说明残差的平方和越小,也表示回归的效果越好.
统计概率:真题
考点01有限制条件的排列问题
1.(2024·全国甲卷·高考真题)某独唱比赛的决赛阶段共有甲、乙、丙、丁四人参加,每人出场一次,出场次序由随机抽签确定,则丙不是第一个出场,且甲或乙最后出场的概率是( )
A. B. C. D.
【详解】解法一:画出树状图,如图,
由树状图可得,出场次序共有24种,其中符合题意的出场次序共有8种,故所求概率;
解法二:当甲最后出场,乙第一个出场,丙有种排法,丁就种,共种;
当甲最后出场,乙排第二位或第三位出场,丙有种排法,丁就种,共种;
于是甲最后出场共种方法,同理乙最后出场共种方法,于是共种出场顺序符合题意;
基本事件总数显然是,根据古典概型的计算公式,所求概率为.故选:C
2.(2025·上海·高考真题)4个家长和2个儿童去爬山,6个人需要排成一条队列,要求队列的头和尾均是家长,则不同的排列个数有 种.
【详解】先选两位家长排在首尾有种排法;再排对中的四人有种排法,
故有种排法.故答案为:288
3.(2022·新高考全国Ⅱ卷·高考真题)有甲、乙、丙、丁、戊5名同学站成一排参加文艺汇演,若甲不站在两端,丙和丁相邻,则不同排列方式共有( )
A.12种 B.24种 C.36种 D.48种
【详解】因为丙丁要在一起,先把丙丁捆绑,看做一个元素,连同乙,戊看成三个元素排列,有种排列方式;为使甲不在两端,必须且只需甲在此三个元素的中间两个位置任选一个位置插入,有2种插空方式;注意到丙丁两人的顺序可交换,有2种排列方式,故安排这5名同学共有:种不同的排列方式,
故选:B
4.(2021·全国甲卷·高考真题)将3个1和2个0随机排成一行,则2个0不相邻的概率为( )
A.0.3 B.0.5 C.0.6 D.0.8
【详解】解:将3个1和2个0随机排成一行,可以是:
,共10种排法,
其中2个0不相邻的排列方法为:,共6种方法,
故2个0不相邻的概率为,故选:C.
5.(2021·全国甲卷·高考真题)将4个1和2个0随机排成一行,则2个0不相邻的概率为( )
A. B. C. D.
【详解】将4个1和2个0随机排成一行,可利用插空法,4个1产生5个空,
若2个0相邻,则有种排法,若2个0不相邻,则有种排法,
所以2个0不相邻的概率为.故选:C.
6.(2024·上海·高考真题)设集合中的元素皆为无重复数字的三位正整数,且元素中任意两个不同元素之积皆为偶数,求集合中元素个数的最大值 .
【详解】由题意知集合中且至多只有一个奇数,其余均是偶数.首先讨论三位数中的偶数,
①当个位为0时,则百位和十位在剩余的9个数字中选择两个进行排列,则这样的偶数有个;
②当个位不为0时,则个位有个数字可选,百位有个数字可选,十位有个数字可选,
根据分步乘法这样的偶数共有,
最后再加上单独的奇数,所以集合中元素个数的最大值为个.故答案为:329.
7.(2023·全国甲卷·高考真题)现有5名志愿者报名参加公益活动,在某一星期的星期六、星期日两天,每天从这5人中安排2人参加公益活动,则恰有1人在这两天都参加的不同安排方式共有( )
A.120 B.60 C.30 D.20
【详解】不妨记五名志愿者为,
假设连续参加了两天公益活动,再从剩余的4人抽取2人各参加星期六与星期天的公益活动,共有种方法,
同理:连续参加了两天公益活动,也各有种方法,
所以恰有1人连续参加了两天公益活动的选择种数有种.故选:B.
考点02组合问题
8.(2023·新课标Ⅱ卷·高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( ).
A.种 B.种
C.种 D.种
【详解】根据分层抽样的定义知初中部共抽取人,高中部共抽取,
根据组合公式和分步计数原理则不同的抽样结果共有种.故选:D.
9.(2022·新高考全国Ⅰ卷·高考真题)从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为( )
A. B. C. D.
【详解】从2至8的7个整数中随机取2个不同的数,共有种不同的取法,
若两数不互质,不同的取法有:,共7种,
故所求概率.故选:D.
10.(2023·全国甲卷·高考真题)某校文艺部有4名学生,其中高一、高二年级各2名.从这4名学生中随机选2名组织校文艺汇演,则这2名学生来自不同年级的概率为( )
A. B. C. D.
【详解】依题意,从这4名学生中随机选2名组织校文艺汇演,总的基本事件有件,
其中这2名学生来自不同年级的基本事件有,
所以这2名学生来自不同年级的概率为.故选:D.
11.(2021·全国乙卷·高考真题)将5名北京冬奥会志愿者分配到花样滑冰、短道速滑、冰球和冰壶4个项目进行培训,每名志愿者只分配到1个项目,每个项目至少分配1名志愿者,则不同的分配方案共有( )
A.60种 B.120种 C.240种 D.480种
【详解】根据题意,有一个项目中分配2名志愿者,其余各项目中分配1名志愿者,可以先从5名志愿者中任选2人,组成一个小组,有种选法;然后连同其余三人,看成四个元素,四个项目看成四个不同的位置,四个不同的元素在四个不同的位置的排列方法数有4!种,根据乘法原理,完成这件事,共有种不同的分配方案,故选:C.
12.(2023·全国乙卷·高考真题)甲乙两位同学从6种课外读物中各自选读2种,则这两人选读的课外读物中恰有1种相同的选法共有( )
A.30种 B.60种 C.120种 D.240种
【详解】首先确定相同得读物,共有种情况,
然后两人各自的另外一种读物相当于在剩余的5种读物里,选出两种进行排列,共有种,
根据分步乘法公式则共有种,故选:C.
13.(2024·天津·高考真题)某校组织学生参加农业实践活动,期间安排了劳动技能比赛,比赛共5个项目,分别为整地做畦、旱田播种、作物移栽、田间灌溉、藤架搭建,规定每人参加其中3个项目.假设每人参加每个项目的可能性相同,则甲同学参加“整地做畦”项目的概率为 ;已知乙同学参加的3个项目中有“整地做畦”,则他还参加“田间灌溉”项目的概率为 .
【详解】解法一:列举法,给这5个项目分别编号为,从五个活动中选三个的情况有:
,共10种情况,
其中甲选到有6种可能性:,
则甲参加“整地做畦”的概率为:;
乙选活动有6种可能性:,其中再选择有3种可能性:,
故乙参加的3个项目中有“整地做畦”,则他还参加“田间灌溉”项目的概率为.
解法二:设甲、乙选到为事件,乙选到为事件,则甲选到的概率为;
乙选了活动,他再选择活动的概率为;故答案为:;
14.(2022·上海·高考真题)为了检测学生的身体素质指标,从游泳类1项,球类3项,田径类4项共8项项目中随机抽取4项进行检则,则每一类都被抽到的概率为 ;
【详解】解:从游泳类1项,球类3项,田径类4项共8项项目中随机抽取4项进行检测,则每一类都被抽到的方法共有种,而所有的抽取方法共有种,
故每一类都被抽到的概率为==,
15.(2023·新课标Ⅰ卷·高考真题)某学校开设了4门体育类选修课和4门艺术类选修课,学生需从这8门课中选修2门或3门课,并且每类选修课至少选修1门,则不同的选课方案共有 种(用数字作答).
【详解】(1)当从8门课中选修2门,则不同的选课方案共有种;
(2)当从8门课中选修3门,
①若体育类选修课1门,则不同的选课方案共有种;
②若体育类选修课2门,则不同的选课方案共有种;综上所述:不同的选课方案共有种.
16.(2022·全国甲卷·高考真题)从正方体的8个顶点中任选4个,则这4个点在同一个平面的概率为 .
【详解】从正方体的个顶点中任取个,有个结果,这个点在同一个平面的有个,故所求概率.
17.(2022·全国乙卷·高考真题)从甲、乙等5名同学中随机选3名参加社区服务工作,则甲、乙都入选的概率为 .
【详解】解法一:设这5名同学分别为甲,乙,1,2,3,从5名同学中随机选3名,
有:(甲,乙,1),(甲,乙,2),(甲,乙,3),(甲,1,2),(甲,1,3),(甲,2,3),(乙,1,2),(乙,1,3),(乙,2,3),(1,2,3),共10种选法;
其中,甲、乙都入选的选法有3种,故所求概率.故答案为:.
解法二:从5名同学中随机选3名的方法数为
甲、乙都入选的方法数为,所以甲、乙都入选的概率;故答案为:
18.(2021·上海·高考真题)某人某天需要运动总时长大于等于60分钟,现有五项运动可以选择,如下表所示,问有几种运动方式组合
A运动
B运动
C运动
D运动
E运动
7点8点
8点9点
9点10点
10点11点
11点12点
30分钟
20分钟
40分钟
30分钟
30分钟
【详解】由题意,至少要选2种运动,并且选2种运动的情况中,的组
合是不符题意的,∴,故答案为:23.
考点03求二项式展开式的特定项
19.(2022·新高考全国Ⅰ卷·高考真题)的展开式中的系数为 (用数字作答).
【详解】因为,
所以的展开式中含的项为,
的展开式中的系数为-28;故答案为:-28
30.(2022·上海·高考真题)二项式的展开式中,项的系数是常数项的5倍,则 ;
【详解】由题知 ,当 时,的系数为 ;当 时,常数项为 ;
又的系数是常数项的5倍,所以,解得 .
考点04二项式展开式项的系数和
20.(2022·北京·高考真题)若,则( )
A.40 B.41 C. D.
【详解】令,则,令,则,故,故选:B.
21.(2025·北京·高考真题)已知,则 ; .
【详解】令,则,又,
故,
令,则,
令,则,故;故答案为:.
22.(2022·浙江·高考真题)已知多项式,则 , .
【详解】含的项为:,故;
令,即,令,即,∴,故答案为:;.
23.(2021·浙江·高考真题)已知多项式,则 , .
【详解】, ,
所以,,所以.故答案为:.
考点05项的系数最值问题
24.(2024·全国甲卷·高考真题)的展开式中,各项系数中的最大值为 .
【详解】由题展开式通项公式为,且,
设展开式中第项系数最大,则,,即,又,故,
所以展开式中系数最大的项是第9项,且该项系数为.故答案为:5.
25.(2021·上海·高考真题)的二项展开式中有且仅有的系数为最大值,则的系数为 .
【详解】因为的二项展开式中有且仅有的系数为最大值,则,
故的二项展开式的通项为,
由可得,故的系数为.故答案为:.
26.【多选】(2023·新课标Ⅰ卷·高考真题)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
【详解】对于选项A:设的平均数为,的平均数为,
则,
因为没有确定的大小关系,所以无法判断的大小,例如:,可得;例如,可得;例如,可得;故A错误;
对于选项B:不妨设,
可知的中位数等于的中位数均为,故B正确;
对于选项C:举反例说明,例如:,则平均数,
标准差,
,则平均数,
标准差,显然,即,
所以的标准差不小于的标准差,这一论断不成立,故C错误;
对于选项D:不妨设,
则,当且仅当时,等号成立,故D正确;故选:BD.
27.(2022·新高考全国Ⅱ卷·高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间的概率;
(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
【详解】(1)平均年龄
(岁).
(2)设“一人患这种疾病的年龄在区间”,所以
.
(3)设“任选一人年龄位于区间[40,50)”,“从该地区中任选一人患这种疾病”,
则由已知得:
,
则由条件概率公式可得
从该地区中任选一人,若此人的年龄位于区间,此人患这种疾病的概率为.
考点06相关系数
28.(2025·天津·高考真题)下列说法中错误的是( )
A.若,则
B.若,,则
C.越接近1,相关性越强
D.越接近0,相关性越弱
【详解】对于A,根据正态分布对称性可知,,A说法正确;
对于B,根据正态分布对称性可知,,B说法错误;
对于C和D,相关系数越接近0,相关性越弱,越接近1,相关性越强,故C和D说法正确.故选:B
考点07古典概型
29.(2023·全国甲卷·高考真题)某校文艺部有4名学生,其中高一、高二年级各2名.从这4名学生中随机选2名组织校文艺汇演,则这2名学生来自不同年级的概率为( )
A. B. C. D.
【详解】依题意,从这4名学生中随机选2名组织校文艺汇演,总的基本事件有件,
其中这2名学生来自不同年级的基本事件有,所以这2名学生来自不同年级的概率为.选D.
30.(2023·全国乙卷·高考真题)某学校举办作文比赛,共6个主题,每位参赛同学从中随机抽取一个主题准备作文,则甲、乙两位参赛同学抽到不同主题概率为( )
A. B. C. D.
【详解】用1,2,3,4,5,6表示6个主题,甲、乙二人每人抽取1个主题的所有结果如下表:
乙甲
1
2
3
4
5
6
1
2
3
4
5
6
共有36个不同结果,它们等可能,其中甲乙抽到相同结果有,共6个,
因此甲、乙两位参赛同学抽到不同主题的结果有30个,概率.故选:A
31.(2022·全国甲卷·高考真题)从分别写有1,2,3,4,5,6的6张卡片中无放回随机抽取2张,则抽到的2张卡片上的数字之积是4的倍数的概率为( )
A. B. C. D.
【详解】【最优解】无序从6张卡片中无放回抽取2张,共有15种情况,其中数字之积为4的倍数的有6种情况,故概率为.故选:C.
32.(2022·新高考全国Ⅰ卷·高考真题)从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为( )
A. B. C. D.
【详解】从2至8的7个整数中随机取2个不同的数,共有种不同的取法,
若两数不互质,不同的取法:,共7种,故所求概率D.
33.(2021·全国甲卷·高考真题)将4个1和2个0随机排成一行,则2个0不相邻的概率为( )
A. B. C. D.
【详解】将4个1和2个0随机排成一行,可利用插空法,4个1产生5个空,
若2个0相邻,则有种排法,若2个0不相邻,则有种排法,
所以2个0不相邻的概率为.故选:C.
34.(2022·上海·高考真题)为了检测学生的身体素质指标,从游泳类1项,球类3项,田径类4项共8项项目中随机抽取4项进行检则,则每一类都被抽到的概率为 ;
【详解】
解:从游泳类1项,球类3项,田径类4项共8项项目中随机抽取4项进行检测,则每一类都被抽到的方法共有种,而所有的抽取方法共有种,
故每一类都被抽到的概率为==,
35.(2022·全国甲卷·高考真题)从正方体的8个顶点中任选4个,则这4个点在同一个平面的概率为 .
【详解】从正方体的个顶点中任取个,有个结果,这个点在同一个平面的有个,故所求概率.
36.(2022·全国乙卷·高考真题)从甲、乙等5名同学中随机选3名参加社区服务工作,则甲、乙都入选的概率为 .
【详解】解法一:设这5名同学分别为甲,乙,1,2,3,从5名同学中随机选3名,
有:(甲,乙,1),(甲,乙,2),(甲,乙,3),(甲,1,2),(甲,1,3),(甲,2,3),(乙,1,2),(乙,1,3),(乙,2,3),(1,2,3),共10种选法;
其中,甲、乙都入选的选法有3种,故所求概率.故答案为:.
解法二:从5名同学中随机选3名的方法数为
甲、乙都入选的方法数为,所以甲、乙都入选的概率故答案为:
考点08相互独立事件
37.(2021·新高考全国Ⅰ卷·高考真题)有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回的随机取两次,每次取1个球,甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则( )
A.甲与丙相互独立 B.甲与丁相互独立
C.乙与丙相互独立 D.丙与丁相互独立
【详解】 ,
故选:B
38.(2025·上海·高考真题)己知事件A、B相互独立,事件A发生的概率为,事件B发生的概率为,则事件发生的概率为( )
A. B. C. D.0
【详解】因为相互独立,故,故选:B.
39.(2023·天津·高考真题)把若干个黑球和白球(这些球除颜色外无其它差异)放进三个空箱子中,三个箱子中的球数之比为.且其中的黑球比例依次为.若从每个箱子中各随机摸出一球,则三个球都是黑球的概率为 ;若把所有球放在一起,随机摸出一球,则该球是白球的概率为 .
【详解】设甲、乙、丙三个盒子中的球的个数分别为,所以总数为,
所以甲盒中黑球个数为,白球个数为;乙盒中黑球个数为,白球个数为;
丙盒中黑球个数为,白球个数为;
记“从三个盒子中各取一个球,取到的球都是黑球”为事件,所以,;
记“将三个盒子混合后取出一个球,是白球”为事件,黑球总共有个,白球共有个,
所以,.故答案为:;.
40.【多选】(2023·新课标Ⅱ卷·高考真题)在信道内传输0,1信号,信号的传输相互独立.发送0时,收到1的概率为,收到0的概率为;发送1时,收到0的概率为,收到1的概率为. 考虑两种传输方案:单次传输和三次传输.单次传输是指每个信号只发送1次,三次传输 是指每个信号重复发送3次.收到的信号需要译码,译码规则如下:单次传输时,收到的信号即为译码;三次传输时,收到的信号中出现次数多的即为译码(例如,若依次收到1,0,1,则译码为1).
A.采用单次传输方案,若依次发送1,0,1,则依次收到l,0,1的概率为
B.采用三次传输方案,若发送1,则依次收到1,0,1的概率为
C.采用三次传输方案,若发送1,则译码为1的概率为
D.当时,若发送0,则采用三次传输方案译码为0的概率大于采用单次传输方案译码为0的概率
【详解】对于A,依次发送1,0,1,则依次收到l,0,1的事件是发送1接收1、发送0接收0、发送1接收1的3个事件的积,它们相互独立,所以所求概率为,A正确;
对于B,三次传输,发送1,相当于依次发送1,1,1,则依次收到l,0,1的事件,
是发送1接收1、发送1接收0、发送1接收1的3个事件的积,
它们相互独立,所以所求概率为,B正确;
对于C,三次传输,发送1,则译码为1的事件是依次收到1,1,0、1,0,1、0,1,1和1,1,1的事件和,
它们互斥,由选项B知,所以所求的概率为,C错误;
对于D,由选项C知,三次传输,发送0,则译码为0的概率,
单次传输发送0,则译码为0的概率,而,
因此,即,D正确.故选:ABD
考点09条件概率与全概率公式
41.(2023·全国甲卷·高考真题)某地的中学生中有的同学爱好滑冰,的同学爱好滑雪,的同学爱好滑冰或爱好滑雪.在该地的中学生中随机调查一位同学,若该同学爱好滑雪,则该同学也爱好滑冰的概率为( )
A.0.8 B.0.6 C.0.5 D.0.4
【详解】同时爱好两项的概率为,记“该同学爱好滑雪”为事件,记“该同学爱好滑冰”为事件,则,所以.故选:.
42.(2024·天津·高考真题)某校组织学生参加农业实践活动,期间安排了劳动技能比赛,比赛共5个项目,分别为整地做畦、旱田播种、作物移栽、田间灌溉、藤架搭建,规定每人参加其中3个项目.假设每人参加每个项目的可能性相同,则甲同学参加“整地做畦”项目的概率为 ;已知乙同学参加的3个项目中有“整地做畦”,则他还参加“田间灌溉”项目的概率为 .
【详解】解法一:列举法,给这5个项目分别编号为,从五个活动中选三个的情况有:
,共10种情况,
其中甲选到有6种可能性:,则甲参加“整地做畦”的概率为:;
乙选活动有6种可能性:,其中再选择有3种可能性:,
故乙参加的3个项目中有“整地做畦”,则他还参加“田间灌溉”项目的概率为.
解法二:设甲、乙选到为事件,乙选到为事件,则甲选到的概率为;
乙选了活动,他再选择活动的概率为故答案为:;
43.(2022·天津·高考真题)52张扑克牌,没有大小王,无放回地抽取两次,则两次都抽到A的概率为 ;已知第一次抽到的是A,则第二次抽取A的概率为
【详解】由题意,设第一次抽到A的事件为B,第二次抽到A的事件为C,
则.故答案为:;.
44.(2024·上海·高考真题)某校举办科学竞技比赛,有3种题库,题库有5000道题,题库有4000道题,题库有3000道题.小申已完成所有题,已知小申完成题库的正确率是0.92,题库的正确率是0.86,题库的正确率是0.72.现他从所有的题中随机选一题,正确率是 .
【详解】由题意知,题库的比例为:, 各占比分别为,
则根据全概率公式知所求正确率.故答案为:0.85.
45.(2025·天津·高考真题)小桐操场跑圈,一周2次,一次5圈或6圈.第一次跑5圈或6圈的概率均为0.5,若第一次跑5圈,则第二次跑5圈的概率为0.4,6圈的概率为0.6;若第一次跑6圈,则第二次跑5圈的概率为0.6,6圈的概率为0.4.小桐一周跑11圈的概率为 ;若一周至少跑11圈为动量达标,则连续跑4周,记合格周数为X,则期望
【详解】设小桐一周跑11圈为事件A,设第一次跑5圈为事件,设第二次跑5圈为事件,
则;
若至少跑11圈为运动量达标为事件,,
所以,;故答案为:;
考点10求离散型随机变量的均值
46.(2022·浙江·高考真题)现有7张卡片,分别写上数字1,2,2,3,4,5,6.从这7张卡片中随机抽取3张,记所抽取卡片上数字的最小值为,则 , .
【详解】从写有数字1,2,2,3,4,5,6的7张卡片中任取3张共有种取法,其中所抽取的卡片上的数字的最小值为2的取法有种,所以,由已知可得的取值有1,2,3,4,
,,
所以,故答案为:,.
47.(2025·全国一卷·高考真题)一个箱子里有5个相同的球,分别以1~5标号,若每次取一颗,有放回地取三次,记至少取出一次的球的个数X,则数学期望 .
【详解】法一:依题意,的可能取值为1、2、3,总的选取可能数为,
其中:三次抽取同一球,选择球的编号有5种方式,故,
:恰好两种不同球被取出(即一球出现两次,另一球出现一次),
选取出现两次的球有5种方式,选取出现一次的球有4种方式,
其中选取出现一次球的位置有3种可能,故事件的可能情况有种,故,
:三种不同球被取出,由排列数可知事件的可能情有况种,
故,所以.
考点11正态分布
48.(2021·新高考全国Ⅱ卷·高考真题)某物理量的测量结果服从正态分布,下列结论中不正确的是( )
A.越小,该物理量在一次测量中在的概率越大
B.该物理量在一次测量中大于10的概率为0.5
C.该物理量在一次测量中小于9.99与大于10.01的概率相等
D.该物理量在一次测量中落在与落在的概率相等
【详解】对于A,为数据的方差,所以越小,数据在附近越集中,所以测量结果落在内的概率越大,故A正确;
对于B,由正态分布密度曲线的对称性可知该物理量一次测量大于10的概率为,故B正确;
对于C,由正态分布密度曲线的对称性可知该物理量一次测量结果大于的概率与小于的概率相等,故C正确;
对于D,因为该物理量一次测量结果落在的概率与落在的概率不同,所以一次测量结果落在的概率与落在的概率不同,故D错误.故选:D.
49.【多选】(2024·新课标Ⅰ卷·高考真题)随着“一带一路”国际合作的深入,某茶叶种植区多措并举推动茶叶出口.为了解推动出口后的亩收入(单位:万元)情况,从该种植区抽取样本,得到推动出口后亩收入的样本均值,样本方差,已知该种植区以往的亩收入服从正态分布,假设推动出口后的亩收入服从正态分布,则( )(若随机变量Z服从正态分布,)
A. B.
C. D.
【详解】依题可知,,所以,
故,C正确,D错误;
因为,所以,
因为,所以,
而,B正确,A错误,故选:BC.
统计概率:2年模拟
1. (2026浙江金丽衢一模)有一组数据,则( )
A. 该组数据的极差为6
B. 该组数据的中位数为5
C. 该组数据平均数为4
D. 将数据1均改3后,方差会变大
【详解】数据的极差为,所以A正确;数据的中位数为,故B错误;
数据的平均数为,故C正确;
原数据的方差
.
数据1均改为3后的数据为,平均数为
.
因为,所以数据1均改为3后,方差会变小,故D错误.故选:AC
2. (2026浙江金丽衢一模)某晚会由4个歌舞节目和2个机器人表演节目组成,若要求机器人表演节目不能相邻出演且前3个节目中至少有一个是机器人表演节目,则不同的节目安排方法有( )种.
A. 216 B. 360 C. 432 D. 672
【详解】步骤1:先排 4 个歌舞节目:,排好后会产生 5 个空位(包括两端);
步骤2:将 2 个机器人节目插入空位:;
步骤3:排除“前3个节目全是歌舞”的情况:先从4个歌舞节目中选3个排在前3个位置,有种方法,剩下的1个歌舞节目和2个机器人节目排在后3个位置,且机器人节目不相邻,只能是“机器人-歌舞-机器人”的排列,有种方法.故不满足条件的情况有.
故总数为:故选:C
3. (2026四川泸州二模-多选)已知两组样本数据和,其中是的中位数,则这两组样本数据的( )
A 极差不相等 B. 中位数相等
C. 平均数相等 D. 标准差可能相等
【详解】不妨设,则,
新数据按升序排列可得,
对于选项A:两组数据的极差均为,即极差相等,故A错误;
对于选项B:两组数据的中位数均为,即中位数相等,故B正确;
对于选项C:例如,则,平均数为,
新数据的平均数为,
显然,所以平均数不相等,故C错误;对于选项D:例如,则,显然其标准差为0,新数据的标准差也为0,两者相等,故D正确;故选:BD.
4. (2026山东枣庄一模-多选)下列命题正确的是( )
A. 若,,则
B. 已知关于的经验回归方程为,且,则
C. 一组样本数据,,…,(),其中是最小值,是最大值,则,,…,的75%分位数一定与,…,的75%分位数不同
D. 若事件,满足,则与独立
【详解】对于A,由于,,则,故A错误,
对于B,将代入可得,故,B正确;
对于C,将原来17个数从小到大排列,,
则17个数的75%分位数为17个数中的第13个数,
去掉其中最大和最小两个数据后,,
故剩下的15个数据的75%分位数为15个数中的第12个数字,也是17个数中的第13个数,故两者可能相等,C错误,
对于D,,所以相互独立,因此也相互独立,D正确,
故选:BD.
5. (2026山东潍坊一模)某智慧交通管理平台为优化城市主干道通行效率,实时监测并记录各路口信号灯的运行模式.每个时段(例如早、晚高峰或特定监控周期)的运行模式对应一个代码(如下表):
运行模式
代码
绿波协调
0
红灯截流控制
1
区域协调
-1
现按时间顺序记录某路口5个时段的运行模式,如编码表示5个时段中第1,3时段是“绿波协调”运行模式,则该路口某天这5个时段的运行模式中出现绿波协调不少于3个的所有可能种数为( )
A. 40 B. 51 C. 131 D. 210
【详解】出现绿波协调个的可能种数有:;
出现绿波协调个的可能种数有:;出现绿波协调个的可能种数有:;
则出现绿波协调不少于3个的所有可能种数为.故选:B
6. (2026山东泰安一模-多选)下列选项正确的是( )
A. 对A,B,C三类个体按3:1:2的比例进行分层抽样,已知从类个体中抽取了9个,则样本容量为30
B. 若随机变量,则
C. 恒成立
D. 一组数1,2,2,2,3,3,3,4,5,6的第80百分位数为4.5
【详解】A选项,从类个体中抽取了9个,则样本容量为,A错误;
B选项,由正态分布的对称性可知,B正确;
C选项,当时,,C错误;
D选项,,故从小到大,选取第8个数和第9个数的平均数作为第80百分位数,
故1,2,2,2,3,3,3,4,5,6第80百分位数为,D正确.故选:BD
7. (2026山东泰安一模)在一个不透明的盒中装有6个大小质地完全相同的小球,分别标有数字1,2,3,4,5,6,现从盒中一次取出2个小球,设事件为“取出2个小球的数字之和大于6”,事件为“取出的2个小球中最小数字为3”,则( )
A. B. C. D.
【详解】从装有6个大小质地完全相同的小球的盒中一次取出2个小球,共有种取法,
其中事件,
有9种取法,概率,
事件,有3种取法,概率为,
所以.故选:C.
8. (2026山东济南一模)若,则的值为__________.
【详解】由,令,
则有,即.故答案为:0
9. (2026山东济南一模)我国2016-2024年科幻产业营收(单位:亿元)如下表所示:
年份
2016
2017
2018
2019
2020
2021
2022
2023
2024
时间变量
1
2
3
4
5
6
7
8
9
营收
100.0
140.0
456.4
658.7
551.1
829.6
877.5
1132.9
1089.6
根据表中数据建立与的线性回归方程,预测我国2025年科幻产业营收约为()(参考数据:)
A. 1222.1亿元 B. 1310.9亿元 C. 1339.1亿元 D. 1443.4亿元
【详解】,所以样本中心点为满足回归方程,代入得:,计算得:
所以回归方程为.2025年对应的时间变量,代入回归方程:
因此,预测我国2025年科幻产业营收为1310.9亿元.故选:B
8. (2026江西萍乡一模-多选)下列结论正确的有( )
A. 若数据,,…,的方差为9,则数据,,…,的方差为4
B. 若一组数据3,6,,,1260%分位数为8,则,的值分别可能为7,9
C. 若,,,则
D. 在的展开式中,项的系数为3
【详解】对于选项A,已知,,则,故A错误;对于选项B,数据共个,,因此60%分位数为第、个数的平均值,
将数据从小到大排列后,第3、4个数的平均值为8,当时,数据排序后为3,6,7,9,12,
此时第3、4个数的平均值为,满足条件,故B正确;
对于选项C,因为,则 ,所以,即独立,,故C正确;
对于选项D,展开式的通项为:,
的通项为:,
令,即,且.:系数,
:系数,总系数为,故D正确.故选:BCD
9. (2026江西二调)若的展开式中存在含的项,则可能等于( )
A. 5 B. 9 C. 15 D. 19
【详解】由二项式定理得,的展开式通项为,
,令,
当时,,故A错误;当时,,故B错误;
当时,,故C正确;当时,,故D错误.故选:C.
10. (2026江苏徐州一模-多选)在的二项展开式中,下列结论正确的是( )
A. 常数项是60 B. 各项系数之和是64
C. 二项式系数最大值是20 D. 不含的项
【详解】对于A,二项展开式通项为,
当时,,所以常数项是60,故A正确;
对于B,当时,,所以各项系数之和是1,故B错误;
对于C,,二项式系数最大值是,故C正确;
对于D,,当时,解得,所以二项展开式中含的项,故D错误.
故选:AC.
11. (2026江苏徐州一模)已知随机变量,且,则的最小值为( )
A. B. C. 16 D. 48
【详解】因为,正态曲线关于直线对称,
又,所以,解得.
所以,
因为,所以,
当且仅当,即时取等号.故选:C
12. (2026江苏徐州一模)已知线性相关的两个变量,的取值如表所示,如果其线性回归方程为,那么当时的残差为( )
3
4
6
7
20
40
60
A. 2 B. 3 C. 4 D. 5
【详解】由题设可得,故,
故即,故残差为,故选:A.
13. (2026江苏南通一模)若的展开式中各项的二项式系数之和为64,则展开式中的常数项为______.
【详解】因为各项的二项式系数之和为64,,即;
通项公式=令,解得.
展开式中常数项为.
14. (2026湖南株洲一模-多选)某电脑程序每次等概率随机输出中的一个数,和分别表示输出的前个数中的最大值和最小值.已知每次输出都是独立的,且可以重复输出同一个数.则下列命题正确的是( )
A. B.
C. D.
【详解】选项A:表示第一个数的最大值,即该数本身;表示第一个数的最小值,也即该数本身;
所以,,A正确;
选项B:表示输出的前3个数的最大值为3,即需满足“输出的每个数,且至少有一个数为3”.
所有数均的概率:;所有数均的概率:.
所以,B正确;
选项C:表示输出的前3个数的最小值为3,即需满足“输出的每个数,且至少有一个数为3”.
所有数均的概率:;所有数均的概率:.
所以,C错误;
选项D:记为事件,即前4个数最大值为6,为事件,前4个数最小值为3.
则.
表示前4个数最大值为6且最小值为3,即所有数均在3到6之间(含3和6),
所以.
故,D正确.故选:ABD.
15. (2026湖南长沙一模-多选)有一组数据,则( )
A. 该组数据的极差为6
B. 该组数据的中位数为5
C. 该组数据的平均数为4
D. 将数据1均改为3后,方差会变大
【详解】数据的极差为,所以A正确;数据的中位数为,故B错误;
数据的平均数为,故C正确;
原数据的方差
.
数据1均改为3后的数据为,平均数为
.
因为,所以数据1均改为3后,方差会变小,故D错误.故选:AC
16. (2026湖南长沙模拟-多选)在军训打靶测试中,四位同学各射靶5次,分别记录每次射击所命中的环数.根据这四名同学射击成绩的统计结果,可以判断出可能出现10环的是( )
A. 平均数为8,极差为3 B. 中位数为8,平均数为8
C. 中位数为7,众数为9 D. 平均数为7,方差为2.4
【详解】对于A:平均数为8,总环数为,极差为3,若有10环,则最小环数为,
构造组合:,总和为40,极差为3,平均数为8,存在10环,所以A正确;
对于B:构造组合:满足中位数为8,平均数为8,故B正确;
对于C:若出现10环,且众数为9,即由大到小的环数为,所以中位数不可能为7,故C错误;
对于D:若出现10环,由于平均数为7,所以射击环数可为,此时方差为,故D正确.故选:ABD
17. (2026湖南岳阳一模-多选)某企业2024年12个月的收入与支出数据的折线图如图所示.
已知:利润=收入-支出,根据该折线图,下列说法正确的是( )
A. 该企业2024年1月至6月的总利润低于2024年7月至12月的总利润
B. 该企业2024年第一季度的利润约是60万元
C. 该企业2024年4月至7月的月利润持续增长
D. 该企业2024年11月份的月利润最大
【详解】对于A,由企业2024年12个月的收入与支出数据的折线图,得该企业2024年1月至6月的总利润约为(万元),
该企业2024年7月至12月的总利润约为(万元),
所以该企业2024年1月至6月的总利润低于2024年7月至12月的总利润,故A正确;
对于B,该企业2024年第一季度的利润约是(万元),故B错误;
对于C,该企业2024年4月至7月的月利润(单位:万元)分别为10,28,30,52,所以该企业2024年4月至7月的月利润持续增长,故C正确;
对于D,该企业2024年7月和8月的月利润比11月份的月利润大,故D错误.故选:AC.
18. (2026湖南湘潭一模)现有一组数据2,4,5,2,3,6,8,4,5,则这组数据的第百分位数与中位数分别是( )
A. 4,6 B. 5,4 C. 6,4 D. 6,5
【详解】这组数据按照从小到大的顺序排列为2,2,3,4,4,5,5,6,8,
这组数据个数,中位数位置,取第5个数,即为4,
,
这组数据的第百分位数取第8个数,即为6,
这组数据的第百分位数与中位数分别是6和4,故C正确.故选:C.
19. (2026湖南邵阳一模)已知多项式,若,则___________.
【详解】令,可得,
令,可得,
两式相减得
又,所以.故答案为:3
20. (2026湖南常德一模-多选)设,为两个相互独立的随机事件,且,,则下列命题中正确的是( )
A. B.
C. D.
【详解】由,可得;因此C正确;
又,为两个相互独立的随机事件,所以,所以;
根据全概率公式可得,
解得,因此A错误;
又,
解得,因此B错误;
易知,
所以,即D正确.故选:CD
21. (2026湖北孝感一模)某商场举办抽奖活动,在一个不透明的抽奖箱中有六个相同的小球,编号分别为1、2、3、4、5、6.活动规则如下:每位顾客连续有放回地抽取三次,若三次抽到的小球编号之和为5的倍数,则视为中奖.现甲、乙、丙三位顾客依次参加抽奖活动,且每人是否中奖相互独立.记中奖人数为X,则X的数学期望为______.
【详解】由题意,三次抽奖的所有情况共有种,和为5的倍数的情况有:
①三个编号均不相同1,3,6;1,4,5;2,3,5;4,5,6共种;
②恰有两个编号相同1,1,3;2,2,1;2,2,6;3,3,4;4,4,2;6,6,3共种,
③三个编号都相同5,5,5共1种,所以中奖的概率,
由题意,所以X的数学期望.
22. (2026湖北荆州一模-多选)某校教学比武活动有7名评委现场打分,7名评委对某位选手的评分分别为a,b,c,d,e,f,g.设这组数据的平均数、标准差、中位数、众数分别为,s,m,z,根据计分规则,去掉一个最高分和一个最低分后,余下数据的平均数、标准差、中位数、众数分别为,,,,则以下判断一定正确的有( )
A. B.
C. D.
【详解】选项A,设,则,
,无法比较的大小,故选项A错误;
选项B,,,去掉一个最高分和一个最低分后,数据的波动性减小,故,故选项B正确;
选项C,原数据的中位数,去掉一个最高分和一个最低分后的新数据的中位数为,故,故选项C正确;
选项D,众数是数据中出现次数最多的数,去掉一个最高分和一个最低分后,众数可能发生变化,可能不发生变化,故不一定有,故选项D错误.故选:BC.
23. 为了研究某班学生的听力成绩(单位:分)与笔试成绩(单位:分)的关系,从该班随机抽取20名学生,根据散点图发现与之间有线性关系,设其回归直线为,已知,若该班某学生的听力成绩为28,据此估计其笔试成绩约为__________.
【详解】,故;,故,
故点在回归直线上,即,得,
即,当时,代入计算得到.故答案为:.
24. (2026河北沧州一模)某流水线上生产的一批零件,其规格指标X可以看作一个随机变量,且,对于的零件即为不合格,不合格零件出现的概率为0.05,现从这批零件中随机抽取500个,用Y表示这500个零件的规格指标X位于区间的个数,则随机变量Y的方差是________.
【详解】由正态分布的性质得质量指标在区间的概率为,
即1件产品的质量指标位于区间的概率为,∴,
故.
25. (2026河北沧州一模)将4个不同的小球放入4个不同的盒子中,则恰有两个盒子为空的放法种数为( )
A. 72 B. 84 C. 96 D. 108
【详解】选个空盒:种,分配个小球到个非空盒
情况一(分法):种情况二(分法):种
总分配方法; 种,总放法数:种选:
26. (2026广东湛江一模-多选)一组互不相等的数据从小到大排列为,去掉后,则下列选项正确的有( )
A. 极差变大 B. 平均数变大 C. 中位数变小 D. 分位数变大
【详解】由题意,去掉后,极差为,极差变小,故A错误;
平均数,所以平均数变大,故B正确;
原数据和新数据的中位数分别为,且,故中位数变大,故C错误;
原数据的分位数:,取第5个数,新数据的分位数:,
取第4、5个数的平均,因为,所以,故分位数变大,故D正确.
和新数据,故选:BD.
27. (2026广东湛江一模)某次展览会有4个核心主题,已知每个主题下有2个案例,现需从8个案例中随机抽取4个案例进行重点演示,则抽出的4个案例中,恰好包含某一个主题下的2个案例,而另外2个案例来自两个不同主题的抽取方案的种数为( )
A. 120 B. 96 C. 48 D. 24
【详解】先取出同一主题的两个案例有种取法,再从剩下的主题中取出2个主题,有种方法,
最后再从这2个主题分别包含的2个案例中各取一个案例有种,
由分步计数原理,可得取法种数为.故选:C.
28. (2026广东茂名一模)从1至13的整数中任取3个不同的数,则能被2整除的概率为( )
A. B. C. D.
【详解】因为1至13的整数中有6个偶数,7个奇数,
若能被2整除,则只需能被2整除,的取值异于即可,
当都为奇数时,的取法有种;
当都为偶数时,的取法有种,
所以能被2整除的概率为.故选:B.
29. (2026福建泉州一模-多选)某市环保部门连续10天监测甲、乙两个区域的空气质量指数(简称AQI),记日期编号为,甲、乙两个区域的AQI分别为,将数据整理如下:
日期编号
1
2
3
4
5
6
7
8
9
10
甲区域AQI
27
44
43
45
34
35
33
34
40
35
乙区域AQI
34
34
30
31
36
33
32
34
33
33
根据数据进行分析,以下说法正确的是( )
A. 甲区域AQI的极差为18
B. 乙区域AQI的第65百分位数为33.5
C. 甲区域AQI的方差大于乙区域AQI的方差
D. 根据最小二乘法求得关于的经验回归方程对应的直线必过点
【详解】对于A,甲区域AQI的极差为,A正确
对于B,乙区域AQI的数据从小到大排序:,共10个数据,
计算,第65百分位数是第个数,B错误;
对于C,甲区域AQI的平均数为,方差
乙区域AQI的平均数为
方差,因为,故甲区域AQI的方差大于乙区域AQI的方差,C正确;
对于D,因为,由上可知
所以根据最小二乘法求得关于的经验回归方程对应的直线必过点,D正确;故选:ACD.
30. (2026安徽宿州一模-多选)已知是各项均为正数的等差数列,且公差,是各项均为正数的等比数列,且公比,若项数均为项(),下列说法正确的有( )
A. 数据的平均数是
B. 数据的平均数是
C. 若,则数据的中位数大于数据的中位数
D. 若,则数据的平均数大于数据的平均数
【详解】对于A选项,设的前项和为,
所以数据的平均数是,故A选项正确:
对于B选项,当时,取为2,4,8,
平均数,故B选项错误;
对于C选项,的中位数是,的中位数
是,故C选项正确;
对于D选项,数列的前项和为,
所以数列的前项和的平均数为,
数列是各项均为正数,且公比的等比数列,所以,
所以的前项和,
所以数列的前项和的平均数小于,
由C选项知,,所以数列的前项和的平均数
比的前项和的平均数大,D选项正确.故选:ACD.
31.(2026安徽宿州一模) 2025年11月7日,安徽省乒乓球群众业余联赛在宿州市开赛.宿州某代表队第一轮比赛需和对手比赛三场,在第一、二、三场比赛中该队赢对方的概率分别是,每场比赛结果相互独立.则该队在三场比赛中恰有两场赢对方的条件下,第一场赢对方的概率为( )
A. B. C. D.
【详解】设第一、第二、第三场单打赢对手分别为事件A,B,C,
三场比赛中恰有两场赢对方为事件D,则,
,
所以.故选:B
32. (2026安徽马鞍山一模)已知事件满足,则__________.
【详解】由,得,,
由全概率公式,得,则,
即,解得,,
因此,所以.
33. (2026安徽黄山一模)已知随机变量,若,则______.
【详解】由题意,.
35. (2026安徽淮南一模-多选)某AI软件公司开发了一款新型智能写作软件,现将该软件上市后的月份以及每个月获得的利润(单位:万元)之间的关系统计如下表所示,并根据表中数据,得到经验回归方程,则( )
月份
1
2
3
4
5
利润
5
8
10
12
15
A. B. 每增加1个月份,月利润约提高2.8万元
C. 10月份利润约为26.4万元 D. 5月份利润的残差为0.2万元
【详解】依题意 ,
将 代入中,解得,故A正确;
可以估计每增加1个月份,月利润提高2.4万元,故B错误;
将代入中,得到,故C错误;
将代入中,得到,则所求残差为,故 D 正确.故选:AD.
36.(2026安徽淮南一模) 2025年12月11日淮南市科技馆正式开馆,淮南市某中学有甲、乙、丙、丁等7位学生约好2026年1月1日去科技馆志愿服务.现将7位学生随机分为3组,每组至少一人,则甲乙同组且丙丁同组的概率为( )
A. B. C. D.
【详解】由题意,不同的分组方法有5,1,1;4,2,1;3,2,2;3,3,1四种,
当分组为5,1,1时,共有种,其中甲乙同组且丙丁同组有种;
当分组为4,2,1时,共有种,其中甲乙同组且丙丁同组有种;
当分组为3,2,2时,共有种,其中甲乙同组且丙丁同组有种;
当分组为3,3,1时,共有种,其中甲乙同组且丙丁同组有种;
甲乙同组且丙丁同组的概率为.故选:A.
37. (2026安徽淮北一模)代数式的展开式中的系数为__________.
【详解】第一步,中的和的展开式的常数项相乘为的展开式中的项,
即;
第二步,中的和的展开式的的项相乘为的展开式中的项,
即;
则的展开式中的项为,系数为.
38. (2026安徽淮北一模-多选)在一次科普知识竞赛中共有200名同学参赛,经过评判,这200名参赛者的得分都在之内,其得分的频率分布直方图如图所示,则( )
A. B. 这200名参赛者得分的中位数为64
C. 得分在内的频率为 D. 得分在内的共有80人
详解】由题意有,解得,故A正确;
设中位数为,所以,解得,故B错误;
由题意得得分在内的频率为,故C正确;
由题意得得分在内的频率为,
则得分在内的共有人,故D正确.故选:ACD.
39.(2026安徽合肥一模) 国庆假期,某人计划去五个不同景点游览.在确定景点的游览顺序时,要求在之前,与相邻,则不同的游览顺序共有( )
A. 18种 B. 24种 C. 48种 D. 60种
【详解】若与相邻,则需将其捆绑并排列,再将四个元素排列,共有种,
因为在之前和在之后各占一半,故符合题意的不同的游览顺序共有种.故选:B
40. (2026安徽合肥一模)某公司50名员工月工资统计表如下:
工资/元
3600
4000
4400
5000
6000
7000
人数/名
5
10
20
7
5
3
记这50名员工月工资的平均数为元,中位数为元,众数为元,则( )
A. B. C. D.
【详解】这50名员工月工资的平均数为元;
从小到大排列后第25和第26个数均为4400,所以中位数为元;
显然4400出现次数最多为20次,所以众数为元故.故选:B.
41.(2026安徽滁州一模) 某4S店开展抽奖活动,已知抽奖箱内有大小相同、质地均匀的4个红球,2个黄球.参与抽奖的顾客随机摸出2个球,若2个球颜色相同,则奖励6千元消费券;若2个球颜色不相同,则奖励4千元消费券.现有两种摸球方案,方案A:逐个有放回地摸球2次,每次摸出1个球;方案B:一次摸出2个球.若每位顾客只能从两种方案中选择一种方案参与活动,则选择最佳方案时获得的消费券均值为______千元.
【详解】记获得的消费券金额为千元,的取值有,
方案A:,,则,
方案B:,,则,
因为,所以最佳方案为方案A,此时获得的消费券均值为.
42. (2026安徽滁州一模)甲、乙两人向同一目标各射击1次,甲命中目标的概率为0.6,乙命中目标的概率为0.5,且两人的射击相互独立.已知目标至少被命中1次,则甲命中目标的概率为( )
A B. C. D.
【详解】甲、乙两人向同一目标各射击1次,设甲命中目标为事件,则,
设乙命中目标为事件,则,两人的射击相互独立,
则目标没被命中的概率为,
则目标至少被命中1次的概率为,
已知目标至少被命中1次,则甲命中目标的概率为.故选:B.
43. (2025湖北武汉五调)在的展开式中,的系数是__________.
【详解】,
的展开式通项为,
的展开式通项为,
令,得,,
因此,的系数为.故答案为:0.
44. (2025湖北武汉五调-多选)下列说法正确的是( )
A. 利用进行独立性检验时,的值越大,说明有更大的把握认为两个分类变量独立
B. 在残差图中,残差点分布的带状区域的宽度越窄,其模型拟合效果越好
C. 样本相关系数的绝对值大小可以反映成对样本数据之间线性相关的程度,当越接近1时,成对样本数据的线性相关程度越弱
D. 用决定系数来比较两个模型拟合效果,越大,表示残差平方和越小,即模型的拟合效果越好
【详解】利用进行独立性检验时,的值越大,说明有更大的把握认为两个分类变量相关,因此A错误;在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高,因此B正确;
线性相关系数的范围在到之间,有正有负,相关有正相关和负相关,
相关系数绝对值的大小越接近于1,两个变量的线性相关性越强,反之,线性相关性越弱,因此C选项错误;
用决定系数来比较两个模型的拟合效果,越大,表示残差平方和越小,即模型的拟合效果越好,D选项正确;故选:BD.
45. (2025湖北武汉五调)有四对双胞胎共8人,从中随机选4人,则其中恰有一对双胞胎的选法种数为( )
A. 48 B. 72 C. 96 D. 192
【详解】第一步:选一对双胞胎有种;
第二步:再选两对双胞胎,并从每对双胞胎中各选一人共有种;
利用分步计数乘法原理可知:从中随机选4人,则其中恰有一对双胞胎的选法种数为,故:A.
46. (2025湖北武汉四调)已知连续型随机变量服从正态分布,记函数,则的图象( )
A. 关于直线对称 B. 关于直线对称
C. 关于点成中心对称 D. 关于点成中心对称
【详解】由连续型随机变量服从正态分布,
可得,可得,所以正态密度曲线关于对称,即,
由,可得在时增加较快,在时增加越来越慢,
所以无对称轴,故AB错误;
,
所以关于点成中心对称,故C正确,D错误.故选:C.
47. (2025湖北武汉四调)随着Deepseek的流行,各种AI大模型层出不穷,现有甲、乙两个AI大模型,在对甲、乙两个大模型进行深度体验后,6位评委分别对甲、乙进行打分(满分10分),得到如图所示的统计表格,则下列结论不正确的是( )
评委编号
模型名称
1
2
3
4
5
6
甲
7.0
9.3
8.3
9.2
8.9
8.9
乙
8.1
9.1
8.5
8.6
8.7
8.6
A. 甲得分的平均数大于乙得分的平均数 B. 甲得分的众数大于乙得分的众数
C. 甲得分的中位数大于乙得分的中位数 D. 甲得分的方差大于乙得分的方差
【详解】甲、乙的得分从小到大排列如下:
甲:,乙:,
甲得分的中位数为,乙得分的中位数为,甲得分的中位数大于乙得分的中位数,故C正确;
甲得分的众数,乙得分的众数为,甲得分的众数大于乙得分的众数,故B正确;
甲得分的平均数,
乙得分的平均数,所以甲得分的平均数等于乙得分的平均数,故A错误;
甲的方差,
乙的方差为
故甲得分的方差大于乙得分的方差,故D正确.故选:A.
48. (2025湖北武汉二调) 有四对双胞胎共8人,从中随机选出4人,则其中恰有一对双胞胎的选法种数为( )
A. 40 B. 48 C. 52 D. 60
【详解】先从四对双胞胎中选出一对,有种选择;然后从剩下的六个人中选出两个人,且不能是同一对双胞胎,这相当于从三对双胞胎中选出两对,再从每对中选出一个人,共有种选择.
根据乘法原理,总共有种选法.故选:B.
49. (2025湖北武汉二调) 某批产品检验后的评分,由统计结果制成如图所示的频率分布直方图,
下列说法中正确的是( )
A. B. 评分的众数估值为70
C. 评分的第25百分位数估值为67.5 D. 评分的平均数估值为76
【详解】由题意:,解得,A错误,
所以平均数为,故D错误;
众数为,故B错误;因为,第百分位数估计为,故C正确
50.(2025·安徽·一模)同时抛掷三枚质地均匀的骰子,得到向上的点数分别为,则是直角三角形的三个内角的概率为( )
A. B. C. D.
【详解】若是直角三角形的三个内角,则,即.
因为,所以这三个数只能是2,3,6或2,4,4,
所以是直角三角形的三个内角的概率为=.故选:B.
51.(2025·安徽合肥·一模)袋中有三个相同的小球,用不同数字对三个小球进行标记.从袋中随机摸出一个小球,接着从袋中取出比该小球上数字大的所有小球不再放回,并将该小球放回袋中.然后,对袋中剩下的小球再作一次同样的操作,此时袋中剩下2个小球的概率为 .
【详解】不妨对三个小球进行标记,记为1,2,3号,
若第一次取出的是1号球,两次操作之后袋子里面只剩1号球;
若第一次取出的是2号球,则第二次操作时袋子中有1,2号球,若要让袋子中有2个球,需取2号球才行,其概率为;若第一次取出的是3号球,则第二次操作时袋子中有1,2,3号球,若让袋子中有2个球,需取2号球才行,其概率为;
综上,袋中剩下2个小球的概率为.故答案为:
52.(2025·安徽马鞍山·一模)(多选)甲罐中有4个红球,2个白球,乙罐中有5个红球,3个白球.整个取球过程分为两步:(1)先从甲罐中随机取出一个球放入乙罐,记事件为“取出的是红球”,事件为“取出的是白球”;(2)再从乙罐中随机取出两个球,记事件B为“取出的两球都是红球”,事件C为“取出的两球为一红一白”,则( )
A. B.
C. D.
【详解】由题意知,,,,
,,
,
.故选:.
53.(2025·安徽马鞍山·一模)在某次马鞍山市高三一模联考中,从某班随机抽取8名同学的数学成绩,分数从低到高依次为:71,76,91,101,116,120,131,141,则第70百分位数为 .
【详解】因为,所以第6位数是第70百分位数,即第70百分位数为120;
54.(2025·安徽·一模)我国文化体育事业蓬勃发展,正从体育大国向体育强国的目标持续迈进.中国代表队在历届夏季奥运会获得的金牌数依次为15,5,16,16,28,32,48,39,26,38,40,则这11届夏季奥运会中国代表队获得的金牌数的第40百分位数为( )
A.16 B.26 C.28 D.32
【详解】将这组数据按照从小到大的顺序排列为5,15,16,16,26,28,32,38,39,40,48.
因为,所以这11届夏季奥运会中国代表队获得的金牌数的第40百分位数是第五个数26.B
55.(2025·安徽滁州·一模)(多选)下列说法中正确的是( )
A.一个样本(数据不全为3)的平均数为3,若添加一个新数据3组成一个新样本,则新样本的平均数不变,方差变小
B.在成对样本数据中,两个变量间的样本相关系数越小,则它们的线性相关程度越弱
C.数据,53,56,69,70,72,79,65,80,45,41的极差为40,则这组数据的第m百分位数为79
D.依据小概率值的独立性检验推断两个分类变量X与Y之间是否有关联,经计算得,则可以认为“X与Y没有关联”
【详解】一个样本(数据不全为3)的平均数为3,若添加一个新数据3组成一个新样本,则新样本的平均数不变,根据方差公式,可知方差变小,故A正确;
两个变量的相关系数越小,则两者的线性相关程度越弱,故B错误;
除m外,剩余数据的极差为,因为所有数据的极差为40,且,
所以把数据技从小到大题序排列,得:41,45,53,56,65,69,70,72,79,80,
由,所以这组数据的第m百分位数为第9个,为故C正确;
零假设为与Y相互独立,即X与Y没有关联,由,
可知依据的独立性检验,没有充分证据推断不成立,可以认为“X与Y有关联”,故D错.选AC.
56.(2025·安徽·一模)(多选)已知数据的平均数为10,方差为1,且,则下列说法正确的是( )
A.数据的方差为4
B.数据的平均数为17
C.数据的平均数为10,方差大于1
D.若数据的中位数为分位数为,则
【详解】对于A:数据的方差为,A选项正确;
对于B:数据的平均数为,B选项正确;对于C:数据的平均数为,
方差,C选项错误;
对于D:若取数据,平均数为10,方差为1,
中位数为,因为,所以第5个数为分位数,所以,D错.选AB.
57.(2025·安徽合肥·一模)(多选)某同学两次实验得到的数据如下表.实验一所得的样本相关系数为,Y关于x的经验回归方程为;实验二所得的样本相关系数为,u关于v的经验回归方程为,下列结论中正确的是( )
实验一
x
2
3
4
5
6
y
12
10
9
7
4
实验二
v
4
6
8
10
12
u
8
10
11
13
16
参考公式:样本相关系数,.
A. B. C. D.
【详解】解:,,A正确;
,B正确;
,,
,C错误;
,,
,
,
所以,D正确.故选:
58.(2025·安徽滁州·一模)中国被称为“制扇王国”,折扇的起源历史悠久,最早可以追溯到西汉时期.现有一把折扇,其结构如图.完全展开后扇面的圆心角为,上板长为若把该扇面围成一个圆台,则圆台的高为( )
A. B. C. D.
【详解】设小扇形的半径为xcm,则大扇形的半径为,设圆台的上下底面半径分别为,
则,所以,所以,
所以圆台的高为故选:
18.(2025·安徽·一模)在正四棱柱中,,分别为侧棱上一点,则的最小值为( )
A. B. C. D.14
【详解】如图所示:
,
将正四棱柱(图1)的侧面展开,得到展开图(图2),
当五点共线时,取得最小值,
且最小值为.故选:A
20.(2025·安徽黄山·一模)已知三棱锥的四个面均为直角三角形,平面,,,则三棱锥外接球的表面积为( )
A. B. C. D.
【详解】根据题意,构造如图所示的长方体,设其外接球的半径为,易知三棱锥的外接球就是长方体的外接球,则,
所以三棱锥的外接球的表面积为.故选:D.
1
学科网(北京)股份有限公司
$
第12讲 统计概率小题:
排列组合、二项式、统计概率、百分位数、条形统计
知识核心
一、二项式定理
(1)二项式定理:(a+b)n=Can+Can-1b+…+ Can-kbk+…+Cbn(n∈N*);
(2)通项公式:Tk+1=Can-kbk,它表示第k+1项;
(3)二项式系数:二项展开式中各项的系数为C,C,…,C.
(4)(a+b)n的展开式的二项式系数和等于2n,即C+C+C+…+C+…+C=2n.
偶数项的二项式系数的和等于奇数项的二项式系数的和=C+C+C+…=C+C+C+…=
(5)若,则使用赋值法
①常数项:令,得;②各项系数和:令,得
二、条件概率
1、互斥事件:不可能同时发生;P(A+B)=P(A)+P(B).
2、对立事件:不可能同时发生,且必有一个发生
3、独立事件:一个事件的发生对另一个事件发生没有影响,两个事件相互独立不一定互斥;P(AB)= P(A)·P(B)
独立事件的性质:如果事件A与事件B相互独立,则与,与,与也都相互独立
4、条件概率定义:发生的条件下,发生的概率:(定义法、样本点数法)
5、解释:(1)表示事件和同时发生的概率;
(2)条件概率的乘法公式:
(3)设和互为对立事件,则
(4)如果和是两个互斥事件,则;
6、全概率公式:设,,是一组两两互斥的事件,,则对任意的事件,有,我们称此公式为全概率公式
三、离散型随机变量的分布列
(1)分布列的定义:①解析式法:i,;②表格法:
…
…
…
…
(2)分布列的性质:①,; ②
(3)均值、期望:
(4)均值的性质:若,则由与之间分布列的关系可知
(5)方差
(6)随机变量的标准差:;
(7)方差的性质:
(8)方差与期望:
四、四种分布列
(一)两点分布或者0-1分布:只有2种情况的实验
0
1
用表示“成功”,表示“失败”,如果,则,那么的分布列如上:
;
(二)二项分布,记作:两点分布重复多次的实验
设事件发生的概率为,用表示发生的次数,则的分布列为:
,
(三)超几何分布:一批产品共有件,其中有件次品,从件产品中随机抽取件(不放回),用表示抽取的件产品中的次品数,则的分布列为
二项分布与超几何分布的区别
若有放回抽样的抽取,则服从二项分布;若不放回抽样的抽取,则服从超几何分布.
超几何分布需要知道总体容量,二项分布不需要知道总体容量,但需要知道成功率
(四)正态曲线,记为
(1)正态曲线的特点
①曲线位于轴上方,与轴不相交;②关于直线对称;
③曲线与轴之间的面积为1;④确定曲线的形状;
当一定时,曲线的形状由确定。越小,曲线越高瘦,表示总体的分布越集中;越大,曲线越矮胖,表示总体的分布越分散
(2)正态分布定义:若的概率密度函数为,称随机变量服从正态分布
(3)标准正态分布:当,时,称随机变量服从标准正态分布,密度函数
(4)正态分布的原则:正态分布在三个特殊区间的概率值
假设,可以证明:对给定的是一个只与有关的定值
特别地,
在一次试验中,的值几乎总是落在区间内,而在此区间以外取值的概率大约只有0.0027,通常认为这种情况几乎不可能发生.这在统计学中称为原则.
五、数字样本特征
(1)中位数:将一组数据按从小到大(或从大到小)的顺序排列,如果为奇数个,中位数为中间数;若为偶数个,中位数为中间两个数的平均数
(2)平均数:,反映样本的平均水平
(3)方差:
(4)标准差:,标准差等于方差的算术平方根
六、用样本估计总体
1、频率分布直方图
①×组距=频率;②频率分布直方图中各个小方形的面积总和等于
③最高的小长方形底边中点的横坐标即是众数
④中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于
⑤平均数是频率分布直方图的重心
2、计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据
②计算
③若不是整数而大于的比邻整数,则第百分位数为第项数据;
若是整数,则第百分位数为第项与第项数据的平均数.
常见的四分位数:第百分位数是中位数;第百分位数,第百分位数
3、平均数、方差的性质:如果数据的平均数为,方差为,那么
①一组新数据的平均数为,方差是
②一新数据的平均数为,方差是
③一组新数据的平均数为,方差是
定义样本方差为;
简化公式:=(原数据平方的平均数-平均数的平方)(证明)
七、成对数据的统计分析
1、回归方程:数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为
其中,,,(,)称为样本点的中心.
2、相关系数
若相应于变量的取值,变量的观测值为,
则变量与的相关系数,
通常用来衡量与之间的线性关系的强弱,的范围为.
①当时,表示两个变量正相关;当时,表示两个变量负相关.
②越接近,表示两个变量的线性相关性越强;
越接近,表示两个变量间几乎不存在线性相关关系;
当时,所有数据点都在一条直线上
③通常当时,认为两个变量具有很强的线性相关关系
3、残差分析
(1)对于观测值,通过回归方程得到的称为预测值,观测值减去预测值等于残差,即有.
(2)残差平方和,如果越小,则拟合效果越好
(3)相关指数:.越接近于,说明残差的平方和越小,也表示回归的效果越好.
统计概率:真题
考点01有限制条件的排列问题
1.(2024·全国甲卷·高考真题)某独唱比赛的决赛阶段共有甲、乙、丙、丁四人参加,每人出场一次,出场次序由随机抽签确定,则丙不是第一个出场,且甲或乙最后出场的概率是( )
A. B. C. D.
2.(2025·上海·高考真题)4个家长和2个儿童去爬山,6个人需要排成一条队列,要求队列的头和尾均是家长,则不同的排列个数有 种.
3.(2022·新高考全国Ⅱ卷·高考真题)有甲、乙、丙、丁、戊5名同学站成一排参加文艺汇演,若甲不站在两端,丙和丁相邻,则不同排列方式共有( )
A.12种 B.24种 C.36种 D.48种
4.(2021·全国甲卷·高考真题)将3个1和2个0随机排成一行,则2个0不相邻的概率为( )
A.0.3 B.0.5 C.0.6 D.0.8
5.(2021·全国甲卷·高考真题)将4个1和2个0随机排成一行,则2个0不相邻的概率为( )
A. B. C. D.
6.(2024·上海·高考真题)设集合中的元素皆为无重复数字的三位正整数,且元素中任意两个不同元素之积皆为偶数,求集合中元素个数的最大值 .
7.(2023·全国甲卷·高考真题)现有5名志愿者报名参加公益活动,在某一星期的星期六、星期日两天,每天从这5人中安排2人参加公益活动,则恰有1人在这两天都参加的不同安排方式共有( )
A.120 B.60 C.30 D.20
考点02组合问题
8.(2023·新课标Ⅱ卷·高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( ).
A.种 B.种
C.种 D.种
9.(2022·新高考全国Ⅰ卷·高考真题)从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为( )
A. B. C. D.
10.(2023·全国甲卷·高考真题)某校文艺部有4名学生,其中高一、高二年级各2名.从这4名学生中随机选2名组织校文艺汇演,则这2名学生来自不同年级的概率为( )
A. B. C. D.
11.(2021·全国乙卷·高考真题)将5名北京冬奥会志愿者分配到花样滑冰、短道速滑、冰球和冰壶4个项目进行培训,每名志愿者只分配到1个项目,每个项目至少分配1名志愿者,则不同的分配方案共有( )
A.60种 B.120种 C.240种 D.480种
12.(2023·全国乙卷·高考真题)甲乙两位同学从6种课外读物中各自选读2种,则这两人选读的课外读物中恰有1种相同的选法共有( )
A.30种 B.60种 C.120种 D.240种
13.(2024·天津·高考真题)某校组织学生参加农业实践活动,期间安排了劳动技能比赛,比赛共5个项目,分别为整地做畦、旱田播种、作物移栽、田间灌溉、藤架搭建,规定每人参加其中3个项目.假设每人参加每个项目的可能性相同,则甲同学参加“整地做畦”项目的概率为 ;已知乙同学参加的3个项目中有“整地做畦”,则他还参加“田间灌溉”项目的概率为 .
14.(2022·上海·高考真题)为了检测学生的身体素质指标,从游泳类1项,球类3项,田径类4项共8项项目中随机抽取4项进行检则,则每一类都被抽到的概率为 ;
15.(2023·新课标Ⅰ卷·高考真题)某学校开设了4门体育类选修课和4门艺术类选修课,学生需从这8门课中选修2门或3门课,并且每类选修课至少选修1门,则不同的选课方案共有 种(用数字作答).
16.(2022·全国甲卷·高考真题)从正方体的8个顶点中任选4个,则这4个点在同一个平面的概率为 .
17.(2022·全国乙卷·高考真题)从甲、乙等5名同学中随机选3名参加社区服务工作,则甲、乙都入选的概率为 .
【详解】解法一:设这5名同学分别为甲,乙,1,2,3,从5名同学中随机选3名,
18.(2021·上海·高考真题)某人某天需要运动总时长大于等于60分钟,现有五项运动可以选择,如下表所示,问有几种运动方式组合
A运动
B运动
C运动
D运动
E运动
7点8点
8点9点
9点10点
10点11点
11点12点
30分钟
20分钟
40分钟
30分钟
30分钟
考点03求二项式展开式的特定项
19.(2022·新高考全国Ⅰ卷·高考真题)的展开式中的系数为 (用数字作答).
考点04二项式展开式项的系数和
20.(2022·北京·高考真题)若,则( )
A.40 B.41 C. D.
21.(2025·北京·高考真题)已知,则 ; .
22.(2022·浙江·高考真题)已知多项式,则 , .
23.(2021·浙江·高考真题)已知多项式,则 , .
考点05项的系数最值问题
24.(2024·全国甲卷·高考真题)的展开式中,各项系数中的最大值为 .
25.(2021·上海·高考真题)的二项展开式中有且仅有的系数为最大值,则的系数为 .
26.【多选】(2023·新课标Ⅰ卷·高考真题)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
27.(2022·新高考全国Ⅱ卷·高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间的概率;
(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
考点06相关系数
28.(2025·天津·高考真题)下列说法中错误的是( )
A.若,则
B.若,,则
C.越接近1,相关性越强
D.越接近0,相关性越弱
考点07古典概型
29.(2023·全国甲卷·高考真题)某校文艺部有4名学生,其中高一、高二年级各2名.从这4名学生中随机选2名组织校文艺汇演,则这2名学生来自不同年级的概率为( )
A. B. C. D.
31.(2022·全国甲卷·高考真题)从分别写有1,2,3,4,5,6的6张卡片中无放回随机抽取2张,则抽到的2张卡片上的数字之积是4的倍数的概率为( )
A. B. C. D.
32.(2022·新高考全国Ⅰ卷·高考真题)从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为( )
A. B. C. D.
33.(2021·全国甲卷·高考真题)将4个1和2个0随机排成一行,则2个0不相邻的概率为( )
A. B. C. D.
34.(2022·上海·高考真题)为了检测学生的身体素质指标,从游泳类1项,球类3项,田径类4项共8项项目中随机抽取4项进行检则,则每一类都被抽到的概率为 ;
35.(2022·全国甲卷·高考真题)从正方体的8个顶点中任选4个,则这4个点在同一个平面的概率为 .
36.(2022·全国乙卷·高考真题)从甲、乙等5名同学中随机选3名参加社区服务工作,则甲、乙都入选的概率为 .
考点08相互独立事件
37.(2021·新高考全国Ⅰ卷·高考真题)有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回的随机取两次,每次取1个球,甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则( )
A.甲与丙相互独立 B.甲与丁相互独立
C.乙与丙相互独立 D.丙与丁相互独立
38.(2025·上海·高考真题)己知事件A、B相互独立,事件A发生的概率为,事件B发生的概率为,则事件发生的概率为( )
A. B. C. D.0
39.(2023·天津·高考真题)把若干个黑球和白球(这些球除颜色外无其它差异)放进三个空箱子中,三个箱子中的球数之比为.且其中的黑球比例依次为.若从每个箱子中各随机摸出一球,则三个球都是黑球的概率为 ;若把所有球放在一起,随机摸出一球,则该球是白球的概率为 .
40.【多选】(2023·新课标Ⅱ卷·高考真题)在信道内传输0,1信号,信号的传输相互独立.发送0时,收到1的概率为,收到0的概率为;发送1时,收到0的概率为,收到1的概率为. 考虑两种传输方案:单次传输和三次传输.单次传输是指每个信号只发送1次,三次传输 是指每个信号重复发送3次.收到的信号需要译码,译码规则如下:单次传输时,收到的信号即为译码;三次传输时,收到的信号中出现次数多的即为译码(例如,若依次收到1,0,1,则译码为1).
A.采用单次传输方案,若依次发送1,0,1,则依次收到l,0,1的概率为
B.采用三次传输方案,若发送1,则依次收到1,0,1的概率为
C.采用三次传输方案,若发送1,则译码为1的概率为
D.当时,若发送0,则采用三次传输方案译码为0的概率大于采用单次传输方案译码为0的概率
考点09条件概率与全概率公式
41.(2023·全国甲卷·高考真题)某地的中学生中有的同学爱好滑冰,的同学爱好滑雪,的同学爱好滑冰或爱好滑雪.在该地的中学生中随机调查一位同学,若该同学爱好滑雪,则该同学也爱好滑冰的概率为( )
A.0.8 B.0.6 C.0.5 D.0.4
42.(2024·天津·高考真题)某校组织学生参加农业实践活动,期间安排了劳动技能比赛,比赛共5个项目,分别为整地做畦、旱田播种、作物移栽、田间灌溉、藤架搭建,规定每人参加其中3个项目.假设每人参加每个项目的可能性相同,则甲同学参加“整地做畦”项目的概率为 ;已知乙同学参加的3个项目中有“整地做畦”,则他还参加“田间灌溉”项目的概率为 .
43.(2022·天津·高考真题)52张扑克牌,没有大小王,无放回地抽取两次,则两次都抽到A的概率为 ;已知第一次抽到的是A,则第二次抽取A的概率为
44.(2024·上海·高考真题)某校举办科学竞技比赛,有3种题库,题库有5000道题,题库有4000道题,题库有3000道题.小申已完成所有题,已知小申完成题库的正确率是0.92,题库的正确率是0.86,题库的正确率是0.72.现他从所有的题中随机选一题,正确率是 .
45.(2025·天津·高考真题)小桐操场跑圈,一周2次,一次5圈或6圈.第一次跑5圈或6圈的概率均为0.5,若第一次跑5圈,则第二次跑5圈的概率为0.4,6圈的概率为0.6;若第一次跑6圈,则第二次跑5圈的概率为0.6,6圈的概率为0.4.小桐一周跑11圈的概率为 ;若一周至少跑11圈为动量达标,则连续跑4周,记合格周数为X,则期望
考点10求离散型随机变量的均值
46.(2022·浙江·高考真题)现有7张卡片,分别写上数字1,2,2,3,4,5,6.从这7张卡片中随机抽取3张,记所抽取卡片上数字的最小值为,则 , .
47.(2025·全国一卷·高考真题)一个箱子里有5个相同的球,分别以1~5标号,若每次取一颗,有放回地取三次,记至少取出一次的球的个数X,则数学期望 .
考点11正态分布
48.(2021·新高考全国Ⅱ卷·高考真题)某物理量的测量结果服从正态分布,下列结论中不正确的是( )
A.越小,该物理量在一次测量中在的概率越大
B.该物理量在一次测量中大于10的概率为0.5
C.该物理量在一次测量中小于9.99与大于10.01的概率相等
D.该物理量在一次测量中落在与落在的概率相等
49.【多选】(2024·新课标Ⅰ卷·高考真题)随着“一带一路”国际合作的深入,某茶叶种植区多措并举推动茶叶出口.为了解推动出口后的亩收入(单位:万元)情况,从该种植区抽取样本,得到推动出口后亩收入的样本均值,样本方差,已知该种植区以往的亩收入服从正态分布,假设推动出口后的亩收入服从正态分布,则( )(若随机变量Z服从正态分布,)
A. B.
C. D.
统计概率:2年模拟
1. (2026浙江金丽衢一模)有一组数据,则( )
A. 该组数据的极差为6
B. 该组数据的中位数为5
C. 该组数据平均数为4
D. 将数据1均改3后,方差会变大
2. (2026浙江金丽衢一模)某晚会由4个歌舞节目和2个机器人表演节目组成,若要求机器人表演节目不能相邻出演且前3个节目中至少有一个是机器人表演节目,则不同的节目安排方法有( )种.
A. 216 B. 360 C. 432 D. 672
3. (2026四川泸州二模-多选)已知两组样本数据和,其中是的中位数,则这两组样本数据的( )
A 极差不相等 B. 中位数相等
C. 平均数相等 D. 标准差可能相等
4. (2026山东枣庄一模-多选)下列命题正确的是( )
A. 若,,则
B. 已知关于的经验回归方程为,且,则
C. 一组样本数据,,…,(),其中是最小值,是最大值,则,,…,的75%分位数一定与,…,的75%分位数不同
D. 若事件,满足,则与独立
5. (2026山东潍坊一模)某智慧交通管理平台为优化城市主干道通行效率,实时监测并记录各路口信号灯的运行模式.每个时段(例如早、晚高峰或特定监控周期)的运行模式对应一个代码(如下表):
运行模式
代码
绿波协调
0
红灯截流控制
1
区域协调
-1
现按时间顺序记录某路口5个时段的运行模式,如编码表示5个时段中第1,3时段是“绿波协调”运行模式,则该路口某天这5个时段的运行模式中出现绿波协调不少于3个的所有可能种数为( )
A. 40 B. 51 C. 131 D. 210
6. (2026山东泰安一模-多选)下列选项正确的是( )
A. 对A,B,C三类个体按3:1:2的比例进行分层抽样,已知从类个体中抽取了9个,则样本容量为30
B. 若随机变量,则
C. 恒成立
D. 一组数1,2,2,2,3,3,3,4,5,6的第80百分位数为4.5
7. (2026山东泰安一模)在一个不透明的盒中装有6个大小质地完全相同的小球,分别标有数字1,2,3,4,5,6,现从盒中一次取出2个小球,设事件为“取出2个小球的数字之和大于6”,事件为“取出的2个小球中最小数字为3”,则( )
A. B. C. D.
8. (2026山东济南一模)若,则的值为__________.
9. (2026山东济南一模)我国2016-2024年科幻产业营收(单位:亿元)如下表所示:
年份
2016
2017
2018
2019
2020
2021
2022
2023
2024
时间变量
1
2
3
4
5
6
7
8
9
营收
100.0
140.0
456.4
658.7
551.1
829.6
877.5
1132.9
1089.6
根据表中数据建立与的线性回归方程,预测我国2025年科幻产业营收约为()(参考数据:)
A. 1222.1亿元 B. 1310.9亿元 C. 1339.1亿元 D. 1443.4亿元
8. (2026江西萍乡一模-多选)下列结论正确的有( )
A. 若数据,,…,的方差为9,则数据,,…,的方差为4
B. 若一组数据3,6,,,1260%分位数为8,则,的值分别可能为7,9
C. 若,,,则
D. 在的展开式中,项的系数为3
9. (2026江西二调)若的展开式中存在含的项,则可能等于( )
A. 5 B. 9 C. 15 D. 19
10. (2026江苏徐州一模-多选)在的二项展开式中,下列结论正确的是( )
A. 常数项是60 B. 各项系数之和是64
C. 二项式系数最大值是20 D. 不含的项
11. (2026江苏徐州一模)已知随机变量,且,则的最小值为( )
A. B. C. 16 D. 48
12. (2026江苏徐州一模)已知线性相关的两个变量,的取值如表所示,如果其线性回归方程为,那么当时的残差为( )
3
4
6
7
20
40
60
A. 2 B. 3 C. 4 D. 5
13. (2026江苏南通一模)若的展开式中各项的二项式系数之和为64,则展开式中的常数项为______.
14. (2026湖南株洲一模-多选)某电脑程序每次等概率随机输出中的一个数,和分别表示输出的前个数中的最大值和最小值.已知每次输出都是独立的,且可以重复输出同一个数.则下列命题正确的是( )
A. B.
C. D.
15. (2026湖南长沙一模-多选)有一组数据,则( )
A. 该组数据的极差为6
B. 该组数据的中位数为5
C. 该组数据的平均数为4
D. 将数据1均改为3后,方差会变大
16. (2026湖南长沙模拟-多选)在军训打靶测试中,四位同学各射靶5次,分别记录每次射击所命中的环数.根据这四名同学射击成绩的统计结果,可以判断出可能出现10环的是( )
A. 平均数为8,极差为3 B. 中位数为8,平均数为8
C. 中位数为7,众数为9 D. 平均数为7,方差为2.4
17. (2026湖南岳阳一模-多选)某企业2024年12个月的收入与支出数据的折线图如图所示.
已知:利润=收入-支出,根据该折线图,下列说法正确的是( )
A. 该企业2024年1月至6月的总利润低于2024年7月至12月的总利润
B. 该企业2024年第一季度的利润约是60万元
C. 该企业2024年4月至7月的月利润持续增长
D. 该企业2024年11月份的月利润最大
18. (2026湖南湘潭一模)现有一组数据2,4,5,2,3,6,8,4,5,则这组数据的第百分位数与中位数分别是( )
A. 4,6 B. 5,4 C. 6,4 D. 6,5
19. (2026湖南邵阳一模)已知多项式,若,则___________.
20. (2026湖南常德一模-多选)设,为两个相互独立的随机事件,且,,则下列命题中正确的是( )
A. B.
C. D.
21. (2026湖北孝感一模)某商场举办抽奖活动,在一个不透明的抽奖箱中有六个相同的小球,编号分别为1、2、3、4、5、6.活动规则如下:每位顾客连续有放回地抽取三次,若三次抽到的小球编号之和为5的倍数,则视为中奖.现甲、乙、丙三位顾客依次参加抽奖活动,且每人是否中奖相互独立.记中奖人数为X,则X的数学期望为______.
22. (2026湖北荆州一模-多选)某校教学比武活动有7名评委现场打分,7名评委对某位选手的评分分别为a,b,c,d,e,f,g.设这组数据的平均数、标准差、中位数、众数分别为,s,m,z,根据计分规则,去掉一个最高分和一个最低分后,余下数据的平均数、标准差、中位数、众数分别为,,,,则以下判断一定正确的有( )
A. B.
C. D.
23. 为了研究某班学生的听力成绩(单位:分)与笔试成绩(单位:分)的关系,从该班随机抽取20名学生,根据散点图发现与之间有线性关系,设其回归直线为,已知,若该班某学生的听力成绩为28,据此估计其笔试成绩约为__________.
24. (2026河北沧州一模)某流水线上生产的一批零件,其规格指标X可以看作一个随机变量,且,对于的零件即为不合格,不合格零件出现的概率为0.05,现从这批零件中随机抽取500个,用Y表示这500个零件的规格指标X位于区间的个数,则随机变量Y的方差是________.
25. (2026河北沧州一模)将4个不同的小球放入4个不同的盒子中,则恰有两个盒子为空的放法种数为( )
A. 72 B. 84 C. 96 D. 108
26. (2026广东湛江一模-多选)一组互不相等的数据从小到大排列为,去掉后,则下列选项正确的有( )
A. 极差变大 B. 平均数变大 C. 中位数变小 D. 分位数变大
27. (2026广东湛江一模)某次展览会有4个核心主题,已知每个主题下有2个案例,现需从8个案例中随机抽取4个案例进行重点演示,则抽出的4个案例中,恰好包含某一个主题下的2个案例,而另外2个案例来自两个不同主题的抽取方案的种数为( )
A. 120 B. 96 C. 48 D. 24
28. (2026广东茂名一模)从1至13的整数中任取3个不同的数,则能被2整除的概率为( )
A. B. C. D.
29. (2026福建泉州一模-多选)某市环保部门连续10天监测甲、乙两个区域的空气质量指数(简称AQI),记日期编号为,甲、乙两个区域的AQI分别为,将数据整理如下:
日期编号
1
2
3
4
5
6
7
8
9
10
甲区域AQI
27
44
43
45
34
35
33
34
40
35
乙区域AQI
34
34
30
31
36
33
32
34
33
33
根据数据进行分析,以下说法正确的是( )
A. 甲区域AQI的极差为18
B. 乙区域AQI的第65百分位数为33.5
C. 甲区域AQI的方差大于乙区域AQI的方差
D. 根据最小二乘法求得关于的经验回归方程对应的直线必过点
30. (2026安徽宿州一模-多选)已知是各项均为正数的等差数列,且公差,是各项均为正数的等比数列,且公比,若项数均为项(),下列说法正确的有( )
A. 数据的平均数是
B. 数据的平均数是
C. 若,则数据的中位数大于数据的中位数
D. 若,则数据的平均数大于数据的平均数
31.(2026安徽宿州一模) 2025年11月7日,安徽省乒乓球群众业余联赛在宿州市开赛.宿州某代表队第一轮比赛需和对手比赛三场,在第一、二、三场比赛中该队赢对方的概率分别是,每场比赛结果相互独立.则该队在三场比赛中恰有两场赢对方的条件下,第一场赢对方的概率为( )
A. B. C. D.
32. (2026安徽马鞍山一模)已知事件满足,则__________.
33. (2026安徽黄山一模)已知随机变量,若,则______.
35. (2026安徽淮南一模-多选)某AI软件公司开发了一款新型智能写作软件,现将该软件上市后的月份以及每个月获得的利润(单位:万元)之间的关系统计如下表所示,并根据表中数据,得到经验回归方程,则( )
月份
1
2
3
4
5
利润
5
8
10
12
15
A. B. 每增加1个月份,月利润约提高2.8万元
C. 10月份利润约为26.4万元 D. 5月份利润的残差为0.2万元
36.(2026安徽淮南一模) 2025年12月11日淮南市科技馆正式开馆,淮南市某中学有甲、乙、丙、丁等7位学生约好2026年1月1日去科技馆志愿服务.现将7位学生随机分为3组,每组至少一人,则甲乙同组且丙丁同组的概率为( )
A. B. C. D.
37. (2026安徽淮北一模)代数式的展开式中的系数为__________.
38. (2026安徽淮北一模-多选)在一次科普知识竞赛中共有200名同学参赛,经过评判,这200名参赛者的得分都在之内,其得分的频率分布直方图如图所示,则( )
A. B. 这200名参赛者得分的中位数为64
C. 得分在内的频率为 D. 得分在内的共有80人
39.(2026安徽合肥一模) 国庆假期,某人计划去五个不同景点游览.在确定景点的游览顺序时,要求在之前,与相邻,则不同的游览顺序共有( )
A. 18种 B. 24种 C. 48种 D. 60种
40. (2026安徽合肥一模)某公司50名员工月工资统计表如下:
工资/元
3600
4000
4400
5000
6000
7000
人数/名
5
10
20
7
5
3
记这50名员工月工资的平均数为元,中位数为元,众数为元,则( )
A. B. C. D.
41.(2026安徽滁州一模) 某4S店开展抽奖活动,已知抽奖箱内有大小相同、质地均匀的4个红球,2个黄球.参与抽奖的顾客随机摸出2个球,若2个球颜色相同,则奖励6千元消费券;若2个球颜色不相同,则奖励4千元消费券.现有两种摸球方案,方案A:逐个有放回地摸球2次,每次摸出1个球;方案B:一次摸出2个球.若每位顾客只能从两种方案中选择一种方案参与活动,则选择最佳方案时获得的消费券均值为______千元.
42. (2026安徽滁州一模)甲、乙两人向同一目标各射击1次,甲命中目标的概率为0.6,乙命中目标的概率为0.5,且两人的射击相互独立.已知目标至少被命中1次,则甲命中目标的概率为( )
A B. C. D.
43. (2025湖北武汉五调)在的展开式中,的系数是__________.
44. (2025湖北武汉五调-多选)下列说法正确的是( )
A. 利用进行独立性检验时,的值越大,说明有更大的把握认为两个分类变量独立
B. 在残差图中,残差点分布的带状区域的宽度越窄,其模型拟合效果越好
C. 样本相关系数的绝对值大小可以反映成对样本数据之间线性相关的程度,当越接近1时,成对样本数据的线性相关程度越弱
D. 用决定系数来比较两个模型拟合效果,越大,表示残差平方和越小,即模型的拟合效果越好
45. (2025湖北武汉五调)有四对双胞胎共8人,从中随机选4人,则其中恰有一对双胞胎的选法种数为( )
A. 48 B. 72 C. 96 D. 192
46. (2025湖北武汉四调)已知连续型随机变量服从正态分布,记函数,则的图象( )
A. 关于直线对称 B. 关于直线对称
C. 关于点成中心对称 D. 关于点成中心对称
47. (2025湖北武汉四调)随着Deepseek的流行,各种AI大模型层出不穷,现有甲、乙两个AI大模型,在对甲、乙两个大模型进行深度体验后,6位评委分别对甲、乙进行打分(满分10分),得到如图所示的统计表格,则下列结论不正确的是( )
评委编号
模型名称
1
2
3
4
5
6
甲
7.0
9.3
8.3
9.2
8.9
8.9
乙
8.1
9.1
8.5
8.6
8.7
8.6
A. 甲得分的平均数大于乙得分的平均数 B. 甲得分的众数大于乙得分的众数
C. 甲得分的中位数大于乙得分的中位数 D. 甲得分的方差大于乙得分的方差
48. (2025湖北武汉二调) 有四对双胞胎共8人,从中随机选出4人,则其中恰有一对双胞胎的选法种数为( )
A. 40 B. 48 C. 52 D. 60
49. (2025湖北武汉二调) 某批产品检验后的评分,由统计结果制成如图所示的频率分布直方图,
下列说法中正确的是( )
A. B. 评分的众数估值为70
C. 评分的第25百分位数估值为67.5 D. 评分的平均数估值为76
50.(2025·安徽·一模)同时抛掷三枚质地均匀的骰子,得到向上的点数分别为,则是直角三角形的三个内角的概率为( )
A. B. C. D.
51.(2025·安徽合肥·一模)袋中有三个相同的小球,用不同数字对三个小球进行标记.从袋中随机摸出一个小球,接着从袋中取出比该小球上数字大的所有小球不再放回,并将该小球放回袋中.然后,对袋中剩下的小球再作一次同样的操作,此时袋中剩下2个小球的概率为 .
52.(2025·安徽马鞍山·一模)(多选)甲罐中有4个红球,2个白球,乙罐中有5个红球,3个白球.整个取球过程分为两步:(1)先从甲罐中随机取出一个球放入乙罐,记事件为“取出的是红球”,事件为“取出的是白球”;(2)再从乙罐中随机取出两个球,记事件B为“取出的两球都是红球”,事件C为“取出的两球为一红一白”,则( )
A. B.
C. D.
53.(2025·安徽马鞍山·一模)在某次马鞍山市高三一模联考中,从某班随机抽取8名同学的数学成绩,分数从低到高依次为:71,76,91,101,116,120,131,141,则第70百分位数为 .
54.(2025·安徽·一模)我国文化体育事业蓬勃发展,正从体育大国向体育强国的目标持续迈进.中国代表队在历届夏季奥运会获得的金牌数依次为15,5,16,16,28,32,48,39,26,38,40,则这11届夏季奥运会中国代表队获得的金牌数的第40百分位数为( )
A.16 B.26 C.28 D.32
55.(2025·安徽滁州·一模)(多选)下列说法中正确的是( )
A.一个样本(数据不全为3)的平均数为3,若添加一个新数据3组成一个新样本,则新样本的平均数不变,方差变小
B.在成对样本数据中,两个变量间的样本相关系数越小,则它们的线性相关程度越弱
C.数据,53,56,69,70,72,79,65,80,45,41的极差为40,则这组数据的第m百分位数为79
D.依据小概率值的独立性检验推断两个分类变量X与Y之间是否有关联,经计算得,则可以认为“X与Y没有关联”
56.(2025·安徽·一模)(多选)已知数据的平均数为10,方差为1,且,则下列说法正确的是( )
A.数据的方差为4
B.数据的平均数为17
C.数据的平均数为10,方差大于1
D.若数据的中位数为分位数为,则
57.(2025·安徽合肥·一模)(多选)某同学两次实验得到的数据如下表.实验一所得的样本相关系数为,Y关于x的经验回归方程为;实验二所得的样本相关系数为,u关于v的经验回归方程为,下列结论中正确的是( )
实验一
x
2
3
4
5
6
y
12
10
9
7
4
实验二
v
4
6
8
10
12
u
8
10
11
13
16
参考公式:样本相关系数,.
A. B. C. D.
18.(2025·安徽·一模)在正四棱柱中,,分别为侧棱上一点,则的最小值为( )
A. B. C. D.14
20.(2025·安徽黄山·一模)已知三棱锥的四个面均为直角三角形,平面,,,则三棱锥外接球的表面积为( )
A. B. C. D.
1
学科网(北京)股份有限公司
$