内容正文:
专题10 计数原理与统计概率
9大考点概览
考点01二项式定理
考点02二项分布
考点03超几何分布
考点04正态分布
考点05离散型随机变量及其期望
考点06统计
考点07古典概型
考点08线性回归方程
考点09独立性检验
(
二项式定理
考点1
)
1.(2026·江苏·一模)的二项展开式的第6项系数是( )
A. B. C. D.
2.(2026·江苏·一模)的展开式中常数项为( )
A. B. C. D.
3.(2026·江苏南京·一模)展开式中的常数项为( )
A.20 B.-20 C.-12 D.-8
4.(2026·江苏·一模)(多选)在的二项展开式中,下列结论正确的是( )
A.常数项是60 B.各项系数之和是64
C.二项式系数最大值是20 D.不含的项
5.(2026·江苏·一模)若的展开式中各项的二项式系数之和为64,则展开式中的常数项为______.
6.(2026·江苏·一模)二项式的展开式中的系数为__________.
(
二项分布
考点
2
)
7.(2026·江苏丹阳·一模)有N个人需要通过血液检测某种酶是否存在.假设每个人血液中含有该酶的事件是相互独立的,且含有该酶的概率均为,若血液检测始终能准确判断样本中该酶是否存在.现采用以下分组检测方法:将待检测人群分成r个小组,每组人.在每一组中,取每人的血液混合成一个样本进行检测.
若某组的混合样本检测结果呈阴性(不含酶),则该组内所有人员无需再进行后续检测.
若某组的混合样本检测结果呈阳性(含有酶),则需要对该组内的每一位成员再分别单独检测一次(不用采集血样,利用现有采集过的血样).
(1)若,,已知某小组的混合样本检测结果呈阳性,求该组内“恰有2人”血液中含有该酶的概率;
(2)用N,k,p表示该方法所需检测次数的期望值;
(3)设检测成本由两部分组成:采集处理血样成本为a元/人份,化验检测成本为b元/次.若,每组人数,且该方法的总成本期望值比“逐一检测”的总成本节省了50%以上,求的取值范围.(参考数据:)
(
超几何分布
考点
3
)
8.(2026·江苏镇江·一模)AI幻觉,是指AI模型生成看似合理但实际不正确或毫无事实依据的信息的现象,AI幻觉率是指AI模型产生AI幻觉的概率.现抽取了某公司研发的14个使用率较高的AI模型,其幻觉率如下表所示:
AI模型
1
2
3
4
5
6
7
8
9
10
11
12
13
14
幻觉率
1.3%
1.8%
2.9%
1.5%
1.9%
2.9%
0.7%
0.9%
1.6%
2.4%
0.8%
1.6%
2.4%
2.8%
(1)从表中提供的AI模型中任取一个,求该模型幻觉率小于2%的概率;
(2)从表中提供的幻觉率小于的AI模型中任取3个,用随机变量表示其中幻觉率小于的模型个数,求随机变量的分布列和数学期望.
(
正态分布
考点
4
)
9.(2026·江苏·一模)已知随机变量,且,则的最小值为( )
A. B. C.16 D.48
10.(2026·江苏南通·一模)某生物学兴趣小组对某地同种成年向日葵的株高(单位:cm)进行了测量,发现株高近似服从正态分布.已知测量的向日葵平均株高为,标准差为14.5.现按株高将这批向日葵划分为四个等级:过矮(后)、正常偏矮、正常偏高、过高(前).若,则“过高”等级中最矮株高可能为( )
A. B. C. D.
11.(2026·江苏·一模)(多选)下列说法正确的是( )
A.若随机变量,则
B.若事件,相互独立,则
C.若样本数据,,,的方差为2,则数据,,,的方差为8
D.用相关指数刻画回归效果,越接近1,说明回归模型的拟合效果越好
12.(2026·江苏·一模)已知随机变量,且,则展开式中各项系数之和为______.
(
离散型随机变量的分布列及其期望
考点
5
)
13.(2026·江苏·一模)某次考试的多项选择题,每题4个选项中正确选项有2个或3个,得分规则如下:若正确选项有2个,只选1个且为正确选项得3分,2个且都为正确选项得6分,否则得0分;若正确选项有3个,只选1个且为正确选项得2分,选2个且都为正确选项得4分,选3个且都为正确选项得6分,否则得0分.学生甲对其中的一道多项选择题完全不会,该题恰有2个正确选项的概率为(),记为甲随机选择1个选项的得分,为甲随机选择2个选项的得分,
(1)若,求;
(2)求的概率分布列和数学期望;
(3)证明:当且仅当时,.
14.(2026·江苏南京·一模)为促进消费,某电商平台和生产商在本周联合推出“有奖闯关”活动.活动规则如下:消费者成功闯过第一关获得基础券(获得10元基础券的概率为0.6,获得20元基础券的概率为0.4).闯过第一关后,可进行第二关闯关,成功闯过第二关后可获得进阶券20元,且这两种优惠券可叠加使用抵扣支付商品.已知消费者闯过第一关的概率为p₀,闯过第二关的概率为p.某生产商将商品定价100元,成本41元;优惠券成本由生产商承担基础券面额的30%,进阶券面额的50%.
(1)若,,记消费者购买一件该商品的实际支付金额为X(单位:元),求X的分布列和数学期望;
(2)设所有消费者均闯过第一关获得了基础券,推出活动后商品购买概率为,记生产商销售一件该商品的期望利润为(单位:元).(期望利润=购买概率×(支付金额的期望-商品成本)-优惠券成本的期望)
(ⅰ)求关于p的函数表达式;
(ⅱ)证明:在内存在唯一极大值点,并求当p为何值时,商家期望利润最大?最大期望利润是多少?(结果保留1位小数)
15.(2026·江苏·一模)已知集合含有个元素,其中,先后两次随机、独立地选取集合的两个子集,记为与.设为集合中元素的个数,
(1)若,且,请列举所有满足条件的和;
(2)求随机变量的数学期望;
(3)设在处取得最大值,试建立与的关系.
16.(2026·江苏·一模)现有除颜色外都相同的3个红球和3个白球,随机取3个球放入一个不透明的袋中,记袋中红球的个数为.从袋中随机摸出一个球,并换入一个另一种颜色的球,经过次摸换,袋中的红球个数记为.
(1)求与;
(2)求;
(3)当时,求随机变量的数学期望.
(
统计
考点
6
)17.(2026·江苏扬州·一模)(多选)一组数据满足,若去掉后组成一组新数据.则新数据与原数据相比( )
A.极差变小 B.平均数变大
C.方差变小 D.第25百分位数变小
18.(2026·江苏丹阳·一模)(多选)上饶市某学校从高一的800名男生中随机抽取50名测量身高,被测学生身高全部介于155cm和之间,将测量结果按如下方式分成八组:第一组,第二组,⋯,第八组.下图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组人数相同,第六组的人数为4人.以下说法正确的是( )
A.第二组的频率为0.016
B.第七组的频率为0.06
C.估计该校高一800名男生的身高的中位数约为
D.估计该校高一800名男生的身高的平均数约为
19.(2026·江苏镇江·一模)(多选)在某校文艺汇演中,六位评委对某小品节目进行打分,得到一组分值7.7,8.1,8.2,8.7,9.4,9.9,若去掉一个最高分和一个最低分,则( )
A.这组分值的极差变小 B.这组分值的均值变大
C.这组分值的方差变小 D.这组分值的第75百分位数不变
20.(2026·江苏·一模)某工厂抽检一批零件,共120个,其中90个零件的合格率为90%,30个零件的合格率为80%,则这120个零件的合格率是______.
21.(2026·江苏·一模)若一组数的众数为,平均数为,则__________.
22.(2026·江苏南京·一模)在对树人中学高一年级学生身高的调查中,采用样本比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生20人,其平均数和方差分别为170和10,抽取了女生30人,其平均数和方差分别为160和15.则估计出总样本的平均数为_____.
(
古典概型
考点
7
)23.(2026·江苏·一模)科学研究中经常涉及对粒子状态的分析.某假想粒子有状态1,状态2,状态3,……,每种状态下的粒子经过1秒有两种可能:状态保持不变或变为更高一级状态,已知状态1的粒子有的概率变为状态2,状态2的粒子有的概率变为状态3,以此类推.现有若干状态1的该粒子,则经过3秒处于状态1和状态2的粒子数目约占( )
A. B. C. D.
24.(2026·江苏·一模)用1,2,3,4,5,6组成六位数(没有重复数字),在任意相邻两个数字的奇偶性不同的条件下,1和2相邻的概率是( )
A. B. C. D.
25.(2026·江苏·一模)从编号1~10的10张卡片中依次不放回地抽出两张,记事件A:“第一次抽到的卡片编号数字为5的倍数”,事件B:“第二次抽到的卡片编号数字小于第一次”,则( )
A. B. C. D.
26.(2026·江苏·一模)(多选)甲、乙两个不透明的袋子里分别装有若干个除颜色外均相同的球,其中甲袋子里有2个红球,乙袋子里有3个红球和2个白球.现从乙袋子里随机取出2个球放入甲袋子里,再从甲袋子里随机取出1个球.记从甲袋子里取出红球的个数为,则( )
A. B.
C. D.
27.(2026·江苏·一模)一个不均匀的骰子,掷出1,2,3,4,5,6点的概率依次成等差数列.独立地先后掷该骰子两次,所得的点数分别记为.若事件“”发生的概率为,则事件“”发生的概率为_____.
(
线性回归方程
考点
8
)28.(2026·江苏·一模)已知线性相关的两个变量,的取值如表所示,如果其线性回归方程为,那么当时的残差为( )
3
4
6
7
20
40
60
A.2 B.3 C.4 D.5
29.(2026·江苏·一模)近年来某App用户保持连续增长,若李明收集了年的年份代码与该App在线用户数y(单位:万)的数据,具体如下表所示:
年份代码x
1
2
3
4
5
App在线用户数y(单位:万)
80
150
210
260
300
(1)求样本相关系数r,并判断变量x与y之间的线性相关关系的强弱:
(2)从年中随机抽取三个不同年份所对应的在线用户数据y,记最小的数据为X,求X的分布列及数学期望.
注:样本相关系数.当越接近1时,成对样本数据的线性相关程度越强;当它接近0时,成对样本数据的线性相关程度越弱.其中,.
30.(2026·江苏·一模)某兴趣小组研究昼夜温差大小与患感冒人数多少之间的关系,他们到气象局和医院抄录了1~7月份每月5日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
日期
1月5日
2月5日
3月5日
4月5日
5月5日
6月5日
7月5日
昼夜温差
10
11
13
12
8
7
6
感冒人数
23
25
29
26
16
13
9
该兴趣小组确定的研究方案是:先从这7组数据中选取2组,用剩下的5组数据求经验回归方程,再用被选取的2组数据进行检验.
(1)求选取的2组数据是不相邻的两个月的概率;
(2)若该小组选取的是1月与6月的两组数据,请根据剩下5个月份的数据:
①求出关于的经验回归方程;
②若由经验回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的经验回归方程是理想的,问:该小组所得经验回归方程是否理想?说明理由.
附:
(
独立性检验
考点
9
)
31.(2026·江苏南通·一模)某地举办业余乒乓球联赛,比赛分“有缝球型”和“无缝球型”两个赛区,从该地区抽取部分选手进行调研,相关数据如下表:
喜欢用有缝球
喜欢用无缝球
直拍打法选手
18
30
横拍打法选手
20
12
(1)能否有95%以上的把握认为不同打法的选手对于有缝球和无缝球的喜好有影响?
(2)若从参加调研的“横拍打法”选手中用分层抽样的方法抽取8名选手,按照各自喜爱的球型参加相应赛区的比赛.现从8名选手中选3人,用AI监测他们的比赛数据,求两个赛区都有人被选中的概率.
附:,
0.100
0.050
0.010
2.706
3.841
6.635
2 / 13
学科网(北京)股份有限公司
$
专题10 计数原理与统计概率
9大考点概览
考点01二项式定理
考点02二项分布
考点03超几何分布
考点04正态分布
考点05离散型随机变量及其期望
考点06统计
考点07古典概型
考点08线性回归方程
考点09独立性检验
(
二项式定理
考点1
)
1.(2026·江苏·一模)的二项展开式的第6项系数是( )
A. B. C. D.
【答案】C
【分析】由二项式展开式求解指定项的系数即可.
【详解】的二项展开式的第6项为,
所以第6项系数是.
2.(2026·江苏·一模)的展开式中常数项为( )
A. B. C. D.
【答案】A
【详解】二项展开式的通项公式为,
整理得:,
令,解得:,
展开式中常数项为:.
3.(2026·江苏南京·一模)展开式中的常数项为( )
A.20 B.-20 C.-12 D.-8
【答案】B
【分析】将给定式子变形,再结合二项式定理求解作答.
【详解】因,
则展开式的通项公式为,
由解得,所以展开式中的常数项为.
故选:B
4.(2026·江苏·一模)(多选)在的二项展开式中,下列结论正确的是( )
A.常数项是60 B.各项系数之和是64
C.二项式系数最大值是20 D.不含的项
【答案】AC
【分析】根据题意,二项展开式通项为,对于A,当时即为常数项,再计算判断即可;对于B,利用赋值法求各项系数之和即可;对于C,由可知二项式系数最大值是;对于D,根据,令,解得即可判断.
【详解】对于A,二项展开式通项为,
当时,,所以常数项是60,故A正确;
对于B,当时,,所以各项系数之和是1,故B错误;
对于C,,二项式系数最大值是,故C正确;
对于D,,
当时,解得,所以二项展开式中含的项,故D错误.
故选:AC.
5.(2026·江苏·一模)若的展开式中各项的二项式系数之和为64,则展开式中的常数项为______.
【答案】60
【分析】各项的二项式系数之和为64,可得,求n;再利用通项公式即可求常数项.
【详解】因为各项的二项式系数之和为64,,即;
通项公式=
令,解得.
展开式中常数项为.
【点睛】本题考查二项式定理的应用,注意二项式的通项公式为.
6.(2026·江苏·一模)二项式的展开式中的系数为__________.
【答案】70
【分析】求二项式的展开式的通项,由条件求,由此可得结论.
【详解】由题意知二项式的展开式的通项为,
令,
则的系数为.
故答案为:
(
二项分布
考点
2
)
7.(2026·江苏丹阳·一模)有N个人需要通过血液检测某种酶是否存在.假设每个人血液中含有该酶的事件是相互独立的,且含有该酶的概率均为,若血液检测始终能准确判断样本中该酶是否存在.现采用以下分组检测方法:将待检测人群分成r个小组,每组人.在每一组中,取每人的血液混合成一个样本进行检测.
若某组的混合样本检测结果呈阴性(不含酶),则该组内所有人员无需再进行后续检测.
若某组的混合样本检测结果呈阳性(含有酶),则需要对该组内的每一位成员再分别单独检测一次(不用采集血样,利用现有采集过的血样).
(1)若,,已知某小组的混合样本检测结果呈阳性,求该组内“恰有2人”血液中含有该酶的概率;
(2)用N,k,p表示该方法所需检测次数的期望值;
(3)设检测成本由两部分组成:采集处理血样成本为a元/人份,化验检测成本为b元/次.若,每组人数,且该方法的总成本期望值比“逐一检测”的总成本节省了50%以上,求的取值范围.(参考数据:)
【答案】(1)
(2)
(3)
【分析】(1)设小组中有酶的人数为X,依题意,可知,分别求出与,利用条件概率公式即可求出恰有2人有酶的概率;
(2)设每组检测次数,则易得,求出其分布列和数学期望,进而可求得总检测次数的期望;
(3)利用(2)中若分组检测,由检测次数的期望求得总成本期望,若逐一检测,则总成本为,依题意,代值计算即得的取值范围.
【详解】(1)设小组中有酶的人数为X,则.
已知混合样本阳性,即,则恰有2人有酶的概率为
.
(2)设每组检测次数,则的分布列为
1
p
期望为
则总检测次数的期望;
(3)若分组检测,检测次数的期望为.
总成本期望为,
若逐一检测,则总成本为.由节省50%以上得.
代入,,,得,
整理得,因此,,故的取值范围是.
(
超几何分布
考点
3
)
8.(2026·江苏镇江·一模)AI幻觉,是指AI模型生成看似合理但实际不正确或毫无事实依据的信息的现象,AI幻觉率是指AI模型产生AI幻觉的概率.现抽取了某公司研发的14个使用率较高的AI模型,其幻觉率如下表所示:
AI模型
1
2
3
4
5
6
7
8
9
10
11
12
13
14
幻觉率
1.3%
1.8%
2.9%
1.5%
1.9%
2.9%
0.7%
0.9%
1.6%
2.4%
0.8%
1.6%
2.4%
2.8%
(1)从表中提供的AI模型中任取一个,求该模型幻觉率小于2%的概率;
(2)从表中提供的幻觉率小于的AI模型中任取3个,用随机变量表示其中幻觉率小于的模型个数,求随机变量的分布列和数学期望.
【答案】(1)
(2)分布列见解析,1
【分析】(1)通过列举法,结合古典概型概率公式求解;
(2)首先列举幻觉率低于2%的AI模型的个数,以及低于1.3%的模型个数,再根据超几何分布公式求概率和分布列,以及数学期望.
【详解】(1)14个AI模型,幻觉率高于2%的有2.9%,2.9%,2.4%,2.4%,2.8%,共有5个,
所以幻觉率低于的概率为.
(2)幻觉率低于2%的AI模型中共9个,其中低于1.3%的模型有3个,故
, ,
, ,
故分布列为
0
1
2
3
故.
(
正态分布
考点
4
)
9.(2026·江苏·一模)已知随机变量,且,则的最小值为( )
A. B. C.16 D.48
【答案】C
【分析】先根据正态分布的性质确定的值,再利用基本不等式求最小值.
【详解】因为,正态曲线关于直线对称,
又,所以,解得.
所以,
因为,所以,
当且仅当,即时取等号.
故选:C
10.(2026·江苏南通·一模)某生物学兴趣小组对某地同种成年向日葵的株高(单位:cm)进行了测量,发现株高近似服从正态分布.已知测量的向日葵平均株高为,标准差为14.5.现按株高将这批向日葵划分为四个等级:过矮(后)、正常偏矮、正常偏高、过高(前).若,则“过高”等级中最矮株高可能为( )
A. B. C. D.
【答案】D
【分析】根据标准正态分布的对称性可得,运算求解结合选项分析判断.
【详解】因为,则,
可得,解得,
即“过高”等级中的株高,结合选项可知D正确,ABC错误.
故选:D.
11.(2026·江苏·一模)(多选)下列说法正确的是( )
A.若随机变量,则
B.若事件,相互独立,则
C.若样本数据,,,的方差为2,则数据,,,的方差为8
D.用相关指数刻画回归效果,越接近1,说明回归模型的拟合效果越好
【答案】ACD
【分析】利用正态曲线的对称性即可判断A,根据随机事件的概率加法公式与互斥事件的概率公式即可判断B;利用数据的和差积商性质即可判断C;根据相关指数与残差平方和之间的关系即可判断D.
【详解】对于A,因随机变量,则,由正态曲线的对称性可得,故A正确;
对于B,由事件,相互独立可知,对于随机事件,,
都有,
故仅当,互斥时,才有,故结论不成立,即B错误;
对于C,由题意,,
对于数据,,,,
其均值为,
其方差为,故C正确;
对于D,相关指数越接近1,值越大,残差平方和接近0,值越小,则该回归模型的拟合效果越好,故D正确.
12.(2026·江苏·一模)已知随机变量,且,则展开式中各项系数之和为______.
【答案】
【分析】由已知条件结合正态分布的性质求出,再利用赋值法求出系数和.
【详解】因为,所以,解得,
代入可得,
令,可得展开式各项系数和为.
故答案为:.
(
离散型随机变量的分布列及其期望
考点
5
)
13.(2026·江苏·一模)某次考试的多项选择题,每题4个选项中正确选项有2个或3个,得分规则如下:若正确选项有2个,只选1个且为正确选项得3分,2个且都为正确选项得6分,否则得0分;若正确选项有3个,只选1个且为正确选项得2分,选2个且都为正确选项得4分,选3个且都为正确选项得6分,否则得0分.学生甲对其中的一道多项选择题完全不会,该题恰有2个正确选项的概率为(),记为甲随机选择1个选项的得分,为甲随机选择2个选项的得分,
(1)若,求;
(2)求的概率分布列和数学期望;
(3)证明:当且仅当时,.
【答案】(1)
(2)分布列见解析,
(3)证明见解析
【分析】(1)得2分以上可能是随机选一个选项时,当为三个正确选项时选对1个,或者两个正确选项时选对1个,由互斥事件的加法公式得解;
(2)可能的取值为,得0分为三个正确选项或两个正确选项的均选到错误选项,得2分只可能是三个正确选项的选对1个,得3分为两个正确选项的选对一个,分别由互斥事件的加法公式求解;
(3)可能的取值为,类似(2)的分析得出的期望,结合(2)中的作差比较,得出证明.
【详解】(1)恰有2个正确选项的概率为,则恰有3个正确选项的概率为,
正确选项是2个时,随机选一个正确可得3分,概率为;
正确选项是3个时,随机选一个正确可得2分,概率为,
因此
(2)由题知,可能的取值为,
,
,
,
分布列为:
(3)由题知,可能的取值为,
,
,
故,
,
故当且仅当时,
14.(2026·江苏南京·一模)为促进消费,某电商平台和生产商在本周联合推出“有奖闯关”活动.活动规则如下:消费者成功闯过第一关获得基础券(获得10元基础券的概率为0.6,获得20元基础券的概率为0.4).闯过第一关后,可进行第二关闯关,成功闯过第二关后可获得进阶券20元,且这两种优惠券可叠加使用抵扣支付商品.已知消费者闯过第一关的概率为p₀,闯过第二关的概率为p.某生产商将商品定价100元,成本41元;优惠券成本由生产商承担基础券面额的30%,进阶券面额的50%.
(1)若,,记消费者购买一件该商品的实际支付金额为X(单位:元),求X的分布列和数学期望;
(2)设所有消费者均闯过第一关获得了基础券,推出活动后商品购买概率为,记生产商销售一件该商品的期望利润为(单位:元).(期望利润=购买概率×(支付金额的期望-商品成本)-优惠券成本的期望)
(ⅰ)求关于p的函数表达式;
(ⅱ)证明:在内存在唯一极大值点,并求当p为何值时,商家期望利润最大?最大期望利润是多少?(结果保留1位小数)
【答案】(1)分布列见解析,80.8
(2)(ⅰ);(ⅱ)证明见解析,时,商家期望利润最大,最大期望利润约为6.7元.
【分析】(1)依题意确定X的可能取值,并利用独立事件的概率乘法公式计算出对应的概率,列出分布列并计算出数学期望;
(2)(ⅰ)分别求出支付金额的期望与优惠券成本的期望,代入期望利润的公式,计算即得;(ⅱ)利用求导判断的单调性,即可证明在内存在唯一极大值点,进而求得期望利润的最大值.
【详解】(1)由题可知,X的可能取值为100,90,80,70,60,
,,
,,
.
分布列为:
X
100
90
80
70
60
P
0.2
0.24
0.16
0.24
0.16
数学期望为:.
(2)(ⅰ)∵期望利润=购买概率×(支付金额的期望-商品成本)-优惠券成本的期望,
则支付金额的期望为:
;
优惠券成本的期望为
.
∴
.
(ⅱ)
令.解得,
当时,在上单调递增;
当时,在上单调递减;
∴在内存在唯一极大值点,
又,
∴当时,商家期望利润最大,最大期望利润约为6.7元.
15.(2026·江苏·一模)已知集合含有个元素,其中,先后两次随机、独立地选取集合的两个子集,记为与.设为集合中元素的个数,
(1)若,且,请列举所有满足条件的和;
(2)求随机变量的数学期望;
(3)设在处取得最大值,试建立与的关系.
【答案】(1)答案见解析
(2)
(3)答案见解析
【分析】(1)根据新定义求解即可;
(2)分类讨论,根据随机变量服从二项分布,利用期望公式求解即可;
(3)列出不等式组,求出取值范围,分类求与的关系即可.
【详解】(1)由题意,;;;;
;.
(2)根据集合的子集个数,可知集合A的可能情况有种;同理,集合B也可能有种.
因此,两集合的所有可能情况数为
X的所有取值为
当时,先从n个元素中选出k个元素,记为,有种可能情况;
对于这k个元素中的每个元素,满足时,
只可能满足这三种情况之一,有种可能情况.
因此,事件“”的所有可能情况数为,则
由,可知,则.
(3)若,由,,则,矛盾.
若,由,可知,当时,满足;
当时,满足
若,由,即,
即,解得,
从而,,其中为自然数.
16.(2026·江苏·一模)现有除颜色外都相同的3个红球和3个白球,随机取3个球放入一个不透明的袋中,记袋中红球的个数为.从袋中随机摸出一个球,并换入一个另一种颜色的球,经过次摸换,袋中的红球个数记为.
(1)求与;
(2)求;
(3)当时,求随机变量的数学期望.
【答案】(1),
(2)
(3)
【分析】(1)根据古典概型的概率公式可求概率;
(2)根据全概率公式可求;
(3)求出的分布列后可求的数学期望.
【详解】(1),.
(2)
,
故.
(3)当时,,,,,且,,
则
,
,
随机变量的数学期望.
(
统计
考点
6
)17.(2026·江苏扬州·一模)(多选)一组数据满足,若去掉后组成一组新数据.则新数据与原数据相比( )
A.极差变小 B.平均数变大
C.方差变小 D.第25百分位数变小
【答案】AC
【详解】由题意可知,原数据是公差为的等差数列,
设,则,去掉后,新数据为共8个数.
选项A:原极差:,
新极差:,
极差变小,A正确;
选项B:原平均数:,
新平均数:,平均数不变,B错误;
选项C:原平均数和新平均数均为,
原方差
新数据的方差
所以方差变小,C正确;
选项D:原数据共个:,向上取整得第25百分位数为第3个数
新数据共个:,第25百分位数为第2、3个数的平均,
百分位数变大,D错误.
18.(2026·江苏丹阳·一模)(多选)上饶市某学校从高一的800名男生中随机抽取50名测量身高,被测学生身高全部介于155cm和之间,将测量结果按如下方式分成八组:第一组,第二组,⋯,第八组.下图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组人数相同,第六组的人数为4人.以下说法正确的是( )
A.第二组的频率为0.016
B.第七组的频率为0.06
C.估计该校高一800名男生的身高的中位数约为
D.估计该校高一800名男生的身高的平均数约为
【答案】BCD
【分析】对于AB,由频率分布直方图矩形面积为1即可求得各组的频率,对于C,先确定中位数所在组,再用中位数计算方法即可求解,对于D,将各组中点值乘以频率后相加即可得到平均数.
【详解】对于A,第二组的频率为,故A错误;
对于B,由题意得第六组人数为4人,则有第六组的频率为,纵坐标为0.016,
所以第七组的满足,故B正确;
对于C,由直方图得,身高在第一组的频率为,
身高在第二组的频率为,
身高在第三组的频率为,
身高在第四组的频率为,
由于,,
设这所学校高一800名男生的身高中位数为,则,
则有,解得,故C正确;
对于D,设这所学校高一800名男生的身高平均数为,
身高在第五组的频率为,
身高在第六组的频率为,
身高在第七组的频率为,
身高在第八组的频率为,
则有,
故D正确.
故选:BCD.
19.(2026·江苏镇江·一模)(多选)在某校文艺汇演中,六位评委对某小品节目进行打分,得到一组分值7.7,8.1,8.2,8.7,9.4,9.9,若去掉一个最高分和一个最低分,则( )
A.这组分值的极差变小 B.这组分值的均值变大
C.这组分值的方差变小 D.这组分值的第75百分位数不变
【答案】AC
【分析】根据极差、百分位数、平均数和方差的定义求解,即可判断选项.
【详解】原始数据:7.7,8.1,8.2,8.7,9.4,9.9,
去掉一个最高分和一个最低分后: 8.1,8.2,8.7,9.4,
极差分别为,极差变小,故A正确;
均值分别为,
,均值变小,故B错误;
方差分别为
,
,方差变小,故C正确;
,,
第75百分位数分别为,,第75百分位数变小,故D错误.
20.(2026·江苏·一模)某工厂抽检一批零件,共120个,其中90个零件的合格率为90%,30个零件的合格率为80%,则这120个零件的合格率是______.
【答案】
【分析】根据平均数的公式求解即可.
【详解】由题意可得,这120个零件的合格率是.
故答案为:.
21.(2026·江苏·一模)若一组数的众数为,平均数为,则__________.
【答案】
【分析】先根据众数的定义确定的值,再根据平均数公式计算的值,最后求.
【详解】依题意可得众数,平均数,
故.
故答案为:.
22.(2026·江苏南京·一模)在对树人中学高一年级学生身高的调查中,采用样本比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生20人,其平均数和方差分别为170和10,抽取了女生30人,其平均数和方差分别为160和15.则估计出总样本的平均数为_____.
【答案】164
【分析】运用总体样本均值公式进行求解即可.
【详解】总样本的平均数为;
故答案为:164.
(
古典概型
考点
7
)23.(2026·江苏·一模)科学研究中经常涉及对粒子状态的分析.某假想粒子有状态1,状态2,状态3,……,每种状态下的粒子经过1秒有两种可能:状态保持不变或变为更高一级状态,已知状态1的粒子有的概率变为状态2,状态2的粒子有的概率变为状态3,以此类推.现有若干状态1的该粒子,则经过3秒处于状态1和状态2的粒子数目约占( )
A. B. C. D.
【答案】C
【分析】分别计算经过3秒后处于状态1和状态2的粒子的概率,然后将这两个概率相加,得到处于状态1和状态2的粒子数目占总粒子数的比例.
【详解】设经过3秒处于状态1的概率为,粒子要始终停留在状态 1,需连续3秒都保持状态 1,根据独立事件概率公式:;
设经过3秒处于状态2的概率为,
情况一:第1秒从状态1变为状态2,第2秒和第3秒都保持状态2不变,概率为;
情况二:第1秒保持状态1不变,第2秒从状态1变为状态2,第3秒保持状态2不变,概率为;
情况三:第1秒和第2秒保持状态1不变,第3秒从状态1变为状态2,概率为;
将上述三种情况的概率相加,得到经过3秒后处于状态2的粒子的概率为,
则经过3秒后处于状态1和状态2的粒子数目占总粒子数的比例为将经过3秒后处于状态1和状态2的粒子的概率相加,可得.
24.(2026·江苏·一模)用1,2,3,4,5,6组成六位数(没有重复数字),在任意相邻两个数字的奇偶性不同的条件下,1和2相邻的概率是( )
A. B. C. D.
【答案】C
【分析】首先算出任意相邻两个数字的奇偶性不同的6位数的个数,再讨论个位是偶数并分2在或不在个位计数,以及个位是奇数并分1在或不在个位计数,最后求目标概率.
【详解】将3个偶数排成一排有种,再将3个奇数分两种情况插空有种,
所以任意相邻两个数字的奇偶性不同的6位数有种,
任意相邻两个数字的奇偶性不同且1和2相邻,分两种情况讨论:
当个位是偶数:2在个位,则1在十位,此时有种;
2不在个位:将4或6放在个位,百位或万位上放2,在2的两侧选一个位置放1,最后剩余的2个位置放其它两个奇数,此时有种;
所以个位是偶数共有20种;
同理,个位是奇数也有20种,则任意相邻两个数字的奇偶性不同且1和2相邻数有40种,
所以任意相邻两个数字的奇偶性不同的条件下,1和2相邻的概率是.
故选:C
【点睛】关键点点睛:对任意相邻两个数字的奇偶性不同且1和2相邻做计数时,注意讨论特殊位置上放置偶数或奇数,进而分1、2是否在该位置的情况计数.
25.(2026·江苏·一模)从编号1~10的10张卡片中依次不放回地抽出两张,记事件A:“第一次抽到的卡片编号数字为5的倍数”,事件B:“第二次抽到的卡片编号数字小于第一次”,则( )
A. B. C. D.
【答案】B
【分析】根据古典概型的计算方法和分步乘法概率计算公式,求出事件的概率和积事件的概率,依据条件概率公式求出条件概率即可.
【详解】由题意,在1~10这10个数字中,5的倍数有5、10,共2个,
所以事件A发生的概率,
记事件AB表示“第一次抽到的卡片编号数字为5的倍数且第二次抽到的卡片编号数字小于第一次”,
若第一次抽到5,那么第二次从剩下9张卡片中抽小于5的卡片,有4种抽法;
若第一次抽到10,那么第二次从剩下9张卡片中抽小于10的卡片,有9种抽法;
所以.
根据条件概率公式,.
故选:B.
26.(2026·江苏·一模)(多选)甲、乙两个不透明的袋子里分别装有若干个除颜色外均相同的球,其中甲袋子里有2个红球,乙袋子里有3个红球和2个白球.现从乙袋子里随机取出2个球放入甲袋子里,再从甲袋子里随机取出1个球.记从甲袋子里取出红球的个数为,则( )
A. B.
C. D.
【答案】BC
【分析】分别求出从乙袋子中取出2个红球、2个白球和1个红球和1个白球的概率,分析X的可能取值,求出各个概率,可判断A、B的正误,代入期望公式,可判断C、D的正误.
【详解】设从乙袋子中取出2个红球为事件A,则,
从乙袋子中取出2个白球为事件B,则,
从乙袋子中取出1个红球和1个白球为事件C,则,
由题意,X的可能取值为0和1,
则
,故A错误,B正确;
所以,故C正确,D错误.
27.(2026·江苏·一模)一个不均匀的骰子,掷出1,2,3,4,5,6点的概率依次成等差数列.独立地先后掷该骰子两次,所得的点数分别记为.若事件“”发生的概率为,则事件“”发生的概率为_____.
【答案】
【分析】利用等差数列性质以及分布列性质可得,且;再利用完全平方公式计算可得结果.
【详解】设掷出点的概率分别为;
由于成等差数列,且,故;
事件“”发生的概率为;
事件“”发生的概率为;
于是;
由于,所以.
故答案为:
(
线性回归方程
考点
8
)28.(2026·江苏·一模)已知线性相关的两个变量,的取值如表所示,如果其线性回归方程为,那么当时的残差为( )
3
4
6
7
20
40
60
A.2 B.3 C.4 D.5
【答案】A
【分析】根据样本中心在回归直线上可求的值,从而可求残差.
【详解】由题设可得,故,
故即,故残差为,
故选:A.
29.(2026·江苏·一模)近年来某App用户保持连续增长,若李明收集了年的年份代码与该App在线用户数y(单位:万)的数据,具体如下表所示:
年份代码x
1
2
3
4
5
App在线用户数y(单位:万)
80
150
210
260
300
(1)求样本相关系数r,并判断变量x与y之间的线性相关关系的强弱:
(2)从年中随机抽取三个不同年份所对应的在线用户数据y,记最小的数据为X,求X的分布列及数学期望.
注:样本相关系数.当越接近1时,成对样本数据的线性相关程度越强;当它接近0时,成对样本数据的线性相关程度越弱.其中,.
【答案】(1),很强的线性正相关关系
(2)
X
80
150
210
P
【详解】(1)由题意,,,
则,
由,
同理,
则,
则,
由接近1且为正,故变量x与y之间有很强的线性正相关关系.
(2)由题意,X的可能取值为80、150、210,
则,,
,
故X的分布列为:
X
80
150
210
P
则.
30.(2026·江苏·一模)某兴趣小组研究昼夜温差大小与患感冒人数多少之间的关系,他们到气象局和医院抄录了1~7月份每月5日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
日期
1月5日
2月5日
3月5日
4月5日
5月5日
6月5日
7月5日
昼夜温差
10
11
13
12
8
7
6
感冒人数
23
25
29
26
16
13
9
该兴趣小组确定的研究方案是:先从这7组数据中选取2组,用剩下的5组数据求经验回归方程,再用被选取的2组数据进行检验.
(1)求选取的2组数据是不相邻的两个月的概率;
(2)若该小组选取的是1月与6月的两组数据,请根据剩下5个月份的数据:
①求出关于的经验回归方程;
②若由经验回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的经验回归方程是理想的,问:该小组所得经验回归方程是否理想?说明理由.
附:
【答案】(1)
(2)①;②是理想的,理由见解析
【分析】(1)利用组合数和对立事件概率公式直接求解即可;
(2)①利用最小二乘法直接求解即可;
②分别将和代入回归直线方程,由此可得预估值,与检验数据之差的绝对值均不超过2可确定结论.
【详解】(1)记事件为“选取的2组数据是不相邻的两个月”,
则
(2)①由题意,,.
1
3
2
4
8
5
则,
即,
所以关于的经验回归方程为.
②当时,;
当时,.
所以该小组所得经验回归方程是理想的.
(
独立性
检验
考点
9
)
31.(2026·江苏南通·一模)某地举办业余乒乓球联赛,比赛分“有缝球型”和“无缝球型”两个赛区,从该地区抽取部分选手进行调研,相关数据如下表:
喜欢用有缝球
喜欢用无缝球
直拍打法选手
18
30
横拍打法选手
20
12
(1)能否有95%以上的把握认为不同打法的选手对于有缝球和无缝球的喜好有影响?
(2)若从参加调研的“横拍打法”选手中用分层抽样的方法抽取8名选手,按照各自喜爱的球型参加相应赛区的比赛.现从8名选手中选3人,用AI监测他们的比赛数据,求两个赛区都有人被选中的概率.
附:,
0.100
0.050
0.010
2.706
3.841
6.635
【答案】(1)有95%以上的把握
(2)
【分析】(1)根据表中数据及公式计算判断;
(2)根据抽样比从各层中抽取相应人数,再利用古典概型概率计算公式求解.
【详解】(1)假设不同打法的选手对于有缝球和无缝球的喜好没有影响.
所以有95%以上的把握认为不同打法选手对于有缝球和无缝球的喜好有影响.
(2)根据分层抽样可知,各层的抽样比为,所以从喜欢有缝球的选手中选取人,从喜欢无缝球的选手中选取人,
记“两个赛区都有人被选中”为事件,
则.
答:两个赛区都有人被选中的概率为.
2 / 13
学科网(北京)股份有限公司
$