内容正文:
易错易混10 概率与统计、计数原理
目录(Ctrl并单击鼠标可跟踪链接)
01 错点扫描・易错建模夯基石 1
02 易错归纳・查漏补缺避陷阱 6
易错归纳01 中位数、百分位数的求解(★★★) 6
易错归纳02 平均数、方差的运算公式与性质(★★★★) 8
易错归纳03 频率分布直方图中数据特征的计算(★★★★) 11
易错归纳04 残差与决定系数(★★★★★) 17
易错归纳05 排列组合中的分组分配问题(★★★★) 21
易错归纳06 混淆二项式系数与项的系数(★★★★) 23
易错归纳07 互斥、对立、事件的相互独立性概念(公式)混淆(★★★★★) 27
易错归纳08 条件概率与全概率公式(★★★★★) 31
03 实战检测・易错通关验成效 37
一、频率分布直方图
1、频率分布直方图
(1)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在左闭右开区间,最后一组取闭区间;
也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:
①,
②个小长方形的面积等于1,
③.
(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.
(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,
频率分布直方图可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线.
总体密度曲线精确地反映了一个总体在各个区域内取值的规律.
2、根据频率分布直方图求平均数、中位数和众数
众数、中位数、平均数与频率分布直方图的关系
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)众数:众数是最高小矩形底边的中点所对应的数据.
二、总体百分位数的估计
1、第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2、计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
三、总体集中趋势的估计
1、相关概念
(1)众数:在样本数据中,出现次数最多的那个数据;
(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,
若样本数据个数为偶数,则取中间两个数据的平均数作为中位数。
(3)平均数:设样本的数据为,则样本的算术平均数为;
2、众数、中位数和平均数的比较
名称
优点
缺点
平均数
与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
中位数
不受少数几个极端数据(即排序靠前或靠后的数据)的影响
对极端值不敏感
众数
体现了样本数据的最大集中点
众数只能传递数据中的信息的很少一部分,对极端值不敏感
3、平均数相关结论:
①如果两组数和的平均数分别是和,则一组数的平均数是;
②如果一组数的平均数为,则一组数的平均数为。
③如果一组数的平均数为,则一组数的平均数为
四、总体离散程度的估计
1、用样本的标准差估计总体的标准差
(1)数据的离散程度可以用极差、方差或标准差来描述;
(2)极差(又叫全距)是一组数据的最大值和最小值之差,反映一组数据的变动幅度;
(3)样本方差描述了一组数据围绕平均数波动的大小;
一般地,设样本的数据为,样本的平均数为,
定义样本方差为;
简化公式:=
(方差等于原数据平方的平均数减去平均数的平方)
(4)样本的标准差是方差的算术平方根.
样本标准差.
标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围.
(5)方差相关结论:
①如果一组数的方差为,则一组数的方差为;
②如果一组数的方差为,则一组数的方差为。
五、残差与决定系数
1、残差
对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.
2、残差图
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
3、残差分析
残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.其步骤为:计算残差化残差图在残差图中分析残差特性.
4、残差平方和
残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
5、决定系数
决定系数是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.
,越大,即拟合效果越好,越小,模型拟合效果越差.
六、分组、分配问题
(1)整体均分问题,解题时要注意分组后,不管它们的顺序如何,都是一种情况,所以分组后一定要除以A(n为均分的组数),避免重复计数.
(2)局部均分问题,解题时注意重复的次数是均匀分组的阶乘数,即若有m组元素个数相等,则分组时应除以m!,一个分组过程中有几个这样的均匀分组就要除以几个这样的全排列数.
(3)不等分问题,只需先分组,后排列,分组时任何组中元素的个数都不相等,所以不需要除以全排列数.
七、二项式系数和与项的系数和
1、二项式系数和令,则二项式系数的和为
2、各项系数和:令,得.
八、事件的关系判断
1、互斥(互不相容):一般地,如果事件A与事件B不能同时发生,
也就是说A∩B是一个不可能事件,即A∩B=∅,则称事件A与事件B互斥(或互不相容)
2、互为对立:一般地,如果事件A与事件B在任何一次试验中有且仅有一个发生,
即A∪B=Ω,且A∩B=∅,那么称事件A与事件B互为对立.
事件A的对立事件记为
九、概率的基本性质
1、概率的基本性质
性质1
对任意的事件A,都有P(A)≥0.
性质2
必然事件的概率为1,不可能事件的概率为0,即P()= 1,P()=0.
性质3
如果事件A与事件B互斥,那么P()=P(A)+P(B). 推广:如果事件A1,A2,…,Am.两两互斥,那么事件发生的概率等于这m个事件分别发生的概率之和,即P()=P(A1)+P(A2)+…+P(Am).
性质4
如果事件A与事件B互为对立事件,那么P(B)=1P(A),
P(A)=1P(B).
性质5
如果,那么P(A)≤P(B).
性质6
设A,B是一个随机试验中的两个事件,我们有P()=P(A)+P(B) P().
十、事件的相互独立性
1、定义:对任意两个事件A与B,如果成立,则称事件A与事件B相互独立,简称为独立.
2、性质:如果事件A与事件B相互独立,则与,与,与也都相互独立。
3、两个相互独立事件同时发生的概率乘法:事件与事件相互独立,则
4、推广:两个事件的相互独立可以推广到个事件的相互独立性,即若事件相互独立,则这个事件同时发生的概率
十一、条件概率
1、定义:一般地,设,为两个随机事件,且,我们称为在事件发生的条件下,事件发生的条件概率,简称条件概率.
2、条件概率性质应用
(1)由条件概率的定义,对任意两个事件与,若,则.我们称上式为概率的乘法公式.
(2)如果和是两个互斥事件,则;
3、全概率公式及其应用
一般地,设,,是一组两两互斥的事件,,且,,则对任意的事件,有,我们称此公式为全概率公式.
4、贝叶斯公式及其应用
(1)设,,是一组两两互斥的事件,,且,,
则对任意的事件,,有,.
易错归纳01 中位数、百分位数的求解
【易错陷阱·避错攻略】
在求数据的中位数、百分数时,一定要先把数据从小到大排列,然后再根据中位数、百分数的定义进行求解.
1.(2025·陕西西安·三模)样本数据的中位数是( )
A.8 B.8.5 C.9 D.9.5
【答案】B
【分析】从小到大排列后,取第四、五个数的平均数可得.
【详解】从小到大排列为,
共有8个数,所以中位数为.
故选:B.
2.(25-26高三上·山东潍坊·期中)某科技攻关青年团队共有20人,他们的年龄分布如下表所示.则这20人年龄的60%分位数为( )
年龄
28
29
30
32
36
40
45
人数
1
3
3
5
4
3
1
A.30 B.32 C.34 D.36
【答案】C
【分析】结合表格数据根据百分位数的概念求解即可.
【详解】因为,又,
这20人年龄的60%分位数为.
故选:C.
3.(2025·河北保定·三模)一组数据按从小到大排列为2,4,6,a,13,14,如果该组数据的中位数与这组数据的第60百分位数相等,则该组数据的平均数为( )
A.7.5 B.6 C.4.5 D.3
【答案】A
【分析】根据给定条件,利用中位数、第60百分位数的定义求出,进而求出平均数.
【详解】这组数据的中位数为,由,得这组数据的第60百分位数为,
因此,解得,所以这组数据的平均数为.
故选:A
4.(2025·山西·模拟预测)某大学科研团队利用自主开发的新型静电电机,成功研制出仅重4.21克的太阳能动力微型无人机,实现纯自然光供能下的持续飞行.为激发同学们对无人机的兴趣,某校无人机兴趣社团在校内进行选拔赛,8名参赛学生的成绩依次为,,,,,,,,则这组数据的上四分位数为( )
A.93 B.92 C.91.5 D.93.5
【答案】D
【分析】从小到大排列,根据上四分位数的定义计算得到答案.
【详解】从小到大排列得到,
由得上四分位数为.
故选:D.
5.(25-26高三上·贵州·月考)某社区为了解该社区老年人的运动情况,在该社区随机抽取70名老年人,对他们一周的运动时长(单位:小时)进行统计,数据如下表,则该组数据的中位数为( )
一周的运动时长
3
4
5
6
7
8
9
人数
15
10
8
10
10
8
9
A.4小时 B.6小时 C.5小时 D.5.5小时
【答案】B
【分析】根据中位数的求法求得正确答案.
【详解】由,则中位数为第35个数和第36个数的平均数,
因为,,
则第35个数和第36个数均为6,
所以该组数据的中位数为6小时.
故选:B
易错归纳02 平均数、方差的运算公式与性质
【易错陷阱·避错攻略】
方差(标准差)越大,说明数据的离散性越大;方差(标准差)越小,说明数据的离散性越小,数据越集中、稳定.用样本的数字特征估计总体的数字特征时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,这些偏差是由样本的随机性引起的.虽然样本的数字特征并不是总体真正的数字特征,而是总体的一个估计,但这种估计是合理的,特别是当样本容量很大时,样本的数字特征稳定于总体的数字特征.
1.已知一组数,,,的平均数是3,方差为4,则数据,,,的平均数和标准差分别是( )
A.7,4 B.7,16 C.6,4 D.6,16
【答案】A
【分析】利用平均数与方差的性质求解即可.
【详解】由题知,,
所以,,,的平均数,
方差,所以标准差为4.
故选:A.
2.(2025·河北·一模)在一组数据中,出现的频率分别为,则这组数据的方差为( )
A.2 B.2.4 C.3 D.4
【答案】B
【分析】先求出平均数,再根据方差公式计算即可.
【详解】这组数据的平均数.
方差.
故选:B.
3.(2025·甘肃武威·模拟预测)某学校从高三某次联考中随机抽取了甲班50名、乙班40名学生的成绩.已知甲班50名学生成绩的平均数为112分,方差为8,乙班40名学生成绩的平均数为94分,方差为8,则这90名学生成绩的方差为( )
A.8 B.36 C.64 D.88
【答案】D
【分析】根据两组数据的均值和方差,利用方差合并公式计算可得.
【详解】设甲班50名学生成绩的平均数和方差分别为,,
乙班40名学生成绩的平均数和方差分别为,,
则,,,,
所以这90名学生成绩的平均数为,
则这90名学生成绩的方差为
.
故选:D.
4.(25-26高三上·河北邢台·期中)已知互不相等的数据的平均数为,方差为,数据的方差为,则,的大小关系为( )
A. B. C. D.无法判断
【答案】C
【分析】应用平均数、方差的求法,用表示出,即可得.
【详解】由,则,
设的平均数为,
所以.
所以,
而,
因为互不相等,
所以.
故选:C.
5.(25-26高三上·山东青岛·开学考试)某校为了解学生每个月在图书馆借阅书籍的数量,图书管理员甲抽取了一个容量为100的样本,并算得样本的平均数为5,方差为9;图书管理员乙也抽取了一个容量为100的样本,并算得样本的平均数为7,方差为16.若将两个样本合在一起组成一个容量为200的新样本,则新样本数据的( )
A.平均数为5.5 B.平均数为6.5 C.方差为12.5 D.方差为13.5
【答案】D
【分析】根据给定条件,利用平均数公式及方差公式分别计算即可判断.
【详解】甲抽取的样本数据为;乙抽取的样本数据为,
依题意,,,,,
新样本数据的平均数,故A、B错误;
新样本数据的方差
,故C错误,D正确.
故选:D.
6.(2025·江西·模拟预测)(多选题)将一组互不相同的数据,,,,中的每一个数都变成原来的2倍再减去1,则这两组数据可能相同的数字特征是( )
A.平均数 B.中位数 C.方差 D.极差
【答案】AB
【分析】由数据变换前后的数字特征之间的关系可解.
【详解】不妨设,,,,视为从小到大排序,原平均数为,变化后的平均数为,当时,,故A正确;
原中位数为,变化后的中位数为,当时,,故B正确;
原方差为,变化后的方差为,若两方差相等,则,得,此时每个数都相等,与已知矛盾,故C错误;
原极差为,变化后的极差为,若两极差相等,则,与已知矛盾,故D错误;
故选:AB.
7.(25-26高三上·青海西宁·开学考试)(多选题)已知一组数据:27,37,14,33,47,26,24,18,35,若去掉14和47,则剩下的数据与原数据相比,下列说法正确的是( )
A.中位数不变 B.平均数不变 C.方差不变 D.第40百分位数不变
【答案】AD
【分析】依次分别算出这组数据去掉14和47前后的平均数,方差,第40百分位数和中位数,对比即可得解.
【详解】将原数据按从小到大的顺序排列为14,18,24,26,27,33,35,37,47,其中位数为27,平均数为,
方差是,
由,得原数据的第40百分位数是第4个数26.
若去掉14和47,得到新的一组数据为:18,24,26,27,33,35,37,其中位数为27,
平均数是,
方差是,由,得新数据的第40百分位数是第3个数26,
故中位数和第40百分位数不变,平均数与方差改变,故A,D正确,B,C错误.
故选:AD.
易错归纳03 频率分布直方图中数据特征的计算
【易错陷阱·避错攻略】
利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即是众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
1.(2025·广西河池·三模)(多选题)阅读不仅能帮助孩子积累知识,还能提升他们的语言表达能力和思维能力,从小培养阅读习惯显得尤为重要.为了了解小学生的阅读情况,随机调查了某市1000名小学生每日阅读的情况,并将这1000名小学生每日的阅读时间数据绘制成如图所示的频率分布直方图,则( )
A.
B.估计样本中有75%的小学生每日的阅读时间不超过40分钟
C.估计样本中小学生每日的阅读时间的中位数为40分钟
D.估计样本中小学生每日的平均阅读时间为33.6分钟(每组数据以该组区间的中间值作代表)
【答案】ABD
【分析】根据频率和为1求的值判断A的真假;求阅读时间不超过40分钟的频率判断B的真假;根据频率分布直方图估计中位数判断C的真假;估计平均数判断D的真假.
【详解】对A:由,故A正确;
对B:阅读时间不超过40分钟的频率为,即估计样本中有75%的小学生每日的阅读时间不超过40分钟,故B正确;
对C:由B的计算结果,40是该组数据的第百分位数,所以中位数应该小于40,故C错误;
对D:估计样本的平均数为:,故D正确.
故选:ABD
2.(2025·广东清远·一模)(多选题)某企业招聘考试分笔试与面试,笔试满分为100分,笔试成绩排名前(含)的考生才可以参加面试.现有1800人报名参加笔试,所有考生的笔试成绩和年龄分别如下图所示,则( )
A.90后考生比00后考生多100人
B.所有考生笔试成绩的分位数约为83.3(保留一位小数)
C.进入面试的笔试成绩最低分约为85.7(保留一位小数)
D.所有考生笔试成绩的中位数大于平均数
【答案】BD
【分析】根据题意,由统计图表中的数据,结合频率分布直方图的面积和百分位数,以及平均数的计算公式,逐项判定,即可求解.
【详解】对于A中,由年龄的扇形统计图,可得90后的考生有人,
00后的考生有人,可得人,所以A不正确;
对于B中,由频率分布直方图性质,可得,
解得,则前三个矩形的面积和,
前四个矩形的面积和,
所有考生笔试成绩的分位数,所以,
所以笔试成绩的分位数为分,所以B正确;
对于C中,设进入面试成绩的最低分为,由前三个矩形的面积和为,第四个矩形的面积为,则分,所以C不正确;
对于D中,根据频率分布直方图的平均数的计算公式,可得考试的平均成绩为:
分,
因为前两个矩形的面积和,前三个矩形的面积和,
设考试成绩的中位数设为,所以,所以笔试成绩的中位数为分,所以D正确.
故选:BD.
3.(23-24高三上·湖南长沙·月考)(多选题)抽取市某届马拉松比赛前5000名的部分跑者成绩绘制如下频数分布表(单位:分钟):
分组
频数
20
60
160
140
80
40
则下列选项正确的是( )
A.估计总体中成绩落在分钟内的选手人数为4500
B.这组数据平均数的估计值为307分钟
C.这组数据第62百分位数的估计值为325分钟
D.在由以上数据绘制的频率分布直方图中,各组长方形的高度之和为0.02
【答案】BCD
【分析】根据前五组的频率求解人数判断A,根据平均数计算公式求解判断B,根据百分位数的概念求解判断C,根据频率分布直方图中面积之和等于1求解高度之和判断D.
【详解】A项,用样本估计总体,
估计总体中成绩落在分钟内的选手人数为,A项错误;
平均数的估计值为
,B项正确;
C项,这组数据中区间对应的频率为,
区间对应的频率为,
故这组数据第62百分位数落在区间中,
设第62百分位数为,则,解得,C项正确;
在由以上数据绘制的频率分布直方图中,纵坐标为频率除组距,
因此各组长方形的高度之和为,D项正确.
故选:BCD
4.(2025·四川自贡·三模)(多选题)为了解本地区居民用水情况,甲、乙两个兴趣小组同学利用假期分别对、两个社区随机选择100户居民进行了“家庭月用水量”的调查统计,利用调查数据分别绘制成频率分布直方图(如图所示).甲组同学所得数据的中位数、平均数、众数、标准差分别记为、、、,乙组同学所得数据的中位数、平均数、众数、标准差分别记为、、、.则下列判断正确的有( ).
A.且. B.且.
C.且. D..
【答案】ABD
【分析】根据频率分布直方图的中位数,平均数公式,众数公式,可判断结果,标准差是衡量数据的离散程度,数据越集中,标准差越小,从而可判断标准差.
【详解】中位数的计算与比较:
由图甲可判断甲组数据的中位数在[7,10.5)内,
第一组[0,3.5)的数据的频率为0.01×3.5=0.035,第二组[3.5,7)频率为0.10×3.5=0.35,
则,解得,
由图乙可判断乙组数据的中位数在[10.5,14)内,
则,解得,所以<.
平均数的计算与比较:
甲组平均数 :
.
乙组平均数:
.
所以.
众数的计算与比较:
由图甲可得甲组众数;
由图乙可得乙组众数,所以 .
标准差的比较:
因甲组数据分布相对分散,乙组数据相对集中在中间区间,所以.
对于A,由前面计算可知<且,故A 正确;
对于B,因且,故B正确;
对于C,由前分析得,,,
,,,故C错误;
对于D ,因,,,则 ,故D正确 .
故答案选 ABD.
5.(多选题)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则( )
A.骑车时间的中位数的估计值22分钟
B.坐公交车时间的40%分位数的估计值是19分钟
C.坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值
D.坐公交车时间的方差的估计值大于骑车时间的方差的估计值
【答案】BCD
【分析】A根据频率分布直方图中位数计算方法可得;
B选项根据频率分布直方图百分位数计算方法可得;
C选项根据频率分布直方图平均数计算方法可得;
D选项根据频率分布直方图观察数据集中程度可得.
【详解】A选项:设骑车时间的中位数为,由频率分布直方图可知
,
得,
故A错误;
B选项:设坐公交车时间的40%分位数的估计值是,
由频率分布直方图可知,
得,
故B正确;
C选项:
坐公交车时间的平均数的估计值
骑车时间的平均数的估计值
故,C正确;
选项D:由频率分布直方图观察可知,骑车时间的数据更集中,
所以坐公交车时间的方差的估计值大于骑车时间的方差的估计值.
故D正确.
故选:BCD
易错归纳04 残差与决定系数
【易错陷阱·避错攻略】
残差分析
对于预报变量,通过观测得到的数据称为观测值,通过回归方程得到的称为预测值,观测值减去预测值等于残差,称为相应于点的残差,即有.
残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
(1)残差图:通过残差分析,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.
(2)通过残差平方和分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;反之,不合适.
(3)相关指数:用相关指数来刻画回归的效果,其计算公式是:.
1.(24-25高三上·天津西青·月考)如图所示,5 个数据,去掉 后,下列说法正确的是( )
A.相关系数变小 B.决定系数变小
C.残差平方和变小 D.解释变量与预报变量的相关性变弱
【答案】C
【分析】由散点图知,去掉离群点后, 与的相关性变强,且为正相关,由此判断即可.
【详解】由散点图知,去掉离群点后,与的相关性变强,且为正相关,
所以相关系数的值变大,决定系数的值变大,残差平方和变小.
故选:C.
2.(2025·江西新余·模拟预测)样本点数据,且大致呈线性分布,其经验回归方程为,若,数据的80%分位数为7,则当时,随机误差的残差为:( ).
A.-0.5 B.0.5 C.-1.5 D.1.5
【答案】B
【分析】根据题意计算出观测值与预估值,再计算残差即可.
【详解】将从小到大排列,,所以,预测值为,
所以残差为观测值-预测值=6-5.5=0.5
故选:B.
3.根据变量Y和x的成对样本数据,由一元线性回归模型得到经验回归模型,求得残差图.对于以下四幅残差图,满足一元线性回归模型中对随机误差假设的是( )
A. B.
C. D.
【答案】D
【分析】根据一元线性回归模型中对随机误差的假定进行判断.
【详解】根据一元线性回归模型中对随机误差的假定,残差应是均值为、方差为的随机变量的观测值.
对于A选项,残差与有线性关系,故A错误;
对于B选项,残差的方差不是一个常数,随着观测时间变大而变小,故B错;
对于C选项,残差与有非线性关系,故C错;
对于D选项,残差比较均匀地分布在以取值为的横轴为对称轴的水平带状区域内,故D正确.
故选:D.
4.已知某产品的色度y和色差x之间满足线性相关关系,且现有一对测量数据为,则该数据的残差为( )
色差x
色度y
15
18
19
20
A. B. C.0.6 D.0.76
【答案】C
【分析】求得样本中心代入回归方程后,将代入回归方程,求出预测值,从而求出残差.
【详解】因为,,
所以样本中心为,,
即色度y和色差x之间满足线性回归方程为:,
当时,,
故残差为.
故选:C.
5.耐盐碱水稻俗称“海水稻”,是一种可以长在滩涂和盐碱地的水稻.海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究浇灌海水浓度(单位:‰)对亩产量(单位:吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与浇灌海水浓度的有关数据如下表.绘制散点图发现,可用线性回归模型拟合亩产量与浇灌海水浓度之间的相关关系,用最小二乘法计算得与之间的经验回归方程为.
浇灌海水浓度
3
4
5
6
7
亩产量吨
0.62
0.58
0.49
0.4
0.31
残差
(1)求,并估计当浇灌海水浓度为8‰时该品种的亩产量;
(2)①将上表补充完整;
②统计学中常用决定系数来刻画回归效果,越大,模型拟合效果越好,如假设,就说明响应变量的差异有是由解释变量引起的.请计算决定系数(精确到0.01),并指出亩产量的变化多大程度上是由浇灌海水浓度引起的?
【答案】(1),0.24吨.
(2)①答案见解析;②0.98,亩产量的变化有是由浇灌海水浓度引起的
【分析】(1)计算,代入得,当时,代入计算即可求解;
(2)①根据残差计算即可;②根据公式可求相关指数,从而可得亩产量的变化多大程度上是由浇灌海水浓度引起的.
【详解】(1)经计算,得,由可得,,则当时,,所以估计当浇灌海水浓度为8‰时,该品种的亩产量为0.24吨.
(2)①由(1)知,从而有
浇灌海水浓度/‰
3
4
5
6
7
亩产量吨
0.62
0.58
0.49
0.4
0.31
残差
-0.02
0.02
0.01
0
-0.01
②,所以亩产量的变化有是由浇灌海水浓度引起的.
6.(2025·广西来宾·模拟预测)现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本(单位:万元)和企业利润的数据(单位:万元)如下表所示:
月份
1
2
3
4
5
6
7
8
物流成本
83
83.5
80
86.5
89
84.5
79
86.5
利润
114
116
106
122
132
114
132
残差
0.2
0.6
1.8
-3
-1
-4.6
根据最小二乘法公式求得经验回归方程为.
(1)求的值,并利用已知的经验回归方程求出8月份对应的残差值;
(2)请先求出线性回归模型的决定系数(精确到0.0001),若根据非线性模型求得解释变量(物流成本)对于响应变量(利润)的决定系数,请说明以上两种模型哪种模型拟合效果更好.
参考公式及数据:,,.
【答案】(1),;
(2),拟合程度更好.
【分析】(1)根据经验回归方程过样本中心点,先由经验回归方程和的平均数,求出的平均数,再根据平均数的定义求出;然后根据残差定义计算8月份的残差.
(2)先求出残差平方和,再代入公式计算,最后与非线性回归模型的比较大小,即可判断.
【详解】(1)因为,,,
则,解得;
8月份对应的残差值.
(2)因为,
所以,
所以,
所以线性回归模型拟合程度更好.
易错归纳05 排列组合中的分组分配问题
【易错陷阱·避错攻略】
对于分堆与分配问题应注意:①处理分配问题要注意先分堆再分配;②被分配的元素是不同的,位置也应是不同的;③分堆时要注意是否均匀.
1.(2025·湖南娄底·二模)长沙是一座有着悠久历史和丰富文化底蕴的城市,其当地美食也独具特色.某个假期期间,一名游客前往长沙旅游打卡,现要每天分别从臭豆腐、炸藕夹、剁椒鱼头、辣椒小炒肉、酱板鸭、糖油粑粑这6种美食中随机选择2种品尝(选择的2种美食不分先后顺序),若三天后他品尝完这6种美食,则这三天他选择美食的不同选法种数为( )
A.90 B.120 C.150 D.180
【答案】A
【分析】将6种美食平均分成3组,再排到3天去品尝即可.
【详解】将6种美食平均分成3组,有种不同的分法,
该游客每天选择其中一组美食进行品尝,有种不同的选法,
所以这三天他选择美食的不同选法种数为种.
故选:A
2.(25-26高三上·河南·期中)某校园诗歌朗诵大赛共有5名同学进入决赛,决赛要求这5名同学均从《琵琶行》《蜀道难》《离骚》中选择1篇进行参赛,且这3篇诗歌中每篇均有同学选择,则这5名同学诗歌篇目的选择情况共有( )
A.150种 B.240种 C.180种 D.120种
【答案】A
【分析】由题意人数分配只能是“2,2,1”与“3,1,1” 两种组合,分类求解即可.
【详解】5名同学分配到3篇诗歌(每篇至少1人),人数分配只能是 “2,2,1” 或 “3,1,1” 两种组合,
若人数分配为“2,2,1”,则有种不同选择情况;
若人数分配为“3,1,1”,则有种不同选择情况;
综上,共有种不同选择情况.
故选:A
3.(25-26高三上·陕西西安·开学考试)某校安排高一年级(1)~(5)班共5个班去A,B,C,D四个劳动教育基地进行社会实践,每个班去一个基地,每个基地至少安排一个班,则高一(1)班被安排到A基地的排法种数为( )
A.24 B.36 C.60 D.240
【答案】C
【分析】根据只有高一(1)班被安排到A基地与还有一个班和高一(1)班一起被安排到A基地两种情况,结合排列组合知识求解即可.
【详解】由题得,若只有高一(1)班被安排到A基地,则有(种)安排方法,
若还有1个班和高一(1)班一起被安排到A基地,则有(种)安排方法,
故高一(1)班被安排到A基地的安排方法种数为种.
故选:C.
4.(2025·湖南郴州·一模)“湘超”足球比赛正在如火如荼进行中,某企业赞助一批足球训练设备给甲、乙、丙三个球队.这批设备分别为个相同的跳箱和箱相同的药球.要求每队至少有一个跳箱,且药球不能全部分配给同一球队,则不同的分配方案有( )
A.种 B.种 C.种 D.种
【答案】B
【分析】分两步完成,先分跳箱、再分药球,确定每一步的分法种数,结合分步乘法计数原理可得结果.
【详解】分以下两步:
(1)先分跳箱:个相同的跳箱分给三个球队,三个球队分得的跳箱数量分别为、、或、、或、、,
所以,跳箱的分法种数为种;
(2)接下来分药球:将个药球分给三个球队,三个球队分得的药球数量分别为、、或、、,
所以,药球的分法种数为种.
由分步乘法计数原理可知,不同的分法种数为种.
故选:B.
5.(2025·云南昆明·模拟预测)将甲、乙等6名志愿者分配到3个社区协助开展活动,每个社区至少1人,每个人只去1个社区,且甲、乙两人不在同1个社区,则不同的分配方法数是( )
A.540 B.504 C.408 D.390
【答案】D
【分析】先分组后分配,再间接减去甲、乙在一起的情况即可.
【详解】总的分配方法有种.
若按照分堆,甲、乙在一起的情况有种;
若按照分堆,甲、乙在一起的情况有种;
若按照分堆,甲、乙在一起的情况有种,故不同的分配方法数为.
故选D.
易错归纳06 混淆二项式系数与项的系数
【易错陷阱·避错攻略】
处理二项展开式的系数问题要区分“二项式系数”与“项的系数”的区别:二项展开式中各项的二项式系数为(),项的系数是指该项中除变量外的常数部分,包含符号等.
1.(24-25高三下·河北承德·月考)若展开式的二项式系数之和为,则展开式中含项的系数为( )
A. B. C. D.
【答案】B
【分析】根据二项式系数和为可得,利用通项公式计算可得结果.
【详解】∵展开式的二项式系数之和为,
∴,故,
∴展开式的第项为,
由得,
∴,即含项的系数为.
故选:B.
2.(2025·江苏徐州·模拟预测)已知的展开式中第2项与第5项的系数相等,则偶数项的二项式系数和为( )
A.8 B.16 C.32 D.64
【答案】B
【分析】根据给定条件,求出,再利用二项式系数的性质求解.
【详解】依题意,,解得,
所以的展开式偶数项的二项式系数和为.
故选:B
3.若的展开式中各项系数之和为,则第四项与第五项的系数之比为( )
A. B. C. D.
【答案】D
【分析】先令,根据各项系数之和解得,再求对应项系数计算比值即可.
【详解】的各项系数和:令,则,
所以,所以的通项,第四项的系数:令,得,
第五项的系数:令,得,
所以.
故选:D.
4.(25-26高三上·广东揭阳·期中)已知的展开式中各项系数之和为64,则该展开式的常数项为( )
A.10 B.20 C.30 D.40
【答案】B
【分析】先由赋值法得到关于a的方程求出a,接着求出二项式展开式中含和的项即可求出展开式的常数项,进而得解.
【详解】令得,解得,
二项式的展开式的通项公式为且,
所以当时,;当时,,
所以二项式展开式的常数项为.
故选:B
5.的展开式中,二项式系数最大的项是第四项和第五项,则的系数为( )
A.35 B. C. D.
【答案】D
【分析】根据二项式系数的增减性确定的值,再利用通项求出含的项即可得出结果.
【详解】由二项式系数最大的项是第四项和第五项可知,即可得,
二项展开式的通项为,
令,解得;
因此含的项为;
即的系数为.
故选:D
6.在的展开式中含项的系数为15,则展开式中二项式系数最大的是第( )项
A.2 B.3 C.4 D.5
【答案】C
【分析】根据二项式定理展开式化简得出通项,结合已知列出方程组求出的值,结合二项式定理的性质即可得出答案.
【详解】根据二项式定理可知的展开式的通项为
.
由已知可得,,解得.
根据二项式定理的性质可知,该展开式中二项式系数最大的是第4项.
故选:C.
7.已知,则( )
A. B. C. D.
【答案】D
【分析】对展开式两边同时求导,再令即可求解得结果.
【详解】对两边求导,
得.
令,得.
故选:D.
8.(24-25高三下·云南昭通·月考)在的展开式中,二项式系数的最大值为20,则系数的最大值为( )
A.729 B.1243 C.1458 D.2187
【答案】C
【分析】根据二项式系数最大值求出,再列不等式得出系数的最大值.
【详解】因为,,,所以.
设展开式的第项的系数为,则,.
令得,所以取,得.
故选:C.
易错归纳07 互斥、对立、事件的相互独立性概念(公式)混淆
【易错陷阱·避错攻略】
(1)判断互斥事件、对立事件一般用定义判断,不可能同时发生的两个事件为互斥事件;两个事件,若有且仅有一个发生,则这两事件为对立事件,对立事件一定是互斥事件.
(2)互斥事件与相互独立事件的相同点与不同点:①相同点:二者都是描述两个事件间的关系;
②不同点:互斥事件强调两事件不可能同时发生,即P(AB)=0,相互独立事件则强调一个事件的发生与否对另一个事件发生的概率没有影响.
1.(多选题)已知,为随机事件,,,则下列结论正确的有( )
A.若,为互斥事件,则 B.若,为互斥事件,则
C.若,相互独立,则 D.若,相互独立,则
【答案】ACD
【分析】利用互斥事件的概率公式即可判断AB,利用独立事件的概率公式即可判断C,利用独立事件先计算,由即可判断D.
【详解】对于A:若,为互斥事件,所以,故A正确;
对于B:若,为互斥事件,则,
所以,故B错误;
对于C:若,相互独立,所以与相互独立,
所以,故C正确;
对于D:若,相互独立,,
所以,故D正确.
故选:ACD
2.(2025·云南玉溪·模拟预测)(多选题)已知A,B为随机事件,且,,则下列结论错误的是( )
A.若互斥,则 B.若相互独立,
C.若,则 D.若相互独立,则
【答案】CD
【分析】利用互斥事件的概率公式判断A;利用概率的加法公式判断B;利用对立事件和条件概率的概率公式判断C;利用独立事件的概率公式判断D.
【详解】若互斥,则,故A正确;
若相互独立,则,
则,故B正确;
若相互独立,则相互独立,
则,故D错误;
若,则,
则,则,
则,故C错误.
故选:CD
3.(25-26高三上·湖南常德·开学考试)(多选题)已知随机事件发生的概率满足,且事件与互斥,则下列说法正确的是( )
A.
B.与相互独立
C.
D.若与相互独立,则
【答案】ABD
【分析】根据互斥得到,由计算可判断A;根据求出,结合的值可判断B;由A与互斥,得与互斥,求得可判断C;由与相互独立,可求,再结合求得,根据条件概率公式求得即可判断D.
【详解】对于A,与互斥,故,,则,故A正确;
对于B,,即,故,故,与相互独立,B正确;
对于C,A与互斥,故与互斥,故,C错误;
对于D,因为与相互独立,,
又,∴,
∴,故D正确.
故选:ABD.
4.(多选题)已知为古典概型样本空间中的两个随机事件,其中,则下列选项正确的是( )
A.事件与互斥 B.
C.事件与独立 D.
【答案】BCD
【分析】通过Veen图,确定各自事件包含基本事件个数,结合古典概率概率计算公式及独立事件概率,逐个判断即可.
【详解】由,
可得,所以事件与不互斥,A错误;
,
所以,B正确,
,
显然,C正确,
如图阴影部分即为,
所以,
可得,D正确,
故选:BCD
5.(24-25高三下·重庆·月考)(多选题)已知,为随机事件,的对立事件,,且,则( )
A. B.
C. D.
【答案】ABC
【分析】根据条件概率的计算公式,事件的相互独立性,概率的加法公式逐一求解判断.
【详解】,
,即事件,相互独立,故A正确;
则,故B正确;
且,相互独立,则,故C正确;
又,故D错误.
故选:ABC.
6.(25-26高三上·江西上饶·月考)(多选题)设事件满足,且,则( )
A.事件与事件一定不相互独立
B.事件与事件一定不互斥
C.在事件发生的条件下,事件发生与不发生的概率相等
D.在事件发生的条件下,事件发生与不发生的概率相等
【答案】BC
【分析】根据题意可得.对于A:分析可知当时,事件与事件相互独立,即可判断;对于B:可得,即可判断;对于C:根据题意结合条件概率公式分析判断;对于D:举反例说明即可.
【详解】因为,
则,可得.
对于选项A:若事件与事件相互独立,则,
即,由于,故,
即当时,事件与事件相互独立,故A错误;
对于选项B:事件与事件互斥的充要条件是,
因为,则其一定不互斥,故B正确;
对于选项C:因为,且,
则,即,
所以在事件发生的条件下,事件发生与不发生的概率相等,故C正确;
对于选项D:例如,由选项A可知:事件与事件相互独立,
则,,
即,则,故D错误.
故选:BC.
易错归纳08 条件概率与全概率公式
【易错陷阱·避错攻略】
解决条件概率问题的步骤
第一步,判断是否为条件概率,若题目中出现“已知”“在……前提下”等字眼,一般为条件概率.题目中若没有出现上述字眼,但已知事件的出现影响所求事件的概率时,也需注意是否为条件概率.若为条件概率,则进行第二步.
第二步,计算概率,这里有两种思路:
思路一
缩减样本空间法计算条件概率,如求P(A|B),可分别求出事件B,AB包含的基本事件的个数,再利用公式P(A|B)=计算
思路二
直接利用公式计算条件概率,即先分别计算出P(AB),P(B),再利用公式P(A|B)=计算
1.(25-26高三上·山东青岛·开学考试)盒中装有个红球和个蓝球,小球除颜色外均相同.甲、乙两人先后从盒中随机取出个球,记录颜色后放回.已知两人取出的球颜色相同,则两人取出的球同为蓝色的概率为( )
A. B. C. D.
【答案】C
【分析】记事件两人取出的球颜色相同,事件两人取出的球同为蓝色,利用条件概率公式可求得的值.
【详解】记事件两人取出的球颜色相同,事件两人取出的球同为蓝色,则,
则,,
由条件概率公式可得,
故选:C.
2.(25-26高三上·河北沧州·月考)已知口袋内放有8个大小、质地均匀的小球,其中4个白球,4个红球,每次从中不放回地摸出2个小球,设事件表示第1次摸出的小球中恰有1个红球,事件表示第2次摸出的小球中有红球,则( )
A. B. C. D.
【答案】A
【分析】由条件概率定义即可求得.
【详解】因为是不放回,所以第1次摸完后还剩6个球,
又因为事件发生了,即第1次摸出了1个红球和1个白球,还剩3个红球和3个白球.
,
故选:A.
3.(25-26高三上·江苏南京·月考)从编号1~7的7张卡片中依次不放回地抽出两张,记事件A:“第一次抽到的卡片编号数字为3的倍数”,事件B:“第二次抽到的卡片编号数字大于第一次抽到的卡片编号数字”,则( )
A. B. C. D.
【答案】A
【分析】根据古典概型概率公式及条件概率公式求解即可.
【详解】第一次抽到3或6的概率为,所以,
当第一次抽到3时:第二次可抽4,5,6,7,共4种情况;
当第一次抽到6时,第二次可抽7,共1种情况,
所以,
.
故选:A.
4.(25-26高三上·江西·月考)某百货商场为促销举办抽奖活动,设有两种奖券:甲奖券和乙奖券.顾客每次抽取甲奖券中奖的概率为0.4,每次抽取乙奖券中奖的概率为0.5,每次抽奖结果相互独立.某顾客计划先抽取2张甲奖券,再抽取1张乙奖券.若该顾客恰好中奖2次,且其中有1张甲奖券中奖,则另外中奖的1张也是甲奖券的概率为( )
A.0.12 B.0.2 C.0.25 D.0.32
【答案】C
【分析】利用条件概率计算公式以及独立事件的乘法公式可求解.
【详解】设事件:恰好中奖2次且其中有1张甲奖券中奖,即甲奖券中奖1次且乙奖券中奖1次或甲奖券中奖2次且乙奖券不中奖,
事件:恰好中奖2次且均为甲奖券,即甲奖券中奖2次,乙奖券不中奖,
则,,
又由,
所以所求概率为.
故选: C.
5.(2025·江西·模拟预测)儿童牙齿是否健康与早晚是否都刷牙有关.据调查,某幼儿园大约有的学生牙齿健康,大约有的学生早晚都刷牙,且其中早晚都刷牙的学生中约有的学生牙齿健康.现从不是早晚都刷牙的学生中任意调查一名学生,则他的牙齿健康的概率约为( )
A. B. C. D.
【答案】A
【分析】设出事件,利用全概率公式和条件概率公式进行求解.
【详解】不是早晚都刷牙且牙齿健康的学生占.
记“该学生不是早晚都刷牙”为事件A,“该学生牙齿健康”为事件B,
则,所以.
故选;A.
6.(2025·海南·模拟预测)某次社会实践活动中,甲、乙两个班的同学共同在一个社区进行民意调查,参加活动的甲、乙两班的人数之比为,其中甲班的女生占,乙班中女生占.则该社区居民遇到一位进行民意调查的同学恰好是女生的概率为( )
A. B. C. D.
【答案】D
【分析】由题意设出事件,写出事件的概率以及条件概率,利用全概率公式,可得答案.
【详解】记事件“居民所遇到的一位进行民意调查的同学是甲班的”,
事件“居民所遇到的一位进行民意调查的同学是乙班的”,
“居民所遇到的一位进行民意调查的同学是女生”,
则,且,互斥,,
由题意可知,,且,
由全概率公式可知,
即该社区居民遇到一位进行民意调查的同学恰好是女生的概率为.
故选:D.
7.(24-25高三下·河北邯郸·开学考试)某城市对市民上班的出行方式进行了调查,结果显示有的市民乘坐公共交通工具,有的市民开私家车,有的市民选择步行.在乘坐公共交通工具出行的市民中有的人迟到,在开私家车出行的市民中有的人迟到,在步行出行的市民中有的人迟到.以频率估计概率,从该市随机选择一名市民,若他迟到了,则这名市民是乘坐公共交通工具出行的概率为( )
A. B. C. D.
【答案】C
【分析】利用全概率公式和贝叶斯公式即可求出结果.
【详解】由题知市民乘坐公共交通工具出行迟到的概率为×=,
市民开私家车出行迟到的概率为×=,
市民骑行或步行出行迟到的概率为×=,
则这名市民迟到的概率为×+×+×=,
故所求的概率为.
故选:C.
8.语文老师想了解全班同学课外阅读中国古典四大名著的情况,经调查,全班同学中阅读过《红楼梦》的占,阅读过《三国演义》的占,阅读过《红楼梦》或《三国演义》的占,现从阅读过《三国演义》的同学中随机抽取一位同学,该同学阅读过《红楼梦》的概率为( )
A.0.8 B.0.6 C.0.45 D.0.75
【答案】D
【分析】设出相关事件,根据和事件的概率公式求出,再根据条件概率公式,即可求得答案.
【详解】设事件A:阅读过《红楼梦》;事件B:阅读过《三国演义》,
则,则,
而,即,
故,
故,
即现从阅读过《三国演义》的同学中随机抽取一位同学,该同学阅读过《红楼梦》的概率为0.75,
故选:D
9.(24-25高三上·四川德阳·月考)某汽车4S店从甲乙丙三个车企分别采购同一款智能汽车500,400,100辆进行销售,甲乙丙三个车企生产的该智能汽车的智驾故障率分别为2%,3%,5%,某消费者从该4S店购买了一台此款智能汽车,在智驾过程中突然出现故障,则根据概率计算出甲乙丙三个车企应承担的责任比为( )
A.2:3:5 B.10:12:5 C.5:12:10 D.5:4:1
【答案】B
【分析】设事件 分别表示购买一辆汽车是甲、乙、丙车企生产的,事件 表示智驾出现故障,由贝叶斯公式得,,即可求解.
【详解】设事件 分别表示购买一辆汽车是甲、乙、丙车企生产的,
则 ,
事件 表示智驾出现故障,
则由全概率公式得 ,
由贝叶斯公式得,,,
所以甲乙丙要承担的责任比为.
故选:B.
10.(2025·河北廊坊·模拟预测)某省参加数学竞赛的学生中物理组合占,历史组合占,假定历史组合参赛学生获奖的概率为,物理组合参赛学生获奖的概率为,现从全部参赛学生中抽取3名,已知这3名学生均获奖,则这3名学生中既有物理组合学生又有历史组合学生的概率为( )
A. B. C. D.
【答案】B
【分析】需要计算在3名学生均获奖的情况下,既有物理组合又有历史组合的学生的概率,利用全概率公式和条件概率公式即可求解.
【详解】令事件表示“参加数学竞赛的学生是物理组合”,令事件表示“参加数学竞赛的学生是历史组合”,令事件表示“获奖”,则有,
根据全概率公式有,
令事件表示“3人均获奖”,则,
令事件表示“这3人全是物理”,则,
令事件表示“这3人全是历史”,则,
令事件表示“这3人既有物理又有历史”,则,
根据条件概率公式有.
故选:B.
1.根据中国报告大厅对2023年3月—10月全国太阳能发电量进行监测统计,太阳能发电量(亿千瓦时)月度数据统计如下表,则( )
月份
3
4
5
6
7
8
9
10
发电量
242.94
230.87
240.59
259.33
258.9
269.19
246.06
244.31
A.中位数是259.115 B.极差是36.32
C.第85百分位数是257.33 D.第25百分位数是241.765
【答案】D
【分析】根据样本数字特征的求解逐项检验即可.
【详解】将数据从小到大排序可得230.87,240.59,242.94,244.31,246.06,258.9,259.33,269.19,
共8个数据,所以中位数是,A错误;
极差是,B错误;
因为,所以第85百分位数是第7个数,即259.33,C错误;
因为,所以第25百分位数是,D正确.
故选:D.
2.(25-26高三上·贵州·月考)某中学数学教师共有20人,他们的年龄分布如表所示:
年龄
62
50
43
32
30
28
25
人数
2
3
3
5
2
4
1
下列说法正确的是( )
A.29是这20人年龄的一个上四分位数 B.29是这20人年龄的一个下四分位数
C.31是这20人年龄的一个中位数 D.这20人年龄的众数是5
【答案】B
【分析】对于AB,由上四分位数,下四分位数概念及计算方式,题目数据可判断选项正误;对于C,由中位数计算方式及题目数据可判断选项正误;对于D,由众数概念可判断选项正误.
【详解】对于A,上四分位数,即分位数,因,则上四分位数为从小到大排列第15个数和第16个数的平均数,为,故A错误;
对于B,下四分位数,即分位数,因,则下四分位数为从小到大排列第5个数和第6个数的平均数,为,故B正确;
对于C,这20人年龄的中位数是,故C错误;
对于D,这20人年龄的众数是32,故D错误.
故选:B
3.某个袋子中装有大小形状完全相同的红球和白球各5个,小王从中不放回的逐一取球,在第一次取得白球的条件下,第二次取到红球的概率是( )
A. B. C. D.
【答案】A
【分析】根据给定条件,利用缩小空间的方法求出条件概率.
【详解】在第一次取得白球的条件下,袋子中还有9个球,其中红球5个,白球4个,
所以第二次取到红球的概率是.
故选:A
4.(2025·海南·模拟预测)已知由样本数据组成的一个样本,得到经验回归方程为,且,增加两个样本点和后,得到新样本的经验回归方程为.在新的经验回归方程下,样本的残差为( )
A. B. C. D.2
【答案】C
【分析】先计算新样本的,代入到新样本回归方程中,求出,再计算残差即可.
【详解】设新样本得均值为,
则,
又回归方程过均值点,所以,解得,
所以新样本的经验回归方程为,
预测值,
所以残差为.
故选:C.
5.(25-26高三上·重庆南岸·月考)袋子中放有大小、形状相同的5个小球,其中标号为“0”的小球为1个,标号为“1”的小球2个,标号为“2”的小球2个.从袋中任取两个小球,已知其中一个小球的标号是“1”的条件下,则另一个小球标号也是“1”的概率为( )
A. B. C. D.
【答案】B
【分析】设事件后结合组合数求出概率,再利用条件概率公式求解即可.
【详解】设取出的两个小球中至少有一个标号为“1”为事件,取出的两个小球标号都为“1”为事件,
则,,
所以已知其中一个小球的标号是“1”的条件下,另一个小球标号也是“1”的概率为
,
故选:B
6.(2025·河南驻马店·模拟预测)小明和小强两人计划假期到南京游玩,他们分别从“夫子庙”“钟山风景区”“玄武湖”三个景区中随机选择一个游玩.记事件“两人中至少有一人选择夫子庙”,事件“两人选择的景区不同”,则( )
A. B. C. D.
【答案】A
【分析】根据条件概率公式分别求出和,进而求解即可.
【详解】由题意可得,,
所以.
故选:A.
7.(24-25高三下·上海青浦·月考)某网红奶茶店“Chill Tea”在市中心有三个分店:A店、B店、C店.根据平台数据,顾客选择、、店的概率分别为30%、50%、20%.已知各分店高峰期制作时间超过15分钟的概率分别为:店20%、店40%、店30%.若小明随机选择一个分店下单,他等待超过15分钟的概率是( )
A.28% B.32% C.35% D.40%
【答案】B
【分析】由全概率公式即可求解;
【详解】由题意选择店并超时的概率为:;
选择店并超时的概率为:;
选择店并超时的概率为:;
所以等待超过15分钟的概率为,
故选:B
8.(24-25高三下·辽宁本溪·开学考试)若的展开式中二项式系数之和为32,各项系数之和为243,则展开式中的系数是( )
A.32 B.64 C.80 D.16
【答案】C
【分析】根据二项式系数之和以及系数之和求,再根据二项式定理运算求解即可.
【详解】因为的二项式系数之和为32,
则,解得,即二项式为,
因为展开式各项系数和为243,
令,代入可得,解得,即二项式为,
则该二项式展开式的通项为,
令,解得,
则展开式中的系数为.
故选:C.
9.已知的展开式中第3项与倒数第3项的二项式系数之和等于72,则该展开式中的常数项为( )
A. B. C. D.
【答案】A
【分析】根据给定条件,列式求出,再求出二项展开式的通项,进而求出幂指数为0的项即可.
【详解】依题意,,即,而n为正整数,解得,
则展开式的通项公式为,
由,解得,
所以该展开式中的常数项为.
故选:A.
10.(2025·山东·三模)某班成立了A、B两个数学兴趣小组,A组10人,B组30人,经过一周的补习后进行了一次测试,在该测试中,A组平均成绩为130分,方差115,B组平均成绩为110分,方差为215,则在这次测试中,全班学生的平均成绩和方差为( )
A.115分,105 B.115分,265
C.120分,105 D.120分,265
【答案】B
【分析】利用各层平均数、方差与总体平均数、方差之间的关系式可求全班学生的平均数和方差.
【详解】依题意,,
所以全班学生的平均成绩(分);
全班学生成绩的方差为
.
故选:B
11.学校以劳动周形式开展劳育工作创新实践,开设“民俗文化”“茶艺文化”“茶壶制作”“3D打印”四种课程.甲、乙、丙3名同学每名同学至少从中选一种,每种课程都恰有1人参加,记“甲参加民俗文化”,“甲参加茶艺文化”,“乙参加茶艺文化”,则( )
A.A与B相互独立 B.A与C相互独立
C. D.
【答案】C
【分析】根据排列组合结合古典概型求相应的概率,再根据独立事件、互斥事件以及条件概率逐项分析判断.
【详解】依题意,甲、乙、丙3名同学中有且仅有一名同学选择了两种课程,不同的排法有种,
则,
对于A,,事件A与B不独立,A错误;
对于B,,事件A与C不独立,B错误;
对于C,,C正确;
对于D,,D错误.
故选:C
12.(24-25高三下·重庆·月考)记数据的平均数为 ,方差为,数据的平均数为,方差为,若,为非零常数,则下列说法一定正确的是( )
A. B.
C. D.
【答案】C
【分析】根据给定条件,利用平均数、方差的定义计算判断.
【详解】由,得,
对于AB,,AB错误;
对于CD,,C正确,D错误.
故选:C
13.2025年1月7日9时5分,西藏自治区日喀则市定日县发生6.8级地震.现从各省共抽派7支抢险工作队前往5个灾区县救援,要求每个受灾县至少有一个工作队的方法种数共有( )
A.1800 B.16800 C.14280 D.25200
【答案】B
【分析】先分组后分配,分组分配上有3,1,1,1,1与2,2,1,1,1两种方式,再结合排列组合数计算即可.
【详解】分组分配上有3,1,1,1,1与2,2,1,1,1两种方式.
若是3,1,1,1,1,则有种;
若是2,2,1,1,1,则有种.
所以共有种.
故选:B.
14.(2025·江西九江·三模)含甲、乙的5名同学分成两组参加志愿服务活动,则甲、乙不同组的分配方案有( )
A.6种 B.8种 C.12种 D.16种
【答案】B
【分析】先分析分组情况,再分别计算不同分组下甲、乙不同组的方案数,最后相加得到结果.
【详解】名同学分成两组,有和分组以及和分组这两种情况.
若甲在人组,乙在人组,这是种情况;
若甲在人组,乙在人组,这又是种情况.
所以和分组时甲、乙不同组的方案数为种.
若甲在人组,乙在人组,那么从剩下人中选人与甲一组,根据组合数公式,则种情况;
若甲在人组,乙在人组,同样从剩下人中选人与乙一组,也有种情况.
所以和分组时甲、乙不同组的方案数为种.
根据分类加法计数原理,将两种分组情况的方案数相加,可得甲、乙不同组的分配方案共有种.
故选:B.
15.(25-26高三上·辽宁·月考)7名教师甲、乙、丙、丁、戊、己、庚带领学生参加“探秘未知”活动,教师随机分为4组,每组至少一人,则甲乙同组且丙丁同组的概率为( )
A. B. C. D.
【答案】A
【分析】由题知不同的分组方法有4,1,1,1;3,2,1,1;2,2,2,1三种;利用不平均分组问题计算方法数,列出符合题意得情况,然后求概率即可.
【详解】根据题意,不同的分组方法有4,1,1,1;3,2,1,1;2,2,2,1三种;
当分组为4,1,1,1时,共有种,其中甲乙同组且丙丁同组有1种;
当分组为3,2,1,1时,共有种,其中甲乙同组且丙丁同组有种;
当分组为2,2,2,1时,共有种,其中甲乙同组且丙丁同组有种;
所以乙同组且丙丁同组的概率为.
故选:A.
16.(25-26高三上·湖南常德·开学考试)将6名学生分别安排到甲、乙、丙三地参加社会实践活动,每个地方至少安排一名学生参加,学生不安排到甲地且与学生不安排到同一个地方,则不同的安排方案的种数为( )
A.260 B.280 C.360 D.390
【答案】A
【分析】分三地分别有1人、1人、4人,人、人、人,各有2人三种情况讨论,在每种情况中用总数减去去甲地和、去同一个地方的情况数,再加上、去甲地的情况数,即可得到答案.
【详解】(1)三地分别有1人、1人、4人共有种;
①去甲地,如果甲地有人,则有种,如果甲地有人,则有种,所以去甲地共有种;
②、去同一个地方,有种;
③、去甲地,有种;
所以,三地分别有1人、1人、4人的情况下,符合题意的共有种;
(2)三地分别有人、人、人共有种;
①去甲地,如果甲地有人,有种,如果甲地有人,有种,如果甲地人,有种,所以去甲地共有种;
②、去同一个地方,如果这个地方有人,有种,如果这个地方有人,有种,所以、去同一个地方共有种;
③、去甲地,如果甲地有2人,则有种,如果甲地有3人,则有种,所以、去甲地共有种;
所以,三地分别有人、人、人的情况下,共有种;
(3)三地各有2人,共有种;
①去甲地,有种;
②、去同一个地方,有种;
③、去甲地,有种;
所以,三地各有2人的情况下,符合题意的共有种;
综上,符合题意的安排方案共有种,
故选:A.
17.(24-25高三上·河北·月考)关于的展开式,下列判断正确的是( )
A.该展开式各项的系数之和为
B.该展开式各项系数的绝对值之和为720
C.该展开式中含的各项系数之和为
D.该展开式中不含字母的各项系数之和为64
【答案】C
【分析】利用赋值法计算判断AD;求出按展开的通项公式,再求出展开的通项公式,求出各项系数判断BC.
【详解】对于A,取,得展开式各项的系数之和为1,A错误;
对于B,展开式的通项公式为,
,当时,展开式的通项公式为,
此时,
的系数为,的系数为,
的系数为,
的系数为,
的系数为,
的系数为,
展开式各项系数的绝对值之和为,B错误;
对于C,展开式中含的各项系数之和为,C正确;
对于D,展开式中不含字母的各项即展开式的各项,
取,得展开式的各项系数和为0,D错误.
故选:C
18.(2025·河北保定·二模)已知甲箱中有2个红球和3个黑球,乙箱中有个红球和3个黑球(所有球除颜色外完全相同),某学生先从甲箱中随机取出2个球放入乙箱,再从乙箱中随机取出1个球,记“从甲箱中取出的球恰有个红球”为事件,“从乙箱中取出的球是黑球”为事件,则是( )
A.与有关的常量 B.与有关的变量
C.与无关的定值,且为 D.与无关的定值,且为
【答案】C
【分析】先利用条件概率公式和全概率公式计算得,然后利用贝叶斯概率公式即可求出.
【详解】依题意可得,,,
若先发生,则乙袋中有个红球,5黑球,此时,
若先发生,则乙袋中有个红球,4黑球,此时,
若先发生,则乙袋中有个红球,3黑球,此时.
所以,,,
所以,
所以,即是与无关的定值,且为.
故选:C.
19.(2025·江西九江·三模)某校选拔乒乓球队队员,选拔时选手与教练对局.若选手连胜两局则成功入选,若连负两局则落选.已知某选手每局测试中(无平局)获胜的概率为,则该选手成功入选的概率是( )
A. B. C. D.
【答案】A
【分析】本题通过定义不同状态下成功入选的概率,利用状态转移的思想建立方程组来求解选手成功入选的概率.先根据不同状态下获胜和失败的概率建立关于和的方程组,求解出和后,再根据初始状态与、的关系求出.
【详解】定义状态(最近一局赢),(最近一局输),成功入选的概率分别为和,初始状态成功入选的概率为.
建立方程组
将第二个方程代入第一个方程可得:
把代入可得:
又因为,将,代入可得:
该选手成功入选的概率是,
故选:A.
20.(2024·广东深圳·模拟预测)(多选题)一组数据的平均值为5,方差为2,极差为7,中位数为6,记,的平均值为,方差为,极差为,中位数为,则( )
A. B. C. D.
【答案】AD
【分析】根据平均值、方差、极差、中位数的定义及性质可得.
【详解】由题意可得,,,,.
故选:AD
21.(2025·山东青岛·三模)(多选题)某学校组织全体学生参加了文创大赛,随机抽取了400名学生的成绩进行统计,得频率分布直方图(如图),则( )
A.图中的值为0.020
B.该样本中成绩在区间内的学生有160人
C.估计全校学生成绩的平均数约为86.5
D.估计全校学生成绩的分位数约为95
【答案】BD
【分析】由各组的频率和为1求解判断A;由频率分布直方图求出的频率,再乘以400判断B;求出平均数判断C;求出分位数判断D.
【详解】对于A,由,得,A错误;
对于B,成绩在区间内的学生人数为,B正确;
对于C,平均数,C错误;
对于D,低于90分的频率为,设样本数据的80%分位数为,
则,解得,D正确.
故选:BD
22.(23-24高三下·广西柳州·月考)(多选题)两个具有线性相关关系的变量的一组数据可建立经验回归方程,下列说法正确的是( ).
A.相关系数越接近1,变量x,y相关性越强 .
B.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
C.残差
D.决定系数越小,残差平方和越大,即模型的拟合效果越差
【答案】AD
【分析】根据统计案例的相关知识逐项分析判断.
【详解】对于A:相关系数越接近1,相关性越强,故A正确;
对于B:回归直线方程拟合效果的强弱由决定系数,故B错误;
对于C:残差故C错误;
对于D:决定系数越小,残差平方和越大,效果越差,故D正确.
故选:AD.
23.(2024·山东济南·模拟预测)(多选题)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这100名学生中,成绩位于内的学生成绩方差为12,成绩位于内的同学成绩方差为10.则( )
A.
B.估计该年级学生成绩的中位数约为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25
【答案】BCD
【分析】A项,由各组频率之和为求参数;B项可由频率分布直方图面积与比较,估计中位数所在区间,利用面积关系建方程求解可得;C项,两组求加权平均数可得;D项,由分别两组成绩的方差与两组总方差的关系求解即可.
【详解】A项,在频率分布直方图中,所有直方图的面积之和为1,
则,解得,故A错误;
项,前两个矩形的面积之和为
前三个矩形的面积之和为.
设该年级学生成绩的中位数为,则,
根据中位数的定义可得,解得,
所以,估计该年级学生成绩的中位数约为,故B正确;
C项,估计成绩在80分以上的同学的成绩的平均数为
分,故C正确;
D项,估计该年级成绩在80分及以上的学生成绩的方差为
,故D正确.
故选:BCD.
24.(多选题)已知是随机事件,且,则下列说法正确的有( )
A.与可能为互斥事件
B.若,则与相互独立
C.若,则
D.若与相互独立,则
【答案】BC
【分析】由题设结合独立事件、互斥事件的定义、概率公式与性质逐项判断即可.
【详解】选项A:因为,所以,与不可能为互斥事件,A说法错误;
选项B:因为,所以若,则与相互独立,B说法正确;
选项C:若,则,C说法正确;
选项D:若与相互独立,则与也相互独立,证明如下:
因为与互斥,且,
所以,
所以,即与也相互独立,
所以,
因为,所以,
代入得,D说法错误;
故选:BC
25.(2025·内蒙古赤峰·模拟预测)(多选题)一组数据,,,,满足,若去掉,后组成一组新数据,则新数据与原数据相比( )
A.极差变小 B.平均数变大 C.方差变小 D.第25百分位数变小
【答案】AC
【分析】根据极差、平均数、方差和百分位数的计算公式一一计算分析即可.
【详解】由于,故,
A选项,原来极差为,去掉,后,极差为,极差变小,A正确;
B选项,原来的平均数为,
去掉,后的平均数为,平均数不变,B错误;
C选项,原来的方差为,
去掉,后的方差为,方差变小,C正确;
D选项,,从小到大排列,选第3个数作为第25百分位数,即,
去掉,后,,故从小到大排列,选择第2个数和第3个数的平均数作为第25百分位数,
即,由于,第25百分位数变大,D错误.
故选:AC
26.(2025·江苏镇江·模拟预测)(多选题)为响应校团委发起的“青年大学习”号召,某班组织了有奖知识竞答活动.决赛准备了4道选择题和2道填空题,每位参赛者从6道题中不放回地随机抽取三次,每次抽取1道题作答.设事件为“第次抽到选择题”,则下列结论中正确的是( )
A.与互斥;与互斥
B.不管第几次抽取,抽到选择题的概率都相同
C.
D.
【答案】BC
【分析】根据互斥事件的定义判断A,由简单随机抽样的性质判断B,根据古典概型的概率公式判断CD.
【详解】由题意可知第1次抽到选择题与第2次抽到选择题可能同时发生,
所以与不是互斥事件,同理与也不是互斥事件,A说法错误;
从6道题中不放回地随机抽取三次,满足简单随机抽样,每次抽取时各个个体被抽到的概率相等,B说法正确;
第二次抽到选择题且第三次也抽到选择题的概率,C说法正确;
第1次抽到选择题或第2次抽到选择题的概率,D说法错误;
故选:BC
27.(2025·四川成都·一模)(多选题)眼睛是心灵的窗户,保护视力从青少年开始.“近视”(设为事件)和“老花”(设为事件)是影响中老年人学习与生活质量的重要视力因素.设,,,则( )
A.与互为对立 B.与相互独立
C. D.
【答案】BCD
【分析】根据对立事件及独立事件定义判断A,B,应用条件概率公式判断D,应用概率基本性质判断C即可.
【详解】因为,,,
则,所以,
所以,则与不对立,故A错误;
得到,与相互独立,故B正确;
而,故,故C正确;
,
所以,故D正确;
故选:BCD.
28.(多选题)甲、乙两个不透明的袋子中分别装有两种颜色不同但是大小相同的小球,甲袋中装有4个红球和4个绿球;乙袋中装有3个红球和5个绿球.先从甲袋中随机摸出一个小球放入乙袋中,再从乙袋中随机摸出一个小球,记表示事件“从甲袋摸出的是红球”,表示事件“从甲袋摸出的是绿球”,记表示事件“从乙袋摸出的是红球”,表示事件“从乙袋摸出的是绿球”.下列说法正确的是( )
A.是对立事件 B. C. D.
【答案】ABD
【分析】根据对立事件的定义可判断A;计算出可判断B;计算出可判断C;计算出可判断D.
【详解】对于A:从甲袋中摸球,结果只能是红球或者绿球,即与互斥且必有一个发生,
所以与是对立事件,故A正确;
对于B:当发生时,即从甲袋中摸出1个绿球放入乙袋 ,则乙袋中有红球3个,绿球6个,
根据条件概率的含义得, 故B正确;
对于C:由题得,计算得. 由全概率公式可知:
,即,故C错误;
对于D:由前面的计算可知,,根据贝叶斯公式
,则,故D正确.
故选:ABD.
29.肥胖不仅影响形体美,而且给生活带来不便,此外还有关节软组织损伤、心脏病、糖尿病、脂肪肝、痛风等危害.小王通过运动和节食进行减肥,并将时间x(单位:周)和体重(单位:)记录制作如下统计表:
1
2
3
4
6
8
90.1
87.6
87.2
86.2
84.2
84.3
(1)若和满足经验回归模型,求;
(2)求该模型的决定系数,并判断该经验回归方程是否有价值(认为有价值);
(3)当某组数据残差的绝对值不超过0.3时,称该组数据为“身材有效管理数据”,现从这六组数据中任意抽取两组,设抽取的“身材有效管理数据”的个数为,求的分布列和期望.
附:经验回归方程中,,
参考数据:.
【答案】(1);.
(2);该经验回归方程有价值.
(3)分布列见解析;数学期望是1.
【分析】(1)设得,计算,继而得到和;
(2)分别计算和,计算出,即得结论;
(3)依题意,残差的绝对值不超过0.3的有三组,由此确定的可能值有,利用超几何分布计算概率,写出分布列,计算出数学期望即可.
【详解】(1)设则, 因
,
则
又且经验回归直线过点,
故得,,
(2)由(1),
1
2
3
4
6
8
90.1
87.6
87.2
86.2
84.2
84.3
90
88
86.8
86
84.8
84
0.01
0.16
0.16
0.04
0.36
0.09
12.25
1
0.36
0.16
5.76
5.29
则,因,则该经验回归方程有价值;
(3)经计算,这六组数据中,残差的绝对值不超过0.3的有三组,分别是第一组、第四组和第八组,
故从这六组数据中任意抽取两组,的可能值有,
于是,,
则的分布列为:
0
1
2
故数学期望为.
30.数据显示,某企业近年加大了科技研发资金的投入,其科技投入(百万元)与收益(百万元)的数据统计如下:
科技投入
1
2
3
4
5
6
7
收益
19
20
22
31
40
50
70
根据数据特点,甲认为样本点分布在指数型曲线的周围,据此他对数据进行了一些初步处理.如下表:
5
140
1239
149
2134
130
其中,.
(1)请根据表中数据,建立关于的回归方程(系数精确到0.1);
(2)①乙认为样本点分布在直线的周围,并计算得线性回归方程为,以及该回归模型的决定系数,试比较甲、乙两人所建立的模型,谁的拟合效果更好?
②由①所得的结论,计算该企业欲使收益达到1亿元,科技投入的费用至少要多少百万元?(精确到0.1)
附:对于一组数据,,……,,其线性回归直线的斜率和截距的最小二乘法估计公式分别为,,决定系数:.参考数据:.
【答案】(1)
(2)① ;甲建立的回归模型拟合效果更好;② 科技投入的费用至少要9.3百万元.
【分析】(1)两边取对数得,令,利用最小二乘法可求得,由此可得回归方程;
(2)①根据公式计算可得相关指数,由此可得结论;
②由,解不等式可求得x范围,由此可得结果.
【详解】(1)将两边取对数得:,令,则,
∵,∴根据最小二乘估计可知:,
∴,
∴回归方程为,即.
(2)①甲建立的回归模型的.
∴甲建立的回归模型拟合效果更好.
②由①知,甲建立的回归模型拟合效果更好.
设,解得:,解得:.
∴科技投入的费用至少要9.3百万元,下一年的收益才能达到1亿.
1 / 1
学科网(北京)股份有限公司
$
易错易混10 概率与统计、计数原理
目录(Ctrl并单击鼠标可跟踪链接)
01 错点扫描・易错建模夯基石 1
02 易错归纳・查漏补缺避陷阱 6
易错归纳01 中位数、百分位数的求解(★★★) 6
易错归纳02 平均数、方差的运算公式与性质(★★★★) 7
易错归纳03 频率分布直方图中数据特征的计算(★★★★) 8
易错归纳04 残差与决定系数(★★★★★) 10
易错归纳05 排列组合中的分组分配问题(★★★★) 13
易错归纳06 混淆二项式系数与项的系数(★★★★) 14
易错归纳07 互斥、对立、事件的相互独立性概念(公式)混淆(★★★★★) 15
易错归纳08 条件概率与全概率公式(★★★★★) 16
03 实战检测・易错通关验成效 18
一、频率分布直方图
1、频率分布直方图
(1)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在左闭右开区间,最后一组取闭区间;
也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:
①,
②个小长方形的面积等于1,
③.
(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.
(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,
频率分布直方图可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线.
总体密度曲线精确地反映了一个总体在各个区域内取值的规律.
2、根据频率分布直方图求平均数、中位数和众数
众数、中位数、平均数与频率分布直方图的关系
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)众数:众数是最高小矩形底边的中点所对应的数据.
二、总体百分位数的估计
1、第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2、计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
三、总体集中趋势的估计
1、相关概念
(1)众数:在样本数据中,出现次数最多的那个数据;
(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,
若样本数据个数为偶数,则取中间两个数据的平均数作为中位数。
(3)平均数:设样本的数据为,则样本的算术平均数为;
2、众数、中位数和平均数的比较
名称
优点
缺点
平均数
与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
中位数
不受少数几个极端数据(即排序靠前或靠后的数据)的影响
对极端值不敏感
众数
体现了样本数据的最大集中点
众数只能传递数据中的信息的很少一部分,对极端值不敏感
3、平均数相关结论:
①如果两组数和的平均数分别是和,则一组数的平均数是;
②如果一组数的平均数为,则一组数的平均数为。
③如果一组数的平均数为,则一组数的平均数为
四、总体离散程度的估计
1、用样本的标准差估计总体的标准差
(1)数据的离散程度可以用极差、方差或标准差来描述;
(2)极差(又叫全距)是一组数据的最大值和最小值之差,反映一组数据的变动幅度;
(3)样本方差描述了一组数据围绕平均数波动的大小;
一般地,设样本的数据为,样本的平均数为,
定义样本方差为;
简化公式:=
(方差等于原数据平方的平均数减去平均数的平方)
(4)样本的标准差是方差的算术平方根.
样本标准差.
标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围.
(5)方差相关结论:
①如果一组数的方差为,则一组数的方差为;
②如果一组数的方差为,则一组数的方差为。
五、残差与决定系数
1、残差
对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.
2、残差图
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
3、残差分析
残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.其步骤为:计算残差化残差图在残差图中分析残差特性.
4、残差平方和
残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
5、决定系数
决定系数是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.
,越大,即拟合效果越好,越小,模型拟合效果越差.
六、分组、分配问题
(1)整体均分问题,解题时要注意分组后,不管它们的顺序如何,都是一种情况,所以分组后一定要除以A(n为均分的组数),避免重复计数.
(2)局部均分问题,解题时注意重复的次数是均匀分组的阶乘数,即若有m组元素个数相等,则分组时应除以m!,一个分组过程中有几个这样的均匀分组就要除以几个这样的全排列数.
(3)不等分问题,只需先分组,后排列,分组时任何组中元素的个数都不相等,所以不需要除以全排列数.
七、二项式系数和与项的系数和
1、二项式系数和令,则二项式系数的和为
2、各项系数和:令,得.
八、事件的关系判断
1、互斥(互不相容):一般地,如果事件A与事件B不能同时发生,
也就是说A∩B是一个不可能事件,即A∩B=∅,则称事件A与事件B互斥(或互不相容)
2、互为对立:一般地,如果事件A与事件B在任何一次试验中有且仅有一个发生,
即A∪B=Ω,且A∩B=∅,那么称事件A与事件B互为对立.
事件A的对立事件记为
九、概率的基本性质
1、概率的基本性质
性质1
对任意的事件A,都有P(A)≥0.
性质2
必然事件的概率为1,不可能事件的概率为0,即P()= 1,P()=0.
性质3
如果事件A与事件B互斥,那么P()=P(A)+P(B). 推广:如果事件A1,A2,…,Am.两两互斥,那么事件发生的概率等于这m个事件分别发生的概率之和,即P()=P(A1)+P(A2)+…+P(Am).
性质4
如果事件A与事件B互为对立事件,那么P(B)=1P(A),
P(A)=1P(B).
性质5
如果,那么P(A)≤P(B).
性质6
设A,B是一个随机试验中的两个事件,我们有P()=P(A)+P(B) P().
十、事件的相互独立性
1、定义:对任意两个事件A与B,如果成立,则称事件A与事件B相互独立,简称为独立.
2、性质:如果事件A与事件B相互独立,则与,与,与也都相互独立。
3、两个相互独立事件同时发生的概率乘法:事件与事件相互独立,则
4、推广:两个事件的相互独立可以推广到个事件的相互独立性,即若事件相互独立,则这个事件同时发生的概率
十一、条件概率
1、定义:一般地,设,为两个随机事件,且,我们称为在事件发生的条件下,事件发生的条件概率,简称条件概率.
2、条件概率性质应用
(1)由条件概率的定义,对任意两个事件与,若,则.我们称上式为概率的乘法公式.
(2)如果和是两个互斥事件,则;
3、全概率公式及其应用
一般地,设,,是一组两两互斥的事件,,且,,则对任意的事件,有,我们称此公式为全概率公式.
4、贝叶斯公式及其应用
(1)设,,是一组两两互斥的事件,,且,,
则对任意的事件,,有,.
易错归纳01 中位数、百分位数的求解
【易错陷阱·避错攻略】
在求数据的中位数、百分数时,一定要先把数据从小到大排列,然后再根据中位数、百分数的定义进行求解.
1.(2025·陕西西安·三模)样本数据的中位数是( )
A.8 B.8.5 C.9 D.9.5
2.(25-26高三上·山东潍坊·期中)某科技攻关青年团队共有20人,他们的年龄分布如下表所示.则这20人年龄的60%分位数为( )
年龄
28
29
30
32
36
40
45
人数
1
3
3
5
4
3
1
A.30 B.32 C.34 D.36
3.(2025·河北保定·三模)一组数据按从小到大排列为2,4,6,a,13,14,如果该组数据的中位数与这组数据的第60百分位数相等,则该组数据的平均数为( )
A.7.5 B.6 C.4.5 D.3
4.(2025·山西·模拟预测)某大学科研团队利用自主开发的新型静电电机,成功研制出仅重4.21克的太阳能动力微型无人机,实现纯自然光供能下的持续飞行.为激发同学们对无人机的兴趣,某校无人机兴趣社团在校内进行选拔赛,8名参赛学生的成绩依次为,,,,,,,,则这组数据的上四分位数为( )
A.93 B.92 C.91.5 D.93.5
5.(25-26高三上·贵州·月考)某社区为了解该社区老年人的运动情况,在该社区随机抽取70名老年人,对他们一周的运动时长(单位:小时)进行统计,数据如下表,则该组数据的中位数为( )
一周的运动时长
3
4
5
6
7
8
9
人数
15
10
8
10
10
8
9
A.4小时 B.6小时 C.5小时 D.5.5小时
易错归纳02 平均数、方差的运算公式与性质
【易错陷阱·避错攻略】
方差(标准差)越大,说明数据的离散性越大;方差(标准差)越小,说明数据的离散性越小,数据越集中、稳定.用样本的数字特征估计总体的数字特征时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,这些偏差是由样本的随机性引起的.虽然样本的数字特征并不是总体真正的数字特征,而是总体的一个估计,但这种估计是合理的,特别是当样本容量很大时,样本的数字特征稳定于总体的数字特征.
1.已知一组数,,,的平均数是3,方差为4,则数据,,,的平均数和标准差分别是( )
A.7,4 B.7,16 C.6,4 D.6,16
2.(2025·河北·一模)在一组数据中,出现的频率分别为,则这组数据的方差为( )
A.2 B.2.4 C.3 D.4
3.(2025·甘肃武威·模拟预测)某学校从高三某次联考中随机抽取了甲班50名、乙班40名学生的成绩.已知甲班50名学生成绩的平均数为112分,方差为8,乙班40名学生成绩的平均数为94分,方差为8,则这90名学生成绩的方差为( )
A.8 B.36 C.64 D.88
4.(25-26高三上·河北邢台·期中)已知互不相等的数据的平均数为,方差为,数据的方差为,则,的大小关系为( )
A. B. C. D.无法判断
5.(25-26高三上·山东青岛·开学考试)某校为了解学生每个月在图书馆借阅书籍的数量,图书管理员甲抽取了一个容量为100的样本,并算得样本的平均数为5,方差为9;图书管理员乙也抽取了一个容量为100的样本,并算得样本的平均数为7,方差为16.若将两个样本合在一起组成一个容量为200的新样本,则新样本数据的( )
A.平均数为5.5 B.平均数为6.5 C.方差为12.5 D.方差为13.5
6.(2025·江西·模拟预测)(多选题)将一组互不相同的数据,,,,中的每一个数都变成原来的2倍再减去1,则这两组数据可能相同的数字特征是( )
A.平均数 B.中位数 C.方差 D.极差
7.(25-26高三上·青海西宁·开学考试)(多选题)已知一组数据:27,37,14,33,47,26,24,18,35,若去掉14和47,则剩下的数据与原数据相比,下列说法正确的是( )
A.中位数不变 B.平均数不变 C.方差不变 D.第40百分位数不变
易错归纳03 频率分布直方图中数据特征的计算
【易错陷阱·避错攻略】
利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:
(1)最高的小长方形底边中点的横坐标即是众数;
(2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
1.(2025·广西河池·三模)(多选题)阅读不仅能帮助孩子积累知识,还能提升他们的语言表达能力和思维能力,从小培养阅读习惯显得尤为重要.为了了解小学生的阅读情况,随机调查了某市1000名小学生每日阅读的情况,并将这1000名小学生每日的阅读时间数据绘制成如图所示的频率分布直方图,则( )
A.
B.估计样本中有75%的小学生每日的阅读时间不超过40分钟
C.估计样本中小学生每日的阅读时间的中位数为40分钟
D.估计样本中小学生每日的平均阅读时间为33.6分钟(每组数据以该组区间的中间值作代表)
2.(2025·广东清远·一模)(多选题)某企业招聘考试分笔试与面试,笔试满分为100分,笔试成绩排名前(含)的考生才可以参加面试.现有1800人报名参加笔试,所有考生的笔试成绩和年龄分别如下图所示,则( )
A.90后考生比00后考生多100人
B.所有考生笔试成绩的分位数约为83.3(保留一位小数)
C.进入面试的笔试成绩最低分约为85.7(保留一位小数)
D.所有考生笔试成绩的中位数大于平均数
3.(23-24高三上·湖南长沙·月考)(多选题)抽取市某届马拉松比赛前5000名的部分跑者成绩绘制如下频数分布表(单位:分钟):
分组
频数
20
60
160
140
80
40
则下列选项正确的是( )
A.估计总体中成绩落在分钟内的选手人数为4500
B.这组数据平均数的估计值为307分钟
C.这组数据第62百分位数的估计值为325分钟
D.在由以上数据绘制的频率分布直方图中,各组长方形的高度之和为0.02
4.(2025·四川自贡·三模)(多选题)为了解本地区居民用水情况,甲、乙两个兴趣小组同学利用假期分别对、两个社区随机选择100户居民进行了“家庭月用水量”的调查统计,利用调查数据分别绘制成频率分布直方图(如图所示).甲组同学所得数据的中位数、平均数、众数、标准差分别记为、、、,乙组同学所得数据的中位数、平均数、众数、标准差分别记为、、、.则下列判断正确的有( ).
A.且. B.且.
C.且. D..
5.(多选题)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则( )
A.骑车时间的中位数的估计值22分钟
B.坐公交车时间的40%分位数的估计值是19分钟
C.坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值
D.坐公交车时间的方差的估计值大于骑车时间的方差的估计值
易错归纳04 残差与决定系数
【易错陷阱·避错攻略】
残差分析
对于预报变量,通过观测得到的数据称为观测值,通过回归方程得到的称为预测值,观测值减去预测值等于残差,称为相应于点的残差,即有.
残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
(1)残差图:通过残差分析,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.
(2)通过残差平方和分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;反之,不合适.
(3)相关指数:用相关指数来刻画回归的效果,其计算公式是:.
1.(24-25高三上·天津西青·月考)如图所示,5 个数据,去掉 后,下列说法正确的是( )
A.相关系数变小 B.决定系数变小
C.残差平方和变小 D.解释变量与预报变量的相关性变弱
2.(2025·江西新余·模拟预测)样本点数据,且大致呈线性分布,其经验回归方程为,若,数据的80%分位数为7,则当时,随机误差的残差为:( ).
A.-0.5 B.0.5 C.-1.5 D.1.5
3.根据变量Y和x的成对样本数据,由一元线性回归模型得到经验回归模型,求得残差图.对于以下四幅残差图,满足一元线性回归模型中对随机误差假设的是( )
A. B.
C. D.
4.已知某产品的色度y和色差x之间满足线性相关关系,且现有一对测量数据为,则该数据的残差为( )
色差x
色度y
15
18
19
20
A. B. C.0.6 D.0.76
5.耐盐碱水稻俗称“海水稻”,是一种可以长在滩涂和盐碱地的水稻.海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究浇灌海水浓度(单位:‰)对亩产量(单位:吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与浇灌海水浓度的有关数据如下表.绘制散点图发现,可用线性回归模型拟合亩产量与浇灌海水浓度之间的相关关系,用最小二乘法计算得与之间的经验回归方程为.
浇灌海水浓度
3
4
5
6
7
亩产量吨
0.62
0.58
0.49
0.4
0.31
残差
(1)求,并估计当浇灌海水浓度为8‰时该品种的亩产量;
(2)①将上表补充完整;
②统计学中常用决定系数来刻画回归效果,越大,模型拟合效果越好,如假设,就说明响应变量的差异有是由解释变量引起的.请计算决定系数(精确到0.01),并指出亩产量的变化多大程度上是由浇灌海水浓度引起的?
6.(2025·广西来宾·模拟预测)现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本(单位:万元)和企业利润的数据(单位:万元)如下表所示:
月份
1
2
3
4
5
6
7
8
物流成本
83
83.5
80
86.5
89
84.5
79
86.5
利润
114
116
106
122
132
114
132
残差
0.2
0.6
1.8
-3
-1
-4.6
根据最小二乘法公式求得经验回归方程为.
(1)求的值,并利用已知的经验回归方程求出8月份对应的残差值;
(2)请先求出线性回归模型的决定系数(精确到0.0001),若根据非线性模型求得解释变量(物流成本)对于响应变量(利润)的决定系数,请说明以上两种模型哪种模型拟合效果更好.
参考公式及数据:,,.
易错归纳05 排列组合中的分组分配问题
【易错陷阱·避错攻略】
对于分堆与分配问题应注意:①处理分配问题要注意先分堆再分配;②被分配的元素是不同的,位置也应是不同的;③分堆时要注意是否均匀.
1.(2025·湖南娄底·二模)长沙是一座有着悠久历史和丰富文化底蕴的城市,其当地美食也独具特色.某个假期期间,一名游客前往长沙旅游打卡,现要每天分别从臭豆腐、炸藕夹、剁椒鱼头、辣椒小炒肉、酱板鸭、糖油粑粑这6种美食中随机选择2种品尝(选择的2种美食不分先后顺序),若三天后他品尝完这6种美食,则这三天他选择美食的不同选法种数为( )
A.90 B.120 C.150 D.180
2.(25-26高三上·河南·期中)某校园诗歌朗诵大赛共有5名同学进入决赛,决赛要求这5名同学均从《琵琶行》《蜀道难》《离骚》中选择1篇进行参赛,且这3篇诗歌中每篇均有同学选择,则这5名同学诗歌篇目的选择情况共有( )
A.150种 B.240种 C.180种 D.120种
3.(25-26高三上·陕西西安·开学考试)某校安排高一年级(1)~(5)班共5个班去A,B,C,D四个劳动教育基地进行社会实践,每个班去一个基地,每个基地至少安排一个班,则高一(1)班被安排到A基地的排法种数为( )
A.24 B.36 C.60 D.240
4.(2025·湖南郴州·一模)“湘超”足球比赛正在如火如荼进行中,某企业赞助一批足球训练设备给甲、乙、丙三个球队.这批设备分别为个相同的跳箱和箱相同的药球.要求每队至少有一个跳箱,且药球不能全部分配给同一球队,则不同的分配方案有( )
A.种 B.种 C.种 D.种
5.(2025·云南昆明·模拟预测)将甲、乙等6名志愿者分配到3个社区协助开展活动,每个社区至少1人,每个人只去1个社区,且甲、乙两人不在同1个社区,则不同的分配方法数是( )
A.540 B.504 C.408 D.390
易错归纳06 混淆二项式系数与项的系数
【易错陷阱·避错攻略】
处理二项展开式的系数问题要区分“二项式系数”与“项的系数”的区别:二项展开式中各项的二项式系数为(),项的系数是指该项中除变量外的常数部分,包含符号等.
1.(24-25高三下·河北承德·月考)若展开式的二项式系数之和为,则展开式中含项的系数为( )
A. B. C. D.
2.(2025·江苏徐州·模拟预测)已知的展开式中第2项与第5项的系数相等,则偶数项的二项式系数和为( )
A.8 B.16 C.32 D.64
3.若的展开式中各项系数之和为,则第四项与第五项的系数之比为( )
A. B. C. D.
4.(25-26高三上·广东揭阳·期中)已知的展开式中各项系数之和为64,则该展开式的常数项为( )
A.10 B.20 C.30 D.40
5.的展开式中,二项式系数最大的项是第四项和第五项,则的系数为( )
A.35 B. C. D.
6.在的展开式中含项的系数为15,则展开式中二项式系数最大的是第( )项
A.2 B.3 C.4 D.5
7.已知,则( )
A. B. C. D.
8.(24-25高三下·云南昭通·月考)在的展开式中,二项式系数的最大值为20,则系数的最大值为( )
A.729 B.1243 C.1458 D.2187
易错归纳07 互斥、对立、事件的相互独立性概念(公式)混淆
【易错陷阱·避错攻略】
(1)判断互斥事件、对立事件一般用定义判断,不可能同时发生的两个事件为互斥事件;两个事件,若有且仅有一个发生,则这两事件为对立事件,对立事件一定是互斥事件.
(2)互斥事件与相互独立事件的相同点与不同点:①相同点:二者都是描述两个事件间的关系;
②不同点:互斥事件强调两事件不可能同时发生,即P(AB)=0,相互独立事件则强调一个事件的发生与否对另一个事件发生的概率没有影响.
1.(多选题)已知,为随机事件,,,则下列结论正确的有( )
A.若,为互斥事件,则 B.若,为互斥事件,则
C.若,相互独立,则 D.若,相互独立,则
2.(2025·云南玉溪·模拟预测)(多选题)已知A,B为随机事件,且,,则下列结论错误的是( )
A.若互斥,则 B.若相互独立,
C.若,则 D.若相互独立,则
3.(25-26高三上·湖南常德·开学考试)(多选题)已知随机事件发生的概率满足,且事件与互斥,则下列说法正确的是( )
A.
B.与相互独立
C.
D.若与相互独立,则
4.(多选题)已知为古典概型样本空间中的两个随机事件,其中,则下列选项正确的是( )
A.事件与互斥 B.
C.事件与独立 D.
5.(24-25高三下·重庆·月考)(多选题)已知,为随机事件,的对立事件,,且,则( )
A. B.
C. D.
6.(25-26高三上·江西上饶·月考)(多选题)设事件满足,且,则( )
A.事件与事件一定不相互独立
B.事件与事件一定不互斥
C.在事件发生的条件下,事件发生与不发生的概率相等
D.在事件发生的条件下,事件发生与不发生的概率相等
易错归纳08 条件概率与全概率公式
【易错陷阱·避错攻略】
解决条件概率问题的步骤
第一步,判断是否为条件概率,若题目中出现“已知”“在……前提下”等字眼,一般为条件概率.题目中若没有出现上述字眼,但已知事件的出现影响所求事件的概率时,也需注意是否为条件概率.若为条件概率,则进行第二步.
第二步,计算概率,这里有两种思路:
思路一
缩减样本空间法计算条件概率,如求P(A|B),可分别求出事件B,AB包含的基本事件的个数,再利用公式P(A|B)=计算
思路二
直接利用公式计算条件概率,即先分别计算出P(AB),P(B),再利用公式P(A|B)=计算
1.(25-26高三上·山东青岛·开学考试)盒中装有个红球和个蓝球,小球除颜色外均相同.甲、乙两人先后从盒中随机取出个球,记录颜色后放回.已知两人取出的球颜色相同,则两人取出的球同为蓝色的概率为( )
A. B. C. D.
2.(25-26高三上·河北沧州·月考)已知口袋内放有8个大小、质地均匀的小球,其中4个白球,4个红球,每次从中不放回地摸出2个小球,设事件表示第1次摸出的小球中恰有1个红球,事件表示第2次摸出的小球中有红球,则( )
A. B. C. D.
3.(25-26高三上·江苏南京·月考)从编号1~7的7张卡片中依次不放回地抽出两张,记事件A:“第一次抽到的卡片编号数字为3的倍数”,事件B:“第二次抽到的卡片编号数字大于第一次抽到的卡片编号数字”,则( )
A. B. C. D.
4.(25-26高三上·江西·月考)某百货商场为促销举办抽奖活动,设有两种奖券:甲奖券和乙奖券.顾客每次抽取甲奖券中奖的概率为0.4,每次抽取乙奖券中奖的概率为0.5,每次抽奖结果相互独立.某顾客计划先抽取2张甲奖券,再抽取1张乙奖券.若该顾客恰好中奖2次,且其中有1张甲奖券中奖,则另外中奖的1张也是甲奖券的概率为( )
A.0.12 B.0.2 C.0.25 D.0.32
5.(2025·江西·模拟预测)儿童牙齿是否健康与早晚是否都刷牙有关.据调查,某幼儿园大约有的学生牙齿健康,大约有的学生早晚都刷牙,且其中早晚都刷牙的学生中约有的学生牙齿健康.现从不是早晚都刷牙的学生中任意调查一名学生,则他的牙齿健康的概率约为( )
A. B. C. D.
6.(2025·海南·模拟预测)某次社会实践活动中,甲、乙两个班的同学共同在一个社区进行民意调查,参加活动的甲、乙两班的人数之比为,其中甲班的女生占,乙班中女生占.则该社区居民遇到一位进行民意调查的同学恰好是女生的概率为( )
A. B. C. D.
7.(24-25高三下·河北邯郸·开学考试)某城市对市民上班的出行方式进行了调查,结果显示有的市民乘坐公共交通工具,有的市民开私家车,有的市民选择步行.在乘坐公共交通工具出行的市民中有的人迟到,在开私家车出行的市民中有的人迟到,在步行出行的市民中有的人迟到.以频率估计概率,从该市随机选择一名市民,若他迟到了,则这名市民是乘坐公共交通工具出行的概率为( )
A. B. C. D.
8.语文老师想了解全班同学课外阅读中国古典四大名著的情况,经调查,全班同学中阅读过《红楼梦》的占,阅读过《三国演义》的占,阅读过《红楼梦》或《三国演义》的占,现从阅读过《三国演义》的同学中随机抽取一位同学,该同学阅读过《红楼梦》的概率为( )
A.0.8 B.0.6 C.0.45 D.0.75
9.(24-25高三上·四川德阳·月考)某汽车4S店从甲乙丙三个车企分别采购同一款智能汽车500,400,100辆进行销售,甲乙丙三个车企生产的该智能汽车的智驾故障率分别为2%,3%,5%,某消费者从该4S店购买了一台此款智能汽车,在智驾过程中突然出现故障,则根据概率计算出甲乙丙三个车企应承担的责任比为( )
A.2:3:5 B.10:12:5 C.5:12:10 D.5:4:1
10.(2025·河北廊坊·模拟预测)某省参加数学竞赛的学生中物理组合占,历史组合占,假定历史组合参赛学生获奖的概率为,物理组合参赛学生获奖的概率为,现从全部参赛学生中抽取3名,已知这3名学生均获奖,则这3名学生中既有物理组合学生又有历史组合学生的概率为( )
A. B. C. D.
1.根据中国报告大厅对2023年3月—10月全国太阳能发电量进行监测统计,太阳能发电量(亿千瓦时)月度数据统计如下表,则( )
月份
3
4
5
6
7
8
9
10
发电量
242.94
230.87
240.59
259.33
258.9
269.19
246.06
244.31
A.中位数是259.115 B.极差是36.32
C.第85百分位数是257.33 D.第25百分位数是241.765
2.(25-26高三上·贵州·月考)某中学数学教师共有20人,他们的年龄分布如表所示:
年龄
62
50
43
32
30
28
25
人数
2
3
3
5
2
4
1
下列说法正确的是( )
A.29是这20人年龄的一个上四分位数 B.29是这20人年龄的一个下四分位数
C.31是这20人年龄的一个中位数 D.这20人年龄的众数是5
3.某个袋子中装有大小形状完全相同的红球和白球各5个,小王从中不放回的逐一取球,在第一次取得白球的条件下,第二次取到红球的概率是( )
A. B. C. D.
4.(2025·海南·模拟预测)已知由样本数据组成的一个样本,得到经验回归方程为,且,增加两个样本点和后,得到新样本的经验回归方程为.在新的经验回归方程下,样本的残差为( )
A. B. C. D.2
5.(25-26高三上·重庆南岸·月考)袋子中放有大小、形状相同的5个小球,其中标号为“0”的小球为1个,标号为“1”的小球2个,标号为“2”的小球2个.从袋中任取两个小球,已知其中一个小球的标号是“1”的条件下,则另一个小球标号也是“1”的概率为( )
A. B. C. D.
6.(2025·河南驻马店·模拟预测)小明和小强两人计划假期到南京游玩,他们分别从“夫子庙”“钟山风景区”“玄武湖”三个景区中随机选择一个游玩.记事件“两人中至少有一人选择夫子庙”,事件“两人选择的景区不同”,则( )
A. B. C. D.
7.(24-25高三下·上海青浦·月考)某网红奶茶店“Chill Tea”在市中心有三个分店:A店、B店、C店.根据平台数据,顾客选择、、店的概率分别为30%、50%、20%.已知各分店高峰期制作时间超过15分钟的概率分别为:店20%、店40%、店30%.若小明随机选择一个分店下单,他等待超过15分钟的概率是( )
A.28% B.32% C.35% D.40%
8.(24-25高三下·辽宁本溪·开学考试)若的展开式中二项式系数之和为32,各项系数之和为243,则展开式中的系数是( )
A.32 B.64 C.80 D.16
9.已知的展开式中第3项与倒数第3项的二项式系数之和等于72,则该展开式中的常数项为( )
A. B. C. D.
10.(2025·山东·三模)某班成立了A、B两个数学兴趣小组,A组10人,B组30人,经过一周的补习后进行了一次测试,在该测试中,A组平均成绩为130分,方差115,B组平均成绩为110分,方差为215,则在这次测试中,全班学生的平均成绩和方差为( )
A.115分,105 B.115分,265
C.120分,105 D.120分,265
11.学校以劳动周形式开展劳育工作创新实践,开设“民俗文化”“茶艺文化”“茶壶制作”“3D打印”四种课程.甲、乙、丙3名同学每名同学至少从中选一种,每种课程都恰有1人参加,记“甲参加民俗文化”,“甲参加茶艺文化”,“乙参加茶艺文化”,则( )
A.A与B相互独立 B.A与C相互独立
C. D.
12.(24-25高三下·重庆·月考)记数据的平均数为 ,方差为,数据的平均数为,方差为,若,为非零常数,则下列说法一定正确的是( )
A. B.
C. D.
13.2025年1月7日9时5分,西藏自治区日喀则市定日县发生6.8级地震.现从各省共抽派7支抢险工作队前往5个灾区县救援,要求每个受灾县至少有一个工作队的方法种数共有( )
A.1800 B.16800 C.14280 D.25200
14.(2025·江西九江·三模)含甲、乙的5名同学分成两组参加志愿服务活动,则甲、乙不同组的分配方案有( )
A.6种 B.8种 C.12种 D.16种
15.(25-26高三上·辽宁·月考)7名教师甲、乙、丙、丁、戊、己、庚带领学生参加“探秘未知”活动,教师随机分为4组,每组至少一人,则甲乙同组且丙丁同组的概率为( )
A. B. C. D.
16.(25-26高三上·湖南常德·开学考试)将6名学生分别安排到甲、乙、丙三地参加社会实践活动,每个地方至少安排一名学生参加,学生不安排到甲地且与学生不安排到同一个地方,则不同的安排方案的种数为( )
A.260 B.280 C.360 D.390
17.(24-25高三上·河北·月考)关于的展开式,下列判断正确的是( )
A.该展开式各项的系数之和为
B.该展开式各项系数的绝对值之和为720
C.该展开式中含的各项系数之和为
D.该展开式中不含字母的各项系数之和为64
18.(2025·河北保定·二模)已知甲箱中有2个红球和3个黑球,乙箱中有个红球和3个黑球(所有球除颜色外完全相同),某学生先从甲箱中随机取出2个球放入乙箱,再从乙箱中随机取出1个球,记“从甲箱中取出的球恰有个红球”为事件,“从乙箱中取出的球是黑球”为事件,则是( )
A.与有关的常量 B.与有关的变量
C.与无关的定值,且为 D.与无关的定值,且为
19.(2025·江西九江·三模)某校选拔乒乓球队队员,选拔时选手与教练对局.若选手连胜两局则成功入选,若连负两局则落选.已知某选手每局测试中(无平局)获胜的概率为,则该选手成功入选的概率是( )
A. B. C. D.
20.(2024·广东深圳·模拟预测)(多选题)一组数据的平均值为5,方差为2,极差为7,中位数为6,记,的平均值为,方差为,极差为,中位数为,则( )
A. B. C. D.
21.(2025·山东青岛·三模)(多选题)某学校组织全体学生参加了文创大赛,随机抽取了400名学生的成绩进行统计,得频率分布直方图(如图),则( )
A.图中的值为0.020
B.该样本中成绩在区间内的学生有160人
C.估计全校学生成绩的平均数约为86.5
D.估计全校学生成绩的分位数约为95
22.(23-24高三下·广西柳州·月考)(多选题)两个具有线性相关关系的变量的一组数据可建立经验回归方程,下列说法正确的是( ).
A.相关系数越接近1,变量x,y相关性越强 .
B.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
C.残差
D.决定系数越小,残差平方和越大,即模型的拟合效果越差
23.(2024·山东济南·模拟预测)(多选题)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这100名学生中,成绩位于内的学生成绩方差为12,成绩位于内的同学成绩方差为10.则( )
A.
B.估计该年级学生成绩的中位数约为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25
24.(多选题)已知是随机事件,且,则下列说法正确的有( )
A.与可能为互斥事件
B.若,则与相互独立
C.若,则
D.若与相互独立,则
25.(2025·内蒙古赤峰·模拟预测)(多选题)一组数据,,,,满足,若去掉,后组成一组新数据,则新数据与原数据相比( )
A.极差变小 B.平均数变大 C.方差变小 D.第25百分位数变小
26.(2025·江苏镇江·模拟预测)(多选题)为响应校团委发起的“青年大学习”号召,某班组织了有奖知识竞答活动.决赛准备了4道选择题和2道填空题,每位参赛者从6道题中不放回地随机抽取三次,每次抽取1道题作答.设事件为“第次抽到选择题”,则下列结论中正确的是( )
A.与互斥;与互斥
B.不管第几次抽取,抽到选择题的概率都相同
C.
D.
27.(2025·四川成都·一模)(多选题)眼睛是心灵的窗户,保护视力从青少年开始.“近视”(设为事件)和“老花”(设为事件)是影响中老年人学习与生活质量的重要视力因素.设,,,则( )
A.与互为对立 B.与相互独立
C. D.
28.(多选题)甲、乙两个不透明的袋子中分别装有两种颜色不同但是大小相同的小球,甲袋中装有4个红球和4个绿球;乙袋中装有3个红球和5个绿球.先从甲袋中随机摸出一个小球放入乙袋中,再从乙袋中随机摸出一个小球,记表示事件“从甲袋摸出的是红球”,表示事件“从甲袋摸出的是绿球”,记表示事件“从乙袋摸出的是红球”,表示事件“从乙袋摸出的是绿球”.下列说法正确的是( )
A.是对立事件 B. C. D.
29.肥胖不仅影响形体美,而且给生活带来不便,此外还有关节软组织损伤、心脏病、糖尿病、脂肪肝、痛风等危害.小王通过运动和节食进行减肥,并将时间x(单位:周)和体重(单位:)记录制作如下统计表:
1
2
3
4
6
8
90.1
87.6
87.2
86.2
84.2
84.3
(1)若和满足经验回归模型,求;
(2)求该模型的决定系数,并判断该经验回归方程是否有价值(认为有价值);
(3)当某组数据残差的绝对值不超过0.3时,称该组数据为“身材有效管理数据”,现从这六组数据中任意抽取两组,设抽取的“身材有效管理数据”的个数为,求的分布列和期望.
附:经验回归方程中,,
参考数据:.
30.数据显示,某企业近年加大了科技研发资金的投入,其科技投入(百万元)与收益(百万元)的数据统计如下:
科技投入
1
2
3
4
5
6
7
收益
19
20
22
31
40
50
70
根据数据特点,甲认为样本点分布在指数型曲线的周围,据此他对数据进行了一些初步处理.如下表:
5
140
1239
149
2134
130
其中,.
(1)请根据表中数据,建立关于的回归方程(系数精确到0.1);
(2)①乙认为样本点分布在直线的周围,并计算得线性回归方程为,以及该回归模型的决定系数,试比较甲、乙两人所建立的模型,谁的拟合效果更好?
②由①所得的结论,计算该企业欲使收益达到1亿元,科技投入的费用至少要多少百万元?(精确到0.1)
附:对于一组数据,,……,,其线性回归直线的斜率和截距的最小二乘法估计公式分别为,,决定系数:.参考数据:.
1 / 1
学科网(北京)股份有限公司
$