内容正文:
第五章 统计与概率知识归纳与题型突破(题型清单)
知识一、统计的相关概念
(1)普查
像人口普查这样,对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
(2)总体、个体
在一个调查中,我们把调查对象的全体称为总体.组成总体的每一个调查对象称为个体.为了强调调查目的,也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体.
(3)抽样调查
(1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体.
(2)个体:构成总体的每一个元素叫做个体.
(3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样本中个体的数目叫做样本容量.
知识二、简单随机抽样
(1)定义
一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
(2)两种常用的简单随机抽样方法
①抽签法:一般地,抽签法就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取次,就得到一个容量为的样本.
②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字,,,…,组成,并且每个数字在表中各个位置出现的机会都是一样的.
注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置.
知识三、总体均值
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k()个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数(i=1,2,…,k),则总体均值还可以写成加权平均数的形式
知识四、样本均值
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称为样本均值,又称样本平均数.
探究:总体均值与样本均值有何区别与联系?
答案:(1)区别:当总体中个体较多时,总体均值不易计算,样本均值比较方便计算.总体均值是一个确定的数,样本均值具有随机性.
(2)联系:在简单随机抽样中,我们常用样本均值估计总体均值.
知识五、分层抽样
1、分层抽样定义一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫分层抽样.
2、分层抽样适用范围
当总体是由差异明显的几个部分组成时,往往采用分层抽样.
3、分层抽样的步骤
(1)根据已掌握的信息,将总体分成若干部分.
(2)根据总体中的个体数N和样本容量n计算出抽样比.
(3)根据抽样比k计算出各层中应抽取的个体数:(其中为第i层所包含的个体总数).
(4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n的样本.
知识六、频率分布直方图
1、频率分布直方图绘制步骤
①求极差,即一组数据中的最大值与最小值的差.
②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.
③将数据分组.
④列频率分布表.计算各小组的频率,第i组的频率是.
⑤画频率分布直方图.其中横轴表示分组,纵轴表示,实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度.
2、频率分布直方图意义:各个小长方形的面积表示相应各组的频率,频率分布直方图以面积的形式反映数据落在各个小组的频率的大小,各小长方形的面积的总和等于1.
3、总体取值规律的估计:我们可以用样本观测数据的频率分布估计总体的取值规律.
4、频率分布直方图的特征:当频率分布直方图的组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原式数据信息;当频率分布直方图的组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易从中看出总体数据的分布特点.
知识七、第p百分位数
1、第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
2、计算第百分位数的步骤
第1步:按从小到大排列原始数据.
第2步:计算.
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第项数据的平均数.
3、四分位数
常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
知识八、众数、中位数、平均数
1、众数、中位数、平均数定义
(1)众数:一组数据中重复出现次数最多的数.
(2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数据的中位数.
(3)平均数:如果个数,那么叫做这个数的平均数.
2、频率分布直方图中的众数、中位数、平均数
①在频率分布直方图中,众数是最高矩形中点的横坐标;
②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
知识九、方差、标准差
1、方差、标准差的定义
一组数据,用表示这组数据的平均数,则这组数据的方差为,标准差为.
2、总体方差、总体标准差的定义
如果总体中所有个体的变量值分别为,总体平均数为,则称为总体方差,为总体标准差.如果总体的个变量值中,不同的值共有个,记为,,其中出现的频数为,则总体方差为.
3、样本方差、样本标准差的定义
如果一个样本中个体的变量值分别为,样本平均数为,则称为样本方差,为样本标准差.
4、方差、标准差特征
标准差、方差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.
知识十、随机试验
1、随机试验的特点
(1)试验可以在相同条件下重复进行;
(2)试验的所有可能结果是明确可知的,并且不止一个;
(3)每次试验总是恰好出现这些可能结果中的一个,但事先不能确定出现哪一个结果.
2、样本空间
我们把随机试验的每个可能的基本结果称为样本点,全体样本点的集合称为试验的样本空间(samplespace).一般地,我们用表示样本空间,用表示样本点.在本书中,我们只讨论为有限集的情况.如果一个随机试验有个可能结果,则称样本空间为有限样本空间.
3、随机事件
一般地,随机试验中的每个随机事件都可以用这个试验的样本空间的子集来表示.为了叙述方便,我们将样本空间的子集称为随机事件(randomevent),简称事件,并把只包含一个样本点的事件称为基本事件(elementaryevent).随机事件一般用大写字母A,B,C,表示.在每次试验中,当且仅当中某个样本点出现时,称为事件发生.
4、必然事件,不可能事件
在每次试验中总有一个样本点发生,所以总会发生,我们称为必然事件.而空集抔包含任何样本点,在每次试验中都不会发生,我们称不可能事件.
知识十一、概率
1、古典概型
(1)古典概型
考察这些试验的共同特征,就是要看它们的样本点及样本空间有哪些共性.可以发现,它们具有如下共同特征:
①有限性:样本空间的样本点只有有限个;
②等可能性:每个样本点发生的可能性相等.
我们将具有以上两个特征的试验称为古典概型试验,其数学模型称为古典概率模型,简称古典概型.
(2)概率公式
一般地,设试验是古典概型,样本空间包含个样本点,事件包含其中的个样本点,则定义事件的概率
其中,和分别表示事件和样本空间包含的样本点个数.
2、概率的基本性质
一般地,概率有如下性质:
性质1:对任意的事件,都有.
性质2:必然事件的概率为1,不可能事件的概率为0,即
性质3:如果事件与事件互斥,那么
性质4:如果事件与事件互为对立事件,那么
,
性质5:如果,那么.
性质6:设A,B是一个随机试验中的两个事件,我们有
知识十二:相互独立事件
1、相互独立事件的概念
对任意两个事件与,如果成立,则称事件与事件相互独立,简称为独立.
2、相互独立事件的性质
(1)事件与是相互独立的,那么与,与,与也是否相互独立.
(2)相互独立事件同时发生的概率:.
知识十五:频率的稳定性
一般地,随着试验次数的增大,频率偏离概率的幅度会缩小,即事件发生的频率会逐渐稳定于事件发生的概率.我们称频率的这个性质为频率的稳定性.因此,我们可以用频率估计概率.
题型一:数据的收集方案
例题1.某医院老年医生、中年医生和青年医生的人数分别为72,120,160,为了解该医院医生的出诊情况,按年龄采用比例分配的分层随机抽样方法抽取样本,已知抽取青年医生的人数为40,则抽取老年医生的人数为 .
【答案】18
【分析】根据分层抽样比例计算即得.
【详解】因抽取青年医生的比例为,而该医院老年医生有72人,
则按照分层随机抽样方法抽取样本,抽取老年医生的人数为.
故答案为:18.
例题2.总体由编号为1,2,⋯,99,100的100个个体组成,现用随机数法选取60个个体,利用电子表格软件产生的若干个1~100范围内的整数随机数的开始部分数据,如下表,则选出来的第5个个体的编号为
8 44 2 17 8 31 57 4 55 6
88 8 31 47 7 21 76 33 50 63
【答案】31
【分析】根据题意,结合随机数表选取的规则,结合题意,即可求解.
【详解】根据随机数表的选取的规则是选出的样本编号为1~100范围内的整数,
且与前面重复的数据不再出现,所以前5个个体编号为:8 44 2 17 31,
所以选出来的第5个个体的编号为31.
故答案为:31.
巩固训练
1.某新闻机构想了解全国人民对2024年巴黎奥运会开幕式的评价,决定从某市2个区按人口数用分层抽样的方法抽取一个样本.若2个区人口数之比为2∶7,且人口较少的一个区抽出100人,则这个样本的容量为 .
【答案】450
【分析】根据分层抽样的抽取比例相同求解即可.
【详解】设样本容量为,则,解得,
所以样本容量为450,
故答案为:450.
2.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②.完成①②这两项调查采用的抽样方法依次是 .
【答案】分层随机抽样,简单随机抽样
【分析】通过随机抽样的定义进行判断.
【详解】解:对于调查①,某公司在四个地区的销售点存在明显的差距,故采用的是:分层随机抽样;
对于调查②,明显是采用的是:简单随机抽样,
故答案为:分层随机抽样,简单随机抽样
题型二:总体(样本)平均数
例题1.已知样本数据,,,的平均数为,且,则样本数据的平均数为
【答案】1
【分析】利用几个数据的平均数的计算公式整理化简即可求解;
【详解】设的平均数为,
则,,,的平均数为,
所以,
又,代入可得:,
也即,解得:.
故答案为:1
例题2.已知的平均数为a,则的平均数是 .
【答案】
【解析】由题可得,再利用平均数的定义求解即可
【详解】由题,,所以,
则的平均数为:
,
故答案为:
巩固训练
1.已知数据,,,,的方差为,平均数为,则数据,,,的标准差为 ,平均数为 .
【答案】
【解析】题中条件给了第一组数据的平均数和方差,根据平均数和标准差的定义推导出第二组数据的平均数和标准差即得.
【详解】根据平均数定义,
故平均数
.
根据方差定义,
故标准差
.
故答案为:
2.一组数据3,6,,5,7,6的平均数为6,则该组数据的方差为 .
【答案】
【解析】利用平均数、方差的公式计算即可.
【详解】由已知,,解得,所以该组数据的方差为
.
故答案为:
题型三:分层抽样的考点
例题1.为了了解高一、高二、高三学生的身体状况,现用比例分配分层随机抽样的方法抽出一个容量为1500的样本,三个年级学生数之比依次为,已知高一年级共抽取了300人,则高三年级抽取的人数为( )
A.750 B.300 C.450 D.150
【答案】A
【分析】根据高一年级学生所占的比例,求出,进而得到高三年级抽取的人数.
【详解】由题意可得:解得:,
所以高三年级抽取的人数为.
故选:A
例题2.某高中三个年级共有学生2000人,其中高一800人,高二600人,高三600人,该校为了解学生睡眠情况,准备从全校学生中抽取80人进行访谈,若采取按比例分配的分层抽样,且按年级来分层,则高一年级应抽取的人数是( )
A.24 B.26 C.30 D.32
【答案】D
【分析】按照分层抽样计数规则计算可得.
【详解】依题意高一年级应抽取的人数为人.
故选:D.
巩固训练
1.一批热水器共有98台,其中甲厂生产的有56台,乙厂生产的有42台,用分层抽样法从中抽出一个容量为14的样本,那么甲、乙两厂各抽得的热水器台数是( )
A.甲厂9台,乙厂5台 B.甲厂8 台,乙厂6台
C.甲厂 10 台,乙厂4台 D.甲厂7台,乙厂7台
【答案】B
【分析】根据给定条件,利用分层抽样的抽样比计算即得.
【详解】依题意,甲厂抽得的热水器台数是,乙厂抽得的热水器台数是.
故选:B
2.某校有700名高一学生,400名高二学生,400名高三学生,高一数学兴趣小组欲采用按比例分配的分层抽样的方法在全校抽取15名学生进行某项调查,则下列说法正确的是( )
A.高一学生被抽到的概率最大 B.高三学生被抽到的概率最大
C.高三学生被抽到的概率最小 D.每位学生被抽到的概率相等
【答案】D
【分析】根据分层抽样的定义和性质判断即可.
【详解】无论采取简单随机抽样,还是分层抽样,每个个体被抽取的概率都相同.
故选:D.
题型四:频率分布直方图中的相关计算问题
例题1.为了解某校今年准备报考飞行员的学生的体重情况,对所得的体重数据(单位:)进行分组,区间为,将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.画出频率分布直方图(如图所示),已知第一组,第二组和第三组的频率之比为,且第一组的频数为6,则报考飞行员的学生人数是( )
A.48 B.5 C.54 D.60
【答案】A
【分析】先由题意求出前三组频率之和,进而求出第一组的频率,从而再结合第一组频数即可得解.
【详解】由题前三组频率之和为,
又第一组、第二组和第三组的频率之比为,
所以第一组的频率为,又第一组的频数为,
所以报考飞行员的学生人数为人.
故选:A.
例题2.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为:、、、、,由此得到频率分布直方图如图,则这20名工人中一天生产该产品数量在的人数是( )
A.5 B.8 C.13 D.17
【答案】C
【分析】计算出产品数量在的频率,进而得到产品数量在的人数.
【详解】产品数量在的频率为,
故这20名工人中一天生产该产品数量在的人数是.
故选:C
巩固训练
1.为了培养青少年无私奉献,服务社会,回馈社会的精神,某学校鼓励学生在假期去社会上的一些福利机构做义工.某慈善机构抽查了其中100名学生在一年内在福利机构做义工的时间(单位:小时),绘制成如图所示的频率分布直方图,则x的值为( )
A.0.0020 B.0.0025 C.0.0015 D.0.0030
【答案】B
【分析】根据题意结合频率和为1列式求解即可.
【详解】由题意可得:,解得.
故选:B.
2.如图是某校高一年级1000名男生体检时身高的频率分布直方图,现用分层随机抽样的方法从身高在160~175cm的男生中抽取130名,则抽取到的身高在165~170cm的人数为( )
A.20 B.30 C.40 D.50
【答案】C
【分析】根据频率分布直方图分别求出身高在160~175cm和身高在165~170cm的人数,然后根据分层抽样的定义求解即可
【详解】由频率分布直方图可知,高一年级身高在160~175cm的人数有,
高一年级身高在165~170cm的人数,
设抽取到的身高在165~170cm的人数为,则
,解得,
故选:C
题型五:百分位数在具体数据中的应用
例题1.某校举行劳动技能大赛,统计了100名学生的比赛成绩,得到如图所示的频率分布直方图,已知成绩均在区间内,不低于90分的视为优秀,低于60分的视为不及格.若同一组中数据用该组区间中间值做代表值,则下列说法中错误的是( )
A. B.优秀学生人数比不及格学生人数少15人
C.该次比赛成绩的平均分约为70.5 D.这次比赛成绩的分位数为78
【答案】A
【分析】根据频率分布直方图的性质特点,利用平均分的法则和百分位数的定义即可求解.
【详解】对于A项,由题意,所以,故A错误;
对于B项,优秀学生人数为,不及格学生人数,
优秀学生人数比不及格学生人数少15人,故B正确;
对于C项,平均分,故C正确;
对于D项,设百分位数为,则有,所以,故D正确.
故选:A
例题2.从某小型加工厂生产的产品中抽取100件作为样本,将该样本进行某项质量指标值测量,下图是测量结果x的频率分布直方图.若同一组中的数据用该组区间的中点值作代表,则在下列选项中,关于该样本统计量的叙述不正确的选项是( )
A.指标值在区间的产品约有33件 B.指标值的极差介于50与70之间
C.指标值的第60百分位数大于205 D.指标值的方差的估计值是150
【答案】C
【分析】根据频率分布直方图求各组的频率.对于A:根据频率即可求频数;对于B:根据极差的定义分析判断;对于C:根据百分位数的定义分析判断;对于D:以每组区间的中点值为参考,结合平均数、方差的计算公式运算即可.
【详解】由直方图可得出,从第一组至第七组的频率依次是,
对于选项A:指标值在区间的产品约有件,A选项正确;
对于选项B:指标值的最大极差为,最小极差为,B选项正确;
对于选项C:因为,,
所以指标值的第百分位数在内,小于,C选项不正确;
对于选项D:抽取的产品的质量指标值的样本平均数和样本方差的估计值分别为:
,
,D选项正确;
综合以上分析,该样本统计量的叙述不正确的选项是C.
故选:C.
巩固训练
1.高二年级进行消防知识竞赛,统计所有参赛同学的成绩,成绩都在内,估计所有参赛同学成绩的第75百分位数为( )
A. B. C. D.
【答案】C
【分析】先由长方形的面积和为1求出,再由第75百分位数的定义求解;
【详解】因为,所以.
参赛成绩位于内的频率为,
第75百分位数在内,
设为,则,
解得5,即第75百分位数为85,
故选:C.
2.某校高三数学老师共有20人,他们的年龄分布如下表所示:
年龄
人数
1
2
6
5
4
2
下列说法正确的是( )
A.这20人年龄的分位数的估计值是46.5
B.这20人年龄的中位数的估计值是41
C.这20人年龄的极差的估计值是55
D.这20人年龄的众数的估计值是35
【答案】B
【分析】本题根据已知条件提供的数据,可分别计算80%分位数,中位数(50%分位数),但无法计算众数和极差.
【详解】因为,故80%分位数落在区间,设其估计值为m,则,解得,故A错误;
又因为,所以中位数(50%分位数)落在区间,设其估计值为n,则,解得,故B正确;
有表格中数据可知极差不超过,故C错误;
因为本题无法确定年龄的具体数值,故无法判断众数的值,故D错误.
故选:B.
题型六:平均数、中位数、众数在具体数据中的应用
例题1.某选手在参加某次比赛中,各评委打出的分数为10,9,8,9,9,8,10,7,8,6.
(1)求该选手所有得分的平均数;
(2)若该选手所有得分的分位数为9,求整数m的取值集合.
【答案】(1)8.4;(2).
【分析】(1)根据平均数的定义进行求解,得出答案;
(2)先从小到大排序,再根据百分位数定义,分,,,,,和等情况进行求解即可.
【详解】(1)该选手平均分为:;
(2)将所得分数从小到大排列为:6,7,8,8,8,9,9,9,10,10,共10个数,
9在第6,7,8三个位置上,
当时,,选择第6个数作为分位数,满足要求,
若,则,选择第6个和第7个数的平均数作为分位数,满足要求,
当时,,选择第7个数作为分位数,满足要求,
若,则,选择第7个和第8个数的平均数作为分位数,满足要求,
当时,,选择第8个数作为分位数,满足要求,
当或时,经检验,不合要求,
综上,整数m的取值集合为.
例题2.有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
设甲、乙两名运动员射击平均环数分别记为和,方差分别记为和.
(1)求,,,;
(2)如果你是教练,你如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?
【答案】(1)7;7;4;1.2(2)答案见解析
【分析】(1)根据平均数和方差公式计算即可;
(2)由(1)的结论,平均数一样,则通过方差判断其稳定性即可得结果.
【详解】(1),
,
,
.
(2)由(1)知,甲乙射击的平均成绩一样,但乙比甲射击的成绩更稳定,所以选择乙.
巩固训练
1.甲、乙两机床同时加工直径为100mm的零件,为检验质量,各从中抽取6件测量,数据如下(单位:mm):
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
若甲机床所加工的6个零件的数据全都加10,那么所得新数据的平均数及方差分别是多少?
【答案】平均数为,方差为
【分析】根据题意,分别将数据加十,根据平均数和方差的计算公式,可得答案.
【详解】甲的数据为,,,,,,
即,,,,,,
平均数为,
方差为.
2.在2024年世界泳联跳水世界杯蒙特利尔站和柏林站女子10米台跳水决赛中,全红婵奉献了高水准的精彩表现,在决赛中的五个动作惊艳了全世界.在这两场决赛中,7名裁判给选手的五个跳水动作打分,两站裁判对全红婵的打分记录如下:(为了方便计算,采取分数四舍五入取整)
A组(蒙特利尔站):80 80 82 78 93
B组(柏林站):81 80 86 99 86
(1)请写出这10个分数的众数、极差以及A,B两组各自的平均成绩;
(2)请你根据所学的统计知识,分析两站比赛中,哪一站全红婵发挥更稳定?并说明理由.
【答案】(1)众数为80,极差为21,82.6,86.4
(2)蒙特利尔站发挥更稳定,理由见解析
【分析】(1)根据众数、极差和平均数的概念,依次计算即可得出结果;
(2)可以用方差来衡量,方差越小,分数越集中,判断发挥越稳定,根据方差公式计算即可.
【详解】(1)易知在这10个分数中,出现最多的是80,所以众数为80,
这10个分数中,最高分为99,最低分为78,所以极差为,
A,B两组各自的平均成绩分别为,
(2)可以用方差来衡量,方差越小,分数越集中,判断发挥越稳定,
设蒙特利尔站和柏林站的方差分别为,,
易知,
,
因为,所以蒙特利尔站发挥更稳定.
题型七:在频率分布直方图中求平均数、中位数、众数
例题1.从某校参与数学竞赛的试卷中抽取一个样本,考查竞赛的成果分布,将样本分成组,得到频率分布直方图如图,从左到右各小组的小长方形的高的比为:::::,最右边的一组的频数是.请结合直方图的信息,解答下列问题:
(1)样本容量是多少?
(2)成果落在哪个范围的人数最多?并求出该小组的频数和频率;
(3)估计这次数学竞赛成果的众数、中位数和平均数.
【答案】(1)68(2)70~80分之间的人数最多,频率为,频数为24.(3)75,75.83,75
【分析】(1)先得到最右边一组的频率,从而得到样本容量.
(2)由频率分布直方图易得成绩落在~分之间的人数最多,再根据频率与频数的关系可得结果.
(3)根据频率分布直方图的众数、中位数和平均数的计算方法得到结果.
【详解】(1)由从左到右各小组的小长方形的高的比为:::::,
可得从左到右各小组的频率分别为,
故样本容量为.
(2)由频率分布直方图知,成果落在~分的人数最多,该小组的频率为,
故频数为.
(3)众数的估计值是,
中位数的估计值是,
平均数的估计值是.
例题2.某地区有小学生9000人,初中生8600人,高中生4400人,教育局组织网络“防溺水”网络知识问答,现用分层抽样的方法从中抽取220名学生,对其成绩进行统计分析,得到如下图所示的频率分布直方图所示的频率分布直方图.
(1)根据频率分布直方图,估计该地区所有学生中知识问答成绩的平均数和众数;
(2)成绩位列前10%的学生平台会生成“防溺水达人”优秀证书,试估计获得“防溺水达人”的成绩至少为多少分;
(3)已知落在内的平均成绩为67,方差是9,落在内的平均成绩是73,方差是29,求落在内的平均成绩和方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:.记两组数据总体的样本平均数为,则总体样本方差)
【答案】(1)平均数为,众数为.(2).(3)平均数为,方差为.
【分析】(1)在频率分布直方图中,平均数等于每组的组中值乘以每组的频率之和;众数是最高矩形横坐标的中点,据此求解.
(2)依题意可知题目所求是第分位数,先判断第分位数落在哪个区间再求解即可;
(3)先求出每组的比例,再根据分层随机抽样的平均数及方差求解即可.
【详解】(1)一至六组的频率分别为,
平均数.
由图可知,众数为.
以样本估计总体,该地区所有学生中知识问答成绩的平均数为分,众数为分.
(2)前4组的频率之和为,
前5组的频率之和为,
第分位数落在第5组,设为x,则,解得.
“防溺水达人”的成绩至少为分.
(3))的频率为,)的频率为,
所以的频率与的频率之比为
的频率与的频率之比为
设内的平均成绩和方差分别为,
依题意有,解得
,解得,
所以内的平均成绩为,方差为.
巩固训练
1.某高中为了解本校高二年级学生的体育锻炼情况,随机抽取100名学生,统计他们每天体育锻炼的时间,并以此作为样本,按照进行分组,得到如图所示的频率分布直方图.已知样本中体育锻炼时间在内的学生有10人.
(1)求频率分布直方图中和的值;
(2)估计样本数据的中位数和平均数(求平均数时,同一组中的数据以该组区间的中点值为代表).
【答案】(1),(2)中位数是72分钟;平均数是72分钟
【分析】(1)求出在[50,60)内的频率即可求出,根据频率之和为1即可列式求.
(2)先求出前3组的频率之和以及前4组的频率之和得样本数据的中位数x在第4组, 再依据频率分布直方图所给数据列出等量关系式求解即可;由平均数的定义和公式直接计算即可.
【详解】(1)由题意可知,学生每天体育锻炼的时间在[50,60)内的频率为,
则,
由各组频率之和为1,可知,
解得.
(2)前3组的频率之和为,
前4组的频率之和为,
所以样本数据的中位数在第4组,设为,
所以,解得,
估计样本数据的中位数是72分钟;
估计平均数是分钟.
2.南宁三中强调学科阅读,为了解学生的学科阅读情况,计划对学生的阅读素养进行检测,在该校随机抽取了100名学生进行检测,现将所得的成绩按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分成6组,并根据所得数据作出了如图所示的频率分布直方图.
(1)求a的值;
(2)根据样本数据估计该校学生阅读素养成绩的75%分位数以及平均数.
【答案】(1)(2)第分位数为,平均数.
【分析】(1)长方形面积之和为1计算即可.
(2)由(1)的结果,计算75%分位数以及平均数即可.
【详解】(1)由图可知:,
解得.
(2)因为,
所以75%分位数在第四组,设第75%分位数为x,所以有,
即,解得x=77.5,所以第75%分位数为77.5.
平均数:.
题型八:用样本平均数和样本标准差估计总体
例题1.为倡导健康生活方式,某大学社团联合学生会倡议全校学生参与“每日万步行”健走活动.如图为该校甲、乙两名同学在同一星期内每日步数的折线统计图,则下列说法正确的是( )
A.这一星期内甲的日步数的中位数小于乙的日步数的中位数
B.这一星期内甲的日步数的平均数大于乙的日步数的平均数
C.这一星期内乙的日步数的标准差小于甲的日步数的标准差
D.这一星期内乙的日步数的第75百分位数是12400
【答案】BC
【分析】根据折线图得到这一星期内甲,乙的日步数,都从小到大进行排列,得到中位数后即可判断选项A;根据平均数计算公式,计算出这一星期内甲,乙的日步数的平均数,比较大小即可判断选项B;根据图象观察甲的波动程度较大,故方差较大,从而判断选项C;把乙一星期内的步数从小到大进行排列,并计算,故第六个数为所求,即可判断选项D.
【详解】由题中折线图可得甲这一星期内的日步数从小到大排列为:
11000,11800,12200,12600,13500,15400,18200,所以中位数为12600;
乙这一星期内的日步数从小到大排列为:11800,12200,12400,12600,13000,13800,14000,
所以中位数为12600.故这一星期内甲、乙的日步数的中位数都为12600,A错误;
这一星期内甲的日步数的平均数为
,
这一星期内乙的日步数的平均数为
,
因为,故B正确.
由图知,甲的波动程度较大,故方差、标准差较大,故C正确.
,则由A选项得这一星期内乙的日步数的第75百分位数是13800,故D错误.
故选:BC.
例题2.给定一组数,,,,,,,,,,则( )
A.平均数为3 B.标准差为 C.众数为2 D.分位数为5
【答案】AD
【分析】根据平均数、方差、众数和百分位数的概念与计算方法,逐项判定,即可求解.
【详解】平均数为,故A正确;
,所以标准差为,故B错误;
根据众数的定义可得众数为和,故C错误;
将数据从小到大排序得1,2,2,2,3,3,3,4,5,5,可得,所以第85百分位数为5,所以D正确.
故选:AD.
巩固训练
1.新高考模式下,化学、生物等学科实施赋分制,即通过某种数学模型将原始分换算为标准分.某校在一次高三模拟考试中实施赋分制的方式,其中应用的换算模型为:,其中x为原始分,y为换算后的标准分.已知在本校2000名高三学生中某学科原始分最高得分为150分,最低得分为50分,经换算后最高分为150分,最低分为80分.则以下说法正确的是( )
A.若学生甲本学科考试换算后的标准分为115分,则其原始得分为100分
B.若在原始分中学生乙的得分为中位数,则换算后学生乙的分数仍为中位数
C.该校本学科高三全体学生得分的原始分与标准分的标准差相同
D.该校本学科高三全体学生得分的原始分的平均分低于标准分的平均分
【答案】ABD
【分析】先求出换算模型公式,进行原始分和标准分的计算,得到有关结论.
【详解】对A,由题意得:.所以换算模型为:
由,故A对;
对B,因为函数为增函数,所以标准分不改变原始分的排名顺序,原始分的中位数换算后,得到的标准分仍为中位数,故B对;
对C,由,所以只有原始分是150分时,标准分与原始分相等,
当原式分低于150分时,标准分都高于原始分,所以标准分相比于原始分,分数更集中,
所以标准分的标准差比原始分的标准差要小,故C错误;
对D,因为标准分都不低于原式分,所以原始分的平均分低于标准分的平均分,故D对.
故选:ABD
2.制造业PMI指数反映制造业的整体增长或衰退,制造业PMI指数的临界点为.我国2021年10月至2022年10月制造业PMI指数如图所示,则( )
A.2022年10月中国制造业PMI指数为,比上月下降0.9个百分点,低于算界点
B.2021年10月至2022年10月中国制迼业PMI指数的极差为
C.2021年10月至2022年10月中国制造业PMI指数的众数为
D.2021年11月至2022年2月中国制造业PMI指数的标准差小于2022年7月至2022年10月中国制造业PMI指数的标准差
【答案】ABD
【分析】根据图中数据,结合极差、众数的定义、标准差与数据稳定性之间关系可直接得到结果.
【详解】对于A,由图可知:年月中国制造业指数为,年月中国制造业指数为,
年月中国制造业指数比上月下降个百分点,且低于临界点,A正确;
对于B,年月至年月中国制造业指数的极差为,B正确;
对于C,由图中数据知:众数为,C错误;
对于D,由图中数据波动幅度知:年月至年月中国制造业指数比年月至年月更稳定,
年月至年月中国制造业指数的标准差更小,D正确.
故选:ABD.
题型九:事件关系的判断
例题1.对于概率的基本性质,下列选项正确的是( )
A.如果事件A与事件B互斥,那么
B.如果事件A与事件B互为对立事件,那么
C.如果,则
D.
【答案】BD
【分析】根据给定条件,利用概率的基本性质逐项判断即得.
【详解】对于A,事件A与事件B互斥,则,而可以为1,A错误;
对于B,事件A与事件B互为对立事件,则,B正确;
对于C,,则,C错误;
对于D,,D正确.
故选:BD
例题2.(多选)在一次随机试验中,三个事件,,发生的概率分别是0.2,0.3,0.5,则下列说法正确的是( )
A.与是互斥事件,也是对立事件
B.不一定是必然事件
C.
D.
【答案】BD
【分析】根据三个事件,,不一定两两互斥,结合概率运算公式和互斥、对立的概念,即可求解.
【详解】对于选项A:因为,,不一定是两两互斥事件,无法判断与是不是互斥事件,是不是对立事件,所以A不正确;
对于选项B:因为,,不一定是两两互斥事件,所以不一定是必然事件,所以B正确;
对于选项C:,所以C不正确;
对于选项D:,所以D正确;
故选:BD.
巩固训练
1.从装有3只红球,3只白球的袋中任意取出3只球,则下列每对事件,是互斥事件,但不是对立事件的是( )
A.“取出2只红球和1只白球”与“取出1只红球和2只白球”
B.“取出2只红球和1只白球”与“取出3只红球”
C.“取出3只红球”与“取出3只球中至少有1只白球”
D.“取出3只红球”与“取出3只球中至少有1只红球”
【答案】AB
【分析】对于A,判断两个事件是否可以同时发生,从而判断是否为互斥事件,接下来判断是否为对立事件;对于BCD,利用与A相同的方法进行分析,从而解答题目.
【详解】从袋中任意取出3个球,可能的情况有:“3个红球”“2个红球、1个白球”“1个红球、2个白球”“3个白球”.
对于A:“取出2只红球和1只白球”与“取出1只红球和2只白球”不可能同事发生,是互斥事件,
但有可能两个都不发生,故不是对立事件,故A正确;
对于B:“取出2只红球和1只白球”与“取出3只红球”不可能同事发生,是互斥事件,
但有可能同时不发生,故不是对立事件,故B正确;
对于C:“取出3只红球”与“取出3只球中至少有1只白球”不可能同事发生,是互斥事件,
其中必有一事件发生,故是对立事件,故C错误;
对于D:“取出3只红球”与“取出3只球中至少有1只红球”可能同事发生,
故不是互斥事件,不可能是对立事件,故D错误.
故选:AB.
2.已知,,则下列说法中正确的是( )
A.如果,那么 B.如果,那么
C.如果互斥,那么 D.如果互斥,那么
【答案】ABC
【分析】对于AB,由可得即可;对于CD,由互斥可得即可.
【详解】对于AB,由可得,
所以,故AB正确;
对于CD,由互斥可得,
所以,故C正确,D错误.
故选:ABC.
题型十:简单古典概型的计算
例题1.在和两个集合中各取一个数组成一个两位数,则这个两位数能被4整除的概率是 .
【答案】
【分析】确定基本事件空间为,根据古典概型计算求解,即可.
【详解】满足题意的所有两位数有,共15个.
其中能被4整除的两位数有,共5个.
所以概率
故答案为:
例题2.柜子里有3双不同的鞋子,分别用表示6只鞋,从中有放回地取出2只,记事件“取出的鞋是一只左脚一只右脚的,但不是一双鞋”,则事件的概率是 .
【答案】
【分析】列举法写出试验的样本空间,根据古典概型的概率公式直接可得解.
【详解】设表示三只左鞋,表示三只右鞋,
则从中有放回取出2只的所有可能为:
,共计36种,
其中满足取出的鞋一只左脚一只右脚,但不是一双鞋的有12种,
.
故答案为:.
巩固训练
1.甲、乙两人各有四张卡片,每张卡片上标有一个数字,甲的卡片上分别标有数字3,5,7,9,乙的卡片上分别标有数字2,4,6,8,两人进行四轮比赛,在每轮比赛中,两人各自从自己持有的卡片中随机选一张,并比较所选卡片上数字的大小,数字大的人得1分,数字小的人得0分,然后各自弃置此轮所选的卡片(弃置的卡片在此后轮次中不能使用).则四轮比赛后,甲的总得分为3的概率为 .
【答案】
【分析】设相应事件,不妨假设甲的的卡片顺序为3,5,7,9,可求得,列举求,结合古典概型运算求解.
【详解】设样本空间为,甲的总得分为3为事件A,
不妨假设甲的的卡片顺序为3,5,7,9,
则乙的卡片顺序共有种,即;
若甲的总得分为3,则乙的卡片顺序为
,,
共有11种,即,
所以.
故答案为:.
2.用0与1两个数字随机填入如图所示的3个格子里,每个格子填一个数字.若从左到右数,不管数到哪个格子,总是1的个数不少于0的个数,则这样填法的概率为 .
【答案】/0.375
【分析】根据列举法应用古典概型计算即可.
【详解】列出树状图
基本事件的总数为8个,满足条件的基本事件为共3种,
所以概率为.
故答案为:.
题型十一:较复杂的古典概型的计算
例题1.已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.
(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?
(2)现从抽出的7名同学中随机抽取2名同学承担敬老院的卫生工作.
①写出样本空间;
②设事件“抽取的2名同学来自同一年级”,求事件发生的概率.
【答案】(1)甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人
(2)①答案见解析;②
【分析】(1)根据分层抽样得定义即可得解;
(2)①利用列举法即可得解;
②利用古典概型求解即可.
【详解】(1)由已知,甲、乙、丙三个年级的学生志愿者人数之比为,
由于采用分层抽样的方法从中抽取7名同学,
因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人;
(2)①设甲年级的是,乙年级的是,丙年级的是,
则样本空间为
;
②由①得,事件包含的基本事件为共5种,
所以.
例题2.在人群流量较大的街道,有一中年人吆喝“送钱”,只见他手拿一黑色小布袋,袋中有3只黄色、3只白色的乒乓球(其体积、质地完全相同),旁边立着一块小黑板写道:摸球方法:从袋中随机摸出3个球,若摸得同一颜色的3个球,摊主送给摸球者5元钱;若摸得非同一颜色的3个球,摸球者付给摊主1元钱.
(1)摸出的3个球为白球的概率是多少?
(2)假定一天中有100人次摸奖,试从概率的角度估算一下这个摊主一个月(按30天计)能赚多少钱?
【答案】(1)
(2)1200元
【分析】(1)所有摸球的可能结果,再求出概率即可;
(2)题意,利用概率估计频率,计算净收入即可;
【详解】(1)把3只黄色乒乓球分别标记为,3只白色乒乓球分别标记为1,2,3.
从6个球中随机摸出3个球的基本事件为:,
共20个.
则摸出的3个球为白球的概率是,
(2)由前问可知,摸出的球为同一颜色的概率为,
假定一天中有100人次摸奖,则有10次为同一颜色,90次为不同颜色,
则一天可净赚,
则一个月可赚元.
巩固训练
1.甲乙两位同学参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
(1)用茎叶图表示这两组数据;
(2)现要选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?
(3)若将频率视为概率,求甲同学在今后的数学竞赛成绩高于80的概率.
【答案】(1)作图见解析(2)派甲参赛(3)
【分析】(1)根据题目数据,作出甲乙两位同学成绩的茎叶图即可;
(2)计算甲乙两位同学成绩的平均数与方差,比较得出结论;
(3)甲同学成绩高于80分的有6次,根据古典概型求出概率.
【详解】(1)根据题目数据作出茎叶图如下:
(2)从平均数和方差的角度看,甲同学比较优秀,理由如下:
,
方差是;
方差是由于,,
则甲乙两位同学成绩的平均数,甲的成绩比较稳定,所以派甲参赛;
(3)记“甲在一次数学竞赛中成绩高于80分”为事件A,
由题目数据知甲同学成绩高于80分的有6次,所以.
2.已知盒中有大小、质地相同的红球、黄球、蓝球共4个,从中任取一球,得到红球或黄球的概率是,得到黄球或蓝球的概率是.
(1)求盒中红球、黄球、蓝球的个数;
(2)设置游戏规则如下:从盒中有放回的取球两次,每次任取一球记下颜色.若取到两个球颜色相同则甲胜,否则乙胜,从概率的角度判断这个游戏是否公平,请说明理由.
【答案】(1)盒中红球、黄球、蓝球的个数分别是2,1,1;(2)不公平,理由见解析
【分析】(1)根据题设的概率可得关于球数的方程组,求出其解后可得不同颜色的求出.
(2)利用列举法可求甲胜或乙胜的概率,从而可判断游戏是否公平.
【详解】(1)设盒中红球、黄球、蓝球个数分别为x,y,z,从中任取一球,得到红球或黄球为事件A,得到黄球或蓝球为事件B,
则,
由已知得,解得,
所以盒中红球、黄球、蓝球的个数分别是2,1,1;
(2)由(1)知红球、黄球、蓝球个数分别为2个,1个,1个,
用,表示红球,用表示黄球,用表示蓝球,
表示第一次取出的球,表示第二次取出的球,表示试验的样本点,
则样本空间,.
可得,
记“取到两个球颜色相同”为事件,“取到两个球颜色不相同”为事件,
则,所以,
所以,
因为,所以此游戏不公平.
题型十二:事件独立性的判断
例题1.下列说法正确的是( )
A.若,则事件A与B是对立事件
B.设A,B是两个随机事件,且,,若,则A,B是相互独立事件
C.A,B同时发生的概率一定比A,B中恰有一个发生的概率小
D.若,,则“事件A,B相互独立”与“事件A,B互斥”一定不能同时成立
【答案】BD
【分析】对于AC:举反例说明即可;对于BD:根据独立事件概率乘法公式以及互斥事件的概念分析判断.
【详解】对于选项A:例如样本空间为,事件,,
可得,满足,
但,即事件不对立,故A错误;
对于选项B:因为,,,
满足,所以A,B是相互独立事件,故B正确;
对于选项C:例如样本空间为,事件,,
则A,B同时发生为事件,则;
A,B中恰有一个发生为事件,则;
显然,故C错误;
对于选项D:因为,,
若事件A,B相互独立,则,可知事件A,B不互斥;
若事件A,B互斥,则,即,可知事件A,B不相互独立,
所以“事件A,B相互独立”与“事件A,B互斥”一定不能同时成立,故D正确;
故选:BD.
例题2.下列说法正确的有( )
A.若事件与事件是互斥事件,则
B.若事件与事件是对立事件,则
C.把红、橙、黄3张纸牌随机分给甲、乙、丙3人,每人分得1张,则事件“甲分得的不是红牌”与事件“乙分得的不是红牌”是互斥事件
D.某人打靶时连续射击三次,则事件“至少有两次中靶”与事件“至多有一次中靶”是对立事件
【答案】ABD
【分析】根据互斥事件、对立事件的概念一一判断即可.
【详解】对A,事件与事件互斥,则不可能同时发生,所以,故A正确;
对B,事件与事件是对立事件,则事件即为事件,所以,故B正确;
对C,“甲分得的不是红牌”与事件“乙分得的不是红牌”可能同时发生,
即“丙分得的是红牌”,所以不是互斥事件,故C错误;
对D,事件“至少两次中靶”与“至多一次中靶”不可能同时发生,且二者必发生其一,所以为对立事件,故D正确;
故选:ABD
巩固训练
1.已知事件发生的概率分别为,则下列说法正确的是( )
A.若与互斥,则
B.若与相互独立,则
C.若,则与相互独立
D.若发生时一定发生,则
【答案】BC
【分析】选项A,利用互斥事件的概率公式,即可求解;选项B,利用,求得,即可求解;选项C,利用相互独立的判断方法,即可求解;选项D,由题知,即可求解.
【详解】对于选项A,因为与互斥,则,所以选项A错误,
对于选项B,与相互独立,则,所以选项B正确,
对于选项C,因为,所以,由相互独立的定义知与相互独立,所以选项C正确,
对于选项D,因为发生时一定发生,所以,则,所以选项D错误,
故选:BC.
2.设,为随机事件,且,是,发生的概率. ,,则下列说法正确的是( )
A.若,互斥,则 B.若,则,相互独立
C.若,互斥,则,相互独立 D.若,独立,则
【答案】ABD
【分析】利用互斥事件的概率公式可判断A选项;由相互独立事件的概念可判断B选项;由互斥事件和相互独立事件的概念可判断C选项;由相互独立事件的概念,可判断D选项.
【详解】对于选项A,若互斥,根据互斥事件的概率公式,则,所以选项A正确,
对于选项B,由相互独立事件的概念知,若,则事件是相互独立事件,所以选项B正确,
对于选项C,若互斥,则不一定相互独立,例:抛掷一枚硬币的试验中,事件:“正面朝上”,事件:“反面朝上”,事件与事件互斥,但,,不满足相互独立事件的定义,所以选项C错误,
对于选项D,由相互独立事件的定义知,若,独立,则,所以选项D正确,
故选:ABD.
题型十三:相互独立事件概率的计算
例题1.甲、乙、丙三人打台球,约定:第一局由甲、乙对打,丙轮空;每局比赛的胜者与轮空者进行下一局对打,负者下一局轮空,如此循环.设甲、乙、丙三人水平相当,每场比赛双方获胜的概率都为.
(1)求甲连续打四局比赛的概率;
(2)求在前四局中甲轮空两局的概率;
(3)求第四局甲轮空的概率.
【答案】(1)(2)(3)
【分析】(1)由题意知甲前三局都要打胜,计算可得甲连续打四局比赛的概率;
(2)甲轮空两局的情况为,第一局甲败,第二局轮空,第三局甲败,第四局轮空,计算即可;
(3)分析可得甲第四轮空有两种情况:第1种情况,第一局甲败,第二局轮空,第三局甲败,第四局轮空,第2种情况,第一局甲胜,第二局甲胜,第三局甲败,第四局轮空,计算即可.
【详解】(1)若甲连续打四局,根据比赛规则可知甲前三局都要打胜,
所以甲连续打四局比赛的概率;
(2)在前四局中甲轮空两局的情况为,第一局甲败,第二局轮空,第三局甲败,第四局轮空,
故在前四局中甲轮空两局的概率;
(3)甲第四轮空有两种情况:
第1种情况,第一局甲败,第二局轮空,第三局甲败,第四局轮空,
第2种情况,第一局甲胜,第二局甲胜,第三局甲败,第四局轮空,
第1种情况的概率;第2种情况的概率;
由互斥事件的概率加法公式可得第四局甲轮空的概率为.
例题2.,,三人参加知识闯关比赛,三人闯关成功与否相互独立.已知闯关成功的概率是,,,三人闯关都成功的概率是,,,三人闯关都不成功的概率是.
(1)求,两人各自闯关成功的概率;
(2)求,,三人中恰有两人闯关成功的概率.
【答案】(1),两人各自闯关成功的概率都是.(2)
【分析】(1)记三人各自闯关成功分别为事件,三人各自独立闯关,由题意结合独立事件的概率公式可列出方程组,从而解得,两人各自闯关成功的概率;
(2)三人中恰有两人闯关成功为事件,利用独立事件和互斥事件的概率公式计算即可.
【详解】(1)记三人各自闯关成功分别为事件,
三人闯关成功与否得相互独立,且满足,
解得,,
所以,两人各自闯关成功的概率都是.
(2)设,,三人中恰有两人闯关成功为事件,
则,
所以三人中恰有两人闯关成功的概率为.
巩固训练
1.为了选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,教育部启动了“强基计划”的招生改革工作.某校强基招生面试有两道题,两道题都答对者才能通过强基招生面试.假设两题作答相互独立,现有甲、乙、丙三名学生通过考核进入面试环节,他们答对第一题的概率分别是,答对第二题的概率分别是.
(1)求甲、乙两位考生中有且只有一位考生通过强基招生面试的概率;
(2)求甲、乙、丙三人中至少有一人通过强基招生面试的概率.
【答案】(1);(2).
【分析】(1)根据给定条件,利用相互独立事件及互斥事件的概率公式计算即得.
(2)由(1)中信息,利用相互独立事件及对立事件的概率公式计算即得.
【详解】(1)(1)甲通过考核进入面试环节,答对第一题的概率分别是,答对第二题的概率分别是,
甲考生通过某校强基招生面试的概率为,
同理,乙考生通过某校强基招生面试的概率为,
所以甲、乙两位考生中有且只有一位考生通过强基招生面试的概率为:
.
(2)丙考生通过某校强基招生面试的概率为,
所以甲、乙、丙三人中至少有一人通过强基招生面试的概率为:.
2.全国执业医师证考试分实践技能考试与医学综合笔试两部分,每部分考试成绩只记“合格”与“不合格”,两部分考试都“合格”者,则执业医师考试“合格”,并颁发执业医师证书.甲、乙、丙三人在医学综合笔试中“合格”的概率依次为,,,在实践技能考试中“合格”的概率依次为,,,所有考试是否合格互不影响.
(1)求甲没有获得执业医师证书的概率;
(2)这三人进行实践技能考试与医学综合理论考试两项考试后,求恰有两人获得执业医师证书的概率.
【答案】(1)(2)
【分析】(1)先根据对立事件的概率公式结合独立事件概率乘积公式计算;
(2)先应用对立事件的概率公式及独立事件概率乘积公式应用互斥事件求和计算;
【详解】(1)记甲,乙,丙三人在医学综合笔试中合格依次为事件,,,
在实践考试中合格依次为,,,
设甲没有获得执业医师证书的概率为
.
(2)甲、乙、丙获得执业医师证书依次为,,,
并且与,与,与相互独立,
则,,,
由于事件,,彼此相互独立,
“恰有两人获得执业医师证书”即为事件:,
概率为.
题型十四:频率与概率的关系
例题1.下述关于频率与概率的说法中,错误的是( )
A.设有一大批产品,已知其次品率为0.1,则从中任取100件,必有10件是次品
B.利用随机事件发生的频率估计随机事件的概率,即使随机试验的次数超过10000,所估计出的概率也不一定很准确.
C.随机事件发生的频率就是这个随机事件发生的概率
D.做7次抛硬币的试验,结果3次出现正面,因此,抛一枚硬币出现正面的概率是
【答案】ACD
【分析】根据频率与概率的关系,结合各选项的描述判断正误.
【详解】对于A:从中任取100件,可能有10件,A错误;
对于B:10000次的界定没有科学依据,"不一定很准确"的表达正确,试验次数越多,频率越稳定在概率值附近,
但并非试验次数越多,频率就等于概率,B正确.
对于C:多次重复试验中事件发生的频率在某一常数附近,此常数为概率,C中描述不符合概率定义,C错误;
对于D:做7次抛硬币的试验,结果3次出现正面,因此,抛一枚硬币出现正面的频率是,不是概率为,D错误;
故选:ACD.
例题2.下列命题正确的是( )
A.随机事件A的概率是频率的稳定值,频率是概率的近似值
B.抛掷骰子100次,得点数是1的结果是18次,则出现1点的频率是
C.有一批产品,其次品率为0.05,若从中任取200件产品,则一定有190件正品,10件次品
D.抛掷一枚质地均匀的硬币100次,有51次出现了正面,则可得抛掷一次该硬币出现正面的概率是0.51
【答案】AB
【分析】对于A,根据概率与频率的关系分析判断,对于B,根据频率的定义分析判断,对于CD,根据频率与概率的关系分析判断.
【详解】对于A:随机事件A的概率是频率的稳定值,频率是概率的近似值,故A正确;
对于B:抛掷骰子100次,得点数是1的结果是18次,则出现1点的频率是,故B正确;
对于C:有一批产品,其次品率为0.05,若从中任取200件产品,则不一定抽取到190件正品和10件次品,故C错误;
对于D:100次并不是无穷多次,抛掷一枚质地均匀的硬币100次,有51次出现了正面,则可得抛掷一次该硬币出现正面的频率是0.51,故D错误;
故答案选:AB.
巩固训练
1.下列结论正确的是( )
A.任何事件的概率总是在内
B.随着试验次数的增加,频率会逐渐稳定于概率
C.抛掷一枚硬币,试验100次出现正面向上的频率一定比试验50次出现正面向上的频率更接近它出现正面向上的概率
D.随机事件中至少有一个发生的概率一定不小于中恰有一个发生的概率
【答案】BD
【分析】对于A:根据概率的性质分析判断;对于BC:根据概率和频率之间的关系分析判断;对于D:根据事件的运算结合概率的性质分析判断.
【详解】对于选项A:任何事件的概率总是在内,例如必然事件的概率为1,故A错误;
对于选项B:根据频率与概率之间的关系可知:随着试验次数的增加,频率会逐渐稳定于概率,故B正确;
对于选项C:由选项B可知:随着试验次数的增加,频率会逐渐稳定于概率,
但该结论为总体效果,对具体情况不一定成立,故C错误;
对于选项D:因为,则,
且随机事件中至少有一个发生的概率为,
中恰有一个发生的的概率为,
所以随机事件中至少有一个发生的概率一定不小于中恰有一个发生的概率,故D正确;
故选:BD.
2.下列说法不正确的是( )
A.某种福利彩票的中奖概率为,那么买1000张这种彩票一定能中奖
B.随着试验次数的增加,频率一般会越来越接近概率
C.某医院治疗一种疾病的治愈率为,前9个病人没有治愈,则第10个病人一定治愈
D.某市气象台预报“明天本市降水概率为”,指的是该市气象台专家中,有认为明天会降水,30%认为不降水
【答案】ACD
【分析】根据频率和概率之间的关系、概率的定义可得正确的选项.
【详解】对于A,中奖概率为是指买一次彩票,可能中奖的概率为,
不是指1000张这种彩票一定能中奖,故A错误;
对于B,试验次数越多,频率就会稳定在概率的附近,故B正确;
对于C,某医院治疗一种疾病的治愈率为,是指一位病人被治愈的概率为,
不是说每10名患者就一定有一人被治愈,故C错误.
对于D,“明天本市降水概率为”指下雨的可能性为,故D错.
故选:ACD.
题型十五:概率的稳定性
例题1.如图,地到火车站共有两条路径和,现随机抽取100位从地到火车站的人进行调查,调查结果如下:
所用时间(分钟)
[10,20]
(20,30]
(30,40]
(40,50]
(50,60]
选择的人数
6
12
18
12
12
选择的人数
0
4
16
16
4
(1)试用频率估计概率,估计40分钟内不能赶到火车站的概率:
(2)现甲、乙两人分别有40分钟和50分钟时间用于赶往火车站,为了尽量大可能在允许的时间内赶到火车站,试用频率估计概率通过计算说明,他们应如何选择各自的路径.
【答案】(1);(2)甲应选择路径,乙应选择路径.
【分析】(1)根据频数计算频率即可;
(2)分别计算两个时间段的概率,比较概率的大小可得结论.
【详解】(1)调查的100人,其中40分钟内不能赶到火车站有:(人),
因此40分钟内不能赶到火车站的频率为,
用频率估计概率,所以40分钟内不能赶到火车站的概率为.
(2)设分别表示甲选择和时,在40分钟内赶到火车站;
分别表示乙选择和时,在50分钟内赶到火车站,
依题意,,,
由,得甲应选择路径;
,,
由,得乙应选择路径,
所以甲应选择路径,乙应选择路径.
例题2.某市统计近几年婴儿出生数及其中男婴数(单位:人)如下:
出生婴儿数
21840
23070
20094
19982
出生男婴数
11453
12031
10297
10242
(1)试计算这几年男婴出生的频率(精确到0.001);
(2)估计该市男婴出生的概率(精确到0.1).
【答案】(1)答案见解析(2)
【分析】(1)根据表中数据计算即可;
(2)对(1)中的四组数据取平均值.
【详解】(1)男婴出生的频率分别为;
(2)由题意知,所以该市男婴出生的概率约为.
巩固训练
1.某市有名初中生参加数学竞赛预赛,随机调阅了名学生的答卷,成绩如下表:
成绩
1分
2分
3分
4分
5分
6分
7分
8分
9分
10分
人数
0
0
1
5
10
18
11
3
2
0
(1)求样本的平均成绩和方差;
(2)若规定预赛成绩在7分或7分以上的学生参加复赛,试估计有多少名学生可以进入复赛?
【答案】(1)平均成绩为6分,方差为1.6;(2)96名
【分析】(1)根据条件,利用平均数与方差的计算公式,即可求出结果;
(2)先计算出50名选手中,7分或7分以上的学生的频率,即可求出结果.
【详解】(1)平均成绩为:,
方差,
故样本的平均成绩为6分,方差为1.6.
(2)在50名选手中,有(名)学生预赛成绩在7分或7分以上,
所以估计300人中有(名)学生的预赛成绩在7分或7分以上,
故大约有96名学生可以进入复赛.
2.某射击运动员进行双向飞碟射击训练,七次训练的成绩记录如下:
射击次数n
100
120
150
100
150
160
150
击中飞碟次数
81
95
120
81
119
127
121
(1)求各次击中飞碟的频率;(保留三位小数)
(2)该射击运动员击中飞碟的概率约为多少?
【答案】(1)0.810,0.792,0.800,0.810,0.793,0.794,0.807(2)0.800
【分析】(1)根据射击次数及击中飞碟次数计算频率即可;
(2)根据频率与概率的关系可得解.
【详解】(1)根据表格中数据,击中飞碟的频率依次为
,
.
(2)由(1)可知该射击运动员在同一条件下击中飞碟的频率都在0.800附近摆动,
所以该运动员击中飞碟的概率约为0.800.
原创精品资源学科网独家享有版权,侵权必究! 8
原创精品资源学科网独家享有版权,侵权必究! 8
学科网(北京)股份有限公司
$$
第五章 统计与概率知识归纳与题型突破(题型清单)
知识一、统计的相关概念
(1)普查
像人口普查这样,对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
(2)总体、个体
在一个调查中,我们把调查对象的全体称为总体.组成总体的每一个调查对象称为个体.为了强调调查目的,也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体.
(3)抽样调查
(1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体.
(2)个体:构成总体的每一个元素叫做个体.
(3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样本中个体的数目叫做样本容量.
知识二、简单随机抽样
(1)定义
一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
(2)两种常用的简单随机抽样方法
①抽签法:一般地,抽签法就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取次,就得到一个容量为的样本.
②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字,,,…,组成,并且每个数字在表中各个位置出现的机会都是一样的.
注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置.
知识三、总体均值
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k()个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数(i=1,2,…,k),则总体均值还可以写成加权平均数的形式
知识四、样本均值
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称为样本均值,又称样本平均数.
探究:总体均值与样本均值有何区别与联系?
答案:(1)区别:当总体中个体较多时,总体均值不易计算,样本均值比较方便计算.总体均值是一个确定的数,样本均值具有随机性.
(2)联系:在简单随机抽样中,我们常用样本均值估计总体均值.
知识五、分层抽样
1、分层抽样定义一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫分层抽样.
2、分层抽样适用范围
当总体是由差异明显的几个部分组成时,往往采用分层抽样.
3、分层抽样的步骤
(1)根据已掌握的信息,将总体分成若干部分.
(2)根据总体中的个体数N和样本容量n计算出抽样比.
(3)根据抽样比k计算出各层中应抽取的个体数:(其中为第i层所包含的个体总数).
(4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n的样本.
知识六、频率分布直方图
1、频率分布直方图绘制步骤
①求极差,即一组数据中的最大值与最小值的差.
②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.
③将数据分组.
④列频率分布表.计算各小组的频率,第i组的频率是.
⑤画频率分布直方图.其中横轴表示分组,纵轴表示,实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度.
2、频率分布直方图意义:各个小长方形的面积表示相应各组的频率,频率分布直方图以面积的形式反映数据落在各个小组的频率的大小,各小长方形的面积的总和等于1.
3、总体取值规律的估计:我们可以用样本观测数据的频率分布估计总体的取值规律.
4、频率分布直方图的特征:当频率分布直方图的组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原式数据信息;当频率分布直方图的组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易从中看出总体数据的分布特点.
知识七、第p百分位数
1、第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
2、计算第百分位数的步骤
第1步:按从小到大排列原始数据.
第2步:计算.
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第项数据的平均数.
3、四分位数
常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
知识八、众数、中位数、平均数
1、众数、中位数、平均数定义
(1)众数:一组数据中重复出现次数最多的数.
(2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数据的中位数.
(3)平均数:如果个数,那么叫做这个数的平均数.
2、频率分布直方图中的众数、中位数、平均数
①在频率分布直方图中,众数是最高矩形中点的横坐标;
②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
知识九、方差、标准差
1、方差、标准差的定义
一组数据,用表示这组数据的平均数,则这组数据的方差为,标准差为.
2、总体方差、总体标准差的定义
如果总体中所有个体的变量值分别为,总体平均数为,则称为总体方差,为总体标准差.如果总体的个变量值中,不同的值共有个,记为,,其中出现的频数为,则总体方差为.
3、样本方差、样本标准差的定义
如果一个样本中个体的变量值分别为,样本平均数为,则称为样本方差,为样本标准差.
4、方差、标准差特征
标准差、方差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.
知识十、随机试验
1、随机试验的特点
(1)试验可以在相同条件下重复进行;
(2)试验的所有可能结果是明确可知的,并且不止一个;
(3)每次试验总是恰好出现这些可能结果中的一个,但事先不能确定出现哪一个结果.
2、样本空间
我们把随机试验的每个可能的基本结果称为样本点,全体样本点的集合称为试验的样本空间(samplespace).一般地,我们用表示样本空间,用表示样本点.在本书中,我们只讨论为有限集的情况.如果一个随机试验有个可能结果,则称样本空间为有限样本空间.
3、随机事件
一般地,随机试验中的每个随机事件都可以用这个试验的样本空间的子集来表示.为了叙述方便,我们将样本空间的子集称为随机事件(randomevent),简称事件,并把只包含一个样本点的事件称为基本事件(elementaryevent).随机事件一般用大写字母A,B,C,表示.在每次试验中,当且仅当中某个样本点出现时,称为事件发生.
4、必然事件,不可能事件
在每次试验中总有一个样本点发生,所以总会发生,我们称为必然事件.而空集抔包含任何样本点,在每次试验中都不会发生,我们称不可能事件.
知识十一、概率
1、古典概型
(1)古典概型
考察这些试验的共同特征,就是要看它们的样本点及样本空间有哪些共性.可以发现,它们具有如下共同特征:
①有限性:样本空间的样本点只有有限个;
②等可能性:每个样本点发生的可能性相等.
我们将具有以上两个特征的试验称为古典概型试验,其数学模型称为古典概率模型,简称古典概型.
(2)概率公式
一般地,设试验是古典概型,样本空间包含个样本点,事件包含其中的个样本点,则定义事件的概率
其中,和分别表示事件和样本空间包含的样本点个数.
2、概率的基本性质
一般地,概率有如下性质:
性质1:对任意的事件,都有.
性质2:必然事件的概率为1,不可能事件的概率为0,即
性质3:如果事件与事件互斥,那么
性质4:如果事件与事件互为对立事件,那么
,
性质5:如果,那么.
性质6:设A,B是一个随机试验中的两个事件,我们有
知识十二:相互独立事件
1、相互独立事件的概念
对任意两个事件与,如果成立,则称事件与事件相互独立,简称为独立.
2、相互独立事件的性质
(1)事件与是相互独立的,那么与,与,与也是否相互独立.
(2)相互独立事件同时发生的概率:.
知识十五:频率的稳定性
一般地,随着试验次数的增大,频率偏离概率的幅度会缩小,即事件发生的频率会逐渐稳定于事件发生的概率.我们称频率的这个性质为频率的稳定性.因此,我们可以用频率估计概率.
题型一:数据的收集方案
例题1.某医院老年医生、中年医生和青年医生的人数分别为72,120,160,为了解该医院医生的出诊情况,按年龄采用比例分配的分层随机抽样方法抽取样本,已知抽取青年医生的人数为40,则抽取老年医生的人数为 .
例题2.总体由编号为1,2,⋯,99,100的100个个体组成,现用随机数法选取60个个体,利用电子表格软件产生的若干个1~100范围内的整数随机数的开始部分数据,如下表,则选出来的第5个个体的编号为
8 44 2 17 8 31 57 4 55 6
88 8 31 47 7 21 76 33 50 63
巩固训练
1.某新闻机构想了解全国人民对2024年巴黎奥运会开幕式的评价,决定从某市2个区按人口数用分层抽样的方法抽取一个样本.若2个区人口数之比为2∶7,且人口较少的一个区抽出100人,则这个样本的容量为 .
2.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②.完成①②这两项调查采用的抽样方法依次是 .
题型二:总体(样本)平均数
例题1.已知样本数据,,,的平均数为,且,则样本数据的平均数为
例题2.已知的平均数为a,则的平均数是 .
巩固训练
1.已知数据,,,,的方差为,平均数为,则数据,,,的标准差为 ,平均数为 .
2.一组数据3,6,,5,7,6的平均数为6,则该组数据的方差为 .
题型三:分层抽样的考点
例题1.为了了解高一、高二、高三学生的身体状况,现用比例分配分层随机抽样的方法抽出一个容量为1500的样本,三个年级学生数之比依次为,已知高一年级共抽取了300人,则高三年级抽取的人数为( )
A.750 B.300 C.450 D.150
例题2.某高中三个年级共有学生2000人,其中高一800人,高二600人,高三600人,该校为了解学生睡眠情况,准备从全校学生中抽取80人进行访谈,若采取按比例分配的分层抽样,且按年级来分层,则高一年级应抽取的人数是( )
A.24 B.26 C.30 D.32
巩固训练
1.一批热水器共有98台,其中甲厂生产的有56台,乙厂生产的有42台,用分层抽样法从中抽出一个容量为14的样本,那么甲、乙两厂各抽得的热水器台数是( )
A.甲厂9台,乙厂5台 B.甲厂8 台,乙厂6台
C.甲厂 10 台,乙厂4台 D.甲厂7台,乙厂7台
2.某校有700名高一学生,400名高二学生,400名高三学生,高一数学兴趣小组欲采用按比例分配的分层抽样的方法在全校抽取15名学生进行某项调查,则下列说法正确的是( )
A.高一学生被抽到的概率最大 B.高三学生被抽到的概率最大
C.高三学生被抽到的概率最小 D.每位学生被抽到的概率相等
题型四:频率分布直方图中的相关计算问题
例题1.为了解某校今年准备报考飞行员的学生的体重情况,对所得的体重数据(单位:)进行分组,区间为,将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.画出频率分布直方图(如图所示),已知第一组,第二组和第三组的频率之比为,且第一组的频数为6,则报考飞行员的学生人数是( )
A.48 B.5 C.54 D.60
例题2.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为:、、、、,由此得到频率分布直方图如图,则这20名工人中一天生产该产品数量在的人数是( )
A.5 B.8 C.13 D.17
巩固训练
1.为了培养青少年无私奉献,服务社会,回馈社会的精神,某学校鼓励学生在假期去社会上的一些福利机构做义工.某慈善机构抽查了其中100名学生在一年内在福利机构做义工的时间(单位:小时),绘制成如图所示的频率分布直方图,则x的值为( )
A.0.0020 B.0.0025 C.0.0015 D.0.0030
2.如图是某校高一年级1000名男生体检时身高的频率分布直方图,现用分层随机抽样的方法从身高在160~175cm的男生中抽取130名,则抽取到的身高在165~170cm的人数为( )
A.20 B.30 C.40 D.50
题型五:百分位数在具体数据中的应用
例题1.某校举行劳动技能大赛,统计了100名学生的比赛成绩,得到如图所示的频率分布直方图,已知成绩均在区间内,不低于90分的视为优秀,低于60分的视为不及格.若同一组中数据用该组区间中间值做代表值,则下列说法中错误的是( )
A. B.优秀学生人数比不及格学生人数少15人
C.该次比赛成绩的平均分约为70.5 D.这次比赛成绩的分位数为78
例题2.从某小型加工厂生产的产品中抽取100件作为样本,将该样本进行某项质量指标值测量,下图是测量结果x的频率分布直方图.若同一组中的数据用该组区间的中点值作代表,则在下列选项中,关于该样本统计量的叙述不正确的选项是( )
A.指标值在区间的产品约有33件 B.指标值的极差介于50与70之间
C.指标值的第60百分位数大于205 D.指标值的方差的估计值是150
巩固训练
1.高二年级进行消防知识竞赛,统计所有参赛同学的成绩,成绩都在内,估计所有参赛同学成绩的第75百分位数为( )
A. B. C. D.
2.某校高三数学老师共有20人,他们的年龄分布如下表所示:
年龄
人数
1
2
6
5
4
2
下列说法正确的是( )
A.这20人年龄的分位数的估计值是46.5
B.这20人年龄的中位数的估计值是41
C.这20人年龄的极差的估计值是55
D.这20人年龄的众数的估计值是35
题型六:平均数、中位数、众数在具体数据中的应用
例题1.某选手在参加某次比赛中,各评委打出的分数为10,9,8,9,9,8,10,7,8,6.
(1)求该选手所有得分的平均数;
(2)若该选手所有得分的分位数为9,求整数m的取值集合.
例题2.有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
设甲、乙两名运动员射击平均环数分别记为和,方差分别记为和.
(1)求,,,;
(2)如果你是教练,你如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?
巩固训练
1.甲、乙两机床同时加工直径为100mm的零件,为检验质量,各从中抽取6件测量,数据如下(单位:mm):
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
若甲机床所加工的6个零件的数据全都加10,那么所得新数据的平均数及方差分别是多少?
2.在2024年世界泳联跳水世界杯蒙特利尔站和柏林站女子10米台跳水决赛中,全红婵奉献了高水准的精彩表现,在决赛中的五个动作惊艳了全世界.在这两场决赛中,7名裁判给选手的五个跳水动作打分,两站裁判对全红婵的打分记录如下:(为了方便计算,采取分数四舍五入取整)
A组(蒙特利尔站):80 80 82 78 93
B组(柏林站):81 80 86 99 86
(1)请写出这10个分数的众数、极差以及A,B两组各自的平均成绩;
(2)请你根据所学的统计知识,分析两站比赛中,哪一站全红婵发挥更稳定?并说明理由.
题型七:在频率分布直方图中求平均数、中位数、众数
例题1.从某校参与数学竞赛的试卷中抽取一个样本,考查竞赛的成果分布,将样本分成组,得到频率分布直方图如图,从左到右各小组的小长方形的高的比为:::::,最右边的一组的频数是.请结合直方图的信息,解答下列问题:
(1)样本容量是多少?
(2)成果落在哪个范围的人数最多?并求出该小组的频数和频率;
(3)估计这次数学竞赛成果的众数、中位数和平均数.
例题2.某地区有小学生9000人,初中生8600人,高中生4400人,教育局组织网络“防溺水”网络知识问答,现用分层抽样的方法从中抽取220名学生,对其成绩进行统计分析,得到如下图所示的频率分布直方图所示的频率分布直方图.
(1)根据频率分布直方图,估计该地区所有学生中知识问答成绩的平均数和众数;
(2)成绩位列前10%的学生平台会生成“防溺水达人”优秀证书,试估计获得“防溺水达人”的成绩至少为多少分;
(3)已知落在内的平均成绩为67,方差是9,落在内的平均成绩是73,方差是29,求落在内的平均成绩和方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:.记两组数据总体的样本平均数为,则总体样本方差)
巩固训练
1.某高中为了解本校高二年级学生的体育锻炼情况,随机抽取100名学生,统计他们每天体育锻炼的时间,并以此作为样本,按照进行分组,得到如图所示的频率分布直方图.已知样本中体育锻炼时间在内的学生有10人.
(1)求频率分布直方图中和的值;
(2)估计样本数据的中位数和平均数(求平均数时,同一组中的数据以该组区间的中点值为代表).
2.南宁三中强调学科阅读,为了解学生的学科阅读情况,计划对学生的阅读素养进行检测,在该校随机抽取了100名学生进行检测,现将所得的成绩按照[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]分成6组,并根据所得数据作出了如图所示的频率分布直方图.
(1)求a的值;
(2)根据样本数据估计该校学生阅读素养成绩的75%分位数以及平均数.
平均数:.
题型八:用样本平均数和样本标准差估计总体
例题1.为倡导健康生活方式,某大学社团联合学生会倡议全校学生参与“每日万步行”健走活动.如图为该校甲、乙两名同学在同一星期内每日步数的折线统计图,则下列说法正确的是( )
A.这一星期内甲的日步数的中位数小于乙的日步数的中位数
B.这一星期内甲的日步数的平均数大于乙的日步数的平均数
C.这一星期内乙的日步数的标准差小于甲的日步数的标准差
D.这一星期内乙的日步数的第75百分位数是12400
例题2.给定一组数,,,,,,,,,,则( )
A.平均数为3 B.标准差为 C.众数为2 D.分位数为5
巩固训练
1.新高考模式下,化学、生物等学科实施赋分制,即通过某种数学模型将原始分换算为标准分.某校在一次高三模拟考试中实施赋分制的方式,其中应用的换算模型为:,其中x为原始分,y为换算后的标准分.已知在本校2000名高三学生中某学科原始分最高得分为150分,最低得分为50分,经换算后最高分为150分,最低分为80分.则以下说法正确的是( )
A.若学生甲本学科考试换算后的标准分为115分,则其原始得分为100分
B.若在原始分中学生乙的得分为中位数,则换算后学生乙的分数仍为中位数
C.该校本学科高三全体学生得分的原始分与标准分的标准差相同
D.该校本学科高三全体学生得分的原始分的平均分低于标准分的平均分
2.制造业PMI指数反映制造业的整体增长或衰退,制造业PMI指数的临界点为.我国2021年10月至2022年10月制造业PMI指数如图所示,则( )
A.2022年10月中国制造业PMI指数为,比上月下降0.9个百分点,低于算界点
B.2021年10月至2022年10月中国制迼业PMI指数的极差为
C.2021年10月至2022年10月中国制造业PMI指数的众数为
D.2021年11月至2022年2月中国制造业PMI指数的标准差小于2022年7月至2022年10月中国制造业PMI指数的标准差
题型九:事件关系的判断
例题1.对于概率的基本性质,下列选项正确的是( )
A.如果事件A与事件B互斥,那么
B.如果事件A与事件B互为对立事件,那么
C.如果,则
D.
例题2.(多选)在一次随机试验中,三个事件,,发生的概率分别是0.2,0.3,0.5,则下列说法正确的是( )
A.与是互斥事件,也是对立事件
B.不一定是必然事件
C.
D.
巩固训练
1.从装有3只红球,3只白球的袋中任意取出3只球,则下列每对事件,是互斥事件,但不是对立事件的是( )
A.“取出2只红球和1只白球”与“取出1只红球和2只白球”
B.“取出2只红球和1只白球”与“取出3只红球”
C.“取出3只红球”与“取出3只球中至少有1只白球”
D.“取出3只红球”与“取出3只球中至少有1只红球”
2.已知,,则下列说法中正确的是( )
A.如果,那么 B.如果,那么
C.如果互斥,那么 D.如果互斥,那么
题型十:简单古典概型的计算
例题1.在和两个集合中各取一个数组成一个两位数,则这个两位数能被4整除的概率是 .
例题2.柜子里有3双不同的鞋子,分别用表示6只鞋,从中有放回地取出2只,记事件“取出的鞋是一只左脚一只右脚的,但不是一双鞋”,则事件的概率是 .
巩固训练
1.甲、乙两人各有四张卡片,每张卡片上标有一个数字,甲的卡片上分别标有数字3,5,7,9,乙的卡片上分别标有数字2,4,6,8,两人进行四轮比赛,在每轮比赛中,两人各自从自己持有的卡片中随机选一张,并比较所选卡片上数字的大小,数字大的人得1分,数字小的人得0分,然后各自弃置此轮所选的卡片(弃置的卡片在此后轮次中不能使用).则四轮比赛后,甲的总得分为3的概率为 .
2.用0与1两个数字随机填入如图所示的3个格子里,每个格子填一个数字.若从左到右数,不管数到哪个格子,总是1的个数不少于0的个数,则这样填法的概率为 .
题型十一:较复杂的古典概型的计算
例题1.已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.
(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?
(2)现从抽出的7名同学中随机抽取2名同学承担敬老院的卫生工作.
①写出样本空间;
②设事件“抽取的2名同学来自同一年级”,求事件发生的概率.
例题2.在人群流量较大的街道,有一中年人吆喝“送钱”,只见他手拿一黑色小布袋,袋中有3只黄色、3只白色的乒乓球(其体积、质地完全相同),旁边立着一块小黑板写道:摸球方法:从袋中随机摸出3个球,若摸得同一颜色的3个球,摊主送给摸球者5元钱;若摸得非同一颜色的3个球,摸球者付给摊主1元钱.
(1)摸出的3个球为白球的概率是多少?
(2)假定一天中有100人次摸奖,试从概率的角度估算一下这个摊主一个月(按30天计)能赚多少钱?
巩固训练
1.甲乙两位同学参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲 82 81 79 78 95 88 93 84
乙 92 95 80 75 83 80 90 85
(1)用茎叶图表示这两组数据;
(2)现要选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?
(3)若将频率视为概率,求甲同学在今后的数学竞赛成绩高于80的概率.
2.已知盒中有大小、质地相同的红球、黄球、蓝球共4个,从中任取一球,得到红球或黄球的概率是,得到黄球或蓝球的概率是.
(1)求盒中红球、黄球、蓝球的个数;
(2)设置游戏规则如下:从盒中有放回的取球两次,每次任取一球记下颜色.若取到两个球颜色相同则甲胜,否则乙胜,从概率的角度判断这个游戏是否公平,请说明理由.
题型十二:事件独立性的判断
例题1.下列说法正确的是( )
A.若,则事件A与B是对立事件
B.设A,B是两个随机事件,且,,若,则A,B是相互独立事件
C.A,B同时发生的概率一定比A,B中恰有一个发生的概率小
D.若,,则“事件A,B相互独立”与“事件A,B互斥”一定不能同时成立
例题2.下列说法正确的有( )
A.若事件与事件是互斥事件,则
B.若事件与事件是对立事件,则
C.把红、橙、黄3张纸牌随机分给甲、乙、丙3人,每人分得1张,则事件“甲分得的不是红牌”与事件“乙分得的不是红牌”是互斥事件
D.某人打靶时连续射击三次,则事件“至少有两次中靶”与事件“至多有一次中靶”是对立事件
巩固训练
1.已知事件发生的概率分别为,则下列说法正确的是( )
A.若与互斥,则
B.若与相互独立,则
C.若,则与相互独立
D.若发生时一定发生,则
2.设,为随机事件,且,是,发生的概率. ,,则下列说法正确的是( )
A.若,互斥,则 B.若,则,相互独立
C.若,互斥,则,相互独立 D.若,独立,则
题型十三:相互独立事件概率的计算
例题1.甲、乙、丙三人打台球,约定:第一局由甲、乙对打,丙轮空;每局比赛的胜者与轮空者进行下一局对打,负者下一局轮空,如此循环.设甲、乙、丙三人水平相当,每场比赛双方获胜的概率都为.
(1)求甲连续打四局比赛的概率;
(2)求在前四局中甲轮空两局的概率;
(3)求第四局甲轮空的概率.
例题2.,,三人参加知识闯关比赛,三人闯关成功与否相互独立.已知闯关成功的概率是,,,三人闯关都成功的概率是,,,三人闯关都不成功的概率是.
(1)求,两人各自闯关成功的概率;
(2)求,,三人中恰有两人闯关成功的概率.
巩固训练
1.为了选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,教育部启动了“强基计划”的招生改革工作.某校强基招生面试有两道题,两道题都答对者才能通过强基招生面试.假设两题作答相互独立,现有甲、乙、丙三名学生通过考核进入面试环节,他们答对第一题的概率分别是,答对第二题的概率分别是.
(1)求甲、乙两位考生中有且只有一位考生通过强基招生面试的概率;
(2)求甲、乙、丙三人中至少有一人通过强基招生面试的概率.
2.全国执业医师证考试分实践技能考试与医学综合笔试两部分,每部分考试成绩只记“合格”与“不合格”,两部分考试都“合格”者,则执业医师考试“合格”,并颁发执业医师证书.甲、乙、丙三人在医学综合笔试中“合格”的概率依次为,,,在实践技能考试中“合格”的概率依次为,,,所有考试是否合格互不影响.
(1)求甲没有获得执业医师证书的概率;
(2)这三人进行实践技能考试与医学综合理论考试两项考试后,求恰有两人获得执业医师证书的概率.
题型十四:频率与概率的关系
例题1.下述关于频率与概率的说法中,错误的是( )
A.设有一大批产品,已知其次品率为0.1,则从中任取100件,必有10件是次品
B.利用随机事件发生的频率估计随机事件的概率,即使随机试验的次数超过10000,所估计出的概率也不一定很准确.
C.随机事件发生的频率就是这个随机事件发生的概率
D.做7次抛硬币的试验,结果3次出现正面,因此,抛一枚硬币出现正面的概率是
例题2.下列命题正确的是( )
A.随机事件A的概率是频率的稳定值,频率是概率的近似值
B.抛掷骰子100次,得点数是1的结果是18次,则出现1点的频率是
C.有一批产品,其次品率为0.05,若从中任取200件产品,则一定有190件正品,10件次品
D.抛掷一枚质地均匀的硬币100次,有51次出现了正面,则可得抛掷一次该硬币出现正面的概率是0.51
巩固训练
1.下列结论正确的是( )
A.任何事件的概率总是在内
B.随着试验次数的增加,频率会逐渐稳定于概率
C.抛掷一枚硬币,试验100次出现正面向上的频率一定比试验50次出现正面向上的频率更接近它出现正面向上的概率
D.随机事件中至少有一个发生的概率一定不小于中恰有一个发生的概率
2.下列说法不正确的是( )
A.某种福利彩票的中奖概率为,那么买1000张这种彩票一定能中奖
B.随着试验次数的增加,频率一般会越来越接近概率
C.某医院治疗一种疾病的治愈率为,前9个病人没有治愈,则第10个病人一定治愈
D.某市气象台预报“明天本市降水概率为”,指的是该市气象台专家中,有认为明天会降水,30%认为不降水
题型十五:概率的稳定性
例题1.如图,地到火车站共有两条路径和,现随机抽取100位从地到火车站的人进行调查,调查结果如下:
所用时间(分钟)
[10,20]
(20,30]
(30,40]
(40,50]
(50,60]
选择的人数
6
12
18
12
12
选择的人数
0
4
16
16
4
(1)试用频率估计概率,估计40分钟内不能赶到火车站的概率:
(2)现甲、乙两人分别有40分钟和50分钟时间用于赶往火车站,为了尽量大可能在允许的时间内赶到火车站,试用频率估计概率通过计算说明,他们应如何选择各自的路径.
例题2.某市统计近几年婴儿出生数及其中男婴数(单位:人)如下:
出生婴儿数
21840
23070
20094
19982
出生男婴数
11453
12031
10297
10242
(1)试计算这几年男婴出生的频率(精确到0.001);
(2)估计该市男婴出生的概率(精确到0.1).
巩固训练
1.某市有名初中生参加数学竞赛预赛,随机调阅了名学生的答卷,成绩如下表:
成绩
1分
2分
3分
4分
5分
6分
7分
8分
9分
10分
人数
0
0
1
5
10
18
11
3
2
0
(1)求样本的平均成绩和方差;
(2)若规定预赛成绩在7分或7分以上的学生参加复赛,试估计有多少名学生可以进入复赛?
2.某射击运动员进行双向飞碟射击训练,七次训练的成绩记录如下:
射击次数n
100
120
150
100
150
160
150
击中飞碟次数
81
95
120
81
119
127
121
(1)求各次击中飞碟的频率;(保留三位小数)
(2)该射击运动员击中飞碟的概率约为多少?
原创精品资源学科网独家享有版权,侵权必究! 8
原创精品资源学科网独家享有版权,侵权必究! 8
学科网(北京)股份有限公司
$$