内容正文:
第五章 统计与概率(复习讲义)
基础目标
①能复述统计的核心概念(总体、个体、样本等)及简单随机抽样、分层抽样的定义;
②会选择合适抽样方法,能绘制柱形图、折线图等基础统计图表,会计算众数、中位数等基本数字特征;
③能复述随机事件、样本空间等概率概念,理解古典概型的特征,会用定义法计算简单古典概型概率;
④能区分互斥事件与对立事件,会运用概率基本性质解决基础计算问题。
进阶目标
①理解分层抽样的比例计算逻辑,会推导频率分布直方图的绘制步骤及性质;
②能结合统计图表提取数据信息,会分析方差、标准差反映的数据波动特征;
③会推导事件的并、交等运算规则,能运用古典概型公式求解稍复杂场景的概率;
④理解频率的稳定性,会用频率估计概率;
⑤能判断事件独立性,会套用独立事件各类情形的概率计算公式解决实际问题。
拓展目标
①能综合运用抽样方法、数据特征与统计图表进行完整数据分析;
②会灵活处理百分位数的计算,能结合频率分布直方图与数字特征进行多维度推断;
③能综合事件关系、古典概型、独立事件等知识,解决含多个随机事件的综合应用题;
④能通过统计推断与概率计算,完成实际场景中的决策分析,体现数形结合与逻辑推理能力。
一、数据的收集
1.统计的相关概念
名称
定义
总体
调查对象的全体称为整体
个体
组成整体的每一个调查对象称为个体
样本
从总体中抽取的那部分个体称为样本
样本容量
样本中包含的个体数称为样本容量
样本与样本量的区别:样本是从总体中抽取的个体组成的集合,是对象;样本量是样本中个体的数目,是一个数.
2.简单随机抽样
定义
设一个总体含有个个体,从中逐个不放回抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样
方法
抽签法
把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本
随机数法
利用随机数表、随机数骰子或计算机产生的随机数进行抽样
抽签法与随机数法
相同点
①都属于简单随机抽样,并且要求被抽取样本的总体的个体数有限;
②都是从总体中逐个不放回地进行抽取
不同点
①抽签法比随机数法操作简单;
②随机数法更适用于总体中个体数较多的时候,而抽签法适用于总体中个体数较少的情况
利用随机数法抽取个体时的注意事项:
①定起点:事先应确定以表中的哪个数(哪行哪列)作为起点.
②定方向:读数的方向(向左、向右、向上或向下都可以).
③读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数.
3分层抽样
①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
②应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.
注意:分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比.
二、数字特征
1.众数、中位数、平均数
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小矩形的面积乘以小矩形底边中点的横坐标之和
2.极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:.
标准差:.
注:方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
③性质
(1)若的平均数为,那么的平均数为.
(2)数据与数据的方差相等,即数据经过平移后方差不变.
(3)若的方差为s2,那么的方差为.
3.百分位数
(1)定义:一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组几个数据第p百分位数的步骤
第1步,按从小到大排列原始数据;
第2步,计算.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.四分位数
即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.
其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
三、数据的直观表示
1.柱形图
柱形图也称为条形图,可以形象地比较各种数据之间的数量关系。
一般地,柱形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,柱形图的每一矩形都是等宽的。
2.折线图
一般地,如果数据随时间变化的,想了解数据的变化情况,可将数据用折线图来表示,当然,折线图也可以用在其他合适的情形中。
3.扇形图
扇形图也称为饼图、饼形图,它可以形象地表示出各部分数据在全部数据中所占的比例情况,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比。
4.茎叶图
(1)定义:将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到达的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).
(2)一般地,茎叶图中,所有的茎都竖直排列,而叶沿水平方向排列。茎叶图也可以只表示一组数。
将一组数整理成茎叶图后,如果每一行的数都是按从大到小(或从小到大)顺序排列,则从中可以方便地看出这组数的最值、中位数等数字特征。
(3)茎叶图的有点与不足:
优点:一是原始数据信息在图中能够保留,所有数据信息都可以从茎叶图中得到;
二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
不足:当样本数据较多时,茎叶图就显得不太方便。
5频率分布直方图
(1)画频率分布直方图的步骤
第1步:求极差(即一组数据中最大值与最小值的差);
第2步:决定组距与组数;
第3步:将数据分组;
第4步:列频率分布表;
第5步:画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
(2)频率分布直方图的性质
落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.
四、样本空间与事件
1.有限样本空间与随机事件
(1)随机试验
我们把对随机现象的实现和对它的观察称为随机试验,简称试验,常用字母表示.
随机试验具有以下特点:
①试验可以在相同条件下重复进行;
②试验的所有可能结果是明确可知的,并且不止一个;
③每次试验总是恰好出现这些可能结果中的一个,但事先不能确定出现哪一个结果.
(2)试验的样本点和样本空间
项目
定义
字母表示
样本点
我们把随机试验的每个可能的基本结果称为样本点
用表示样本点
样本空间
全体样本点的集合称为试验的样本空间
用表示样本空间
有限样本空间
如果一个随机试验有个可能结果
则称样本空间为有限样本空间
(3)三种事件的定义
随机事件
我们将样本空间的子集称为随机事件,简称事件,并把只包含一个样本点的事件称为基本事件.随机事件一般用大写字母表示.在每次试验中,当且仅当中某个样本点出现时,称为事件发生
必然事件
作为自身的子集,包含了所有的样本点,在每次试验中总有一个样本点发生,所以总会发生,我们称为必然事件
不可能事件
空集不包含任何样本点,在每次试验中都不会发生,我们称为不可能事件
五、事件的关系和运算
1.事件的包含关系
定义
一般地,若事件发生,则事件一定发生,我们就称事件包含事件(或事件包含于事件)
含义
发生导致发生
符号表示
(或)
图形表示
特殊情况
如果事件包含事件,事件也包含事件,即且,则称事件与事件相等,记作
2.并事件(或和事件)
定义
一般地,事件与事件至少有一个发生,这样的一个事件中的样本点或者在事件中,或者在事件中,我们称这个事件为事件与事件的并事件(或和事件)
含义
与至少有一个发生
符号表示
(或)
图形表示
3交事件(或积事件)
定义
一般地,事件与事件同时发生,这样的一个事件中的样本点既在事件中,也在事件中,我们称这样的一个事件为事件与事件的交事件(或积事件)
含义
与同时发生
符号表示
(或)
图形表示
4.互斥事件(或互不相容事件)
定义
一般地,如果事件与事件不能同时发生,也就是说是一个不可能事件,即,则称事件与事件互斥(或互不相容)
含义
与不能同时发生
符号表示
图形表示
5.对立事件
定义
一般地,如果事件和事件在任何一次试验中有且仅有一个发生,那么称事件与事件互为对立.事件的对立事件记为
含义
与有且仅有一个发生
符号表示
,
图形表示
六、古典概型
1.概率
对随机事件发生可能性大小的度量(数值),称为事件的概率,事件的概率用表示.
2.古典概型
一般地,如果随机试验的样本空间的样本点只有有限个(简称为有限性),而且可以认为每个样本点发生的可能性相等(简称等可能性),则称这样的随机试验为古典概型试验,其数学模型称为古典概率模型,简称古典概型.
3.古典概型概率公式
一般地,设试验是古典概型,样本空间包含个样本点,事件包含其中的个样本点,则定义事件的概率,其中,和分别表示事件和样本空间包含的样本点个数.
4.概率的基本性质
一般地,概率具有如下性质:
性质1:对任意的事件,都有
性质2:必然事件的概率为1,不可能事件的概率为0,即.
性质3:如果事件与事件互斥,那么
如果事件两两互斥,那么事件发生的概率等于这个事件分别发生的概率之和,即
性质4:如果事件和事件互为对立事件,那么
性质5:如果,那么.
性质6:设是一个随机试验中的两个事件,我们有
5.频率的稳定性
大量试验证明,在任何确定次数的随机试验中,一个随机事件发生的频率具有随机性.一般地,随着试验次数的增大,频率偏离概率的幅度会缩小,即事件发生的频率会逐渐稳定于事件发生的概率.我们称频率的这个性质为频率的稳定性.因此,我们可以用频率估计概率
七、相互独立
对任意两个事件与,如果成立,则称事件A与事件B相互独立,简称为独立.
(1)如果与相互独立,则与,与,与也相互独立.
(2)与相互独立事件有关的概率的计算公式如下表:
事件相互独立
概率计算公式
同时发生
同时不发生
至少有一个不发生
至少有一个发生
恰有一个发生
题型一 数据的收集
例1.(多选)从某市高一年级考试的学生中随机抽查2000名学生的数学成绩进行统计分析,在这个问题中,下列说法不正确的是( )
A.总体指的是该市高一年级考试的全体学生 B.样本是指2000名学生的数学成绩
C.样本容量指的是2000名学生 D.个体指是指2000名学生中的每一名学生
变式1-1.在对101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中随机抽取10个人,那么下列说法正确的是( )
A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
B.每个人在整个抽样过程中被抽到的机会均等
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
变式1-2.下列抽样的方式属于简单随机抽样的个数为( )
①从500个个体中一次性抽取50个作为样本;
②将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本;
③某班有55个同学,指定个子最高的5名同学参加学校组织的篮球赛;
④福利彩票用摇奖机摇奖.
A.1 B.2 C.3 D.4
变式1-3.某公司利用随机数表对生产的900支新冠疫苗进行抽样测试,先将疫苗按000,001,..,899进行编号,从中抽取90个样本,若选定从第4行第4列的数开始向右读数,(下面摘取了随机数表中的第3行至第5行),根据下图,读出的第6个数的编号是 .
1676622766
5650267107
3290797853
1355385859
8897541410
1256859926
9682731099
1696729315
5712101421
8826498176
5559563564
3854824622
3162430990
0618443253
2383013030
题型二 分层抽样
例2.某校高一有1000名学生,为了培养学生良好的阅读习惯,语文教研组要求高一学生从四大名著中选一本阅读,其中有400人选《三国演义》,250人选《水浒传》,250人选《西游记》,100人选《红楼梦》,若采用分层抽样的方法随机抽取100名学生分享他们的读后感,则选《西游记》或《红楼梦》的学生抽取的人数为( )
A.25 B.30 C.35 D.50
变式2-1.某校高二年级有男生540人,女生360人,用分层抽样的方法从高二年级的学生中随机抽取25名学生进行问卷调查,则应抽取的女生人数为( )
A.25 B.20 C.15 D.10
变式2-2.某羽毛球俱乐部有队和队,其中队有名学员,队有名学员,为了解俱乐部学员的羽毛球水平,用比例分配的分层随机抽样的方法从该俱乐部中抽取一个容量为的样本,已知从队中抽取了名学员,则的值为( )
A. B. C. D.
变式2-3.某学校为了解高一学生每天阅读时长,从高一男生和女生中采用分层抽样的方法抽取部分学生进行调查分析.已知该学校高一学生中男生和女生的比例是,在抽取的学生中男生比女生多24人,则被抽取的学生人数是 .
题型三 统计图的分析
例3.(多选)为了关注学生的健康成长,某学校开展了一次高一年级学生身高的抽样调查,随机抽取了100名学生,将他们的身高划分成了A,B,C,D,E五个层次,根据抽样结果得到如下统计图,则从图中能得出的信息是( )
A.样本中A层次身高的女生少于男生
B.样本中B层次身高的学生人数最多
C.样本中D层次身高的学生人数占总人数的17%
D.样本中E层次身高的男生有6人
变式3-1.(多选)某学校对高一学生选科情况进行了统计,发现学生选科仅有物化生、政史地、物化地、物化政、生史地五种组合,其中选考物化地和物化政组合的人数相等,并绘制得到如下的扇形图和条形图,则( )
A.该校高一学生总数为800
B.该校高一学生中选考物化政组合的人数为96
C.该校高一学生中选考物理的人数比选考历史的人数多
D.用比例分配的分层随机抽样方法从该校高一学生抽取20人,则生史地组合抽取6人
变式3-2.(多选)随着一系列政策落地生效,文旅消费需求加速释放,部分旅游业取得显著效果.如图是2019—2023年上半年国内旅游数据有关情况,则( )
A.2019—2023年上半年国内旅游总人次在2020年第一季度达到最低值
B.2019—2022年每年中,国内旅游总人次均在第二季度达到最高值
C.2022年每季度国内旅游收入呈递减趋势
D.2020—2023年上半年中,每季度国内旅游收入相比上一季度增长量最大的是2023年第一季度
变式3-3.(多选)为了关注学生的健康成长,某校开展了一次高一年级的学生身高的抽样调查,随机抽取了100名学生,将他们的身高划分成了A,B,C,D,E五个层次,根据抽样结果得到如下统计图,则样本中( )
A.身高在A层次中的女生人数比男生多
B.身高在B层次中的人数最多
C.身高在D层次的女生,占女生人数的比例超过15%
D.身高在E层次中的男生有3人
题型四 平均数、中位数、众数在具体数据中的应用
例4.样本数据2,8,14,14,20,下列说法正确的是( )
A.极差为22 B.平均数为14 C.中位数为15 D.众数为14
变式4-1.高三某班有 15 名男生和 35 名女生, 在某次月考的数学成绩中, 男生的平均分比女生的平均分多 5 分, 则男生的平均分比全班的平均分( )
A.多 1.5 分 B.多 2.5 分 C.多 3.5 分 D.多 4.5 分
变式4-2.小李是一名健身运动爱好者,如图所示的统计图记录了他过去一个月(30天)每天花在健身运动上的时间(单位:分钟),记这组数据的众数为M,中位数为N,平均数为P,则( )
A.N<M<P
B.P<N<M
C.M<P<N
D.M<N<P
变式4-3.(多选)国家射击运动员在某次训练中的8次射击成绩(单位:环)为10,7,8,10,x,10,8,6,其中为整数,若这8次射击成绩的中位数为9,则( )
A. B.极差为4 C.众数为10 D.平均值为8.5
题型五 极差、方差、标准差在具体数据中应用
例5.已知互不相等的数据的平均数为,方差为,数据的方差为,则的大小关系为( )
A. B. C. D.无法判断
变式5-1.已知样本容量为5的样本平均数为3,方差为,将数据9加入原样本得到样本容量为6的新样本,若新样本的平均数为,方差为,则( )
A. B. C. D.
变式5-2.(多选)已知样本数据,()(),则( )
A.若样本数据的极差为R,则样本数据的极差为
B.若样本数据的平均值为,则样本数据的平均值为
C.若样本数据的众数为N,则样本数据的众数为
D.若样本数据的方差为,则样本数据的方差为
变式5-3.这5个数据181,182,183,184,185的方差为 .
题型六 百分位数在具体数据中的应用
例6.某汽车零件质检员对一批汽油机电火花零件进行质检,记录的数据(单位:毫米)为3.56,3.58,3.59,3.95,4.03,则这5个数据的第60百分位数为( )
A.3.58 B.3.59 C.3.76 D.3.77
变式6-1.如图是某小组成员的年龄分布茎叶图(十位数字为茎、个位数字为叶),则该小组成员年龄的第30百分位数为 .
2
7
8
3
1
3
6
6
8
4
0
5
5
2
4
8
变式6-2.已知一组数据为,则这组数据的上四分位数为( )
A. B. C. D.
变式6-3.(多选)一组样本数据 的平均数为,方差为,这组样本数据增加 2 个数据后得到新的样本数据 ,则这组新数据与原数据一定相同的是( )
A.平均数 B.中位数 C.方差 D.第10百分位数
题型七 频率分布直方图的相关计算
例7.某市为了了解全市名高一学生的数学学习情况,抽取了本市某个区的1500名学生进行数学能力测试(百分制),并将这些学生的成绩整理成如图所示的频率分布直方图.根据频率分布直方图,下列说法正确的是( )
A.图中a值为0.15
B.估计样本数据的分位数为75
C.用样本可以估计全市高一学生数学能力测试得分的众数约为85
D.用样本可以估计全市高一学生数学能力测试优秀(90分及以上)(多选)的人数为人
变式7-1.对学校高三年级某班50名学生的高校招生体检表中视力情况进行统计,其结果的频率分布直方图如图.若高校专业对视力要求不低于0.9,则该班学生中有 人能报考该专业.
变式7-2.某地区对100名新入职教师技能测试的成绩进行了分析,成绩都在区间内,绘制频率分布直方图如图.则下列结论中不正确的是( )
A.成绩在的频数为10 B.所有小矩形面积之和为1
C.成绩中位数在区间内 D.成绩平均数在区间内
变式7-3.某校为促进学生对数学文化的认识,举办了相关竞赛,从所有答卷中随机抽取份作为样本,发现得分均在区间内现将个样本数据按,,,,,分成组,得到如下频率分布直方图.
(1)求出频率分布直方图中的值;
(2)请估计样本数据的众数和平均数;
(3)学校决定奖励成绩排名前20%的学生,学生甲的成绩是分,请判断学生甲能否得到奖励,并说明理由.
题型八 用样本平均数和样本方差估算总体
例8.潮汕英歌舞以其动作刚劲有力,节奏感强的特色,备受人们喜爱.某校组织英歌队进行训练并作了汇报表演,为了解训练成果,做了一次问卷调查,问卷所涉及的问题均量化成对应的分数(满分100分),从所有答卷中随机抽取100份的分数作为样本,将样本的分数(成绩均为不低于50分的整数且在组内均匀分布)分成五段:,得到如下所示的频数分布表.
样本分数段
[90,100]
频数
10
30
30
10
频率
0.1
0.3
0.3
0.1
(1)求频数分布表中和的值,并估计样本成绩的平均数;
(2)经计算,样本中分数在区间[50,60)内的平均数为56,方差为7;在区间[60,70)内的平均数为65,方差为4,求两组成绩的总平均数和总方差.
变式8-1.(多选)一分钟跳绳是中考体育选考项目之一.小明在平时训练时通常会将自己的训练成绩记录下来,以此评估自己的训练成果.小明记录了他在3月份的10次训练成绩和4月份的20次训练成绩.通过计算,他发现3月份的训练成绩的平均值为177,方差为5.4;4月份的训练成绩的平均值为186,方差为6.3.下列结论正确的是( )
A.小明这两个月的30次训练成绩的平均数为181.5
B.小明这两个月的30次训练成绩的平均数为183
C.小明这两个月的30次训练成绩的方差为6
D.小明这两个月的30次训练成绩的方差为24
变式8-2.2019年国庆前夕,某市教育部门举办中小学生国防教育杯射击比赛,某校5名同学参加比赛,每人射击2次,该校3名男生选手的平均分为7环,方差为3,2名女生选手平均分为8环,方差为0.5,则该校所有选手得分的方差为 .
变式8-3.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取份作为样本,将样本的成绩(满分分,成绩均为不低于分的整数)分成六段:得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)求样本成绩的众数,中位数和平均数;
(3)已知落在的平均成绩是,方差是,落在的平均成绩为,方差是,求两组成绩合并后的平均数和方差.
题型九 事件关系的判断
例9.掷一枚质地均匀的硬币三次,得到如下三个事件:A为“3次正面向上”,B为“只有1次正面向上”,C为“至少1次正面向上”,事件A,B,C之间的关系正确的是( )
A. B. C. D.
变式9-1.(多选)对空中移动的目标连续射击两次,设{两次都击中目标},{两次都没击中目标},{恰有一次击中目标},{至少有一次击中目标},下列关系正确的是( )
A. B. C. D.
变式9-2.(多选)对空中飞行的飞机连续射击两次,每次发射一枚炮弹,记事件为“两次都击中飞机”,事件为“两次都没击中飞机”,事件为“恰有一次击中飞机”,事件为“至少有一次击中飞机”,则( )
A. B. C. D.
变式9-3.已知电路图如图,“开关合上”,“开关合上”.则表示的含义是 .
题型十 简单古典概型的计算
例10.不透明的盒子里面装有五个分别标有数字1、2、3、4、5的乒乓球,这些球除数字外,其他完全相同,一位学生随机摸出两个球,两个球的数字之和是奇数的概率是( ).
A. B. C. D.
变式10-1.一个袋子中装有形状大小完全相同的6个红球,个绿球,现采用不放回的方式从中依次随机取出2个球.若取出的2个球都是红球的概率为,则的值为( )
A.4 B.5 C.12 D.15
变式10-2.一个口袋中装有20个红球和若干个黑球,在不允许将球倒出来数的前提下,为估计口袋中黑球的个数,小张采用了如下的方法:每次从口袋中摸出1个球,记下球的颜色后再把球放回口袋中摇匀.不断重复上述过程900次,共摸出红球400次,根据上述数值,估计口袋中黑球的个数为( )
A.25 B.30 C.35 D.40
变式10-3.从方程的所有非负整数解中随机取出一组解,则该解是正整数解的概率为 .
题型十一 互斥与对立
例11.抛掷两枚质地均匀的骰子,记录朝上的点数,则下列选项的两个事件中,互斥但不对立的是( )
A.事件“点数之和为奇数”与事件“点数之积为偶数”
B.事件“点数之和为奇数”与事件“点数之积为奇数”
C.事件“点数之和不小于8”与事件“点数之和不大于7”
D.事件“点数之积不小于7”与事件“点数之积不大于8”
变式11-1.口袋中装有编号为①、②的2个红球和编号为①、②、③、④、⑤的5个黑球,小球除颜色、编号外形状大小完全相同,现从中取出1个小球,记事件为“取到的小球的编号为②”,事件为“取到的小球是黑球”,则下列说法正确的是( )
A.与互斥 B.与对立 C. D.
变式11-2.(多选)抛掷一枚质地均匀的骰子,记事件“点数为奇数”,事件“点数为偶数”,事件“点数不大于2”,事件“点数为3的倍数”,则( )
A.和互为对立事件 B.和不互斥
C.和互斥 D.和互斥且不对立
变式11-3.下列结论正确的是( )
A.若事件A与事件B互斥,则
B.若事件A与事件B互斥,则
C.若事件A与事件B对立,则
D.若事件A与事件B对立,则
题型十二 事件独立性的判断
例12.已知是一个随机试验中的两个随机事件,若,,则( )
A.与相互独立且 B.与不相互独立且
C.与相互独立且 D.与不相互独立且
变式12-1.连续抛掷一枚质地均匀的骰子2次,记录每次朝上的点数,设事件A为“第一次的点数是2”,事件B为“第二次的点数小于4”,事件C为“两次的点数之和为偶数”,则( )
A. B.A与C相互独立 C.A与C对立 D.B与C互斥
变式12-2.(多选)记事件中的样本点个数为.对于一个古典概型试验的样本空间和事件,已知,,,,,,,,,,,,则( )
A.与互斥 B.与互斥
C.与相互独立 D.与相互独立
变式12-3.(多选)抛掷一枚质地均匀的骰子两次,甲表示事件“第一次骰子正面向上的数字是5”,乙表示事件“两次骰子正面向上的数字之和是7”,丙表示事件“两次骰子正面向上的数字之积是12”,则下列说法正确的是( )
A.甲、乙对立 B.甲、丙互斥 C.甲、乙相互独立 D.乙、丙相互独立
题型十三 独立事件概率的计算
例13.甲、乙两人进行轮流投篮比赛,每人每次只投一球.约定先投中者获胜,当有人投中或者每人都已投球3次时投篮结束.设甲每次投篮投中的概率为,乙每次投篮投中的概率为,且两人各次投篮互不影响.
(1)若甲先投篮,求投篮结束时,甲只投了2个球的概率;
(2)若乙先投篮,求乙获胜的概率.
变式13-1.甲、乙两个人独立地破译一个密码,他们能译出密码的概率分别为和,则恰有一个人译出密码的概率 .
变式13-2.甲乙丙丁互相传球,每次传球由持球者等可能地传给另外三人中的一人,现从甲开始传球,则经过六次传球后球恰好首次回到甲手中的概率为 .
变式13-3.甲、乙、丙三人结伴去游乐园玩射击游戏,其中甲射击一次击中目标的概率为,甲、乙两人各射击一次且都击中目标的概率为,乙、丙两人各射击一次且都击中目标的概率为,已知任意两次射击互不影响.
(1)分别计算乙、丙两人各射击一次且击中目标的概率;
(2)求甲、乙、丙各射击一次且恰有一人击中目标的概率.
题型十四 频率与概率
例14.书架上有中文书和英文书共50本,从中随机拿一本,拿到英文书的概率为,则中文书有( )
A.40本 B.30本 C.20本 D.10本
变式14-1.小何同学喜欢踢足球,已知他踢点球进门的概率是,一次点球训练中,他连续2次都没有踢进门,则他第3次踢进门的概率为( )
A. B. C.1 D.介于和1之间的某个实数
变式14-2.为加强学生身体健康,某校对学生进行了体能测试.已知同学甲在立定跳远项目中每次及格的概率均为0.6,现采用随机模拟的方法估计甲在立定跳远项目中3次机会里至少及格2次的概率:先由计算器产生0到9范围内的整数随机数,指定0,1,2,3表示没有及格,4,5,6,7,8,9表示及格,再以每3个随机数为一组,代表3次立定跳远的结果.经随机模拟产生了如下20组随机数:
759 421 113 215 345 257 704 066 186 203
037 624 616 045 601 366 959 742 710 428
据随机模拟试验估计,甲在立定跳远项目中3次机会里至少及格2次的概率为( )
A. B. C. D.
变式14-3.盒子中有四个大小质地完全相同的小球,分别写有“安”、“宁”、“联”、“盟”四个字,有放回地从中任取一个小球, 将三次抽取后“联”、“盟”两个字都抽取到记为事件.用随机模拟的方法估计事件发生的概率,利用电脑随机产生整数四个随机数,分别代表“安”、“宁”、“联”、“盟”这四个字,以每三个随机数为一组,表示取球三次的结果,经随机模拟产生了以下组随机数:233,103,122,320,031,231,133,130,231,001,220,132,021,123,023,230,321,232,由此可以估计,事件发生的概率为 .
基础巩固通关测
一、单选题
1.样本数据1,1,2,3,5,6的分位数为( )
A.1 B.2.5 C.2 D.3
2.集合,集合,从,中各任意取一个数,构成一个两位数,则这个两位数是奇数的概率为( )
A. B. C. D.
3.某人打靶时连续射击三次,下列事件中与事件“至少一次中靶”互为对立的是( )
A.三次都没有中靶 B.三次都中靶 C.至多一次中靶 D.只有一次中靶
4.“国庆小长假”即将到来,某市举办了主题为“旅游文化周”的活动.为了了解该市关注“旅游文化周”活动的市民的年龄段分布,该市旅游局随机抽取了名年龄在且关注“旅游文化周”的市民进行调查,所得结果统计为如图所示的频率分布直方图.若按照分层抽样的方法从年龄在,的市民中抽取人进行旅游知识推广,并在知识推广后再抽取人反馈,求进行反馈的市民中至少有人的年龄在的概率是( ).
A. B. C. D.
5.已知下面三组数据:5,5,5,5,5,5,5,5,5;3,3,4,4,5,6,6,7,7;4,4,4,5,5,5,6,6,6.它们的方差分别为,,,则( )
A. B. C. D.
6.已知某总体分为两层,第一层总体数量为,第二层总体数量为,采用分层抽样抽取样本,第一层样本平均数为;第二层样本平均数为,则该总体平均数的估计值为( )
A.5.5 B.6.0 C.6.2 D.7.0
7.甲、乙、丙三人独立参加体育达标测试,已知甲、乙、丙各自通过测试的概率分别为,,,且他们是否通过测试互不影响.若三人中只有甲通过测试的概率为,则甲、丙二人中至少有一人通过测试的概率为( ).
A. B. C. D.
8.正多面体被古希腊圣哲认为是构成宇宙的基本元素,加上它们的多种变体,一直是科学、艺术、哲学灵感的源泉之一.如图,一个正八面体八个面分别标有数字1到8,任意抛掷一次这个正八面体,观察它与地面接触的面上的数字,得到样本空间为,记“得到的点数为奇数”为事件,记“得到的点数不大于4”为事件,记“得到的点数为质数”为事件,则下列说法正确的是( )
A.事件与互斥 B.
C.事件与相互独立 D.
二、多选题
9.某超市在两周内的蓝莓每日促销量如图所示,根据此折线图,下面结论正确的是( )
A.这14天日促销量的众数是214
B.这14天日促销量的中位数是196
C.这14天日促销量的极差为194
D.这14天日促销量的第80百分位数是260
10.智慧农业又称数字农业或信息农业,通过利用人工智能、机器学习、物联网等技术使农业更加智能化,推动了农业生产变革,同时也促进了高校毕业生等青年的就业.某智慧农场计划招聘一批员工,为了制定更为合理的招聘策略,统计了现有的名员工的年龄(岁)的情况,并制作了如图所示的频率分布直方图,若同一组中的数据用该组区间的中间值代表,则下列结论正确的是( )
A.
B.这名员工的年龄的众数的估计值为
C.这名员工的年龄的中位数的估计值为
D.从这名员工中任选两人,两人的年龄都在内的概率为
三、填空题
11.一个袋子中有3个红球、4个白球、3个绿球.若随机地摸出一个球,设事件“摸出红球”,事件“摸出白球”,事件“摸出绿球”,则 .
12.某中学举行数学解题比赛,其中6人的比赛成绩分别为:,则这6人成绩的分位数与极差之和是 .
13.临平是生态宜居的福地,地处杭嘉湖平原,大运河、上塘河沿境流淌,临平区一望平畴、塘漾棋布,是典型的江南水乡、鱼米之乡,是文学大师丰子恺笔下的“江南佳丽地”,境内拥有江南三大赏梅胜地之一超山、塘栖古镇、艺尚小镇等风景名胜和人文景观,现有甲、乙两个同学准备周末分赴这三个景点打卡,已知每人都只去1个景点,且甲、乙两个同学前往三地打卡的概率分别是,,和,,,则甲、乙打卡不相同景点的概率为 .
四、解答题
14.衡阳县第一中学为预备2026年的全国高中数学联赛预赛,在该校先选取了前60名的学生(含60名),进行选拔,随后根据分数线选取参赛选手,该60名学生的成绩的频率分布直方图如下,数据的分组依次是(本场选拔总分为100分).
(1)估计该一中学生选拔成绩的平均值(提示:同一组中的数据用该组区间的中点值为代表)
(2)这次选拔测试成绩的第60百分位数可估计为?
(3)若学校定75分为标准选拔分数线,则参赛人数大约为?
15.某校组织答题闯关活动,每位选手必须答4道题,第1,2题各10分,第3,4题各20分,每题答对得到对应的分值,答错得0分.甲参加该活动,已知甲每题答对的概率均为,且每道题能否答对相互独立.
(1)求甲得60分的概率;
(2)求甲得20分的概率;
(3)若得分不低于40分为“闯关成功”,求甲闯关成功的概率.
16.为增强市民的环境保护意识,某市面向全市征召若干名宣传志愿者,成立环境保护宣传小组,现把该小组成员按年龄分成,,,,这5组,得到频率分布直方图如图所示,已知年龄在内的人数为5.
(1)根据频率分布直方图,求该小组成员年龄的众数及第60百分位数.
(2)若用分层抽样的方法从年龄在,,内的志愿者中按比例抽取6名参加某社区的宣传活动,再从这6名志愿者中随机抽取2名志愿者做环境保护知识宣讲,写出试验的样本空间,并求这2名环境保护知识宣讲志愿者中至少有1名年龄在内的概率.
能力提升进阶练
1.某商场推出抽奖活动,在甲抽奖箱中有四张有奖奖票,六张无奖奖票;乙抽奖箱中有三张有奖奖票,七张无奖奖票.每人能在甲乙两箱中各抽一次,以表示“在甲抽奖箱中抽奖中奖的事件”,表示“在乙抽奖箱中抽奖中奖的事件”,表示“两次抽奖均未中奖的事件”,下列结论中不正确的是( )
A.
B.与相互独立
C.
D.与互斥
2.(多选)一个质地均匀的正八面体,八个面分别标以数字1到8,任意抛掷一次这个正八面体,观察它与地面接触的面上的数字,得到样本空间为,记事件“得到的点数不大于4”,记事件“得到的点数为偶数”,记事件“得到的点数为质数”,则下列说法正确的是( )
A. B.事件与互斥
C.两两独立 D.
3.(多选)某中学九年级在体能测试后,为分析学生的跳绳成绩,随机抽取了名学生的分钟跳绳的次数,将所得数据整理后,分为组画出如图频率分布直方图.为进一步分析学生的成绩分布情况,经计算得到这名学生中,跳绳次数位于的学生跳绳次数的方差为,跳绳次数位于的学生跳绳次数的方差为.(同一组中的数据以这组数据所在区间的中点值为代表)则下列正确的是( )
A.
B.估计该年级学生跳绳次数的分位数约为
C.估计该年级学生跳绳次数在次及以上的学生跳绳次数的平均数为
D.估计该年级学生跳绳次数在次及以上的学生跳绳次数的方差为
4.新高考模式下,学生是否选择物理作为高考考试科目对大学专业选择有着非常重要的意义.合肥六中为了解高一年级1800名学生物理科目的学习情况,将他们某次物理测试成绩(满分100分)按照分成6组,制成如图所示的频率分布直方图.
(1)求1800名学生中物理测试成绩在内的频数并补全频率分布直方图.
(2)学校建议,本次物理测试成绩不低于分的学生选择物理为高考考试科目,若学校希望高一年级恰有的学生选择物理为高考考试科目,试求的估计值(结果精确到).
(3)已知落在的学生成绩的平均数为,方差,落在的学生成绩的平均数为,方差,若两组学生成绩的平均数之差不大于6,求落在的学生成绩的方差的最大值.
5.甲、乙两人进行象棋比赛,已知每局比赛甲获胜的概率为,乙获胜的概率为,且各局比赛的胜负互不影响.有两种比赛方案供选择,方案一:三局两胜制(先胜2局者获胜,比赛结束);方案二:五局三胜制(先胜3局者获胜,比赛结束).
(1)用抛掷骰子的方式决定比赛方案,抛掷两枚质地均匀的骰子,观察两枚骰子向上的点数,若两枚骰子向上的点数之差的绝对值不大于1,则选择方案一,否则选择方案二.试判断哪种方案被选择的可能性更大,并说明理由;
(2)若选择方案一,求甲获胜的概率.
1/3
学科网(北京)股份有限公司
$
第五章 统计与概率(复习讲义)
基础目标
①能复述统计的核心概念(总体、个体、样本等)及简单随机抽样、分层抽样的定义;
②会选择合适抽样方法,能绘制柱形图、折线图等基础统计图表,会计算众数、中位数等基本数字特征;
③能复述随机事件、样本空间等概率概念,理解古典概型的特征,会用定义法计算简单古典概型概率;
④能区分互斥事件与对立事件,会运用概率基本性质解决基础计算问题。
进阶目标
①理解分层抽样的比例计算逻辑,会推导频率分布直方图的绘制步骤及性质;
②能结合统计图表提取数据信息,会分析方差、标准差反映的数据波动特征;
③会推导事件的并、交等运算规则,能运用古典概型公式求解稍复杂场景的概率;
④理解频率的稳定性,会用频率估计概率;
⑤能判断事件独立性,会套用独立事件各类情形的概率计算公式解决实际问题。
拓展目标
①能综合运用抽样方法、数据特征与统计图表进行完整数据分析;
②会灵活处理百分位数的计算,能结合频率分布直方图与数字特征进行多维度推断;
③能综合事件关系、古典概型、独立事件等知识,解决含多个随机事件的综合应用题;
④能通过统计推断与概率计算,完成实际场景中的决策分析,体现数形结合与逻辑推理能力。
一、数据的收集
1.统计的相关概念
名称
定义
总体
调查对象的全体称为整体
个体
组成整体的每一个调查对象称为个体
样本
从总体中抽取的那部分个体称为样本
样本容量
样本中包含的个体数称为样本容量
样本与样本量的区别:样本是从总体中抽取的个体组成的集合,是对象;样本量是样本中个体的数目,是一个数.
2.简单随机抽样
定义
设一个总体含有个个体,从中逐个不放回抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样
方法
抽签法
把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本
随机数法
利用随机数表、随机数骰子或计算机产生的随机数进行抽样
抽签法与随机数法
相同点
①都属于简单随机抽样,并且要求被抽取样本的总体的个体数有限;
②都是从总体中逐个不放回地进行抽取
不同点
①抽签法比随机数法操作简单;
②随机数法更适用于总体中个体数较多的时候,而抽签法适用于总体中个体数较少的情况
利用随机数法抽取个体时的注意事项:
①定起点:事先应确定以表中的哪个数(哪行哪列)作为起点.
②定方向:读数的方向(向左、向右、向上或向下都可以).
③读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数.
3分层抽样
①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
②应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.
注意:分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比.
二、数字特征
1.众数、中位数、平均数
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小矩形的面积乘以小矩形底边中点的横坐标之和
2.极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:.
标准差:.
注:方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
③性质
(1)若的平均数为,那么的平均数为.
(2)数据与数据的方差相等,即数据经过平移后方差不变.
(3)若的方差为s2,那么的方差为.
3.百分位数
(1)定义:一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组几个数据第p百分位数的步骤
第1步,按从小到大排列原始数据;
第2步,计算.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.四分位数
即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.
其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
三、数据的直观表示
1.柱形图
柱形图也称为条形图,可以形象地比较各种数据之间的数量关系。
一般地,柱形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,柱形图的每一矩形都是等宽的。
2.折线图
一般地,如果数据随时间变化的,想了解数据的变化情况,可将数据用折线图来表示,当然,折线图也可以用在其他合适的情形中。
3.扇形图
扇形图也称为饼图、饼形图,它可以形象地表示出各部分数据在全部数据中所占的比例情况,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比。
4.茎叶图
(1)定义:将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到达的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).
(2)一般地,茎叶图中,所有的茎都竖直排列,而叶沿水平方向排列。茎叶图也可以只表示一组数。
将一组数整理成茎叶图后,如果每一行的数都是按从大到小(或从小到大)顺序排列,则从中可以方便地看出这组数的最值、中位数等数字特征。
(3)茎叶图的有点与不足:
优点:一是原始数据信息在图中能够保留,所有数据信息都可以从茎叶图中得到;
二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。
不足:当样本数据较多时,茎叶图就显得不太方便。
5频率分布直方图
(1)画频率分布直方图的步骤
第1步:求极差(即一组数据中最大值与最小值的差);
第2步:决定组距与组数;
第3步:将数据分组;
第4步:列频率分布表;
第5步:画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
(2)频率分布直方图的性质
落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.
四、样本空间与事件
1.有限样本空间与随机事件
(1)随机试验
我们把对随机现象的实现和对它的观察称为随机试验,简称试验,常用字母表示.
随机试验具有以下特点:
①试验可以在相同条件下重复进行;
②试验的所有可能结果是明确可知的,并且不止一个;
③每次试验总是恰好出现这些可能结果中的一个,但事先不能确定出现哪一个结果.
(2)试验的样本点和样本空间
项目
定义
字母表示
样本点
我们把随机试验的每个可能的基本结果称为样本点
用表示样本点
样本空间
全体样本点的集合称为试验的样本空间
用表示样本空间
有限样本空间
如果一个随机试验有个可能结果
则称样本空间为有限样本空间
(3)三种事件的定义
随机事件
我们将样本空间的子集称为随机事件,简称事件,并把只包含一个样本点的事件称为基本事件.随机事件一般用大写字母表示.在每次试验中,当且仅当中某个样本点出现时,称为事件发生
必然事件
作为自身的子集,包含了所有的样本点,在每次试验中总有一个样本点发生,所以总会发生,我们称为必然事件
不可能事件
空集不包含任何样本点,在每次试验中都不会发生,我们称为不可能事件
五、事件的关系和运算
1.事件的包含关系
定义
一般地,若事件发生,则事件一定发生,我们就称事件包含事件(或事件包含于事件)
含义
发生导致发生
符号表示
(或)
图形表示
特殊情况
如果事件包含事件,事件也包含事件,即且,则称事件与事件相等,记作
2.并事件(或和事件)
定义
一般地,事件与事件至少有一个发生,这样的一个事件中的样本点或者在事件中,或者在事件中,我们称这个事件为事件与事件的并事件(或和事件)
含义
与至少有一个发生
符号表示
(或)
图形表示
3交事件(或积事件)
定义
一般地,事件与事件同时发生,这样的一个事件中的样本点既在事件中,也在事件中,我们称这样的一个事件为事件与事件的交事件(或积事件)
含义
与同时发生
符号表示
(或)
图形表示
4.互斥事件(或互不相容事件)
定义
一般地,如果事件与事件不能同时发生,也就是说是一个不可能事件,即,则称事件与事件互斥(或互不相容)
含义
与不能同时发生
符号表示
图形表示
5.对立事件
定义
一般地,如果事件和事件在任何一次试验中有且仅有一个发生,那么称事件与事件互为对立.事件的对立事件记为
含义
与有且仅有一个发生
符号表示
,
图形表示
六、古典概型
1.概率
对随机事件发生可能性大小的度量(数值),称为事件的概率,事件的概率用表示.
2.古典概型
一般地,如果随机试验的样本空间的样本点只有有限个(简称为有限性),而且可以认为每个样本点发生的可能性相等(简称等可能性),则称这样的随机试验为古典概型试验,其数学模型称为古典概率模型,简称古典概型.
3.古典概型概率公式
一般地,设试验是古典概型,样本空间包含个样本点,事件包含其中的个样本点,则定义事件的概率,其中,和分别表示事件和样本空间包含的样本点个数.
4.概率的基本性质
一般地,概率具有如下性质:
性质1:对任意的事件,都有
性质2:必然事件的概率为1,不可能事件的概率为0,即.
性质3:如果事件与事件互斥,那么
如果事件两两互斥,那么事件发生的概率等于这个事件分别发生的概率之和,即
性质4:如果事件和事件互为对立事件,那么
性质5:如果,那么.
性质6:设是一个随机试验中的两个事件,我们有
5.频率的稳定性
大量试验证明,在任何确定次数的随机试验中,一个随机事件发生的频率具有随机性.一般地,随着试验次数的增大,频率偏离概率的幅度会缩小,即事件发生的频率会逐渐稳定于事件发生的概率.我们称频率的这个性质为频率的稳定性.因此,我们可以用频率估计概率
七、相互独立
对任意两个事件与,如果成立,则称事件A与事件B相互独立,简称为独立.
(1)如果与相互独立,则与,与,与也相互独立.
(2)与相互独立事件有关的概率的计算公式如下表:
事件相互独立
概率计算公式
同时发生
同时不发生
至少有一个不发生
至少有一个发生
恰有一个发生
题型一 数据的收集
例1.(多选)从某市高一年级考试的学生中随机抽查2000名学生的数学成绩进行统计分析,在这个问题中,下列说法不正确的是( )
A.总体指的是该市高一年级考试的全体学生 B.样本是指2000名学生的数学成绩
C.样本容量指的是2000名学生 D.个体指是指2000名学生中的每一名学生
【答案】ACD
【详解】对于A:总体指的是该市高一年级考试全体学生的数学成绩,故A错误;
对于B:样本是指2000名学生的数学成绩,故B正确;
对于C:样本容量指的是2000,故C错误;
对于D:个体指是指2000名学生中的每一名学生的数学成绩,故D错误.
故选:ACD.
变式1-1.在对101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中随机抽取10个人,那么下列说法正确的是( )
A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会
B.每个人在整个抽样过程中被抽到的机会均等
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
【答案】B
【详解】由于第一次剔除时采用抽签法,对每个人来说可能性相等,
然后随机抽取10人对每个人的机会也是均等的,
所以总的来说每个人的机会都是均等的,被抽到的可能性都是相等的.
故选:B.
变式1-2.下列抽样的方式属于简单随机抽样的个数为( )
①从500个个体中一次性抽取50个作为样本;
②将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本;
③某班有55个同学,指定个子最高的5名同学参加学校组织的篮球赛;
④福利彩票用摇奖机摇奖.
A.1 B.2 C.3 D.4
【答案】C
【详解】①一次性抽取与逐个不放回的抽取等价,是简单随机抽样,③不是等可能抽取,故不是简单随机抽样,②④是简单随机抽样.
故选:C.
变式1-3.某公司利用随机数表对生产的900支新冠疫苗进行抽样测试,先将疫苗按000,001,..,899进行编号,从中抽取90个样本,若选定从第4行第4列的数开始向右读数,(下面摘取了随机数表中的第3行至第5行),根据下图,读出的第6个数的编号是 .
1676622766
5650267107
3290797853
1355385859
8897541410
1256859926
9682731099
1696729315
5712101421
8826498176
5559563564
3854824622
3162430990
0618443253
2383013030
【答案】315
【详解】由题意最先读到的1个的编号是685,
向右读下一个数是992,992它大于899,故舍去,
再下一个数是696,再下一个数是827,再下一个数是310,
再下一个数是991,舍去,再下一个数是696,舍去,再下一个数是729,
再下一个数是315,则读出的第6个数是315.
故答案为:315
题型二 分层抽样
例2.某校高一有1000名学生,为了培养学生良好的阅读习惯,语文教研组要求高一学生从四大名著中选一本阅读,其中有400人选《三国演义》,250人选《水浒传》,250人选《西游记》,100人选《红楼梦》,若采用分层抽样的方法随机抽取100名学生分享他们的读后感,则选《西游记》或《红楼梦》的学生抽取的人数为( )
A.25 B.30 C.35 D.50
【答案】C
【详解】选《西游记》或《红楼梦》的学生抽取的人数为.
故选:C.
变式2-1.某校高二年级有男生540人,女生360人,用分层抽样的方法从高二年级的学生中随机抽取25名学生进行问卷调查,则应抽取的女生人数为( )
A.25 B.20 C.15 D.10
【答案】D
【详解】设应抽取的女生人数为,则,解得.
故选:D.
变式2-2.某羽毛球俱乐部有队和队,其中队有名学员,队有名学员,为了解俱乐部学员的羽毛球水平,用比例分配的分层随机抽样的方法从该俱乐部中抽取一个容量为的样本,已知从队中抽取了名学员,则的值为( )
A. B. C. D.
【答案】D
【详解】根据分层抽样可得,解得.
故选:D.
变式2-3.某学校为了解高一学生每天阅读时长,从高一男生和女生中采用分层抽样的方法抽取部分学生进行调查分析.已知该学校高一学生中男生和女生的比例是,在抽取的学生中男生比女生多24人,则被抽取的学生人数是 .
【答案】168
【详解】设抽取的学生中男生人数为a,女生人数为b,
则,且,解得a=96,b=72,
则被抽取的学生人数是96+72=168.
故答案为:168.
题型三 统计图的分析
例3.(多选)为了关注学生的健康成长,某学校开展了一次高一年级学生身高的抽样调查,随机抽取了100名学生,将他们的身高划分成了A,B,C,D,E五个层次,根据抽样结果得到如下统计图,则从图中能得出的信息是( )
A.样本中A层次身高的女生少于男生
B.样本中B层次身高的学生人数最多
C.样本中D层次身高的学生人数占总人数的17%
D.样本中E层次身高的男生有6人
【答案】ABC
【详解】对于A,样本中女生人数为,则样本中男生有(人),样本中A层次身高的男生人数为,女生人数为4,所以样本中A层次身高的女生少于男生.故A正确;
对于B,因为男生中B层次身高的人数比例最大,女生中B层次身高的人数比例也最大,所以样本中B层次身高的学生人数最多.故B正确;
对于C,样本中D层次身高的女生有8人,D层次身高的男生有(人),所以样本中D层次身高的学生人数占总人数的比例为.故C正确;
对于D,样本中E层次身高的男生有(人).故D错误.
故选:ABC
变式3-1.(多选)某学校对高一学生选科情况进行了统计,发现学生选科仅有物化生、政史地、物化地、物化政、生史地五种组合,其中选考物化地和物化政组合的人数相等,并绘制得到如下的扇形图和条形图,则( )
A.该校高一学生总数为800
B.该校高一学生中选考物化政组合的人数为96
C.该校高一学生中选考物理的人数比选考历史的人数多
D.用比例分配的分层随机抽样方法从该校高一学生抽取20人,则生史地组合抽取6人
【答案】AC
【详解】对于A,选科为政史地的人数为200人,占比为.该校高一学生共有人,A正确;
对于B:选科为物化生的人数为人,选科为物化政的人数为B错误;
对于C,选考历史的人数有人,选考物理的人数有人,
选考物理的人数比选考历史的人数多,C正确;
对于D,选科为生史地的学生人数占比为,
采用分层抽样抽取20人,生史地组合应抽取人,D错误.
故选:AC.
变式3-2.(多选)随着一系列政策落地生效,文旅消费需求加速释放,部分旅游业取得显著效果.如图是2019—2023年上半年国内旅游数据有关情况,则( )
A.2019—2023年上半年国内旅游总人次在2020年第一季度达到最低值
B.2019—2022年每年中,国内旅游总人次均在第二季度达到最高值
C.2022年每季度国内旅游收入呈递减趋势
D.2020—2023年上半年中,每季度国内旅游收入相比上一季度增长量最大的是2023年第一季度
【答案】AD
【详解】选项A,2019—2023年上半年国内旅游总人次在2020年第一季度达到最低值,A正确;
选项B, 2020年的国内旅游总人次在第三季度达到最高值,B错误;
选项C, 2022年第三季度的国内旅游收入与第二季度相比有所增加,C错误;
选项D,2020—2023年上半年相邻两个季度国内旅游收入增长量最大的是2023年第一季度,D正确.
故选:AD.
变式3-3.(多选)为了关注学生的健康成长,某校开展了一次高一年级的学生身高的抽样调查,随机抽取了100名学生,将他们的身高划分成了A,B,C,D,E五个层次,根据抽样结果得到如下统计图,则样本中( )
A.身高在A层次中的女生人数比男生多
B.身高在B层次中的人数最多
C.身高在D层次的女生,占女生人数的比例超过15%
D.身高在E层次中的男生有3人
【答案】BCD
【详解】对于A,样本中女生人数为人,则样本中男生人数为60人,
样本中A层次身高的男生人数为人,女生人数为4人,
所以,样本中A层次身高的女生少于男生,A错误;
对于B,因为男生中B层次的比例最大,女生中B层次的人数最多,
所以样本中B层次身高人数最多,B正确;
对于C,样本中D层次身高的女生有8人,占女生人数的比例为,C正确;
对于D,样本中E层次身高的男生有人,D正确.
故选:BCD
题型四 平均数、中位数、众数在具体数据中的应用
例4.样本数据2,8,14,14,20,下列说法正确的是( )
A.极差为22 B.平均数为14 C.中位数为15 D.众数为14
【答案】D
【详解】对于A:极差为,故A错误;
对于B:平均数为,故B错误;
对于C:中位数为14,故C错误;
对于D:众数为14,故D正确.
故选:D.
变式4-1.高三某班有 15 名男生和 35 名女生, 在某次月考的数学成绩中, 男生的平均分比女生的平均分多 5 分, 则男生的平均分比全班的平均分( )
A.多 1.5 分 B.多 2.5 分 C.多 3.5 分 D.多 4.5 分
【答案】C
【详解】设男生平均分为,女生平均分为;
则,
总体平均分为,
则男生的平均分减全班的平均分为(分),
故男生的平均分比全班的平均分多 3.5 分.
故选:C.
变式4-2.小李是一名健身运动爱好者,如图所示的统计图记录了他过去一个月(30天)每天花在健身运动上的时间(单位:分钟),记这组数据的众数为M,中位数为N,平均数为P,则( )
A.N<M<P
B.P<N<M
C.M<P<N
D.M<N<P
【答案】D
【详解】由统计图可得,众数M=50;处在中间位置的两个数据为50,60,所以中位数平均数P=所以M<N<P.
故选:D.
变式4-3.(多选)国家射击运动员在某次训练中的8次射击成绩(单位:环)为10,7,8,10,x,10,8,6,其中为整数,若这8次射击成绩的中位数为9,则( )
A. B.极差为4 C.众数为10 D.平均值为8.5
【答案】ABC
【详解】A:将成绩(除了)从小到大排列为:6,7,8,8,10,10,10,当时,这8次射击成绩的中位数,所以,故A正确;
B:将8个成绩从小到大排列为:6,7,8,8,10,10,10,10,极差为,故B正确;
C:众数为10,故C正确;
D:平均值为,故D错误.
故选:ABC.
题型五 极差、方差、标准差在具体数据中应用
例5.已知互不相等的数据的平均数为,方差为,数据的方差为,则的大小关系为( )
A. B. C. D.无法判断
【答案】C
【详解】由,则,
所以,且互不相等,
由,
而,
所以.
故选:C
变式5-1.已知样本容量为5的样本平均数为3,方差为,将数据9加入原样本得到样本容量为6的新样本,若新样本的平均数为,方差为,则( )
A. B. C. D.
【答案】B
【详解】设原样本为,,,,,
则:,
.
所以,
.
故选:B
变式5-2.(多选)已知样本数据,()(),则( )
A.若样本数据的极差为R,则样本数据的极差为
B.若样本数据的平均值为,则样本数据的平均值为
C.若样本数据的众数为N,则样本数据的众数为
D.若样本数据的方差为,则样本数据的方差为
【答案】ACD
【详解】对于A,设样本数据中,最大值为,最小值为,则,
由于在上单调递增,
故样本数据中,最大值为,最小值为,
故,
则样本数据的极差为,故A正确:
对于B,由平均数的性质可得,样本数据的平均值为,故B错误;
对于C,根据众数的定义可得,样本数据的众数为,故C正确;
对于D,根据方差的性质可知,样本数据的方差为,故D正确,
故选:ACD.
变式5-3.这5个数据181,182,183,184,185的方差为 .
【答案】2
【详解】平均数,
方差
.
故答案为:2.
题型六 百分位数在具体数据中的应用
例6.某汽车零件质检员对一批汽油机电火花零件进行质检,记录的数据(单位:毫米)为3.56,3.58,3.59,3.95,4.03,则这5个数据的第60百分位数为( )
A.3.58 B.3.59 C.3.76 D.3.77
【答案】D
【详解】因为,所以这5个数据的第60百分位数为.
故选:D.
变式6-1.如图是某小组成员的年龄分布茎叶图(十位数字为茎、个位数字为叶),则该小组成员年龄的第30百分位数为 .
2
7
8
3
1
3
6
6
8
4
0
5
5
2
4
8
【答案】
【详解】由题意可知共有个数据,且,则第百分位数为.
故答案为:.
变式6-2.已知一组数据为,则这组数据的上四分位数为( )
A. B. C. D.
【答案】D
【详解】将数据按照从小到大排序,
由,第位与第位平均数为,所以这组数据的上四分位数为10.
故选:D.
变式6-3.(多选)一组样本数据 的平均数为,方差为,这组样本数据增加 2 个数据后得到新的样本数据 ,则这组新数据与原数据一定相同的是( )
A.平均数 B.中位数 C.方差 D.第10百分位数
【答案】AD
【详解】新数据的平均数为 ,故平均数一定相同.
因为不确定与之间的大小关系,所以中位数无法判断.
,新数据的方差,
所以新数据的方差小于原数据的方差;
因为,所以新数据与原数据的第 10 百分位数都是第一个数,
又所以新数据与原数据的第 10 百分位数均为.
故选:AD.
题型七 频率分布直方图的相关计算
例7.某市为了了解全市名高一学生的数学学习情况,抽取了本市某个区的1500名学生进行数学能力测试(百分制),并将这些学生的成绩整理成如图所示的频率分布直方图.根据频率分布直方图,下列说法正确的是( )
A.图中a值为0.15
B.估计样本数据的分位数为75
C.用样本可以估计全市高一学生数学能力测试得分的众数约为85
D.用样本可以估计全市高一学生数学能力测试优秀(90分及以上)(多选)的人数为人
【答案】BC
【详解】对于A,因为小长方形的面积和为,
所以,
解得,则图中值为,故A错误,
对于B,因为,
所以样本数据的分位数在区间内,
且设样本数据的分位数为,
可得,
解得,则样本数据的分位数为75,故B正确,
对于C,由频率分布直方图性质得样本的众数为区间的平均数,
则众数为,故C正确,
对于D,由题意得优秀学生的频率为,
而人,故D错误.
故选:BC
变式7-1.对学校高三年级某班50名学生的高校招生体检表中视力情况进行统计,其结果的频率分布直方图如图.若高校专业对视力要求不低于0.9,则该班学生中有 人能报考该专业.
【答案】
【详解】由频率分布直方图知:视力在0.9以上的频率为,
所以该班学生中能报专业的最多人数为.
故答案为:20.
变式7-2.某地区对100名新入职教师技能测试的成绩进行了分析,成绩都在区间内,绘制频率分布直方图如图.则下列结论中不正确的是( )
A.成绩在的频数为10 B.所有小矩形面积之和为1
C.成绩中位数在区间内 D.成绩平均数在区间内
【答案】D
【详解】根据频率分布直方图可知:,可得.所以B正确;
成绩在的频数为:,故A正确;
设成绩中位数为,
,
易得中位数在区间内,故C正确;
设成绩平均数为,
而,
平均数在区间内,故D错误.
故选:D.
变式7-3.某校为促进学生对数学文化的认识,举办了相关竞赛,从所有答卷中随机抽取份作为样本,发现得分均在区间内现将个样本数据按,,,,,分成组,得到如下频率分布直方图.
(1)求出频率分布直方图中的值;
(2)请估计样本数据的众数和平均数;
(3)学校决定奖励成绩排名前20%的学生,学生甲的成绩是分,请判断学生甲能否得到奖励,并说明理由.
【答案】(1);
(2)众数、平均数依次为62分、65分;
(3)学生甲能得到奖励,理由见解析.
【分析】
【详解】(1)由直方图知,所以;
(2)平均值为:分,众数为:分;
(3)成绩低于分的频率为,成绩低于分的频率为,则得到奖励的最低成绩为,所以学生甲能得到奖励.
题型八 用样本平均数和样本方差估算总体
例8.潮汕英歌舞以其动作刚劲有力,节奏感强的特色,备受人们喜爱.某校组织英歌队进行训练并作了汇报表演,为了解训练成果,做了一次问卷调查,问卷所涉及的问题均量化成对应的分数(满分100分),从所有答卷中随机抽取100份的分数作为样本,将样本的分数(成绩均为不低于50分的整数且在组内均匀分布)分成五段:,得到如下所示的频数分布表.
样本分数段
[90,100]
频数
10
30
30
10
频率
0.1
0.3
0.3
0.1
(1)求频数分布表中和的值,并估计样本成绩的平均数;
(2)经计算,样本中分数在区间[50,60)内的平均数为56,方差为7;在区间[60,70)内的平均数为65,方差为4,求两组成绩的总平均数和总方差.
【答案】(1),;76;
(2)总平均数是62,总方差是23.
【分析】
【详解】(1)由,
解得,则,
平均数的估计值为.
(2)由表可知,分数在区间内的频数为10,在区间内的频数为20,
故两组成绩的总平均数,
两组成绩的总方差.
所以两组成绩的总平均数是62,总方差是23.
变式8-1.(多选)一分钟跳绳是中考体育选考项目之一.小明在平时训练时通常会将自己的训练成绩记录下来,以此评估自己的训练成果.小明记录了他在3月份的10次训练成绩和4月份的20次训练成绩.通过计算,他发现3月份的训练成绩的平均值为177,方差为5.4;4月份的训练成绩的平均值为186,方差为6.3.下列结论正确的是( )
A.小明这两个月的30次训练成绩的平均数为181.5
B.小明这两个月的30次训练成绩的平均数为183
C.小明这两个月的30次训练成绩的方差为6
D.小明这两个月的30次训练成绩的方差为24
【答案】BD
【详解】对于AB,这两个月的30次训练的平均数为,故A错误,B正确;
对于CD,故这两个月的30次训练的方差为,故C错误,D正确.
故选:BD.
变式8-2.2019年国庆前夕,某市教育部门举办中小学生国防教育杯射击比赛,某校5名同学参加比赛,每人射击2次,该校3名男生选手的平均分为7环,方差为3,2名女生选手平均分为8环,方差为0.5,则该校所有选手得分的方差为 .
【答案】2.24
【详解】男生的6次总分为,女生4次总分为,所以,
男生方差为3,,,
女生方差为0.5,,,
所以..
故答案为:.
变式8-3.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取份作为样本,将样本的成绩(满分分,成绩均为不低于分的整数)分成六段:得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)求样本成绩的众数,中位数和平均数;
(3)已知落在的平均成绩是,方差是,落在的平均成绩为,方差是,求两组成绩合并后的平均数和方差.
【答案】(1)
(2)众数为,中位数为,平均数为
(3)平均数为,方差为
【分析】
【详解】(1)由每组小矩形的面积之和为,得,解得;
(2)由,得样本成绩的众数为,
成绩落在内的频率为,
成绩落在内的频率为,
故中位数在内,由,得样本成绩的中位数为,
由,得样本成绩的平均数为;
(3)由频率分布直方图知,成绩在的样本数为,
成绩在的样本数为,
所以平均数,
总方差为.
题型九 事件关系的判断
例9.掷一枚质地均匀的硬币三次,得到如下三个事件:A为“3次正面向上”,B为“只有1次正面向上”,C为“至少1次正面向上”,事件A,B,C之间的关系正确的是( )
A. B. C. D.
【答案】B
【详解】当事件A发生时,事件C一定发生,当事件B发生时,事件C一定发生,所以有;当事件A发生时,事件B一定不发生,当事件B发生时,事件A一定不发生,所以事件A与事件B之间不存在包含关系.
变式9-1.(多选)对空中移动的目标连续射击两次,设{两次都击中目标},{两次都没击中目标},{恰有一次击中目标},{至少有一次击中目标},下列关系正确的是( )
A. B. C. D.
【答案】ABD
【详解】对于选项A,事件包含于事件,故A正确;
对于选项B,由于事件,不能同时发生,故,故B正确;
对于选项C,由题意知,故C错误;
对于选项D,由于至少有一次击中目标,恰有一次击中目标,所以两次都击中目标,故D正确.
故选:ABD.
变式9-2.(多选)对空中飞行的飞机连续射击两次,每次发射一枚炮弹,记事件为“两次都击中飞机”,事件为“两次都没击中飞机”,事件为“恰有一次击中飞机”,事件为“至少有一次击中飞机”,则( )
A. B. C. D.
【答案】ABC
【详解】因为样本空间两次都没击中飞机,第一次击中、第二次没中,第一次没中、第二次击中,两次都击中飞机;
“恰有一次击中飞机”指第一次击中、第二次没中或第一次没中、第二次击中;
“至少有一次击中飞机”包含三种情况:第一次击中、第二次没中,第一次没中、第二次击中,两次都击中飞机.
所以,,,
所以,,故选项A,B,C正确,D不正确.
故选:ABC.
变式9-3.已知电路图如图,“开关合上”,“开关合上”.则表示的含义是 .
【答案】开关,同时合上
【详解】因为“开关合上”,“开关合上”,所以表示开关、同时合上,
故答案为:开关,同时合上.
题型十 简单古典概型的计算
例10.不透明的盒子里面装有五个分别标有数字1、2、3、4、5的乒乓球,这些球除数字外,其他完全相同,一位学生随机摸出两个球,两个球的数字之和是奇数的概率是( ).
A. B. C. D.
【答案】D
【详解】5个球中随机摸出2个球,共有:
共10种情况,
两个球的数字之和是奇数有共6种情况,
所以两个球的数字之和是奇数的概率是.
故选:D
变式10-1.一个袋子中装有形状大小完全相同的6个红球,个绿球,现采用不放回的方式从中依次随机取出2个球.若取出的2个球都是红球的概率为,则的值为( )
A.4 B.5 C.12 D.15
【答案】A
【详解】一个袋子中有若干个大小质地完全相同的球,其中有6个红球,个绿球,
从袋中不放回地依次随机取出2个球,取出的2个球都是红球的概率是,
则,
解得(负值舍去).
故选:A.
变式10-2.一个口袋中装有20个红球和若干个黑球,在不允许将球倒出来数的前提下,为估计口袋中黑球的个数,小张采用了如下的方法:每次从口袋中摸出1个球,记下球的颜色后再把球放回口袋中摇匀.不断重复上述过程900次,共摸出红球400次,根据上述数值,估计口袋中黑球的个数为( )
A.25 B.30 C.35 D.40
【答案】A
【详解】设黑球的个数为n,由古典概型的概率公式可得,解得.
故选:A.
变式10-3.从方程的所有非负整数解中随机取出一组解,则该解是正整数解的概率为 .
【答案】
【详解】因为方程的非负整数解有个,
它们是,,
,,
其中均为正整数解有个,
所以从方程的所有非负整数解中随机取出一组解,则该解是正整数解的概率为.
故答案为:.
题型十一 互斥与对立
例11.抛掷两枚质地均匀的骰子,记录朝上的点数,则下列选项的两个事件中,互斥但不对立的是( )
A.事件“点数之和为奇数”与事件“点数之积为偶数”
B.事件“点数之和为奇数”与事件“点数之积为奇数”
C.事件“点数之和不小于8”与事件“点数之和不大于7”
D.事件“点数之积不小于7”与事件“点数之积不大于8”
【答案】B
【详解】对于A,二者能同时发生,不是互斥事件,如(3,4),故A错误;
对于B,二者不能同时发生,也不能同时不发生,点数都是偶数,故B正确;
对于C,二者不能同时发生,也不能同时不发生,是对立事件,故C错误;
对于D,二者能同时发生,不是互斥事件,如(2,4),故D错误.
故选:B
变式11-1.口袋中装有编号为①、②的2个红球和编号为①、②、③、④、⑤的5个黑球,小球除颜色、编号外形状大小完全相同,现从中取出1个小球,记事件为“取到的小球的编号为②”,事件为“取到的小球是黑球”,则下列说法正确的是( )
A.与互斥 B.与对立 C. D.
【答案】C
【详解】对于AB,取到的小球为黑球且编号为②,事件与同时发生,则与不互斥,也不对立,AB错误;
对于CD,依题意,,,,则,C正确,D错误.
故选:C
变式11-2.(多选)抛掷一枚质地均匀的骰子,记事件“点数为奇数”,事件“点数为偶数”,事件“点数不大于2”,事件“点数为3的倍数”,则( )
A.和互为对立事件 B.和不互斥
C.和互斥 D.和互斥且不对立
【答案】ABD
【详解】这个试验的样本空间,
事件,,
所以和互为对立事件,和不互斥,和不互斥,和互斥且不对立.
故选:ABD
变式11-3.下列结论正确的是( )
A.若事件A与事件B互斥,则
B.若事件A与事件B互斥,则
C.若事件A与事件B对立,则
D.若事件A与事件B对立,则
【答案】C
【详解】对于A,若抛掷一枚质地均匀的色骰子出现1点记为事件A,出现2点记为事件B,
则互斥,但,故A错误;
对于B,事件A与事件B互斥,则,故B错误;
对于C,若事件A与事件B对立,则,故B正确;
对于D,若事件A与事件B对立,则,故D错误.
故选:C.
题型十二 事件独立性的判断
例12.已知是一个随机试验中的两个随机事件,若,,则( )
A.与相互独立且 B.与不相互独立且
C.与相互独立且 D.与不相互独立且
【答案】C
【详解】由题设,,
所以
所以事件与事件相互独立,
由概率的性质,有.
故选:C
变式12-1.连续抛掷一枚质地均匀的骰子2次,记录每次朝上的点数,设事件A为“第一次的点数是2”,事件B为“第二次的点数小于4”,事件C为“两次的点数之和为偶数”,则( )
A. B.A与C相互独立 C.A与C对立 D.B与C互斥
【答案】B
【详解】根据题意,连续抛掷一枚质地均匀的骰子2次,记录每次朝上的点数,
有,,
,,
,,共36个不同结果,
对于A,事件A为“第一次的点数是2”,包含6种情况,则,A错误;
对于B,事件C为“两次的点数之和为偶数”,包含18个结果,则,
事件AC,即包含3个结果,则,
则有,事件A、C相互独立,B正确.
对于C,事件A、C可以同时发生,故不互斥,于是更不对立,C错误;
对于D,事件C、B可以同时发生,不互斥,D错误;
故选:B
变式12-2.(多选)记事件中的样本点个数为.对于一个古典概型试验的样本空间和事件,已知,,,,,,,,,,,,则( )
A.与互斥 B.与互斥
C.与相互独立 D.与相互独立
【答案】BC
【详解】A选项:,,,所以,
所以与不互斥;
B选项:,,,所以,
所以与互斥;
C选项:,,,
所以,,,
所以,与相互独立;
D选项:,,,
所以,
,,,
所以,与不相互独立.
故选:BC.
变式12-3.(多选)抛掷一枚质地均匀的骰子两次,甲表示事件“第一次骰子正面向上的数字是5”,乙表示事件“两次骰子正面向上的数字之和是7”,丙表示事件“两次骰子正面向上的数字之积是12”,则下列说法正确的是( )
A.甲、乙对立 B.甲、丙互斥 C.甲、乙相互独立 D.乙、丙相互独立
【答案】BC
【详解】由题意可知,先后抛掷两枚骰子出现点数的所有可能情况为36种,
甲表示事件“第一次骰子正面向上的数字是5”记为事件A,
则,可得;
乙表示事件“两次骰子正面向上的数字之和是7” 记为事件B,
则,可得;
丙表示事件“两次骰子正面向上的数字之积是12” 记为事件C,
则,可得;
对于A:因为,可知事件甲、乙不是互斥事件,更不可能为对立事件,故A错误;
对于B:因为,即事件甲、丙不可能同时发生,所以事件甲、丙互斥,故B正确;
对于C:因为,则,即,所以甲、乙相互独立,故C正确;
对于D:因为,则,即,所以乙、丙不相互独立,故D错误;
故选:BC.
题型十三 独立事件概率的计算
例13.甲、乙两人进行轮流投篮比赛,每人每次只投一球.约定先投中者获胜,当有人投中或者每人都已投球3次时投篮结束.设甲每次投篮投中的概率为,乙每次投篮投中的概率为,且两人各次投篮互不影响.
(1)若甲先投篮,求投篮结束时,甲只投了2个球的概率;
(2)若乙先投篮,求乙获胜的概率.
【答案】(1);
(2)
【分析】
【详解】(1)设,分别表示甲、乙在第次投篮投中,
则由题意可得,,
记事件为“投篮结束时甲只投了2个球”,
则
,
即若甲先投,投篮结束时,甲只投了2个球的概率为;
(2)若由乙首次投篮,记事件为“乙获胜”,
则
,
故若乙先投篮,乙获胜的概率为.
变式13-1.甲、乙两个人独立地破译一个密码,他们能译出密码的概率分别为和,则恰有一个人译出密码的概率 .
【答案】
【详解】记“甲独立地译出密码”为事件,“乙独立地译出密码”为事件,为相互独立事件,且,,
恰有1人译出密码可以分为两类,即甲译出乙未译出和甲未译出乙译出,且两个事件为互斥事件,
所以恰有1个人译出密码的概率为.
故答案为:.
变式13-2.甲乙丙丁互相传球,每次传球由持球者等可能地传给另外三人中的一人,现从甲开始传球,则经过六次传球后球恰好首次回到甲手中的概率为 .
【答案】
【详解】由甲传出第一次球后,中途四次每次传球均传给除甲之外的其余两人之一,最后再传给甲,所以概率为.
故答案为:.
变式13-3.甲、乙、丙三人结伴去游乐园玩射击游戏,其中甲射击一次击中目标的概率为,甲、乙两人各射击一次且都击中目标的概率为,乙、丙两人各射击一次且都击中目标的概率为,已知任意两次射击互不影响.
(1)分别计算乙、丙两人各射击一次且击中目标的概率;
(2)求甲、乙、丙各射击一次且恰有一人击中目标的概率.
【答案】(1)乙、丙两人各射击一次且击中目标的概率分别为、;
(2).
【分析】
【详解】(1)由题设甲、乙、丙射击一次击中目标的概率、、,
所以,得,且,得,
乙、丙两人各射击一次且击中目标的概率分别为和;
(2)由(1)得甲、乙、丙各射击一次且恰有一人击中目标的概率为:
.
题型十四 频率与概率
例14.书架上有中文书和英文书共50本,从中随机拿一本,拿到英文书的概率为,则中文书有( )
A.40本 B.30本 C.20本 D.10本
【答案】B
【详解】书架上有中文书和英文书共50本,从中随机拿一本,拿到英文书的概率为,
则拿到中文书的概率为,
则中文书有本.
故选:B.
变式14-1.小何同学喜欢踢足球,已知他踢点球进门的概率是,一次点球训练中,他连续2次都没有踢进门,则他第3次踢进门的概率为( )
A. B. C.1 D.介于和1之间的某个实数
【答案】A
【详解】他踢点球进门的概率是,所以他第3次踢进门的概率为.
故选:A
变式14-2.为加强学生身体健康,某校对学生进行了体能测试.已知同学甲在立定跳远项目中每次及格的概率均为0.6,现采用随机模拟的方法估计甲在立定跳远项目中3次机会里至少及格2次的概率:先由计算器产生0到9范围内的整数随机数,指定0,1,2,3表示没有及格,4,5,6,7,8,9表示及格,再以每3个随机数为一组,代表3次立定跳远的结果.经随机模拟产生了如下20组随机数:
759 421 113 215 345 257 704 066 186 203
037 624 616 045 601 366 959 742 710 428
据随机模拟试验估计,甲在立定跳远项目中3次机会里至少及格2次的概率为( )
A. B. C. D.
【答案】D
【详解】依题意,在每组随机数中,至少有2个数字在4,5,6,7,8,9中,
即代表甲在立定跳远项目中3次机会里至少及格2次,
经统计,20组中一共有13组符合要求,
有:759,345,257,704,066,186,624,616,045,366,959,742,428,
故概率为.
故选:D.
变式14-3.盒子中有四个大小质地完全相同的小球,分别写有“安”、“宁”、“联”、“盟”四个字,有放回地从中任取一个小球, 将三次抽取后“联”、“盟”两个字都抽取到记为事件.用随机模拟的方法估计事件发生的概率,利用电脑随机产生整数四个随机数,分别代表“安”、“宁”、“联”、“盟”这四个字,以每三个随机数为一组,表示取球三次的结果,经随机模拟产生了以下组随机数:233,103,122,320,031,231,133,130,231,001,220,132,021,123,023,230,321,232,由此可以估计,事件发生的概率为 .
【答案】
【详解】根据题意可知“联”、“盟”两个字都抽取到,代表三个数字中同时出现数字2和3,
观察发现组随机数中有233,320,231,231,132,123,023,230,321,232,共10组,
再由古典概型公式计算可得事件发生的概率为.
故答案为:
基础巩固通关测
一、单选题
1.样本数据1,1,2,3,5,6的分位数为( )
A.1 B.2.5 C.2 D.3
【答案】C
【详解】因为,所以该组数据的分位数为2.
故选:C.
2.集合,集合,从,中各任意取一个数,构成一个两位数,则这个两位数是奇数的概率为( )
A. B. C. D.
【答案】C
【详解】组成两位数的样本空间,有11个;
样本点这个两位数是奇数的两位数为,有5个.
故所求概率为.
故选:C
3.某人打靶时连续射击三次,下列事件中与事件“至少一次中靶”互为对立的是( )
A.三次都没有中靶 B.三次都中靶 C.至多一次中靶 D.只有一次中靶
【答案】A
【详解】根据对立事件的概念,事件“至少一次中靶”的对立事件为“三次都没有中靶”.
故选:A
4.“国庆小长假”即将到来,某市举办了主题为“旅游文化周”的活动.为了了解该市关注“旅游文化周”活动的市民的年龄段分布,该市旅游局随机抽取了名年龄在且关注“旅游文化周”的市民进行调查,所得结果统计为如图所示的频率分布直方图.若按照分层抽样的方法从年龄在,的市民中抽取人进行旅游知识推广,并在知识推广后再抽取人反馈,求进行反馈的市民中至少有人的年龄在的概率是( ).
A. B. C. D.
【答案】B
【详解】依题意,被抽取的人中,有人年龄在,分别记为,,,;
有人年龄在,分别记为,,记表示抽取、两人,
则“抽取人进行反馈”包含的基本事件为,共种,
其中 “至少有人的年龄在” 的事件包含的基本事件为,共种,
所以该事件发生的概率为.
故选:B.
5.已知下面三组数据:5,5,5,5,5,5,5,5,5;3,3,4,4,5,6,6,7,7;4,4,4,5,5,5,6,6,6.它们的方差分别为,,,则( )
A. B. C. D.
【答案】B
【详解】第一组数据的平均数为5,且所有数据都为5,所以方差;
第二组数据的平均数为,
所以方差为;
第三组数据的平均数为,
所以方差为;
所以.
故选:B
6.已知某总体分为两层,第一层总体数量为,第二层总体数量为,采用分层抽样抽取样本,第一层样本平均数为;第二层样本平均数为,则该总体平均数的估计值为( )
A.5.5 B.6.0 C.6.2 D.7.0
【答案】C
【详解】因为第一层总体数量为,第二层总体数量为,第一层样本平均数为,第二层样本平均数为,
则总体平均数为:,
故选:C.
7.甲、乙、丙三人独立参加体育达标测试,已知甲、乙、丙各自通过测试的概率分别为,,,且他们是否通过测试互不影响.若三人中只有甲通过测试的概率为,则甲、丙二人中至少有一人通过测试的概率为( ).
A. B. C. D.
【答案】A
【详解】由三人中只有甲通过测试的概率为,得,解得,
所以甲、丙两人中至少有一人通过测试的概率.
故选:A
8.正多面体被古希腊圣哲认为是构成宇宙的基本元素,加上它们的多种变体,一直是科学、艺术、哲学灵感的源泉之一.如图,一个正八面体八个面分别标有数字1到8,任意抛掷一次这个正八面体,观察它与地面接触的面上的数字,得到样本空间为,记“得到的点数为奇数”为事件,记“得到的点数不大于4”为事件,记“得到的点数为质数”为事件,则下列说法正确的是( )
A.事件与互斥 B.
C.事件与相互独立 D.
【答案】B
【详解】对于A,事件B为“得到的点数不大于4”,即得到的点数为,
事件C为“得到的点数为质数”,即得到的点数为,显然得到点数为时,
事件B与事件C同时发生,所以事件与不互斥,故A错误;
对于B,事件A为“得到的点数为奇数”, 事件B为“得到的点数不大于4”,
故得到点数为,表示事件发生,即,故B正确;
对于C,由事件A为“得到的点数为奇数”,则,
事件C为“得到的点数为质数”, 则,
而得到点数为,表示事件发生,即,
此时,所以事件与事件不相互独立,故C错误;
对于D,而得到点数为,表示事件发生,即,
所以,故D错误,
故选:B.
二、多选题
9.某超市在两周内的蓝莓每日促销量如图所示,根据此折线图,下面结论正确的是( )
A.这14天日促销量的众数是214
B.这14天日促销量的中位数是196
C.这14天日促销量的极差为194
D.这14天日促销量的第80百分位数是260
【答案】AD
【详解】由折线图得14天日促销量从小到大排列为:,
对于A,这14天日促销量的众数是214,A正确;
对于B,这14天日促销量的中位数是,B错误;
对于C,这14天日促销量的极差为,C错误;
对于D,由,得这14天日促销量的第80百分位数是260,D正确.
故选:AD
10.智慧农业又称数字农业或信息农业,通过利用人工智能、机器学习、物联网等技术使农业更加智能化,推动了农业生产变革,同时也促进了高校毕业生等青年的就业.某智慧农场计划招聘一批员工,为了制定更为合理的招聘策略,统计了现有的名员工的年龄(岁)的情况,并制作了如图所示的频率分布直方图,若同一组中的数据用该组区间的中间值代表,则下列结论正确的是( )
A.
B.这名员工的年龄的众数的估计值为
C.这名员工的年龄的中位数的估计值为
D.从这名员工中任选两人,两人的年龄都在内的概率为
【答案】AC
【详解】根据频率分布直方图的性质:所有矩形的面积之和为1(即频率之和为1)。
已知组距为,则,
即,解得,选项A正确;
频率分布直方图中,众数是最高矩形对应的区间的中点值,
在频率分布直方图中,对应的矩形最高,所以众数的估计值为,选项B错误;
设中位数为,中位数左边和右边的频率分布直方图的面积相等,都为,
前两个矩形的面积和为,
对应的矩形面积为,
因为,所以中位数在内,
则,,
解得:,所以这名员工的年龄的中位数的估计值为,选项C正确;
年龄在内的频率为,则人数为人,
从名员工中任选两人,两人的年龄都在内的概率为,选项D错误.
故选:AC.
三、填空题
11.一个袋子中有3个红球、4个白球、3个绿球.若随机地摸出一个球,设事件“摸出红球”,事件“摸出白球”,事件“摸出绿球”,则 .
【答案】/0.7
【详解】袋子里共有个球.
事件A:摸出红球,
事件B:摸出白球,
因为摸出一个球不可能既是红球又是白球,所以事件A与B互斥,
于是
故答案为:
12.某中学举行数学解题比赛,其中6人的比赛成绩分别为:,则这6人成绩的分位数与极差之和是 .
【答案】
【详解】将6个数据从小到大排列为,
因为,所以这6人成绩的分位数是,
极差为,
所以分位数与极差之和是.
故答案为:.
13.临平是生态宜居的福地,地处杭嘉湖平原,大运河、上塘河沿境流淌,临平区一望平畴、塘漾棋布,是典型的江南水乡、鱼米之乡,是文学大师丰子恺笔下的“江南佳丽地”,境内拥有江南三大赏梅胜地之一超山、塘栖古镇、艺尚小镇等风景名胜和人文景观,现有甲、乙两个同学准备周末分赴这三个景点打卡,已知每人都只去1个景点,且甲、乙两个同学前往三地打卡的概率分别是,,和,,,则甲、乙打卡不相同景点的概率为 .
【答案】
【详解】设三个景点分别为、、,
则甲前往、、的概率分别为,,,
乙前往、、的概率分别为,,,
甲、乙都打卡景点的概率为,
甲、乙都打卡景点的概率为,
甲、乙都打卡景点的概率:,
所以甲、乙打卡相同景点的概率为,则甲、乙打卡不相同景点的概率为.
故答案为:.
四、解答题
14.衡阳县第一中学为预备2026年的全国高中数学联赛预赛,在该校先选取了前60名的学生(含60名),进行选拔,随后根据分数线选取参赛选手,该60名学生的成绩的频率分布直方图如下,数据的分组依次是(本场选拔总分为100分).
(1)估计该一中学生选拔成绩的平均值(提示:同一组中的数据用该组区间的中点值为代表)
(2)这次选拔测试成绩的第60百分位数可估计为?
(3)若学校定75分为标准选拔分数线,则参赛人数大约为?
【答案】(1)
(2)75
(3)24
【分析】
【详解】(1)由图可估计选拔成绩的平均值为,
(2)成绩位于的频率为,
成绩位于的频率为,
因此第60百分位数位于,设为,
则,故,
(3)由(2)可知75分为第60百分位数,故能参赛的人约有个.
15.某校组织答题闯关活动,每位选手必须答4道题,第1,2题各10分,第3,4题各20分,每题答对得到对应的分值,答错得0分.甲参加该活动,已知甲每题答对的概率均为,且每道题能否答对相互独立.
(1)求甲得60分的概率;
(2)求甲得20分的概率;
(3)若得分不低于40分为“闯关成功”,求甲闯关成功的概率.
【答案】(1)
(2)
(3)
【分析】
【详解】(1)甲得60分,即他每题都答对,所以概率为;
(2)甲得20分有3种情况:①答对第1,2题,答错第3,4题;②答对第3题,答错第1,2,4题;
③答对第4题,答错第1,2,3题,
所以概率为;
(3)甲得40分有以下3种情况:①答对第1,2,3题,答错第4题;②答对第1,2,4题,答错第3题;③答对第3,4题,答错第1,2题;
甲得50分有以下2种情况:①答对第1,3,4题,答错第2题;②答对第2,3,4题,答错第1题;
甲得60分只有1种情况,即他每题都答对,
故甲闯关成功的概率为.
16.为增强市民的环境保护意识,某市面向全市征召若干名宣传志愿者,成立环境保护宣传小组,现把该小组成员按年龄分成,,,,这5组,得到频率分布直方图如图所示,已知年龄在内的人数为5.
(1)根据频率分布直方图,求该小组成员年龄的众数及第60百分位数.
(2)若用分层抽样的方法从年龄在,,内的志愿者中按比例抽取6名参加某社区的宣传活动,再从这6名志愿者中随机抽取2名志愿者做环境保护知识宣讲,写出试验的样本空间,并求这2名环境保护知识宣讲志愿者中至少有1名年龄在内的概率.
【答案】(1)众数为;第60百分位数约为;
(2)样本空间为;概率为.
【分析】
【详解】(1)由频率分布直方图,可知该小组成员年龄的众数为;
因,
则该小组成员年龄的第60百分位数在这一组内,即.
(2)由频率分布直方图可得,年龄在,,内的志愿者所占的频率分别为,
从中按比例抽取6名参加某社区的宣传活动,则分别从这三个小组中抽取的人数分别为,
设在内的3名志愿者为;在内的2名志愿者为,在内的1名志愿者为,
则从这6名志愿者中随机抽取2名志愿者做环境保护知识宣讲,
试验的样本空间为,则,
事件“这2名环境保护知识宣讲志愿者中至少有1名年龄在内”包含的样本点有:
共9个,
故这2名环境保护知识宣讲志愿者中至少有1名年龄在内的概率为.
能力提升进阶练
1.某商场推出抽奖活动,在甲抽奖箱中有四张有奖奖票,六张无奖奖票;乙抽奖箱中有三张有奖奖票,七张无奖奖票.每人能在甲乙两箱中各抽一次,以表示“在甲抽奖箱中抽奖中奖的事件”,表示“在乙抽奖箱中抽奖中奖的事件”,表示“两次抽奖均未中奖的事件”,下列结论中不正确的是( )
A.
B.与相互独立
C.
D.与互斥
【答案】D
【详解】由题意可知:,,,,
因为在甲抽奖箱抽奖和在乙抽奖箱抽奖互不影响,可知事件A和事件B相互独立,故B正确,D错误;
可得,故A正确;
又因为,
所以,故C正确;
故选:D.
2.(多选)一个质地均匀的正八面体,八个面分别标以数字1到8,任意抛掷一次这个正八面体,观察它与地面接触的面上的数字,得到样本空间为,记事件“得到的点数不大于4”,记事件“得到的点数为偶数”,记事件“得到的点数为质数”,则下列说法正确的是( )
A. B.事件与互斥
C.两两独立 D.
【答案】ABD
【详解】由题意:事件的样本点为:,事件的样本点为,事件的样本点为.
所以的样本点为:,所以,故A正确;
因为的样本点为:,所以的样本点为,又的样本点为,所以事件与互斥,故B正确;
因为的样本点为,所以,,.
因为,所以事件,不相互独立,故C错误;
因为,的样本点为,所以,又,所以,故D正确.
故选:ABD
3.(多选)某中学九年级在体能测试后,为分析学生的跳绳成绩,随机抽取了名学生的分钟跳绳的次数,将所得数据整理后,分为组画出如图频率分布直方图.为进一步分析学生的成绩分布情况,经计算得到这名学生中,跳绳次数位于的学生跳绳次数的方差为,跳绳次数位于的学生跳绳次数的方差为.(同一组中的数据以这组数据所在区间的中点值为代表)则下列正确的是( )
A.
B.估计该年级学生跳绳次数的分位数约为
C.估计该年级学生跳绳次数在次及以上的学生跳绳次数的平均数为
D.估计该年级学生跳绳次数在次及以上的学生跳绳次数的方差为
【答案】BD
【分析】
【详解】对于A,由频率分布直方图中各长方形面积和为,得,解得,故A错误;
对于B,根据百分位数的计算,假设该年级学生跳绳次数的分位数为,则,又,所以解得,故B正确;
对于C,该年级学生跳绳次数在次及以上的学生跳绳次数的平均数为,故C错误;
对于D,该年级学生跳绳次数在次及以上的学生跳绳次数的方差为,故D正确.
故选:BD.
4.新高考模式下,学生是否选择物理作为高考考试科目对大学专业选择有着非常重要的意义.合肥六中为了解高一年级1800名学生物理科目的学习情况,将他们某次物理测试成绩(满分100分)按照分成6组,制成如图所示的频率分布直方图.
(1)求1800名学生中物理测试成绩在内的频数并补全频率分布直方图.
(2)学校建议,本次物理测试成绩不低于分的学生选择物理为高考考试科目,若学校希望高一年级恰有的学生选择物理为高考考试科目,试求的估计值(结果精确到).
(3)已知落在的学生成绩的平均数为,方差,落在的学生成绩的平均数为,方差,若两组学生成绩的平均数之差不大于6,求落在的学生成绩的方差的最大值.
【答案】(1)图见解析
(2)
(3)
【分析】
【详解】(1)由频率分布直方图可得物理测试成绩在的频率为
,
频数为,
所以1800名学生中物理测试成绩在内的频数为270,补全频率分布直方图如图所示.
(2)易得前两段频率之和为,前三段频率之和,
则有
满足,所以(分)
(3)成绩在的频数为270人,,
成绩在的频数为540人,,
所以的学生成绩的平均值为,
由方差公式知,,
所以该班成绩的方差为:
所以的最大值为.
5.甲、乙两人进行象棋比赛,已知每局比赛甲获胜的概率为,乙获胜的概率为,且各局比赛的胜负互不影响.有两种比赛方案供选择,方案一:三局两胜制(先胜2局者获胜,比赛结束);方案二:五局三胜制(先胜3局者获胜,比赛结束).
(1)用抛掷骰子的方式决定比赛方案,抛掷两枚质地均匀的骰子,观察两枚骰子向上的点数,若两枚骰子向上的点数之差的绝对值不大于1,则选择方案一,否则选择方案二.试判断哪种方案被选择的可能性更大,并说明理由;
(2)若选择方案一,求甲获胜的概率.
【答案】(1)方案二被选择的可能性更大,理由见解析
(2)
【分析】
【详解】(1)抛掷两枚质地均匀的骰子,设向上的点数为,则共有36种情况,如下:
,
,
其中两枚骰子向上的点数之差的绝对值不大于1的情况有:
,共16种情况,
故选择方案一的概率为,则选择方案二的概率为,故方案二被选择的可能性更大.
(2)若选择方案一,甲获胜包括三类情况:①甲在前两局获胜,其概率为:;
②甲在第一局,第三局获胜,其概率为:;③甲在第二局,第三局获胜,其概率为:,
因三类情况两两互斥,故选择方案一,甲获胜的概率为:.
1/3
学科网(北京)股份有限公司
$