内容正文:
专题05 概率与统计
知识点 1:简单随机抽样
1、简单随机抽样
(1)放回简单随机抽样:一般地,设一个总体含有(为正整数)个个体,从中逐个抽取()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样.
(2)不放回简单随机抽样:如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.
2、抽签法
(1)定义:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个样本容量为n的样本.
(2)抽签法的操作步骤:
第一步,编号:将个个体编号(号码可以从1到,也可以使用已有的号码).
第二步,写签:将个号码写到大小、形状相同的号签上.
第三步,抽签:将号签搅拌均匀,每次从中抽取一个号签,连续不放回地抽取次,并记录其编号.
第四部,定样:从总体中找出与号签上的号码对应的个体,组成样本.
3、随机数法
(1)定义:利用随机试验或信息技术(即计算器、电子表格软件和R统计软件)生成的随机数进行抽样.
(2)随机数表法步骤:
①把总体中的每个个体编号.
②用随机数工具产生编号范围内的整数随机数.
③把产生的随机数作为抽中的编号,使与编号对应的个体进入样本。重复上述过程,知道抽足样本所需要的数量.
知识点2:分层随机抽样
1、分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
2、比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
3、分层随机抽样的步骤
(1)分层:按某种特征将总体分成若干部分(层);
(2)计算抽样比:抽样比;
(3)定数:按抽样比确定每层抽取的个体数;
(4)抽样:每层分贝按简单随机抽样的方法抽取样本
(5)成样:综合各层抽样,组成样本.
4、分层随机抽样的相关计算关系:
(1)=;
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
(3)样本的平均数和各层的样本平均数的关系为:=+=+..
知识点3:用样本估计总体
1、频率分布直方图
(1)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图.
(2)频率分布直方图的特点:
①,
②所有小长方形的面积和等于1,
③.
2、总体百分位数的估计
(1)第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3、总体集中趋势的估计
(1)众数:在样本数据中,出现次数最多的那个数据;
(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,
若样本数据个数为偶数,则取中间两个数据的平均数作为中位数.
(3)平均数:设样本的数据为,则样本的算术平均数为;
4、总体离散程度的估计
用样本的标准差估计总体的标准差
(1)数据的离散程度可以用极差、方差或标准差来描述;
(2)极差(又叫全距)是一组数据的最大值和最小值之差,反映一组数据的变动幅度;
(3)样本方差描述了一组数据围绕平均数波动的大小;
一般地,设样本的数据为,样本的平均数为,
定义样本方差为;
简化公式:
(方差等于原数据平方的平均数减去平均数的平方)
(4)样本的标准差是方差的算术平方根.
样本标准差.
标准差越大数据离散程度越大,数据越分散;标准差越小,数据集中在平均数周围.
知识点4:随机事件与概率
1、有限样本空间与随机事件
(1)有限样本空间:我们把随机试验E的每个可能的基本结果称为样本点,用ω表示样本点;全体样本点的集合称为试验E的样本空间,用Ω表示样本空间;如果一个随机试验有n个可能结果ω1,ω2,…,ωn,则称样本空间Ω={ω1,ω2,…,ωn}为有限样本空间,Ω={ω1,ω2,…,ωn}
(2)随机事件:我们将样本空间Ω的子集称为随机事件,简称事件,并把只包含一个样本点的事件称为基本事件.随机事件一般用大写字母A,B,C,…表示.在每次试验中,当且仅当A中某个样本点出现时,称为事件A发生;Ω作为自身的子集,包含了所有的样本点,在每次试验中总有一个样本点发生,所以Ω总会发生,我们称Ω为必然事件;空集∅不包含任何样本点,在每次试验中都不会发生,我们称∅为不可能事件。
2、事件的关系和运算
(1)互斥(互不相容):一般地,如果事件A与事件B不能同时发生,也就是说A∩B是一个不可能事件,即A∩B=∅,则称事件A与事件B互斥(或互不相容)
(2)互为对立:一般地,如果事件A与事件B在任何一次试验中有且仅有一个发生,
即A∪B=Ω,且A∩B=∅,那么称事件A与事件B互为对立.事件A的对立事件记为
(3)包含关系:一般地,若事件A发生,则事件B一定发生,我们就称事件B包含事件A
(或事件A包含于事件B),即B ⊇A(或A⊆B).
特殊情形:如果事件B包含事件A,事件A也包含事件B,即B⊇A且A⊆B,则称事件A与事件B相等,记作A=B.
(4)并事件(和事件):一般地,事件A与事件B至少有一个发生,这样的事件中的样本点或者在事件A中,或者在事件B中,则称这个事件为事件A与事件B的并事件(或和事件) A∪B(或A+B)
(5)交事件(积事件):一般地,事件A与事件B同时发生,这样的一个事件中的样本点既在事件A中,也在事件B中,则称这样的事件为事件A与事件B的交事件(或积事件) A∩B(或AB)
4、古典概型与概率的基本性质
(1)古典概型的定义:我们将具有以下两个特征的试验称为古典概型试验,其数学模型称为古典概率模型,简称古典概型.
有限性:样本空间的样本点只有有限个;等可能性:每个样本点发生的可能性相等.
(2)古典概型的概率计算公式:一般地,设试验E是古典概型,样本空间Ω包含n个样本点,事件A包含其中k个样本点,则定义事件A的概率P(A)==,其中n(A)和n(Ω)分别表示事件A和样本空间Ω包含的样本点个数.
(3)概率的基本性质
性质1:对任意的事件A,都有P(A)≥0.
性质2:必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P(∅)=0.
性质3:如果事件A与事件B互斥,那么P(A∪B)=P(A)+P(B).
性质4:如果事件A与事件B互为对立事件,那么P(B)=1-P(A),P(A)=1-P(B).
性质5:如果A⊆B,那么P(A) ≤P(B).
性质6:设A,B是一个随机试验中的两个事件,我们有P(A∪B)= P(A)+P(B)-P(A∩B).
知识点5:事件的相互独立性
1、相互独立事件的:对任意两个事件A与B,如果成立,则称事件A与事件B相互独立,简称为独立.
2、性质及推广:
如果事件A与事件B相互独立,则与,与,与也都相互独立.
两个事件的相互独立可以推广到个事件的相互独立性,即若事件相互独立,则这个事件同时发生的概率.
3、相互独立事件的概率计算公式
已知两个事件A,B相互独立,它们的概率分别为P(A),P(B),则有
事件
表示
概率
A,B同时发生
P(A)P(B)
A,B都不发生
A,B恰有一个发生
A,B中至少有一个发生
A,B中至多有一个发生
知识点6:频率与概率
1、频率的稳定性:大量的试验证明,在任何确定次数的随机试验中,一个随机事件A发生的频率具有随机性.一般地,随着试验次数n的增大,频率偏离概率的幅度会缩小,即事件A发生的频率fn(A)会逐渐稳定于事件A发生的概率P(A),我们称频率的这个性质为频率的稳定性.因此我们可以用频率fn(A)估计概率P(A).
2、频率的求法:频率是事件A发生的次数m与试验总次数n的比值,利用此公式可求出它们的频率,
频率本身是随机变量,当n很大时,频率总是在一个稳定值附近摆动,这个稳定值是概率.
3、频率和概率区别和联系
区别:(1)在相同的条件下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数nA为事件A出现的频数,称事件A出现的比例fn(A)=为事件A出现的频率.
(2)概率是度量随机事件发生的可能性大小的量
(3)频率是一个变量,随着试验次数的变化而变化,概率是一个定值,是某事件的固有属性.
联系:对于给定的随机事件A,由于事件A发生的频率fn(A)随着试验次数的增加稳定于概率P(A),因此可以用频率fn(A)来估计概率P(A).
题型归纳
【题型1 两种随机抽样的判断】
满分技法
1、简单随机抽样:从总体中随机选择样本,每个样本被选中的概率是相同的。每个单位被选中的机会是均等的,抽样过程不涉及对总体的分组,适用于总体相对均匀的情况。
2、分层随机抽样:首先将总体分成不同的层或组,这些层在某些特征上是同质的,然后在每一层内进行简单随机抽样。总体被分成多个层,每层内部具有相似的特征。每一层的样本大小可以相同,也可以根据层的大小或重要性进行调整。可以提高样本的代表性。
1.(23-24高一下·江苏无锡·月考)在简单随机抽样中,下列关于其中一个个体被抽中的可能性说法正确的是( )
A.与第几次抽样有关,第一次抽到的可能性更大一些
B.与第几次抽样有关,最后一次抽到的可能性更大一些
C.与第几次抽样无关,每次抽到的可能性都相等
D.与第几次抽样有关,第一次抽到的可能性更小一些
【答案】C
【解析】在简单随机抽样中,每个个体每次被抽中的可能性都相等,
与第几次抽样无关,A,B,D错误,C正确.故选:C
2.(23-24高一下·全国·专题练习)为了保证采用分层随机抽样方法时每个个体被等可能地抽取,必须要求( )
A.每层等可能抽取
B.每层抽取的个体数相等
C.每层抽取的比例为(其中n为抽取的样本容量,N是总体容量)
D.只要抽取的样本容量一定,每层抽取的个体数没有限制
【答案】C
【解析】分层随机抽样时,在各层中按层中所含个体在总体中所占的比例进行抽样,
A中,虽然每层等可能地抽样,但是没有指明各层中应抽取几个个体,故A不正确;
B中,由于每层的个体数不一定相等,每层抽取同样多的个体数,
显然从总体来看,各层的个体被抽取的可能性就不相等了,因此B也不正确;
C中,按照这个比例抽取,对于每个个体来说,被抽取为样本的可能性是相同的,故C正确;
D显然不正确.故选:C.
3.(23-24高一下·全国·专题练习)①一次数学考试中,某班有12人的成绩在100分以上,30人的成绩在90~100分,12人的成绩低于90分,现从中抽取9人了解有关考试题目难度的情况;②运动会的工作人员为参加4×100 m接力赛的6支队伍安排跑道.针对这两件事,恰当的抽样方法分别为( )
A.分层随机抽样,简单随机抽样
B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层随机抽样
D.分层随机抽样,分层随机抽样
【答案】A
【解析】①中,考试成绩在不同分数段之间的同学有明显的差异,用分层随机抽样比较恰当;
②中,总体包含的个体较少,用简单随机抽样比较恰当.故选:A
4.(2023·湖南岳阳·模拟预测)现有以下两项调查:①从40台刚出厂的大型挖掘机中抽取4台进行质量检测;②在某校800名学生中,型、型、B型和型血的学生依次有人.为了研究血型与色弱的关系,需从中抽取一个容量为40的样本.完成这两项调查最适宜采用的抽样方法分别是( )
A.①②都采用简单随机抽样
B.①②都采用分层随机抽样
C.①采用简单随机抽样,②采用分层随机抽样
D.①采用分层随机抽样,②采用简单随机抽样
【答案】C
【解析】由题意对于①,40台刚出厂的大型挖掘机被抽取的可能性一样,故为简单随机抽样,
对于②,为了研究血型与色弱的关系,
说明某校800名学生被抽取的可能性要按照血型比例分层抽取,故为分层随机抽样.故选:C.
【题型2 随机数表法的应用】
满分技法
应用随机数表法的两个关键点:
1、确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;
2、读数时注意结合编号特点进行读取.若编号为两位数字,则两位两位地读取;若编号为三位数字,则三位三位地读取,有超过总体号码或出现重复号码的数字舍去,这样继续下去,直到获取整个样本.
5.(23-24高一下·江苏连云港·期末)总体编号为01,02,…,29,30的30个个体组成.利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为( )
7816 1572 0802 6315 0216 4319 9714 0198
3204 9234 4936 8200 3623 4869 6938 7181
A.02 B.14 C.15 D.16
【答案】B
【解析】选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,
则选出来的个体的编号为16,15,72(舍去),08,02,63(舍去),15(舍去),
02(舍去),16(舍去),43(舍去),19,97(舍去),14.
故选出的第6个个体编号为14.故选:B.
6.(23-24高一下·云南玉溪·月考)某工厂用简单随机抽样中的随机数法对生产的700个零件进行抽样,先将700个零件进行编号,.从中抽取70个样本,下图是利用软件生成的随机数,只需随机选定一个初始位置和方向开始读数,每次读取一个3位数,只要读取的号码落在编号范围内,该号码就是所抽到的样本编号,这样即可获得70个样本的编号,注意样本号码不能重复.若从表中第2行第6列的数2开始向右读取数据,取到的第一个样本编号是253,则得到的第6个样本编号是( )
A.007 B.328 C.253 D.623
【答案】D
【解析】依题意可得抽取的样本编号依次为:,,,,,,,
所以第个样本编号是.故选:D
7.(23-24高一下·江苏常州·月考)现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为 .
95226000 49840128 66175168 39682927 43772366 27096623
92580956 43890890 06482834 59741458 29778149 64608925
【答案】14
【解析】由题意可知,第一支为01,以后依次为17,09,08,06,14,
所以第6支水笔的编号为14.故答案为:14
8.(23-24高一下·河北邢台·月考)要考查某种品牌的850颗种子的发芽率,从中抽取50颗种子进行实验,利用随机数表法抽取种子,先将850颗种子按001,002,…,850进行编号,如果从随机数表第2行第2列的数开始并向右读,下列选项中属于最先检验的4颗种子依次是 .
(下面抽取了随机数表第1行至第3行)
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95
97 74 94 67 74 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73
16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10
【答案】774,428,114,572
【解析】依据题意可知:向右读数依次为:774,946,774,428,114,572,042,533,,
所以最先检验的4颗种子符合条件的为:774,428,114,572.
故答案为:774,428,114,572.
【题型3 分层抽样的相关计算】
满分技法
解决分层抽样的两个常用公式
先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取的个体数.
(1)抽样比==;
(2)层1的容量∶层2的容量∶层3的容量=样本中层1的容量∶样本中层2的容量∶样本中层3的容量.
9.(23-24高一下·河北·期末)某公司共有940名员工,其中女员工有400人.为了解他们的视力状况,用分层随机抽样(按男员工、女员工进行分层)的方法从中抽取一个容量为47的样本,则男员工的样本量为( )
A.21 B.24 C.27 D.30
【答案】C
【解析】设男员工的样本量为,由分层随机抽样的定义可得,解得.故选:C.
10.(23-24高一下·湖南永州·期末)在杭州亚运会期间,共有1.8万多名赛会志愿者参与服务,据统计某高校共有本科生4400人,硕士生400人,博士生200人参与志愿者服务.现用分层抽样的方法从该高校志愿者中抽取部分学生了解服务心得,其中博士生抽取了10人,则本科生抽取的人数为( )
A.250 B.220 C.30 D.20
【答案】B
【解析】设本科生抽取的人数为人,由分层抽样每层中抽取样本比例相同,
可得,解得.故选:.
11.(23-24高一下·全国·月考)某高中的三个年级共有学生2000人,其中高一600人,高二600人,高三800人,该校现在要了解学生对校本课程的看法,准备从全校学生中抽取80人进行访谈,若采取按比例分配的分层抽样,且按年级来分层,则高一年级应抽取的人数是( )
A.24 B.26 C.30 D.36
【答案】A
【解析】依题意高一年级应抽取的人数为人.故选:A
12.(22-23高一下·山东聊城·期末)某校高一年级有女生504人,男生596人.学校想通过抽样的方法估计高一年级全体学生的平均体重,从高一女生和男生中随机抽取50人和60人,经计算这50个女生的平均体重为,60个男生的平均体重为,依据以上条件,估计该校高一年级全体学生的平均体重最合理的计算方法为( )
A. B.
C. D.
【答案】D
【解析】高一年级有女生504人,男生596人.总人数为,
从高一女生和男生中随机抽取50人和60人,没有按照比例分配的方式进行抽样,
不能直接用样本平均数估计总体平均数,
需要按照女生和男生在总人数中的比例计算总体的平均体重,
即,即D选项最合理.故选:D
【题型4 几种常见统计图表的应用】
满分技法
1、条形图:一般与小长方形的宽无关,主要是高的值;要注意条形图横、纵坐标的含义;复合条形图是不同数据在同一条形图中反映,对相同横坐标含义进行对比,准确确定彼此间的差异;
2、折线图:可以观察点的个数,从而得到数据的数量,同时直观得出数据变化趋势以及变化幅度的大小,也可得到所有数据中的最大值与最小值,因而容易得到所要解决的问题数值,如果不同的折线图反映在同一坐标系中,可以已通过比较观察期波动程度大小,并进行优劣判断;
3、扇形图:需要运用各个圆心角或弧长得百分比,同时可清楚得到各部分与总体检的关系,用百分比×总体个体数,估算某含义的个体数.
13.(23-24高二下·浙江绍兴·学业考试)下图为某同学两次月考成绩占总成绩百分数的扇形统计图,已知该同学第一次月考总分低于第二次月考总分,则( )
A.该同学数学学科成绩一定下降 B.该同学政治学科成绩一定下降
C.该同学化学学科成绩可能下降 D.该同学语文学科成绩一定提升
【答案】D
【解析】对于A:第一次月考数学成绩占,第二次月考数学成绩占,
且第一次月考总分低于第二次月考总分,
所以第二次月考数学成绩比第一次数学成绩要高,故A错误;
对于B:第一次月考政治成绩占,第二次月考政治成绩占,
由于只知道第一次月考总分低于第二次月考总分,
故无法判断这两次月考政治学科成绩的变化,故B错误;
对于C:第一次月考化学成绩占,第二次月考化学成绩占,
且第一次月考总分低于第二次月考总分,
所以第二次月考化学成绩比第一次化学成绩要高,故C错误;
对于D:第一次月考语文成绩占,第二次月考语文成绩占,
且第一次月考总分低于第二次月考总分,
所以第二次月考语文成绩比第一次语文成绩要高,故D正确.故选:D
14.(23-24高一下·吉林通化·月考)2024年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩在前200名的学生中,高一人数比高二人数多30
B.成绩在第1~50名的学生中,高三最多有32人
C.高一学生成绩在第101~150名的人数一定比高三学生成绩在第1~50名的人数多
D.成绩在第51~100名的学生中,高二人数比高一人数多
【答案】D
【解析】由饼状图可知,成绩在前200名的学生中,高一人数比高二人数多,A正确;
成绩在第名的学生中,高一人数为,因此高三最多有32人,B正确;
由条形图知高一学生的成绩在第名的人数为,
而高三的学生成绩在第名的人数最多为人,
故高一学生的成绩在第名的人数一定比高三的学生成绩在第名的人数多,C正确;
成绩在第名的学生中,高一人数为,
高二成绩在第名的人数最多为,
即成绩在第51~100名的学生中,高一的人数一定比高二的人数多,D错误.故选:D.
15.(23-24高一下·四川·期末)(多选)某校为更好地支持学生的个性化发展,开设了学科拓展类、创新素质类、兴趣爱好类三种类型的校本课程,每位学生从中选择一门课程学习.现对该校4000名学生的选课情况进行了统计,如图①,并用分层抽样的方法从中抽取的学生对其所选课程进行了满意率调查,如图②.下列说法正确的是( )
A.抽取的样本容量为4000
B.该校学生中对兴趣爱好类课程满意的人数约为700
C.若抽取的学生中对创新素质类课程满意的人数为24,则
D.该校学生中选择学科拓展类课程的人数为1000
【答案】BD
【解析】对于A,抽取的样本容量为,故A错误;
对于B,该校学生中对兴趣爱好类课程满意的人数约为人,故B正确;
对于C,抽取的学生中对创新素质类课程满意的人数为,
则,解得,故C错误;
对于D,由扇形统计图知该校学生中选择学科拓展类课程的频率为,
则该校学生中选择学科拓展类课程的人数为人,故D正确;故选:BD.
16.(23-24高一下·湖南·月考)如图为近一年我国商品零售总额和餐饮收入总额同比增速情况折线图,根据该图,下列结论正确的是( )
(注:同比,指当前的数据与上一年同期进行比对;环比,指当前数据与上个月的数据进行比对.)
A.23-24年月份,商品零售总额同比增长
B.2023年月份,餐饮收入总额同比都降低
C.2023年月份,商品零售总额同比都增加
D.2023年12月,餐饮收入总额环比增速为
【答案】C
【解析】对于A,23-24年月份,商品零售总额同比增长,故A错误;
对于B,2023年8月份,餐饮收入总额同比增加,故B错误;
对于C,2023年月份,商品零售总额同比都增加,故C正确;
对于D,2023年12月,餐饮收入总额环比增速并未告知,故D错误.故选:C
【题型5 频率分布直方图及其应用】
满分技法
1、由频率分布直方图进行相关计算需掌握的2个关系式
(1)×组距=频率.
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
2、利用频率分布直方图估计样本的数字特征的方法
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.
(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.
(3)众数:最高的矩形的中点的横坐标.
17.(23-24高一下·海南·期中)如图是某校高一年级1000名男生体检时身高的频率分布直方图,现用分层随机抽样的方法从身高在160~175cm的男生中抽取130名,则抽取到的身高在165~170cm的人数为( )
A.20 B.30 C.40 D.50
【答案】C
【解析】由频率分布直方图可知,高一年级身高在160~175cm的人数有,
高一年级身高在165~170cm的人数,
设抽取到的身高在165~170cm的人数为,则,解得,故选:C
18.(23-24高一下·山西大同·期末)某部门为了了解一批树苗的生长情况,在4000棵树苗中随机抽取400棵,统计这400棵树苗的高度(单位:),将所得数据分成7组:,,,,,,,并绘制了如图所示的频率分布直方图,那么根据该图可推测,在这4000棵树苗中高度小于的树苗棵数约是( )
A.1680 B.1760 C.1840 D.1920
【答案】B
【解析】由频率分布直方图可得,小于的树苗的频率,
所以可推测,4000棵树苗中高度小于的树苗棵数约为.故选:B.
19.(23-24高一下·湖北武汉·期末)(多选)供电部门对某社区100位居民6月份人均用电情况进行统计后,按人均用电量分为,,,,五组,整理得到如图所示的频率分布直方图,则有关这100位居民,下列说法正确的是( )
A.6月份人均用电量人数最多的一组有40人
B.6月份人均用电量在内的有30人
C.6月份人均用电量不低于20度的有50人
D.在这100位居民中用比例分配的分层随机抽样方法抽取10位居民协助收费,抽到的居民用电量在一组的人数为3
【答案】ACD
【解析】A:根据频率分布直方图知,6月份人均用电量人数最多的一组是,
有(人),故A正确;
B:6月份人均用电量在内的人数为,故B错误;
C:6月份人均用电量不低于20度的频率是,
有(人),故C正确;
D:用电量在内的有(人),
所以在这位居民中用比例分配的分层随机抽样方法抽取10位居民协助收费,
抽到的居民用电量在一组的人数为,故D正确.故选:ACD
20.(22-23高一下·吉林长春·月考)某城市户居民的月平均用电量单位:度,以,,,分组的频率分布直方图如图.
(1)求直方图中的值;
(2)在这户居民中,月平均用电量不低于度的有多少户?
(3)在月平均用电量为,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?
【答案】(1);(2)55;(3).
【解析】(1)由频率分布直方图,得,
解得,所以直方图中x的值是.
(2)月平均用电量为的用户有户,
月平均用电量为的用户有户,
月平均用电量为的用户有户,
月平均用电量为的用户有户,
所以月平均用电量不低于度的有户.
(3)由(2)可知,抽取比例为,
所以月平均用电量在的用户中应抽取户.
【题型6 平均数与方差的和差倍分】
满分技法
1、平均数的相关结论
①如果两组数和的平均数分别是和,则一组数的平均数是.
②如果一组数的平均数为,则一组数的平均数为.
③如果一组数的平均数为,则一组数的平均数为.
2、方差的相关结论
①如果一组数的方差为,则一组数的方差为;
②如果一组数的方差为,则一组数的方差为.
21.(23-24高一下·山东聊城·月考)已知数据的平均数为,则数据的平均数为 .
【答案】
【解析】由于的平均数为=5,
所以的平均数为.
故答案为:
22.(23-24高一下·河南·月考)已知样本数据的平均数为,样本数据的平均数为,若样本数据的平均数为,则( )
A.12 B.10 C.2 D.11
【答案】B
【解析】根据题意可得,解得.故选:B.
23.(23-24高一下·江苏南京·期末)已知数据的平均数为10,方差为5,数据的平均数为,方差为,则( )
A. =10,=14 B. =9,=44
C. =29,=45 D. =29,=44
【答案】C
【解析】原来数据平均值为,方差为
则,
方差为
.故选:C.
24.(23-24高一下·山西忻州·月考)有一组样本数据(其中是最小值,是最大值)的平均数为,方差为,中位数为,则( )
A.的平均数为
B.的方差为
C.的中位数为
D.的极差为
【答案】C
【解析】对于A中,根据平均数的性质,可得的平均数为,所以A错误;
对于B中,根据方差的性质,可得的方差为,所以B错误;
对于C中,根据中位数的定义和计算方法,可得的中位数为,
所以C正确;
对于D中,根据极差的计算方法,可得的极差为,
所以D错误.故选:C.
【题型7 百分位数的计算】
满分技法
计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
25.(23-24高一下·天津南开·期末)某校高三数学备课组老师的年龄(单位:岁)分别为:37,30,42,32,41,46,45,48,35,53,则这组数据的第60百分位数为( )
A.45 B.42 C.43.5 D.45.5
【答案】C
【解析】10名老师的年龄从小到大排列为:30,32,35,37,41,42,45,46,48,53,
由,所以这组数据的第60百分位数为.故选:C
26.(23-24高一下·河北廊坊·期末)一组数据:5,1,3,5,2,2,2,3,1,2,则这组数据的分位数是( )
A.3 B.4 C.4.5 D.5
【答案】D
【解析】将数据从小到大排序为1,1,2,2,2,2,3,3,5,5,
因为不是整数,故取第9个数,第9个数为5,
故这组数据的第85百分位数为5.故选:D.
27.(23-24高一下·河南·期末)样本数据14,16,18,20,21,22,24,28的第三四分位数为( )
A.16 B.17 C.23 D.24
【答案】C
【解析】这组数据一共有个数据,从小往大排列为14,16,18,20,21,22,24,28,
因为,这组数据的第三四分位数是从小往大排列的第个和第个数据的平均数,
即.故选:C.
28.(23-24高一下·河北·期末)若一组数据3,4,6,,8,3,7,9的第40百分位数为6,则正整数的最小值为 .
【答案】6
【解析】剔除,将剩余7个数按照从小到大的顺序排列为3,3,4,6,7,8,9,
因为,且数据3,4,6,m,8,3,7,9的第40百分位数为6,所以.
故整数的最小值为6,故答案为:6
【题型8 判断互斥与对立事件】
满分技法
判断互斥与对立事件的两种方法:
(1)定义法:判断互斥事件、对立事件一般用定义判断,不可能同时发生的两个事件为互斥事件;两个事件,若有且仅有一个发生,则这两事件为对立事件,对立事件一定是互斥事件.
(2)集合法:①由各个事件所含的结果组成的集合彼此的交集为空集,则事件互斥.
②事件A的对立事件所含的结果组成的集合,是全集中由事件A所含的结果组成的集合的补集.
29.(22-23高一下·广东阳江·期末)从装有2件正品和2件次品的盒子内任取2件产品,下列选项中是互斥而不对立的两个事件的是( )
A.“至少有1件正品”与“都是次品” B.“恰好有1件正品”与“恰好有1件次品”
C.“至少有1件次品”与“至少有1件正品” D.“都是正品”与“都是次品”
【答案】D
【解析】从装有2件正品和2件次品的盒子内任取2件产品,可能的结果为:1正1次、2正、2次,
对于A:“至少有1件正品”与“都是次品”是对立事件,不符合;
对于B:“恰好有1件正品”与“恰好有1件次品”是同一个事件,不符合题意;
对于C:“至少有1件次品”包括1正1次、2次,“至少有1件正品”
包括1次1正、2正,这两个事件不是互斥事件,不符合题意;
对于D:“都是正品”与“都是次品”是互斥事件而不是对立事件,符合题意;故选:D
30.(22-23高一下·山西朔州·期末)从装有2个红色乒乓球和3个白色乒乓球的口袋内任取3个球,那么是互斥事件而不是对立事件的两个事件是( )
A.恰有1个白色乒乓球与至少2个白色乒乓球
B.至少2个白色乒乓球与都是白色乒乓球
C.至少1个白色乒乓球与至少1个红色乒乓球
D.恰有1个红色乒乓球与恰有1个白色乒乓球
【答案】D
【解析】恰有1个白色乒乓球与至少2个白色乒乓球是对立事件,故A错误;
至少2个白色乒乓球与都是白色乒乓球可以同时发生,不是互斥事件,故B错误;
至少1个白色乒乓球与至少1个红色乒乓球可以同时发生,不是互斥事件,故C错误;
恰有1个红色乒乓球与恰有1个白色乒乓球是互斥事件而不是对立事件,故D正确.故选:D.
31.(22-23高一下·河南洛阳·月考)某饮料生产企业推出了一种有一定几率中奖的新饮料.甲、乙两名同学都购买了这种饮料,设事件为“甲、乙都中奖”,则与互为对立事件的是( )
A.甲、乙恰有一人中奖 B.甲、乙都没中奖
C.甲、乙至少有一人中奖 D.甲、乙至多有一人中奖
【答案】D
【解析】“甲、乙恰有一人中奖”与互斥但不对立,故A错误;
“甲、乙都没中奖”与互斥但不对立,故B错误;
“甲、乙至少有一人中奖”与不互斥,故C错误;
“甲、乙至多有一人中奖”与互斥且对立,故D正确.故选:D.
32.(22-23高一上·山东潍坊·期末)“韦神”数学兴趣小组有4名男生和2名女生,从中任选2名同学参加数学公式推导比赛,下列各对事件中互斥而不对立的是( )
A.至少有1名男生与全是男生;
B.至少有1名男生与全是女生;
C.恰有1名男生与恰有2名男生;
D.至少有1名男生与至少有1名女生.
【答案】C
【解析】对于A项,事件至少有1名男生包括恰有1名男生和全是男生两种情况,故A项错误;
对于B项,事件至少有1名男生包括恰有1名男生和全是男生两种情况,
与事件全是女生是互斥对立事件,故B项错误;
对于C项,事件恰有1名男生指恰有1名男生和1名女生,
与事件恰有2名男生是互斥事件,但不是对立事件,故C项正确;
对于D项,事件至少有1名男生包括恰有1名男生和全是男生两种情况,
事件至少有1名女生包括恰有1名女生和全是女生两种情况,
两个事件有交事件恰有1名男生和1名女生,故D项错误.故选:C.
【题型9 古典概型的概率计算】
满分技法
用公式法求古典概型的概率就是用所求事件A所含的基本事件个数除以基本事件空间Ω所含的基本事件个数求解事件A发生的概率P(A).解题的关键如下:
①定型,即根据古典概型的特点——有限性与等可能性,确定所求概率模型为古典概型.
②求量,利用列举法、排列组合等方法求出基本事件空间Ω及事件A所含的基本事件数.
③求值,代入公式P(A)=求值.
33.(23-24高一下·河北廊坊·期末)用2,3,4这3个数组成没有重复数字的三位数,则事件“这个三位数是偶数”发生的概率为( )
A. B. C. D.
【答案】C
【解析】将2,3,4组成一个没有重复数字的三位数的情况有,共6种,
其中偶数有,共4种,
所以事件“这个三位数是偶数”发生的概率为.故选:C.
34.(23-24高一下·湖南·期末)从这四个数字中任意取出两个不同的数字,设取出的两数字之和为,则的概率为( )
A. B. C. D.
【答案】B
【解析】由 可得 .
从这四个数字中任意取出两个不同的数字,
有 ,共 6 种不同的结果,
取出的两数字之和 满足 对应的结果有共 3 种,
所以所求概率为 .故选:B.
35.(23-24高一下·山西太原·期末)已知甲、乙两个袋子中各装有若干个白球和红球(这些球仅颜色不同),且乙袋中球数是甲袋中球数2倍,若从甲袋中随机摸一个球,摸到红球的概率为,而将甲、乙两个袋子中的球装在一起后,从中随机摸一个球,摸到红球的概率为,则从乙袋中随机摸一个球,摸到红球的概率为( )
A. B. C. D.
【答案】C
【解析】假设甲袋中的总球数为,因为从甲袋中随机摸一个球,摸到红球的概率为,
则甲袋中有个红球,个白球,
又乙袋中球数是甲袋中球数2倍,乙袋中的总球数为;
因为将甲、乙两个袋子中的球装在一起后,从中随机摸一个球,摸到红球的概率为,
所以甲、乙两袋中共有个红球,所以乙袋中有个红球,
因而从乙袋中摸到红球的概率为.故选:C.
36.(23-24高一下·山西太原·期末)某场乒乓球单打比赛按三局两胜的赛制进行,甲乙两人参加比赛.已知每局比赛甲获胜的概率为0.4,乙获胜的概率为0.6.现用计算机产生1~5之间的整数随机数,当出现1或2时,表示此局比赛甲获胜,当出现3,4或5时,表示此局比赛乙获胜.在一次试验中,产生了20组随机数如下:
534 123 512 114 125 334 432 332 314 152
423 443 423 344 541 453 525 151 354 345
根据以上数据,利用随机模拟试验,估计甲获得冠军的概率为( )
A.0.24 B.0.3 C.0.7 D.0.76
【答案】B
【解析】根据题意,在20组随机数中,表示甲获胜的有:123,512,114,125,152,151,共6种情况,
所以可估计甲获得冠军的概率为.故选:B.
【题型10 概率的基本性质及应用】
满分技法
(1)首先判断几个事件的发生是否相互独立.
(2)求相互独立事件同时发生的概率的方法主要有:
①利用相互独立事件的概率乘法公式直接求解.
②正面计算较繁或难以入手时,可从其对立事件入手计算.
37.(23-24高一下·山西大同·期末)袋子中有一些大小质地完全相同的红球、白球和黑球,从中任意摸出一球,摸出的球是红球或白球的概率为0.56,摸出的球是红球或黑球的概率为0.68,则摸出的球是白球或黑球的概率为( )
A.0.64 B.0.72 C.0.76 D.0.82
【答案】C
【解析】设摸出红球的概率为,摸出白球的概率为,摸出黑球的概率为,
所以,,且,
所以,,
所以,即摸出的球是白球或黑球的概率为0.76.故选C.
38.(23-24高一下·全国·月考已知事件、、两两互斥,若,则( )
A. B. C. D.
【答案】B
【解析】因为事件、、两两互斥,,
所以,
所以.故选:B
39.(23-24高二上·四川泸州·期末)(多选)下列说法正确的是( )
A.甲、乙、丙三位同学争着去参加一个公益活动,抽签决定谁去,则先抽的概率大些
B.若事件A发生的概率为,则
C.如果事件A与事件B互斥,那么一定有
D.已知事件A发生的概率为,则它的对立事件发生的概率0.7
【答案】BD
【解析】对于A,甲、乙、丙三位同学抽签决定谁去,则每位同学被抽到的概率都是,故A错误;
对于B,由概率的性质可知,,故B正确;
对于C,如果事件A与事件对立,那么一定有,
但互斥事件不一定对立,故C错误;
对于D,因为事件A发生的概率为,
所以它的对立事件发生的概率,故D正确.故选:BD
40.(22-23高一下·福建宁德·期末)设为两个互斥事件,且,,则下列各式一定正确的是( )
A. B.
C. D.
【答案】B
【解析】因为为两个互斥事件,,,
所以,即,且.故选:B.
【题型11 相互独立事件的概率计算】
满分技法
求相互独立事件同时发生的概率的方法
(1)首先判断几个事件的发生是否相互独立.
(2)求相互独立事件同时发生的概率的方法主要有:
①利用相互独立事件的概率乘法公式直接求解.
②正面计算较繁或难以入手时,可从其对立事件入手计算.
41.(23-24高一下·重庆·期末)甲、乙、丙3人独立参加一项挑战,已知甲、乙、丙能完成挑战的概率分别为、、,则甲、乙、丙中有人完成挑战的概率为( )
A. B. C. D.
【答案】D
【解析】由题意,甲、乙、丙三人都没完成挑战的概率,
再由对立事件关系,则甲、乙、丙中有人完成挑战的概率,故选:D.
42.(23-24高一下·天津南开·期末)高一年级某同学参加了学校“数学社”“物理社”“话剧社”三个社团的选拔,该同学能否成功进入这三个社团是相互独立的.假设该同学能够进入“数学社”“物理社”“话剧社”三个社团的概率分别为m,n,,该同学只进入两个社团的概率为,且三个社团都进不了的概率为,则( )
A. B. C. D.
【答案】D
【解析】由该同学可以进入两个社团的概率为,得,
由三个社团都进不了的概率为,得,
整理得,解得.故选:D
43.(23-24高一下·河南洛阳·期末)每年的12月2日是我国的“全国交通安全日”,某市交通广播为了提高社会公众的交通安全意识,2023年12月2日推出了一档交通安全知识闯关栏目,规则如下:第一关,闯关者从甲、乙、丙三道题目中随机抽取一道,若答对抽到的题目,则闯关成功,若没答对抽到的题目,则进入第二关;第二关,该闯关者从剩下的两道题目中随机抽取一道,若答对抽到的题目,则闯关成功,若没答对抽到的题目,则进入第三关;第三关,若该闯关者答对最后这一道题目,则闯关成功,若没有答对,则闯关失败.已知闯关者洛洛答对甲、乙、丙三题的概率依次是,,,且各关题目能否答对互不影响.
(1)求洛洛第一关抽中甲题,且第一关闯关成功的概率;
(2)求洛洛第一关闯关成功或第二关闯关成功的概率.
【答案】(1);(2)
【解析】(1)设事件“洛洛第一关抽中甲题,且第一关闯关成功”.
由题意得洛洛第一关抽到每道题目的概率均为,所以;
(2)设事件“洛洛第一关闯关成功”,则,
设事件“洛洛第二关闯关成功”,
洛洛答题情况如下:
甲题错乙题对,甲题错丙题对,乙题错甲题对,乙题错丙题对,
丙题错甲题对,丙题错乙题对,
所以,
设事件“洛洛第一关闯关成功或第二关闯关成功”,事件与事件互斥,
.
故洛洛第一关闯关成功或第二关闯关成功的概率为.
44.(23-24高一下·河北·期末)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中,则此人继续投篮,若未命中,则换对方投篮.已知甲每次投篮的命中率均为0.7,乙每次投篮的命中率均为0.5,甲、乙每次投篮的结果相互独立.
(1)若第1次投篮的人是甲,求第3次投篮的人是甲的概率;
(2)若第1次投篮的人是乙,求前5次投篮中乙投篮次数不少于4的概率.
【答案】(1)0.64;(2)0.2375
【解析】(1)若第1次投篮的人是甲,且第3次投篮的人是甲,
则甲第1次和第2次投篮都命中或第1次未命中、第2次乙也未命中,
故所求概率为.
(2)前5次投篮中乙投篮次数为5的概率.
若前5次投篮中乙投篮次数为4,
则乙前3次投篮均命中且第4次投篮未命中或中间3次(第2,3,4次)乙有1次投篮未命中
且甲也有1次投篮未命中,
所以前5次投篮中乙投篮次数为4的概率是
.
故所求概率为.
【题型12 频率与概率关系及应用】
满分技法
1、频率是概率的近似值,概率是频率的稳定值.通常用概率来反映随机事件发生的可能性的大小,有时也用频率来作为随机事件概率的估计值.
2、随机事件概率的求法:利用概率的统计定义求事件的概率,即通过大量的重复试验,事件发生的频率会逐渐趋近于某一个常数,这个常数就是概率.
45.(23-24高一下·全国·专题练习)下列说法正确的是( )
A.一个人打靶,打了10发子弹,有7发子弹中靶,因此这个人中靶的概率是
B.一个同学做掷硬币试验,掷了6次,一定有3次正面向上
C.某地发行彩票,其回报率为47%,有人花了100元钱买彩票,一定会有47元的回报
D.大量试验后,可以用频率近似估计概率
【答案】D
【解析】对于A,可得中靶的结果是频率,不是概率;故错误,
对于B,C,太过绝对,故错误,
对于D,符合概率的估算方法,故正确.故选:D.
46.(23-24高一下·浙江温州·期末)气象台预报“本市明天中心城区的降雨概率为30%,郊区的降雨概率为70%.”基于这些信息,关于明天降雨情况的描述最为准确的是( )
A.整个城市明天的平均降雨概率为50%
B.明天如果住在郊区不带伞出门将很可能淋雨
C.只有郊区可能出现降雨,而中心城区将不会有降雨
D.如果明天降雨,郊区的降雨量一定比中心城区多
【答案】B
【解析】对于A,中心城区面积和郊区面积不一定相同,
故整个城市明天的平均降雨概率不一定为50%,故A错误;
对于B,明天郊区的降雨概率比中心城区的降雨概率大,故B正确;
对于C,不管郊区还是中心城区都可能会出现降雨,故C错误;
对于D,降雨量并不取决于降雨概率,反而是降雨时长以及有效覆盖面积
(即下雨的区域在该所参考区域的面积)会影响降雨量,故D错误.故选:B.
47.(23-24高一上·陕西汉中·期末)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来石(古代容量单位),验得米内夹谷(假设一粒米与一粒谷的体积相等),抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )
A.213石 B.152石 C.169石 D.196石
【答案】C
【解析】根据题意,抽样取米一把,数得254粒内夹谷28粒,则样本中夹谷的频率为,
则这批米内夹谷约为(石,故选:C
48.(23-24高一下·全国·专题练习)众所周知,长时间玩手机可能影响视力.据调查,某校学生大约40%的人近视,而该校大约有30%的学生每天玩手机超过2 h,这些人的近视率约为50%.现从每天玩手机不超过2 h的学生中任意调查一名学生,则该名学生近视的概率为( )
A. B. C. D.
【答案】B
【解析】设该校有a名同学,
则由题意可得:约有0.4a的学生近视,约有0.3a的学生每天玩手机超过2 h,
约有0.7a的学生每天玩手机不超过2 h.
因为该校大约有30%的学生每天玩手机超过2 h,这些人的近视率约为50%
所以每天玩手机超过2 h的学生中近视的学生人数为0.3a×0.5=0.15a,
则每天玩手机不超过2 h的学生中有0.4a-0.15a=0.25a的学生近视,
所以从每天玩手机不超过2 h的学生中任意调查一名学生,
该名学生近视的概率为.故选:B.
过关检测
一、单选题
1.(23-24高一下·山西太原·期末)为了解某校高中3000名学生的身高情况,从中抽取了100名学生进行调查,则这100名学生是( )
A.总体 B.样本 C.样本量 D.个体
【答案】B
【解析】依题意,从中抽取了100名学生进行调查,则这100名学生是一组样本.故选:B
2.(23-24高一下·浙江金华·月考)某工厂生产A、B、C三种不同型号的产品,产量之比为现用按比例分配的分层随机抽样的方法抽取一个容量为n的样本,若样本中A种型号的产品有8件,则样本容量n的值为( )
A.48 B.36 C.54 D.42
【答案】A
【解析】因为某工厂生产甲、乙、丙三种不同型号的产品,三种产品产量之比为1:2:3,
已知抽得种型号的产品8件,
所以 ,解得.故选:A
3.(23-24高一下·广东广州·月考要调查某地区高中学生身体素质,从高中生中抽取100人进行跳远测试,根据测试成绩制作频率分布直方图如下图,现再从这100人中用分层抽样的方法抽取20人,应从间抽取人数为b,则b为( )
A.4 B.5 C.6 D.7
【答案】C
【解析】由题得,所以.
在之间的学生:人,
现再从这人中用分层抽样的方法抽取人,
应从间抽取人数为,故. 故选:C.
4.(23-24高一下·天津和平·期末)已知一组样本数据10,10,9,12,10,9,12,则这组样本数据的上四分位数为( )
A.9 B.10 C.11 D.12
【答案】D
【解析】将样本数据按从小到大的顺序排列为:,
上四分位数即为分位数,,
所以四分位数为从小到大的第个数,即.故选:D.
5.(23-24高一下·河南周口·期末)从这4个数中一次性地任取两个数,则这两个数的和大于87的概率为( )
A. B. C. D.
【答案】B
【解析】从这4个数中一次性地任取两个数的所有可能的结果有
,共6种,
其中满足两个数的和大于87的结果有共2种,
所以任取两个数的和大于87的概率.故选:B.
6.(23-24高一下·广西南宁·期末)已知样本空间,事件,事件,事件,则下列选项错误的是( )
A.与独立 B.与独立
C.与独立 D.
【答案】D
【解析】,
有,
即两两独立,ABC正确;
但,故D错误.故选:D.
二、多选题
7.(23-24高二上·山东泰安·开学考试)某小组有3名男生和2名女生,从中任选2名同学去参加演讲比赛,事件“至少1名女生”与事件“全是男生”( )
A.是互斥事件 B.不是互斥事件 C.是对立事件 D.不是对立事件
【答案】AC
【解析】从3男2女中人选2名同学,一共会出现的抽取情况为:2男,或者2女,或者1男1女,
至少一名女生包括一名或两名女生,全是男生相当于女生数为零,
两者间是互斥事件也是对立事件.故选:AC
8.(22-23高一下·广西南宁·期末)(多选)某学校为了解同学们某天上学的交通方式,在高一年级开展了随机调查,将学生某天上学的交通方式归为四类:A一家人接送,B一乘坐地铁,C一乘坐公交,D一其他方式,学校把收集到的数据整理绘制成条形图和扇形图,如图只给出了其中部分信息,根据图中信息,下列说法正确的是( )
A.若该校高一年级有学生1300人,则高一年级约有780人乘坐公共交通工具上学
B.估计该校高一年级有的学生某天家人接送上学
C.扇形图中B的占比为40%
D.估计该校学生上学交通方式为乘坐地铁或者其他方式的人数占全校学生的一半
【答案】AD
【解析】因为C一乘坐公交的调查人数为,所占比例为,
所以调查的总人数为,
对于A选项:,所以A选项正确,
对于B选项:,所以B选项错误,
对于C选项:,所以C选项错误,
对于D选项:,所以D选项正确.故选:AD.
9.(23-24·河南周口·模拟预测)已知一组样本数据的方差,则( )
A.这组样本数据的总和等于100
B.这组样本数据的中位数一定为2
C.数据,,…,的标准差为3s
D.现有一组新的样本数据,该组样本数据的极差比原样本数据的极差大
【答案】AC
【解析】对于A,因为方差,故,所以这组样本数据的总和等于,故A正确.
对于C,数据,,…,的方差为,故其标准差为,故C正确.
对于B,根据方差、均值无法求出中位数,故B错误.
对于D,新样本数据的极差为,
故新的样本数据的极差比原样本数据的极差小,故D错误.故选:AC.
三、填空题
10.(23-24高一下·江苏扬州·期末)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是 .
【答案】09
【解析】从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,
删除超出范围及重复的编号,符合条件的编号有14,05,11,09,
所以选出来的第4个个体的编号为09.故答案为:09
11.(23-24高一下·安徽阜阳·期中)若一组数据,,的平均数为4,则数据,,的平均数为 .
【答案】10
【解析】若一组数据,,的平均数为4,
则数据,,的平均数为.
故答案为:10
12.(23-24高二上·河北石家庄·期末)天气预报预测在今后的三天中,每天下雨的概率都为60%.现采用随机模拟的方法估计这三天中恰有两天下雨的概率,用1,2,3,4,5,6表示下雨,7,8,9,0表示不下雨.用计算机产生了10组随机数为180,792,454,417,165,809,798,386,196,206.据此估计这三天中恰有两天下雨的概率近似为 .
【答案】/0.4
【解析】10组随机数中,表示三天中恰有两天下雨的有417,386,196,206,
故这三天中恰有两天下雨的概率近似为.
故答案为:
四、解答题
13.(23-24高一下·湖南岳阳·期末)甲、乙、丙三人组成一个小组代表学校参加一个“诗词大会”闯关活动团体赛.三人各自独立闯关,在第一轮比赛中甲闯关成功的概率为,甲、乙都闯关成功的概率为,甲、丙都闯关成功的概率为,每人闯关成功记分,三人得分之和记为小组团体总分.
(1)求乙、丙各自闯关成功的概率;
(2)求在第一轮比赛中团体总分为分的概率;
(3)若团体总分不小于分,则小组可参加下一轮比赛,求该小组参加下一轮比赛的概率.
【答案】(1);(2);(3)
【解析】(1)三人各自独立闯关,其中甲闯关成功的概率为,
甲、乙都闯关成功的概率为,
甲、丙都闯关成功的概率为,
设乙闯关成功的概率为,丙闯关成功的概率为,
根据独立事件同时发时的概率公式得,解得,
即乙闯关成功的概率为,丙闯关成功的概率为.
(2)团体总分为4分,即甲、乙、丙三人中恰有2人过关,而另外一人没过关,
设“团体总分为4分”为事件,
则,
即团体总分为4分的概率;
(3)团体总分不小于4分,即团体总分为4分或6分,
设“团体总分不小于4分”为事件,
由(2)可知团体总分为4分的概率,
团体总分为6分,即3人闯关都成功的概率为,
所以参加下一轮比赛的概率为,
即该小组参加下一轮比赛的概率为.
14.(23-24高一下·江苏无锡·月考)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了了解全市居民生活用水量分布情况,通过抽样,获得100户居民月均用水量(单位:),将数据按照,,…,分成9组,制成如图所示的频率分布直方图.为了鼓励居民节约用水,该市政府在本市实行居民生活用水“阶梯水价”:第一阶梯为每户每月用水量不超过的部分按3元收费,第二阶梯为超过但不超过的部分按5元收费,第三阶梯为超过的部分按8元收费.
(1)求直方图中的值;
(2)已知该市有20万户居民,估计全市居民中月均用水费用不超过60元的用户数;
(3)该市政府希望使至少有的用户每月用水量不超过第二阶梯收费标准,请根据样本数据判断,现行收费标准是否符合要求?若不符合,则应该将第二阶梯用水量的上限至少上调到多少?
【答案】(1);(2)万户居民;(3)不符合要求,上调到
【解析】(1)由直方图可知,
,解得:;
(2)居民用水量为时,收费为元,
所以用水费用不超过60元,则用水量小于等于,
由频率分布直方图可知,用水量小于等于的频率为
;
万户,
所以全市居民中月均用水费用不超过60元的用户数为万户.
(3)抽取的100户居民月均用水量不超过的频率为:
,
,所以现行收费标准不符合要求,
抽取的100户居民月均用水量不超过的频率为:
,
,
现行收费标准不符合要求,需将第二阶段用水量的上限至少上调到.
15.(23-24高一下·广西南宁·期末)为备战运动会,射击队的甲、乙两位射击运动员开展了队内对抗赛.在对抗赛中两人各射靶10次,每次命中的成绩(环数)如下:
甲 4 7 6 5 4 9 10 7 8 10
乙 7 5 8 6 7 9 7 6 7 8
(1)求甲运动员的样本数据第85百分位数;
(2)分别计算这两位运动员射击成绩的平均数和方差;
(3)射击队教练希望利用此次射击成绩为依据,挑选一名运动员参加运动会,请你帮助教练分析两个运动员的成绩,作出判断并说明理由.
注:一组数据的平均数为,它的方差为
【答案】(1)10;(2)7;7;4.6;1.2;(3)答案见解析
【解析】(1)根据题意可知,把甲的数据按从小到大排列如下:
,
因为
所以第9个数据是第85百分位数,所以第85百分位数为10.
(2),
,
,
;
(3)由(2)知,
平均数
方差
命中9环及9环以上的次数
甲
7
4.6
3
乙
7
1.2
1
(i)因为两名运动员射击成绩的平均数相同,且,则乙的成绩比甲稳定;
(ii)因为两名运动员射击成绩的平均数相同,命中9环及9环以上的次数甲比乙多,
所以,甲爆发力更强.
(iii)乙成绩在平均数上下波动;
而甲处于上升势头,从第六次以后就没有比乙少的情况发生;故确定人选时,甲更有潜力.
原创精品资源学科网独家享有版权,侵权必究!4
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$
专题05 概率与统计
知识点 1:简单随机抽样
1、简单随机抽样
(1)放回简单随机抽样:一般地,设一个总体含有(为正整数)个个体,从中逐个抽取()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样.
(2)不放回简单随机抽样:如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.
2、抽签法
(1)定义:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个样本容量为n的样本.
(2)抽签法的操作步骤:
第一步,编号:将个个体编号(号码可以从1到,也可以使用已有的号码).
第二步,写签:将个号码写到大小、形状相同的号签上.
第三步,抽签:将号签搅拌均匀,每次从中抽取一个号签,连续不放回地抽取次,并记录其编号.
第四部,定样:从总体中找出与号签上的号码对应的个体,组成样本.
3、随机数法
(1)定义:利用随机试验或信息技术(即计算器、电子表格软件和R统计软件)生成的随机数进行抽样.
(2)随机数表法步骤:
①把总体中的每个个体编号.
②用随机数工具产生编号范围内的整数随机数.
③把产生的随机数作为抽中的编号,使与编号对应的个体进入样本。重复上述过程,知道抽足样本所需要的数量.
知识点2:分层随机抽样
1、分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
2、比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
3、分层随机抽样的步骤
(1)分层:按某种特征将总体分成若干部分(层);
(2)计算抽样比:抽样比;
(3)定数:按抽样比确定每层抽取的个体数;
(4)抽样:每层分贝按简单随机抽样的方法抽取样本
(5)成样:综合各层抽样,组成样本.
4、分层随机抽样的相关计算关系:
(1)=;
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
(3)样本的平均数和各层的样本平均数的关系为:=+=+..
知识点3:用样本估计总体
1、频率分布直方图
(1)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图.
(2)频率分布直方图的特点:
①,
②所有小长方形的面积和等于1,
③.
2、总体百分位数的估计
(1)第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3、总体集中趋势的估计
(1)众数:在样本数据中,出现次数最多的那个数据;
(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,
若样本数据个数为偶数,则取中间两个数据的平均数作为中位数.
(3)平均数:设样本的数据为,则样本的算术平均数为;
4、总体离散程度的估计
用样本的标准差估计总体的标准差
(1)数据的离散程度可以用极差、方差或标准差来描述;
(2)极差(又叫全距)是一组数据的最大值和最小值之差,反映一组数据的变动幅度;
(3)样本方差描述了一组数据围绕平均数波动的大小;
一般地,设样本的数据为,样本的平均数为,
定义样本方差为;
简化公式:
(方差等于原数据平方的平均数减去平均数的平方)
(4)样本的标准差是方差的算术平方根.
样本标准差.
标准差越大数据离散程度越大,数据越分散;标准差越小,数据集中在平均数周围.
知识点4:随机事件与概率
1、有限样本空间与随机事件
(1)有限样本空间:我们把随机试验E的每个可能的基本结果称为样本点,用ω表示样本点;全体样本点的集合称为试验E的样本空间,用Ω表示样本空间;如果一个随机试验有n个可能结果ω1,ω2,…,ωn,则称样本空间Ω={ω1,ω2,…,ωn}为有限样本空间,Ω={ω1,ω2,…,ωn}
(2)随机事件:我们将样本空间Ω的子集称为随机事件,简称事件,并把只包含一个样本点的事件称为基本事件.随机事件一般用大写字母A,B,C,…表示.在每次试验中,当且仅当A中某个样本点出现时,称为事件A发生;Ω作为自身的子集,包含了所有的样本点,在每次试验中总有一个样本点发生,所以Ω总会发生,我们称Ω为必然事件;空集∅不包含任何样本点,在每次试验中都不会发生,我们称∅为不可能事件。
2、事件的关系和运算
(1)互斥(互不相容):一般地,如果事件A与事件B不能同时发生,也就是说A∩B是一个不可能事件,即A∩B=∅,则称事件A与事件B互斥(或互不相容)
(2)互为对立:一般地,如果事件A与事件B在任何一次试验中有且仅有一个发生,
即A∪B=Ω,且A∩B=∅,那么称事件A与事件B互为对立.事件A的对立事件记为
(3)包含关系:一般地,若事件A发生,则事件B一定发生,我们就称事件B包含事件A
(或事件A包含于事件B),即B ⊇A(或A⊆B).
特殊情形:如果事件B包含事件A,事件A也包含事件B,即B⊇A且A⊆B,则称事件A与事件B相等,记作A=B.
(4)并事件(和事件):一般地,事件A与事件B至少有一个发生,这样的事件中的样本点或者在事件A中,或者在事件B中,则称这个事件为事件A与事件B的并事件(或和事件) A∪B(或A+B)
(5)交事件(积事件):一般地,事件A与事件B同时发生,这样的一个事件中的样本点既在事件A中,也在事件B中,则称这样的事件为事件A与事件B的交事件(或积事件) A∩B(或AB)
4、古典概型与概率的基本性质
(1)古典概型的定义:我们将具有以下两个特征的试验称为古典概型试验,其数学模型称为古典概率模型,简称古典概型.
有限性:样本空间的样本点只有有限个;等可能性:每个样本点发生的可能性相等.
(2)古典概型的概率计算公式:一般地,设试验E是古典概型,样本空间Ω包含n个样本点,事件A包含其中k个样本点,则定义事件A的概率P(A)==,其中n(A)和n(Ω)分别表示事件A和样本空间Ω包含的样本点个数.
(3)概率的基本性质
性质1:对任意的事件A,都有P(A)≥0.
性质2:必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P(∅)=0.
性质3:如果事件A与事件B互斥,那么P(A∪B)=P(A)+P(B).
性质4:如果事件A与事件B互为对立事件,那么P(B)=1-P(A),P(A)=1-P(B).
性质5:如果A⊆B,那么P(A) ≤P(B).
性质6:设A,B是一个随机试验中的两个事件,我们有P(A∪B)= P(A)+P(B)-P(A∩B).
知识点5:事件的相互独立性
1、相互独立事件的:对任意两个事件A与B,如果成立,则称事件A与事件B相互独立,简称为独立.
2、性质及推广:
如果事件A与事件B相互独立,则与,与,与也都相互独立.
两个事件的相互独立可以推广到个事件的相互独立性,即若事件相互独立,则这个事件同时发生的概率.
3、相互独立事件的概率计算公式
已知两个事件A,B相互独立,它们的概率分别为P(A),P(B),则有
事件
表示
概率
A,B同时发生
P(A)P(B)
A,B都不发生
A,B恰有一个发生
A,B中至少有一个发生
A,B中至多有一个发生
知识点6:频率与概率
1、频率的稳定性:大量的试验证明,在任何确定次数的随机试验中,一个随机事件A发生的频率具有随机性.一般地,随着试验次数n的增大,频率偏离概率的幅度会缩小,即事件A发生的频率fn(A)会逐渐稳定于事件A发生的概率P(A),我们称频率的这个性质为频率的稳定性.因此我们可以用频率fn(A)估计概率P(A).
2、频率的求法:频率是事件A发生的次数m与试验总次数n的比值,利用此公式可求出它们的频率,
频率本身是随机变量,当n很大时,频率总是在一个稳定值附近摆动,这个稳定值是概率.
3、频率和概率区别和联系
区别:(1)在相同的条件下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数nA为事件A出现的频数,称事件A出现的比例fn(A)=为事件A出现的频率.
(2)概率是度量随机事件发生的可能性大小的量
(3)频率是一个变量,随着试验次数的变化而变化,概率是一个定值,是某事件的固有属性.
联系:对于给定的随机事件A,由于事件A发生的频率fn(A)随着试验次数的增加稳定于概率P(A),因此可以用频率fn(A)来估计概率P(A).
题型归纳
【题型1 两种随机抽样的判断】
满分技法
1、简单随机抽样:从总体中随机选择样本,每个样本被选中的概率是相同的。每个单位被选中的机会是均等的,抽样过程不涉及对总体的分组,适用于总体相对均匀的情况。
2、分层随机抽样:首先将总体分成不同的层或组,这些层在某些特征上是同质的,然后在每一层内进行简单随机抽样。总体被分成多个层,每层内部具有相似的特征。每一层的样本大小可以相同,也可以根据层的大小或重要性进行调整。可以提高样本的代表性。
1.(23-24高一下·江苏无锡·月考)在简单随机抽样中,下列关于其中一个个体被抽中的可能性说法正确的是( )
A.与第几次抽样有关,第一次抽到的可能性更大一些
B.与第几次抽样有关,最后一次抽到的可能性更大一些
C.与第几次抽样无关,每次抽到的可能性都相等
D.与第几次抽样有关,第一次抽到的可能性更小一些
2.(23-24高一下·全国·专题练习)为了保证采用分层随机抽样方法时每个个体被等可能地抽取,必须要求( )
A.每层等可能抽取
B.每层抽取的个体数相等
C.每层抽取的比例为(其中n为抽取的样本容量,N是总体容量)
D.只要抽取的样本容量一定,每层抽取的个体数没有限制
3.(23-24高一下·全国·专题练习)①一次数学考试中,某班有12人的成绩在100分以上,30人的成绩在90~100分,12人的成绩低于90分,现从中抽取9人了解有关考试题目难度的情况;②运动会的工作人员为参加4×100 m接力赛的6支队伍安排跑道.针对这两件事,恰当的抽样方法分别为( )
A.分层随机抽样,简单随机抽样
B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层随机抽样
D.分层随机抽样,分层随机抽样
4.(2023·湖南岳阳·模拟预测)现有以下两项调查:①从40台刚出厂的大型挖掘机中抽取4台进行质量检测;②在某校800名学生中,型、型、B型和型血的学生依次有人.为了研究血型与色弱的关系,需从中抽取一个容量为40的样本.完成这两项调查最适宜采用的抽样方法分别是( )
A.①②都采用简单随机抽样
B.①②都采用分层随机抽样
C.①采用简单随机抽样,②采用分层随机抽样
D.①采用分层随机抽样,②采用简单随机抽样
【题型2 随机数表法的应用】
满分技法
应用随机数表法的两个关键点:
1、确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;
2、读数时注意结合编号特点进行读取.若编号为两位数字,则两位两位地读取;若编号为三位数字,则三位三位地读取,有超过总体号码或出现重复号码的数字舍去,这样继续下去,直到获取整个样本.
5.(23-24高一下·江苏连云港·期末)总体编号为01,02,…,29,30的30个个体组成.利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为( )
7816 1572 0802 6315 0216 4319 9714 0198
3204 9234 4936 8200 3623 4869 6938 7181
A.02 B.14 C.15 D.16
6.(23-24高一下·云南玉溪·月考)某工厂用简单随机抽样中的随机数法对生产的700个零件进行抽样,先将700个零件进行编号,.从中抽取70个样本,下图是利用软件生成的随机数,只需随机选定一个初始位置和方向开始读数,每次读取一个3位数,只要读取的号码落在编号范围内,该号码就是所抽到的样本编号,这样即可获得70个样本的编号,注意样本号码不能重复.若从表中第2行第6列的数2开始向右读取数据,取到的第一个样本编号是253,则得到的第6个样本编号是( )
A.007 B.328 C.253 D.623
7.(23-24高一下·江苏常州·月考)现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为 .
95226000 49840128 66175168 39682927 43772366 27096623
92580956 43890890 06482834 59741458 29778149 64608925
8.(23-24高一下·河北邢台·月考)要考查某种品牌的850颗种子的发芽率,从中抽取50颗种子进行实验,利用随机数表法抽取种子,先将850颗种子按001,002,…,850进行编号,如果从随机数表第2行第2列的数开始并向右读,下列选项中属于最先检验的4颗种子依次是 .
(下面抽取了随机数表第1行至第3行)
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95
97 74 94 67 74 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73
16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10
【题型3 分层抽样的相关计算】
满分技法
解决分层抽样的两个常用公式
先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取的个体数.
(1)抽样比==;
(2)层1的容量∶层2的容量∶层3的容量=样本中层1的容量∶样本中层2的容量∶样本中层3的容量.
9.(23-24高一下·河北·期末)某公司共有940名员工,其中女员工有400人.为了解他们的视力状况,用分层随机抽样(按男员工、女员工进行分层)的方法从中抽取一个容量为47的样本,则男员工的样本量为( )
A.21 B.24 C.27 D.30
10.(23-24高一下·湖南永州·期末)在杭州亚运会期间,共有1.8万多名赛会志愿者参与服务,据统计某高校共有本科生4400人,硕士生400人,博士生200人参与志愿者服务.现用分层抽样的方法从该高校志愿者中抽取部分学生了解服务心得,其中博士生抽取了10人,则本科生抽取的人数为( )
A.250 B.220 C.30 D.20
11.(23-24高一下·全国·月考)某高中的三个年级共有学生2000人,其中高一600人,高二600人,高三800人,该校现在要了解学生对校本课程的看法,准备从全校学生中抽取80人进行访谈,若采取按比例分配的分层抽样,且按年级来分层,则高一年级应抽取的人数是( )
A.24 B.26 C.30 D.36
12.(22-23高一下·山东聊城·期末)某校高一年级有女生504人,男生596人.学校想通过抽样的方法估计高一年级全体学生的平均体重,从高一女生和男生中随机抽取50人和60人,经计算这50个女生的平均体重为,60个男生的平均体重为,依据以上条件,估计该校高一年级全体学生的平均体重最合理的计算方法为( )
A. B.
C. D.
【题型4 几种常见统计图表的应用】
满分技法
1、条形图:一般与小长方形的宽无关,主要是高的值;要注意条形图横、纵坐标的含义;复合条形图是不同数据在同一条形图中反映,对相同横坐标含义进行对比,准确确定彼此间的差异;
2、折线图:可以观察点的个数,从而得到数据的数量,同时直观得出数据变化趋势以及变化幅度的大小,也可得到所有数据中的最大值与最小值,因而容易得到所要解决的问题数值,如果不同的折线图反映在同一坐标系中,可以已通过比较观察期波动程度大小,并进行优劣判断;
3、扇形图:需要运用各个圆心角或弧长得百分比,同时可清楚得到各部分与总体检的关系,用百分比×总体个体数,估算某含义的个体数.
13.(23-24高二下·浙江绍兴·学业考试)下图为某同学两次月考成绩占总成绩百分数的扇形统计图,已知该同学第一次月考总分低于第二次月考总分,则( )
A.该同学数学学科成绩一定下降 B.该同学政治学科成绩一定下降
C.该同学化学学科成绩可能下降 D.该同学语文学科成绩一定提升
14.(23-24高一下·吉林通化·月考)2024年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩在前200名的学生中,高一人数比高二人数多30
B.成绩在第1~50名的学生中,高三最多有32人
C.高一学生成绩在第101~150名的人数一定比高三学生成绩在第1~50名的人数多
D.成绩在第51~100名的学生中,高二人数比高一人数多
15.(23-24高一下·四川·期末)(多选)某校为更好地支持学生的个性化发展,开设了学科拓展类、创新素质类、兴趣爱好类三种类型的校本课程,每位学生从中选择一门课程学习.现对该校4000名学生的选课情况进行了统计,如图①,并用分层抽样的方法从中抽取的学生对其所选课程进行了满意率调查,如图②.下列说法正确的是( )
A.抽取的样本容量为4000
B.该校学生中对兴趣爱好类课程满意的人数约为700
C.若抽取的学生中对创新素质类课程满意的人数为24,则
D.该校学生中选择学科拓展类课程的人数为1000
16.(23-24高一下·湖南·月考)如图为近一年我国商品零售总额和餐饮收入总额同比增速情况折线图,根据该图,下列结论正确的是( )
(注:同比,指当前的数据与上一年同期进行比对;环比,指当前数据与上个月的数据进行比对.)
A.23-24年月份,商品零售总额同比增长
B.2023年月份,餐饮收入总额同比都降低
C.2023年月份,商品零售总额同比都增加
D.2023年12月,餐饮收入总额环比增速为
【题型5 频率分布直方图及其应用】
满分技法
1、由频率分布直方图进行相关计算需掌握的2个关系式
(1)×组距=频率.
(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
2、利用频率分布直方图估计样本的数字特征的方法
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.
(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.
(3)众数:最高的矩形的中点的横坐标.
17.(23-24高一下·海南·期中)如图是某校高一年级1000名男生体检时身高的频率分布直方图,现用分层随机抽样的方法从身高在160~175cm的男生中抽取130名,则抽取到的身高在165~170cm的人数为( )
A.20 B.30 C.40 D.50
18.(23-24高一下·山西大同·期末)某部门为了了解一批树苗的生长情况,在4000棵树苗中随机抽取400棵,统计这400棵树苗的高度(单位:),将所得数据分成7组:,,,,,,,并绘制了如图所示的频率分布直方图,那么根据该图可推测,在这4000棵树苗中高度小于的树苗棵数约是( )
A.1680 B.1760 C.1840 D.1920
19.(23-24高一下·湖北武汉·期末)(多选)供电部门对某社区100位居民6月份人均用电情况进行统计后,按人均用电量分为,,,,五组,整理得到如图所示的频率分布直方图,则有关这100位居民,下列说法正确的是( )
A.6月份人均用电量人数最多的一组有40人
B.6月份人均用电量在内的有30人
C.6月份人均用电量不低于20度的有50人
D.在这100位居民中用比例分配的分层随机抽样方法抽取10位居民协助收费,抽到的居民用电量在一组的人数为3
20.(22-23高一下·吉林长春·月考)某城市户居民的月平均用电量单位:度,以,,,分组的频率分布直方图如图.
(1)求直方图中的值;
(2)在这户居民中,月平均用电量不低于度的有多少户?
(3)在月平均用电量为,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?
【题型6 平均数与方差的和差倍分】
满分技法
1、平均数的相关结论
①如果两组数和的平均数分别是和,则一组数的平均数是.
②如果一组数的平均数为,则一组数的平均数为.
③如果一组数的平均数为,则一组数的平均数为.
2、方差的相关结论
①如果一组数的方差为,则一组数的方差为;
②如果一组数的方差为,则一组数的方差为.
21.(23-24高一下·山东聊城·月考)已知数据的平均数为,则数据的平均数为 .
22.(23-24高一下·河南·月考)已知样本数据的平均数为,样本数据的平均数为,若样本数据的平均数为,则( )
A.12 B.10 C.2 D.11
23.(23-24高一下·江苏南京·期末)已知数据的平均数为10,方差为5,数据的平均数为,方差为,则( )
A. =10,=14 B. =9,=44
C. =29,=45 D. =29,=44
24.(23-24高一下·山西忻州·月考)有一组样本数据(其中是最小值,是最大值)的平均数为,方差为,中位数为,则( )
A.的平均数为
B.的方差为
C.的中位数为
D.的极差为
【题型7 百分位数的计算】
满分技法
计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
25.(23-24高一下·天津南开·期末)某校高三数学备课组老师的年龄(单位:岁)分别为:37,30,42,32,41,46,45,48,35,53,则这组数据的第60百分位数为( )
A.45 B.42 C.43.5 D.45.5
26.(23-24高一下·河北廊坊·期末)一组数据:5,1,3,5,2,2,2,3,1,2,则这组数据的分位数是( )
A.3 B.4 C.4.5 D.5
27.(23-24高一下·河南·期末)样本数据14,16,18,20,21,22,24,28的第三四分位数为( )
A.16 B.17 C.23 D.24
28.(23-24高一下·河北·期末)若一组数据3,4,6,,8,3,7,9的第40百分位数为6,则正整数的最小值为 .
【题型8 判断互斥与对立事件】
满分技法
判断互斥与对立事件的两种方法:
(1)定义法:判断互斥事件、对立事件一般用定义判断,不可能同时发生的两个事件为互斥事件;两个事件,若有且仅有一个发生,则这两事件为对立事件,对立事件一定是互斥事件.
(2)集合法:①由各个事件所含的结果组成的集合彼此的交集为空集,则事件互斥.
②事件A的对立事件所含的结果组成的集合,是全集中由事件A所含的结果组成的集合的补集.
29.(22-23高一下·广东阳江·期末)从装有2件正品和2件次品的盒子内任取2件产品,下列选项中是互斥而不对立的两个事件的是( )
A.“至少有1件正品”与“都是次品” B.“恰好有1件正品”与“恰好有1件次品”
C.“至少有1件次品”与“至少有1件正品” D.“都是正品”与“都是次品”
30.(22-23高一下·山西朔州·期末)从装有2个红色乒乓球和3个白色乒乓球的口袋内任取3个球,那么是互斥事件而不是对立事件的两个事件是( )
A.恰有1个白色乒乓球与至少2个白色乒乓球
B.至少2个白色乒乓球与都是白色乒乓球
C.至少1个白色乒乓球与至少1个红色乒乓球
D.恰有1个红色乒乓球与恰有1个白色乒乓球
31.(22-23高一下·河南洛阳·月考)某饮料生产企业推出了一种有一定几率中奖的新饮料.甲、乙两名同学都购买了这种饮料,设事件为“甲、乙都中奖”,则与互为对立事件的是( )
A.甲、乙恰有一人中奖 B.甲、乙都没中奖
C.甲、乙至少有一人中奖 D.甲、乙至多有一人中奖
32.(22-23高一上·山东潍坊·期末)“韦神”数学兴趣小组有4名男生和2名女生,从中任选2名同学参加数学公式推导比赛,下列各对事件中互斥而不对立的是( )
A.至少有1名男生与全是男生;
B.至少有1名男生与全是女生;
C.恰有1名男生与恰有2名男生;
D.至少有1名男生与至少有1名女生.
【题型9 古典概型的概率计算】
满分技法
用公式法求古典概型的概率就是用所求事件A所含的基本事件个数除以基本事件空间Ω所含的基本事件个数求解事件A发生的概率P(A).解题的关键如下:
①定型,即根据古典概型的特点——有限性与等可能性,确定所求概率模型为古典概型.
②求量,利用列举法、排列组合等方法求出基本事件空间Ω及事件A所含的基本事件数.
③求值,代入公式P(A)=求值.
33.(23-24高一下·河北廊坊·期末)用2,3,4这3个数组成没有重复数字的三位数,则事件“这个三位数是偶数”发生的概率为( )
A. B. C. D.
34.(23-24高一下·湖南·期末)从这四个数字中任意取出两个不同的数字,设取出的两数字之和为,则的概率为( )
A. B. C. D.
35.(23-24高一下·山西太原·期末)已知甲、乙两个袋子中各装有若干个白球和红球(这些球仅颜色不同),且乙袋中球数是甲袋中球数2倍,若从甲袋中随机摸一个球,摸到红球的概率为,而将甲、乙两个袋子中的球装在一起后,从中随机摸一个球,摸到红球的概率为,则从乙袋中随机摸一个球,摸到红球的概率为( )
A. B. C. D.
36.(23-24高一下·山西太原·期末)某场乒乓球单打比赛按三局两胜的赛制进行,甲乙两人参加比赛.已知每局比赛甲获胜的概率为0.4,乙获胜的概率为0.6.现用计算机产生1~5之间的整数随机数,当出现1或2时,表示此局比赛甲获胜,当出现3,4或5时,表示此局比赛乙获胜.在一次试验中,产生了20组随机数如下:
534 123 512 114 125 334 432 332 314 152
423 443 423 344 541 453 525 151 354 345
根据以上数据,利用随机模拟试验,估计甲获得冠军的概率为( )
A.0.24 B.0.3 C.0.7 D.0.76
【题型10 概率的基本性质及应用】
满分技法
(1)首先判断几个事件的发生是否相互独立.
(2)求相互独立事件同时发生的概率的方法主要有:
①利用相互独立事件的概率乘法公式直接求解.
②正面计算较繁或难以入手时,可从其对立事件入手计算.
37.(23-24高一下·山西大同·期末)袋子中有一些大小质地完全相同的红球、白球和黑球,从中任意摸出一球,摸出的球是红球或白球的概率为0.56,摸出的球是红球或黑球的概率为0.68,则摸出的球是白球或黑球的概率为( )
A.0.64 B.0.72 C.0.76 D.0.82
38.(23-24高一下·全国·月考已知事件、、两两互斥,若,则( )
A. B. C. D.
39.(23-24高二上·四川泸州·期末)(多选)下列说法正确的是( )
A.甲、乙、丙三位同学争着去参加一个公益活动,抽签决定谁去,则先抽的概率大些
B.若事件A发生的概率为,则
C.如果事件A与事件B互斥,那么一定有
D.已知事件A发生的概率为,则它的对立事件发生的概率0.7
40.(22-23高一下·福建宁德·期末)设为两个互斥事件,且,,则下列各式一定正确的是( )
A. B.
C. D.
【题型11 相互独立事件的概率计算】
满分技法
求相互独立事件同时发生的概率的方法
(1)首先判断几个事件的发生是否相互独立.
(2)求相互独立事件同时发生的概率的方法主要有:
①利用相互独立事件的概率乘法公式直接求解.
②正面计算较繁或难以入手时,可从其对立事件入手计算.
41.(23-24高一下·重庆·期末)甲、乙、丙3人独立参加一项挑战,已知甲、乙、丙能完成挑战的概率分别为、、,则甲、乙、丙中有人完成挑战的概率为( )
A. B. C. D.
42.(23-24高一下·天津南开·期末)高一年级某同学参加了学校“数学社”“物理社”“话剧社”三个社团的选拔,该同学能否成功进入这三个社团是相互独立的.假设该同学能够进入“数学社”“物理社”“话剧社”三个社团的概率分别为m,n,,该同学只进入两个社团的概率为,且三个社团都进不了的概率为,则( )
A. B. C. D.
43.(23-24高一下·河南洛阳·期末)每年的12月2日是我国的“全国交通安全日”,某市交通广播为了提高社会公众的交通安全意识,2023年12月2日推出了一档交通安全知识闯关栏目,规则如下:第一关,闯关者从甲、乙、丙三道题目中随机抽取一道,若答对抽到的题目,则闯关成功,若没答对抽到的题目,则进入第二关;第二关,该闯关者从剩下的两道题目中随机抽取一道,若答对抽到的题目,则闯关成功,若没答对抽到的题目,则进入第三关;第三关,若该闯关者答对最后这一道题目,则闯关成功,若没有答对,则闯关失败.已知闯关者洛洛答对甲、乙、丙三题的概率依次是,,,且各关题目能否答对互不影响.
(1)求洛洛第一关抽中甲题,且第一关闯关成功的概率;
(2)求洛洛第一关闯关成功或第二关闯关成功的概率.
44.(23-24高一下·河北·期末)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中,则此人继续投篮,若未命中,则换对方投篮.已知甲每次投篮的命中率均为0.7,乙每次投篮的命中率均为0.5,甲、乙每次投篮的结果相互独立.
(1)若第1次投篮的人是甲,求第3次投篮的人是甲的概率;
(2)若第1次投篮的人是乙,求前5次投篮中乙投篮次数不少于4的概率.
【题型12 频率与概率关系及应用】
满分技法
1、频率是概率的近似值,概率是频率的稳定值.通常用概率来反映随机事件发生的可能性的大小,有时也用频率来作为随机事件概率的估计值.
2、随机事件概率的求法:利用概率的统计定义求事件的概率,即通过大量的重复试验,事件发生的频率会逐渐趋近于某一个常数,这个常数就是概率.
45.(23-24高一下·全国·专题练习)下列说法正确的是( )
A.一个人打靶,打了10发子弹,有7发子弹中靶,因此这个人中靶的概率是
B.一个同学做掷硬币试验,掷了6次,一定有3次正面向上
C.某地发行彩票,其回报率为47%,有人花了100元钱买彩票,一定会有47元的回报
D.大量试验后,可以用频率近似估计概率
46.(23-24高一下·浙江温州·期末)气象台预报“本市明天中心城区的降雨概率为30%,郊区的降雨概率为70%.”基于这些信息,关于明天降雨情况的描述最为准确的是( )
A.整个城市明天的平均降雨概率为50%
B.明天如果住在郊区不带伞出门将很可能淋雨
C.只有郊区可能出现降雨,而中心城区将不会有降雨
D.如果明天降雨,郊区的降雨量一定比中心城区多
47.(23-24高一上·陕西汉中·期末)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来石(古代容量单位),验得米内夹谷(假设一粒米与一粒谷的体积相等),抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )
A.213石 B.152石 C.169石 D.196石
48.(23-24高一下·全国·专题练习)众所周知,长时间玩手机可能影响视力.据调查,某校学生大约40%的人近视,而该校大约有30%的学生每天玩手机超过2 h,这些人的近视率约为50%.现从每天玩手机不超过2 h的学生中任意调查一名学生,则该名学生近视的概率为( )
A. B. C. D.
过关检测
一、单选题
1.(23-24高一下·山西太原·期末)为了解某校高中3000名学生的身高情况,从中抽取了100名学生进行调查,则这100名学生是( )
A.总体 B.样本 C.样本量 D.个体
2.(23-24高一下·浙江金华·月考)某工厂生产A、B、C三种不同型号的产品,产量之比为现用按比例分配的分层随机抽样的方法抽取一个容量为n的样本,若样本中A种型号的产品有8件,则样本容量n的值为( )
A.48 B.36 C.54 D.42
3.(23-24高一下·广东广州·月考要调查某地区高中学生身体素质,从高中生中抽取100人进行跳远测试,根据测试成绩制作频率分布直方图如下图,现再从这100人中用分层抽样的方法抽取20人,应从间抽取人数为b,则b为( )
A.4 B.5 C.6 D.7
4.(23-24高一下·天津和平·期末)已知一组样本数据10,10,9,12,10,9,12,则这组样本数据的上四分位数为( )
A.9 B.10 C.11 D.12
5.(23-24高一下·河南周口·期末)从这4个数中一次性地任取两个数,则这两个数的和大于87的概率为( )
A. B. C. D.
6.(23-24高一下·广西南宁·期末)已知样本空间,事件,事件,事件,则下列选项错误的是( )
A.与独立 B.与独立
C.与独立 D.
二、多选题
7.(23-24高二上·山东泰安·开学考试)某小组有3名男生和2名女生,从中任选2名同学去参加演讲比赛,事件“至少1名女生”与事件“全是男生”( )
A.是互斥事件 B.不是互斥事件 C.是对立事件 D.不是对立事件
8.(22-23高一下·广西南宁·期末)(多选)某学校为了解同学们某天上学的交通方式,在高一年级开展了随机调查,将学生某天上学的交通方式归为四类:A一家人接送,B一乘坐地铁,C一乘坐公交,D一其他方式,学校把收集到的数据整理绘制成条形图和扇形图,如图只给出了其中部分信息,根据图中信息,下列说法正确的是( )
A.若该校高一年级有学生1300人,则高一年级约有780人乘坐公共交通工具上学
B.估计该校高一年级有的学生某天家人接送上学
C.扇形图中B的占比为40%
D.估计该校学生上学交通方式为乘坐地铁或者其他方式的人数占全校学生的一半
9.(23-24·河南周口·模拟预测)已知一组样本数据的方差,则( )
A.这组样本数据的总和等于100
B.这组样本数据的中位数一定为2
C.数据,,…,的标准差为3s
D.现有一组新的样本数据,该组样本数据的极差比原样本数据的极差大
三、填空题
10.(23-24高一下·江苏扬州·期末)某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是 .
11.(23-24高一下·安徽阜阳·期中)若一组数据,,的平均数为4,则数据,,的平均数为 .
12.(23-24高二上·河北石家庄·期末)天气预报预测在今后的三天中,每天下雨的概率都为60%.现采用随机模拟的方法估计这三天中恰有两天下雨的概率,用1,2,3,4,5,6表示下雨,7,8,9,0表示不下雨.用计算机产生了10组随机数为180,792,454,417,165,809,798,386,196,206.据此估计这三天中恰有两天下雨的概率近似为 .
四、解答题
13.(23-24高一下·湖南岳阳·期末)甲、乙、丙三人组成一个小组代表学校参加一个“诗词大会”闯关活动团体赛.三人各自独立闯关,在第一轮比赛中甲闯关成功的概率为,甲、乙都闯关成功的概率为,甲、丙都闯关成功的概率为,每人闯关成功记分,三人得分之和记为小组团体总分.
(1)求乙、丙各自闯关成功的概率;
(2)求在第一轮比赛中团体总分为分的概率;
(3)若团体总分不小于分,则小组可参加下一轮比赛,求该小组参加下一轮比赛的概率.
14.(23-24高一下·江苏无锡·月考)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了了解全市居民生活用水量分布情况,通过抽样,获得100户居民月均用水量(单位:),将数据按照,,…,分成9组,制成如图所示的频率分布直方图.为了鼓励居民节约用水,该市政府在本市实行居民生活用水“阶梯水价”:第一阶梯为每户每月用水量不超过的部分按3元收费,第二阶梯为超过但不超过的部分按5元收费,第三阶梯为超过的部分按8元收费.
(1)求直方图中的值;
(2)已知该市有20万户居民,估计全市居民中月均用水费用不超过60元的用户数;
(3)该市政府希望使至少有的用户每月用水量不超过第二阶梯收费标准,请根据样本数据判断,现行收费标准是否符合要求?若不符合,则应该将第二阶梯用水量的上限至少上调到多少?
15.(23-24高一下·广西南宁·期末)为备战运动会,射击队的甲、乙两位射击运动员开展了队内对抗赛.在对抗赛中两人各射靶10次,每次命中的成绩(环数)如下:
甲 4 7 6 5 4 9 10 7 8 10
乙 7 5 8 6 7 9 7 6 7 8
(1)求甲运动员的样本数据第85百分位数;
(2)分别计算这两位运动员射击成绩的平均数和方差;
(3)射击队教练希望利用此次射击成绩为依据,挑选一名运动员参加运动会,请你帮助教练分析两个运动员的成绩,作出判断并说明理由.
注:一组数据的平均数为,它的方差为
原创精品资源学科网独家享有版权,侵权必究!4
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$