内容正文:
专题10 概率与统计 二轮复习核心考点聚焦与强化
专题10统计与概率
一、关键知识:
1.随机抽样
(1)简单随机抽样:一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.两种常用的简单随机抽样方法:①抽签法②随机数法
(2)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.分层抽样适用于已知总体是由差异明显的几部分组成的,抽样比==.
2.数字样本特征
(1)平均数:一组数据的算术平均数,即.
(2)方差:,反映样本的波动程度,稳定程度和离散程度;
越大,样本波动越大,越不稳定;越小,样本波动越小,越稳定.
(3)标准差:,标准差等于方差的算术平方根,数学意义和方差一样.
方差和标准差都是反映这组数据波动的大小,方差越大,数据的波动越大.
(4)极差:等于样本的最大值最小值.
(5)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
(6)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(7)百分位数:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
3.频率分布直方图
(1)频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中的各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直方图.
(2)频率分布直方图的特征
①各长方形面积等于相应各组的频率的数值,所有小矩形面积和为1.
②从频率分布直方图可以清楚地看出数据分布的总体趋势.
③从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息被抹掉.
3.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标.
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
4.列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
总计
总计
从列表中,依据与的值可直观得出结论:两个变量是否有关系.
5.独立性检验
(1)定义:利用独立性假设、随机变量来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
(2)公式:,其中为样本容量.
6.古典概率:
如果某个事件A包含的结果有m个,那么事件A的概率为P(A).
7.相互独立事件的概率:
将事件A和事件B同时发生的事件即为A•B,若两个相互独立事件A、B同时发生,则事件A•B发生的概率P(A•B)=P(A)•P(B).
8.条件概率的求法:
①利用条件概率公式,分别求出P(A)和P(AB),得P(B|A),其中P(A)>0;
②借助古典概型概率公式,先求出事件A包含的基本事件数n(A),再在事件A发生的条件下求出事件B包含的基本事件数,即n(A∩B),得P(B|A).
9.全概率公式:
一般地,设是一组两两互斥的事件,且,则对任意的事件,有,此公式为全概率公式.
10.离散型随机变量的分布列及性质
(1)一般地,若离散型随机变量X可能取的不同值为x1,x2,…,xi,…,xn,X取每一个值xi(i=1,2,…,n)的概率P(X=xi)=pi,则表
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
称为离散型随机变量X的概率分布列.
(2)离散型随机变量的分布列的性质:①pi≥0(i=1,2,…,n);②p1+p2+…+pn=1.
(3)E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.若Y=aX+b,其中a,b为常数,则Y也是随机变量,则E(aX+b)=aE(X)+b.
为这些偏离程度的加权平均,刻画了随机变量X与其均值E(X)的平均偏离程度,称
(4) D(X)= (xi-E(X))2pi为随机变量X的方差,其算术平方根为随机变量X的标准差.
11. 独立重复试验
一般地,在相同条件下重复地做n次试验,各次试验的结果相互独立,称为n次独立重复试验.
在n次独立重复试验中,设事件A发生的次数为X,在每次试验中事件A发生的概率为p,那么在n次独立重复试验中,事件A恰好发生k次的概率为Pn(k)=pk(1-p)n-k,(k=0,1,2,…,n).
12.二项分布
定义:若将事件A发生的次数设为X,发生的概率为P,不发生的概率q=1-p,那么在n次独立重复试验中,事件A恰好发生k次的概率是P(X=k)=pkqn-k(k=0,1,2,…,n),于是得到X的分布列:
X
0
1
…
k
…
n
P
p0qn
p1qn-1
…
pkqn-k
…
pnq0
由于表中第二行恰好是二项式展开式
(q+p)n=p0qn+p1qn-1+…+pkqn-k+…+pnq0各对应项的值,称这样的离散型随机变量X服从参数为n,p的二项分布,记作.
二项分布的期望、方差:若,则.
13.两点分布
X
0
1
P
1-p
p
这样的分布列叫做两点分布列.如果随机变量X的分布列为两点分布列,就称X服从两点分布,而称p=P(X=1)为成功概率.两点分布的期望与方差:.
14.超几何分布列
一般地,在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则事件{X=k}发生的概率为,k=0,1,2,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*,称分布列为超几何分布列.如果随机变量X的分布列为超几何分布列,则称随机变量X服从超几何分布.
X
0
1
…
k
…
m
P
…
…
超几何分布的均值:若X服从参数为N,M,n的超几何分布,则.
15.正态分布
正态曲线: 我们称f(x)= ,x∈R,其中μ∈R,σ>0为参数,为正态密度函数,称它的图
象为正态密度曲线.
正态曲线的特点
(1)曲线位于x轴上方,与x轴不相交;
(2)曲线是单峰的,它关于直线x=μ对称;
(3)曲线在x=μ处达到峰值;
(4)曲线与x轴之间的面积为1;
(5)当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移;
(6)当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
正态分布的三个常用数据:
(1)P(μ-σ<X≤μ+σ)=0.6826;(2)P(μ-2σ<X≤μ+2σ)=0.9544;(3)P(μ-3σ<X≤μ+3σ)=0.9974.
正态分布的均值与方差:若X~N(μ,σ2),则E(X)=μ,D(X)=σ2.
二、聚焦高考:
新高考在概率和统计方面的主要考点和知识点通常包括以下几个方面:
考点一:抽样方法
· 掌握简单随机抽样、分层抽样和系统抽样这三种基本抽样方法的特点和适用情况。
· 能够根据具体问题选择合适的抽样方法进行抽样。
考点二:用样本估计总体
· 利用样本数据估计总体的均值(平均数)、方差、标准差等数字特征。
· 通过样本频率分布估计总体分布,理解频率分布直方图与总体分布的关系。
· 会进行样本均值与总体均值、样本方差与总体方差的比较和推断。
考点三:统计图表
· 能够从统计图表中获取信息,包括数据的分布情况、集中趋势、离散程度等。
· 会根据给定的数据绘制合适的统计图表,以直观地展示数据特征。
考点四:独立性检验
· 了解独立性检验的基本思想和方法,用于判断两个分类变量之间是否存在关联。
· 能够根据给定的列联表计算卡方统计量,并与临界值进行比较,得出关于两个变量独立性的结论。
考点五:随机事件及其概率
· 理解随机事件的概念,能区分必然事件、不可能事件和随机事件。
· 掌握概率的基本性质,如概率的取值范围在 0 到 1 之间,互斥事件的概率加法公式等。
· 会计算简单随机事件的概率,如古典概型(等可能事件的概率),通过列举基本事件的个数来计算事件发生的概率。
考点六:概率分布与期望、方差
· 熟悉常见的离散型随机变量的概率分布,如二项分布、超几何分布等。
· 掌握计算离散型随机变量的期望和方差的方法,理解期望和方差的意义。
· 能够运用概率分布和期望、方差的知识解决实际问题,如决策问题、风险评估等。
这些考点和知识点通常相互关联,在考试中可能会综合考查学生对概率和统计的理解和应用能力。具体的考查形式和难度会根据试卷的整体要求和命题特点而有所变化。
高考真题:
1.(2023全国II)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( ).
A.种 B.种 C.种 D.种
2.(2021全国II)下列统计量中,能度量样本的离散程度的是( )
A.样本的标准差 B.样本的中位数
C.样本的极差 D.样本的平均数
3.(2021全国I)(多选)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则( )
A.两组样本数据的样本平均数相同 B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同 D.两组样本数据的样本极差相同
4.(2023全国I)(多选)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数 B.的中位数等于的中位数
C.的标准差不小于的标准差 D.的极差不大于的极差
5.(2023全国II)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表
亩产量
[900,950)
[950,1000)
[1000,1050)
[1050,1100)
[1100,1150)
[1150,1200)
频数
6
12
18
30
24
10
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
6.(2024全国II)在如图的4×4的方格表中选4个方格,要求每行和每列均恰有一个方格被选中,则共有 种选法,在所有符合上述要求的选法中,选中方格中的4个数之和的最大值是 .
7.(2022全国I)从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为( )
A. B. C. D.
8.(2024全国I)甲、乙两人各有四张卡片,每张卡片上标有一个数字,甲的卡片上分别标有数字1,3,5,7,乙的卡片上分别标有数字2,4,6,8,两人进行四轮比赛,在每轮比赛中,两人各自从自己持有的卡片中随机选一张,并比较所选卡片上数字的大小,数字大的人得1分,数字小的人得0分,然后各自弃置此轮所选的卡片(弃置的卡片在此后的轮次中不能使用).则四轮比赛后,甲的总得分不小于2的概率为 .
9.(2023全国II)(多选)在信道内传输0,1信号,信号的传输相互独立.发送0时,收到1的概率为,收到0的概率为;发送1时,收到0的概率为,收到1的概率为. 考虑两种传输方案:单次传输和三次传输.单次传输是指每个信号只发送1次,三次传输 是指每个信号重复发送3次.收到的信号需要译码,译码规则如下:单次传输时,收到的信号即为译码;三次传输时,收到的信号中出现次数多的即为译码(例如,若依次收到1,0,1,则译码为1).
A.采用单次传输方案,若依次发送1,0,1,则依次收到l,0,1的概率为
B.采用三次传输方案,若发送1,则依次收到1,0,1的概率为
C.采用三次传输方案,若发送1,则译码为1的概率为
D.当时,若发送0,则采用三次传输方案译码为0的概率大于采用单次传输方案译码为0的概率
10.(2022全国II)已知随机变量X服从正态分布,且,则___
11.(2021全国I)有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回的随机取两次,每次取1个球,甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则( )
A.甲与丙相互独立 B.甲与丁相互独立 C.乙与丙相互独立 D.丙与丁相互独立
12.(2021全国II)某物理量的测量结果服从正态分布,下列结论中不正确的是( )
A.越小,该物理量在一次测量中在的概率越大
B.该物理量在一次测量中大于10的概率为0.5
C.该物理量在一次测量中小于9.99与大于10.01的概率相等
D.该物理量在一次测量中落在与落在的概率相等
13.(2024全国I)(多选)随着“一带一路”国际合作的深入,某茶叶种植区多措并举推动茶叶出口.为了解推动出口后的亩收入(单位:万元)情况,从该种植区抽取样本,得到推动出口后亩收入的样本均值,样本方差,已知该种植区以往的亩收入服从正态分布,假设推动出口后的亩收入服从正态分布,则( )(若随机变量Z服从正态分布,)
A. B. C. D.
三、考点精炼:
考点一:抽样方法
1.北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”很受欢迎,现工厂决定从20只“冰墩墩”,15只“雪容融”和10个北京2022年冬奥会会徽中,采用比例分配分层随机抽样的方法,抽取一个容量为n的样本进行质量检测,若“冰墩墩”抽取了4只,则n为( )
A.3 B.2 C.5 D.9
2.某社区有1500名老年居民、2100名中青年居民和1800名儿童居民.为了解该社区居民对社区工作的满意度,现采用分层抽样的方法从这些居民中抽取一个容量为n的样本,若中青年居民比老年居民多抽取20人,则( )
A.120 B.150 C.180 D.210
3.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为
A.60 B.80 C.120 D.180
4.某小区为了调查本小区业主对物业服务满意度的真实情况,对本小区业主进行了调查,调查中问了两个问题1:你的手机尾号是不是奇数?问题2:你是否满意物业的服务?调查者设计了一个随机化装置,其中装有大小、形状和质量完全相同的白球和红球,每个被调查者随机从装置中摸到红球和白球的可能性相同,其中摸到白球的业主回答第一个问题,摸到红球的业主回答第二个问题,回答“是”的人往一个盒子中放一个小石子,回答“否”的人什么都不要做由于问题的答案只有“是”和“否”,而且回答的是哪个问题别人并不知道,因此被调查者可以毫无顾虑地给出符合实际情况的答案.已知某小区80名业主参加了问卷,且有47名业主回答了“是”,由此估计本小区对物业服务满意的百分比大约为( )
A.85% B.75% C.63.5% D.67.5%
5.(多选)某地区公共部门为了调查本地区中学生的吸烟情况,对随机抽出的编号为1~1000的1000名学生进行了调查.调查中使用了两个问题,问题1:你的编号是否为奇数?问题2:你是否吸烟?被调查者从设计好的随机装置(内有除颜色外完全相同的白球50个,红球50个)中摸出一个小球(摸完放回):摸到白球则如实回答问题1,摸到红球则如实回答问题2,回答“是”的人在一张白纸上画一个“√”,回答“否”的人什么都不用做,由于问题的答案只有“是”和“否”,而且回答的是哪个问题也是别人不知道的,因此被调查者可以毫无顾忌的给出真实的答案.最后统计得出,这1000人中,共有265人回答“是”,则下列表述正确的是( )
A.估计被调查者中约有15人吸烟 B.估计约有15人对问题2的回答为“是”
C.估计该地区约有3%的中学生吸烟 D.估计该地区约有1.5%的中学生吸烟
6.设某总体是由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第3列数字开始从左到右依次选取两个数字,则选出来的第6个个体编号为 .
考点二:用样本估计总体
1.我国智慧港口的建设飞速发展,作为智能化搬运设备的自动化引导车作用越发凸显.自重吨.再加上集装箱的重量,全车最重可达吨,但其停启位置十分精确,停车误差不超过厘米.码头地面埋设了几万个磁钉,车辆的位置由它们记录下来,传给后台,再由软件精确计算行驶路径,防止碰撞和刮擦.经统计,某港口某次运输中,有台的停车误差为厘米,有台的停车误差为厘米,有台没有停车误差,则该港口本次运输中所有的平均停车误差约为( )
A.厘米 B.厘米 C.厘米 D.厘米
2. 2024年1月九省联考的数学试卷出现新结构,其中多选题计分标准如下:①本题共3小题,每小题6分,满分18分;②每道小题的四个选项中有两个或三个正确选项,全部选对得6分,有选错的得0分;③部分选对得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某小题正确选项为三个,漏选一个正确选项得4分,漏选两个正确选项得2分).已知在某次新结构数学试题的考试中,小明同学三个多选题中第一小题确定得满分,第二小题随机地选了两个选项,第三小题随机地选了一个选项,则小明同学多选题所有可能总得分(相同总分只记录一次)的中位数为 .
3.(多选)盒子中有编号一次为1,2,3,4,5,6的6个小球(大小相同),从中不放回地抽取4个小球并记下编号,根据以下统计数据,可以判断一定抽出编号为6的小球的是( )
A.极差为5 B.上四分位数为5 C.平均数为3.5 D.方差为4.25
4.(多选)现有一组数据为1,2,4,8,16,32,则( )
A.这组数据的极差为31 B.这组数据的中位数为6
C.这组数据的平均数为6 D.去掉数据中的最大值后,方差较原来变小
5.若某同学连续三次考试的名次(第一名为,第二名为,以此类推,且可以有名次并列的情况)均不超过,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续三次考试的名次数据,推断一定不是尖子生的是( )
A.甲同学:平均数为,中位数为 B.乙同学:平均数为,方差小于
C.丙同学:中位数为,众数为 D.丁同学:众数为,方差大于
6.已知数据,,,,的方差为,则数据,,,,的标准差为( )
A. B. C. D.
7.(多选)下列统计量中,能刻画样本的离散程度的是( )
A.样本的标准差 B.样本的中位数
C.样本的方差 D.样本的极差
8.已知数据是某市个普通职工的年收入,如果再加上世界首富的年收入,组成个数据,则下列说法正确的是( )
A.年收入的平均数可能不变,中位数可能不变,方差可能不变
B.年收入的平均数大大增加,中位数可能不变,方差变大
C.年收入的平均数大大增加,中位数可能不变,方差变小
D.年收入的平均数大大增加,中位数一定变大,方差可能不变
9.现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为( )
A. B. C. D.
考点三:统计图表
1.某校举行数学竞赛,现将100名参赛学生的成绩(单位:分)整理如下:
成绩
频数
5
25
30
20
10
10
根据表中数据,下列结论正确的是( )
A.100名学生成绩的极差为60分
B.100名学生成绩的中位数大于70分
C.100名学生成绩的平均数大于60分
D.100名学生中成绩大于60分的人数所占比例超过
2.某市原来都开小车上班的唐先生统计了过去一年每一工作日的上班通行时间,并进行初步处理,得到频率分布表如下(表示通行时间,单位为分钟):
通行时间
频率
0.1
0.3
0.3
0.2
0.1
该市号召市民尽量减少开车出行,以绿色低碳的出行方式支持节能减排.唐先生积极响应政府号召,准备每天从骑自行车和开小车两种出行方式中随机选择一种.如果唐先生选择骑自行车,当天上班的通行时间为30分钟.将频率视为概率,根据样本估计总体的思想,对唐先生上班通行时间的判断,以下正确的是( )
A.开小车出行的通行时间的中位数为27.5分钟
B.开小车出行两天的总通行时间少于40分钟的概率为0.01
C.选择骑自行车比开小车平均通行时间至少会多耗费5分钟
D.若选择骑自行车和开小车的概率相等,则平均通行时间为28.5分钟
3.(多选)某科研院所共有科研人员200人,统计得到如下数据:
研究学科
性别
数学
物理
化学
生物
合计
女
15
10
24
31
80
男
45
40
18
17
120
合计
60
50
42
48
200
欲了解该所科研人员的创新能力,决定抽取40名科研人员进行调查,那么( )
A.若按照研究学科进行分层抽样(比例分配),则数学学科科研人员一定被抽取12人
B.若按照性别进行分层抽样(比例分配),则男性科研人员可能被抽取20人
C.若按照简单随机抽样,则女性科研人员一定被抽取10人
D.若按照简单随机抽样,则可能抽出的均为数学学科科研人员
4. 2021年是中国共产党建党100周年,为全面贯彻党的教育方针,提高学生的审美水平和人文素养,促进学生全面发展.某学校高一年级举办了班级合唱活动.现从全校学生中随机抽取部分学生,并邀请他们为此次活动评分(单位:分,满分100分),对评分进行整理,得到如图所示的频率分布直方图,则下列结论正确的是( )
A.
B.学生评分的中位数的估计值为85
C.学生评分的众数的估计值为85
D.若该学校有3000名学生参与了评分,则估计评分超过80分的学生人数为1200
5.(多选)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这名学生中,成绩位于内的学生成绩方差为,成绩位于内的同学成绩方差为.则( )
参考公式:样本划分为层,各层的容量、平均数和方差分别为:、、;、、.记样本平均数为,样本方差为,.
A.
B.估计该年级学生成绩的中位数约为
C.估计该年级成绩在分及以上的学生成绩的平均数为
D.估计该年级成绩在分及以上的学生成绩的方差为
6.为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图,根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
考点四:随机事件及其概率
1.有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回地随机取两次,每次取1个球,甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则下列说法错误的是( )
A.丙与丁是互斥事件 B.甲与丙是互斥事件
C.甲与丁相互独立 D.(乙丙)(乙)+(丙)
2.在一次考试中有一道4个选项的双选题,其中B和C是正确选项,A和D是错误选项,甲、乙两名同学都完全不会这道题目,只能在4个选项中随机选取两个选项.设事件“甲、乙两人所选选项恰有一个相同”,事件“甲、乙两人所选选项完全不同”,事件“甲、乙两人所选选项完全相同”,事件“甲、乙两人均未选择B选项”,则( )
A.事件M与事件N相互独立 B.事件X与事件Y相互独立
C.事件M与事件Y相互独立 D.事件N与事件Y相互独立
3.某质检员对一批设备的性能进行抽检,第一次检测每台设备合格的概率是0.5,不合格的设备重新调试后进行第二次检测,第二次检测合格的概率是0.8,如果第二次检测仍不合格,则作报废处理.设每台设备是否合格是相互独立的,则每台设备报废的概率为 ;检测3台设备,则至少2台合格的概率为 .
4.在某世界杯足球赛上,a,b,c,d四支球队进入了最后的比赛,在第一轮的两场比赛中,a对b,c对d,然后这两场比赛的胜者将进入冠亚军决赛,这两场比赛的负者比赛,决出第三名和第四名.若a对b、a对d的胜率均为0.6,a对c、c对d的胜率均为0.5,则a获得冠军的概率为 .
5.甲、乙两人下围棋,若甲执黑子先下,则甲胜的概率为;若乙执黑子先下,则乙胜的概率为.假定每局之间相互独立且无平局,第二局由上一局负者先下,若甲、乙比赛两局,第一局甲、乙执黑子先下是等可能的,则甲胜第一局,乙胜第二局的概率为 .
6.设是一个随机试验中的两个事件,若,则 .
7.在某电路上有C,D两个独立工作的元件,每次通电后,需要更换C元件的概率为0.3,需要更换D元件的概率为0.2,则在某次通电后C,D有且只有一个需要更换的条件下,C需要更换的概率是( )
A. B. C. D.
8.(多选)以码的方式在信道内发送位码数据流,前位为信息码,最后一位为奇检验码,使得位码数据流中的个数为奇数,如若信息码为,则检验码为,所发送数据流为.每位码信号的传输相互独立,发送时,收到的概率为,收到的概率为.接收方收到数据后,若数据流中的个数是偶数个,则数据传输错误,要求重新发送该数据,则( )
A.位码数据流传输无误的概率为
B.接收方要求重新发送该数据的概率为
C.若所接收数据流中的个数是奇数个,则信息码传输正确的概率为
D.若所接收数据流中的个数是偶数个,则信息码传输正确的概率为
考点五:概率分布与期望、方差
1.已知随机变量X服从,若,则( )
A.0.1 B.0.2 C.0.3 D.0.4
2.已知随机变量,且,则( )
A.3 B.2 C.1 D.0
3.某红绿灯十字路口早上9点后的某分钟内10辆汽车到达路口的时间依次为(单位:秒):1,2,4,7,11,16,21,29,37,46,令表示第i辆车到达路口的时间,记,则的方差为 .
4.为了解某大学射击社团的射击水平,分析组用分层抽样的方法抽取了6名老学员和2名新学员的某次射击成绩进行分析,经测算,6名老学员的射击成绩样本均值为8(单位:环),方差为(单位:环2);2名新学员的射击成绩分别为3环和5环,则抽取的这8名学员的射击成绩的方差为 环2.
5.某品牌手机的电池使用寿命(单位:年)服从正态分布.且使用寿命不少于1年的概率为0.9,使用寿命不少于9年的概率为,则该品牌手机的电池使用寿命不少于5年且不多于9年的概率为 .
6.每袋食盐的标准质量为500克,现采用自动流水线包装食盐,抽取一袋食盐检测,它的实际质量与标准质量存在一定的误差,误差值为实际质量减去标准质量.随机抽取100袋食盐,检测发现误差X(单位:克)近似服从正态分布,,则X介于~2的食盐袋数大约为( )
A.4 B.48 C.50 D.96
7.32名业余棋手组队与甲、乙2名专业棋手进行车轮挑战赛,每名业余棋手随机选择一名专业棋手进行一盘比赛,每盘比赛结果相互独立,若获胜的业余棋手人数不少于10名,则业余棋手队获胜.已知每名业余棋手与甲比赛获胜的概率均为,每名业余棋手与乙比赛获胜的概率均为,若业余棋手队获胜,则选择与甲进行比赛的业余棋手人数至少为( )
A.24 B.25 C.26 D.27
8.已知,则,,.今有一批数量庞大的零件.假设这批零件的某项质量指标引单位:毫米)服从正态分布,现从中随机抽取N个,这N个零件中恰有K个的质量指标ξ位于区间.若,试以使得最大的N值作为N的估计值,则N为( )
A.45 B.53 C.54 D.90
四、强化训练:
题组一:抽样方法
1.某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的分位数为( )
A.93 B.93.5 C.94 D.94.5
2.已知三种不同型号的产品数量之比依次为,现用分层抽样的方法抽取容量为的样本,若样本中型号产品有件,则为( )
A.60 B.70 C.80 D.90
3.某中学有初中生600名,高中生200名,为保障学生的身心健康,学校举办“校园安全知识”了竞赛.现按比例分配的分层随机抽样的方法,分别抽取初中生名,高中生名,经统计:名学生的平均成饽为74分,其中名初中生的平均成绩为72分,名高中生的平均成绩为分,则( )
A.74 B.76 C.78 D.80
4.(多选)某学校高三年级学生有500人,其中男生320人,女生180人.为了获得该校全体高三学生的身高信息,现采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为174,方差为16,女生样本的均值为164,方差为30.则下列说法正确的是( )
A.如果抽取25人作为样本,则抽取的样本中男生有16人
B.该校全体高三学生的身高均值为171
C.抽取的样本的方差为44.08
D.如果已知男、女的样本量都是25,则总样本的均值和方差可以作为总体均值和方差的估计值
题组二:用样本估计总体
1.(2022·海南·模拟预测)有一组样本数据如下:
56,62,63,63,65,66,68,69,71,74,76,76,77,78,79,79,82,85,87,88,95,98
则其25%分位数、中位数与75%分位数分别为( )
A.65,76,82 B.66,74,82 C.66,76,79 D.66,76,82
2.(多选)某班班主任为了了解该班学生寒假期间做家务劳动的情况,随机抽取该班15名学生,调查得到这15名学生寒假期间做家务劳动的天数分别是8,18,15,20,16,20,19,18,19,10,6,20,20,23,25,则下列结论正确的是( )
A.这组数据的中位数是18
B.这组数据的众数是20
C.若在记录数据时,漏掉了一个数据,则新数据的众数是20
D.若在记录数据时,漏掉了一个数据,则新数据的中位数是19
3.(多选)今年第5号台风“杜苏芮”于7月28日9时55分在福建晋江登陆,为1949年以来登陆福建的第二强台风,登陆后强度迅速减弱并一路北上影响黄淮、华北,给华北、黄淮等地带来较大范围的特大暴雨.华中地区某市受此次台风影响,最高气温同比有所下降,测得七天的最高气温分别是28,26,25,27,29,27,25(单位:℃),则( )
A.该组数据的极差为4 B.该组数据的众数为27
C.该组数据的中位数为27 D.该组数据的第70百分位数为28
4.(多选)甲,乙两个体育社团小组成员的某次立定跳远成绩(单位:厘米)如下:
甲组:,,,,,,,,,,,
乙组:,,,,,,,,,
则下列说法正确的是( )
A.甲组数据的第60百分位数是252
B.乙组数据的中位数是246
C.从甲、乙两组各随机选取一个成员,两人跳远成绩均在250厘米以上的概率为
D.甲组中存在这样的成员,将他调派到乙组后,甲、乙两组的跳远平均成绩都有提高
5.(多选)在一次党建活动中,甲、乙、丙、丁四个兴趣小组举行党史知识竞赛,每个小组各派10名同学参赛,记录每名同学失分(均为整数)情况,若该组每名同学失分都不超过7分,则该组为“优秀小组”,已知甲、乙、丙、丁四个小组成员失分数据信息如下,则一定为“优秀小组”的是( )
A.甲组中位数为2,极差为5 B.乙组平均数为2,众数为2
C.丙组平均数为1,方差大于0 D.丁组平均数为2,方差为3
6.已知一组样本数据的方差为10,且,则样本数据的方差为( )
A.9.2 B.10.8 C.9.75 D.10.25
7.已知样本数据的平均数为6,方差为16;样本数据的平均数为11,方差为21,现将两组样本数据合并,则新的样本数据,的方差为( )
A.18 B.24 C.26 D.28
8.现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为( )
A. B. C. D.
9.一组样本数据的平均数为,标准差为.另一组样本数据,,…,的平均数为,标准差为.两组数据合成一组新数据,,…,,新数据的平均数为,标准差为,则( )
A. B. C. D.与的大小与有关
题组三:统计图表
1.甲、乙两人进行射击比赛,分别对同一目标各射击10次,其成绩(环数)如下:
甲的环数
7
7
10
6
10
8
7
9
7
9
乙的环数
7
8
8
9
8
7
7
9
8
9
下列说法正确的是( )
A.甲的平均数大于乙的平均数 B.甲的中位数等于乙的中位数
C.甲、乙的众数都是7 D.乙的成绩更稳定
2.(多选)某学校准备组织部分同学去研学旅行,为了便于识别,他们准备定做一批容量一致的双肩包,为此,活动负责人征求了参加同学的意向,得到了如下数据:
容量/L
22
25
28
31
34
37
频数
4
1
5
21
2
2
对于上述数据,下列说法正确的是( )
A.众数为31 B.第一四分位数为28 C.平均数大于28 D.标准差小于2
3.(多选)某地区为促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物、有害垃圾和其他垃圾四类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,随机抽取了该地区四类垃圾箱中总计生活垃圾.经分拣以后数据统计如下表(单位:).根据样本估计本地区生活垃圾投放情况,下列说法中正确的是( )
项目
“厨余垃圾”箱
“可回收物”箱
“有害垃圾”箱
“其他垃圾”箱
厨余垃圾
300
80
20
100
可回收物
30
200
40
30
有害垃圾
20
20
50
10
其他垃圾
20
10
10
60
A.该地区居民可回收垃圾约占生活垃圾的
B.该地区居民生活垃圾投放错误的概率约为0.39
C.该地区四类垃圾箱中投放正确的概率最低的是“有害垃圾”箱
D.厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“有害垃圾”箱、“其他垃圾”箱的投放量的方差为106800
4.在年巴黎奥运会上,我国网球选手郑钦文历经场比赛,勇夺巴黎奥运会女子网球单打冠军,书写了中国网球新的历史.某学校有名学生,一机构在该校随机抽取了名学生对郑钦文奥运会期间场单打比赛的收看情况进行了调查,将数据分组整理后,列表如下:
观看场次
观看人数占调查
人数的百分比
从表中数据可以得出的正确结论为( ).
A.表中的数值为
B.观看场次不超过场的学生的比例为
C.估计该校观看场次不超过场的学生约为人
D.估计该校观看场次不低于场的学生约为人
5.某组样本数据的频率分布直方图如图所示,据此估计该组样本数据的众数、平均数、第一四分位数分别为,,,则,,的大小关系是(注:同一组中数据用该组区间中点值近似代替)( )
A. B. C. D.
6.某教育机构为调查中小学生每日完成作业的时间,收集了某位学生100天每天完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了下列结论,其中正确的是( )
A.估计该学生每日完成作业的时间在2小时至2.5小时的有50天
B.估计该学生每日完成作业时间超过3小时的概率为0.3
C.估计该学生每日完成作业时间的平均数为2.75小时
D.估计该学生每日完成作业时间的中位数与平均数相等
7.作为惠民政策之一,新农合是国家推出的一项新型农村合作医疗保险政策,极大地解决了农村人看病难的问题.为了检测此项政策的落实情况,现对某地乡镇医院随机抽取100份住院记录作出频率分布直方图如图,已知该医院报销政策为:花费400元及以下的不予报销;花费超过400元不超过6000元的,超过400元的部分报销;花费在6000元以上的报销所花费费用的.则下列说法中,正确的是( )
A.
B.若某病人住院花费了4300元,则报销后实际花费为2235元
C.根据频率分布直方图可估计一个病人在该医院报销所花费费用为的概率为
D.这100份花费费用的中位数是4200元
8.在某区高三年级举行的一次质量检测中,某学科共有3000人参加考试.为了解本次考试学生的成绩情况,从中抽取了部分学生的成绩(成绩均为正整数,满分为100分)作为样本进行统计,样本容量为n.按照,,,,的分组作出频率分布直方图(如图所示).已知成绩落在内的人数为16,则下列结论正确的是( )
A.样本容量
B.图中
C.估计全体学生该学科成绩的平均分为70.6分
D.若将该学科成绩由高到低排序,前15%的学生该学科成绩为A等,则成绩为78分的学生该学科成绩肯定不是A等
9.(多选)根据《冰雪运动发展规划(2016-2025年)》,到2025年,我国冰雪运动普及度大幅提高,直接参加冰雪运动的人数超过5000万,并“带动3亿人参与冰雪运动”.某滑冰馆统计了2021年11月1日到30日某小区居民在该滑冰馆的锻炼天数,得到如图所示的频率分布直方图(将频率视为概率),则下列说法正确的是( )
A.该小区居民在该滑冰馆的锻炼天数在区间内的最多
B.估计该小区居民在该滑冰馆的锻炼天数的中位数为16
C.估计该小区居民在该滑冰馆的锻炼天数的平均值不超过14
D.估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为0.465
10.(多选)衡阳市第八中学为了解学生数学史知识的积累情况,随机抽取150名同学参加数学史知识测试,测试题共5道,每答对一题得20分,答错得0分.得分不少于60分记为及格,不少于80分记为优秀,测试成绩百分比分布图如图所示,则( )
A.该次数学史知识测试及格率超过90%
B.该次数学史知识测试得满分的同学有15名
C.该次测试成绩的中位数大于测试成绩的平均数
D.若八中共有3000名学生,则数学史知识测试成绩能得优秀的同学大约有1800名
11.(多选)新中国成立以来,我国共进行了次人口普查,这次人口普查的城乡人口数据如图所示.根据该图数据判断,下列选项中正确的是( )
A.乡村人口数均高于城镇人口数
B.城镇人口比重的极差是
C.城镇人口数达到最高峰是第次
D.和前一次相比,城镇人口比重增量最大的是第次
题组四:随机事件及其概率
1.有四种礼盒,前三种里面分别仅装有中国结、记事本、笔袋,第四个礼盒里面三种礼品都有,现从中任选一个盒子,设事件:所选盒中有中国结,事件:所选盒中有记事本,事件:所选盒中有笔袋,则( )
A.事件与事件互斥 B.事件与事件相互独立
C.事件与事件互斥 D.事件与事件相互独立
2.随机安排甲、乙等4位同学参加校运会跳高、跳远、投铅球比赛,要求每位同学参加一项比赛,每项比赛至少一位同学参加,事件“甲参加跳高比赛”,事件“乙参加跳高比赛”,事件“乙参加跳远比赛”,则( )
A.事件A与B相互独立 B.事件A与C为互斥事件
C. D.
3.(多选)某人连续掷两次骰子,表示事件“第一次掷出的点数是2”,表示事件“第二次掷出的点数是3”.表示事件“两次掷出的点数之和为5”,表示事件“两次掷出的点数之和为9”.则( )
A.与相互独立 B.与相互独立 C.与不相互独立 D.与不相互独立
4.2022年11月30日,神舟十五号与神舟十四号航天员乘组在太空“胜利会师”,一起在中国人自己的“太空家园”留下了一张足以载入史册的太空合影.为了帮助同学们了解这六名航天员的奋斗历程,某班进行了相关专题讲座,并要求每人写一篇感想,班主任从中选取两篇优秀感想A,B向甲、乙报社投稿,先把A投向甲报社,B投向乙报社,两篇感想被采用的概率均为,若两篇感想至少有一篇被采用,则没被采用的将不再继续投稿;若两篇感想都没有被采用,则把A投向乙报社,B投向甲报社,此时A,B被采用的概率均为.若A,B是否被采用互不影响,则两篇感想至少有一篇被采用的概率为 .
5. 2023年“中华情·中国梦”中秋展演系列活动在厦门举办,包含美术、书法、摄影民间文艺作品展览,书画笔会,中秋文艺晚会等内容.假如在美术、书法、摄影民间文艺作品展览中,某区域有2幅不同的美术作品、3幅不同的书法作品、2幅不同的摄影作品,将这7幅作品排成一排挂在同一面墙上,则美术作品不能挂两端且摄影作品不能相邻的概率为( )
A. B. C. D.
6.某学校为了搞好课后服务工作,教务科组建了一批社团,学生们都能积极选择自己喜欢的社团.目前话剧社团、书法社团、摄影社团、街舞社团分别还可以再接收1名学生,恰好含甲、乙的4名同学前来教务科申请加入,按学校规定每人只能加入一个社团,则甲进街舞社团,乙进书法社团或摄影社团的概率为( )
A. B. C. D.
7.甲、乙两名游客慕名来到四川旅游,准备分别从九寨沟、峨眉山、海螺沟、都江堰、青城山这5个景点中随机选一个.事件:甲和乙选择的景点不同,事件:甲和乙恰好有一人选择九寨沟.则条件概率( )
A. B. C. D.
8.甲乙两位游客慕名来到赣州旅游,准备分别从大余丫山、崇义齐云山、全南天龙山、龙南九连山和安远三百山5个景点中随机选择其中一个,记事件A:甲和乙选择的景点不同,事件B:甲和乙恰好一人选择崇义齐云山,则条件概率( )
A. B. C. D.
9.在信道内传输0,1信号,信号的传输相互独立.发送0时,收到1的概率为,收到0的概率为;发送1时,收到0的概率为,收到1的概率为.考虑两种传输方案:单次传输和三次传输.单次传输是指每个信号只发送1次,三次传输是指每个信号重复发送3次.收到的信号需要译码,译码规则如下:单次传输时,收到的信号即为译码;三次传输时,收到的信号中出现次数多的即为译码(例如,若依次收到1,0,1,则译码为1)下列说法错误的是( )
A.采用单次传输方案,若依次发送1,0,1,则依次收到1,0,1的概率为
B.采用三次传输方案,若发送1,则依次收到1,0,1的概率为
C.采用三次传输方案,若发送1,则译码为1的概率为
D.当时,若发送0,则采用三次传输方案译码为0的概率大于采用单次传输方案译码为0的概率
题组五:概率分布与期望、方差
1.已知有4个数据的平均值为5,方差为4,现加入数据6和10,则这6个数据的新方差为( )
A. B. C.6 D.10
2.已知随机变量X服从正态分布N,若,则( )
A. B. C. D.
3.(多选)已知随机变量服从正态分布,即,则( ).
A. B. C. D.
4.小强对重力加速度做n次实验,若以每次实验结果的平均值作为重力加速度的估值.已知估值的误差,为使误差在内的概率不小于0.6827,至少要实验 次.
(参考数据:若,则).
5.某企业生产的一种零件,其质量指标介于的为优质品,该企业生产的这种零件质量指标服从正态分布,技术改造后生产的同种零件质量指标服从正态分布,那么,该企业生产的这种零件的优质品率约提高了 .
(若,则,,).
6.下列说法:①若随机变量X服从正态分布,若,则;②设某校男生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据,用最小二乘法建立的回归方程为,若该校某男生的身高为170cm,则其体重大约为62.5kg;③有甲、乙两个袋子,甲袋子中有3个白球,2个黑球;乙袋子中有4个白球,4个黑球.现从甲袋子中任取2个球放入乙袋子,然后再从乙袋子中任取一个球,则此球为白球的概率为,其中正确的个数为( )
A.0 B.1 C.2 D.3
7.(多选)18世纪30年代,数学家棣莫弗发现,如果随机变量X服从二项分布,那么当n比较大时,可视为X服从正态分布,其密度函数,.任意正态分布,可通过变换转化为标准正态分布(且).当时,对任意实数x,记,则( )
A.
B.当时,
C.随机变量,当减小,增大时,概率保持不变
D.随机变量,当,都增大时,概率单调增大
A.若随机变量,则
B.若随机变量服从两点分布,且,则
C.若随机变量的分布列为,则
D.若随机变量,则的分布列中最大的只有
9.(多选)假设某厂有两条包装食盐的生产线甲、乙,生产线甲正常情况下生产出来的包装食盐质量服从正态分布(单位:g),生产线乙正常情况下生产出来包装食盐质量为xg,随机变量x服从正态密度函数,其中,则( )
附:随机变量,则,,.
A.正常情况下,从生产线甲任意抽取一包食盐,质量小于485g的概率为0.15%
B.生产线乙的食盐质量
C.生产线乙产出的包装食盐一定比生产线甲产出的包装食盐质量重
D.生产线甲上的检测员某天随机抽取两包食盐,称得其质量均大于515g,于是判断出该生产线出现异常是合理的
10 / 27
学科网(北京)股份有限公司
$$专题10 概率与统计 二轮复习核心考点聚焦与强化
专题10统计与概率
一、关键知识:
1.随机抽样
(1)简单随机抽样:一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.两种常用的简单随机抽样方法:①抽签法②随机数法
(2)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.分层抽样适用于已知总体是由差异明显的几部分组成的,抽样比==.
2.数字样本特征
(1)平均数:一组数据的算术平均数,即.
(2)方差:,反映样本的波动程度,稳定程度和离散程度;
越大,样本波动越大,越不稳定;越小,样本波动越小,越稳定.
(3)标准差:,标准差等于方差的算术平方根,数学意义和方差一样.
方差和标准差都是反映这组数据波动的大小,方差越大,数据的波动越大.
(4)极差:等于样本的最大值最小值.
(5)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
(6)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(7)百分位数:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
3.频率分布直方图
(1)频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中的各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直方图.
(2)频率分布直方图的特征
①各长方形面积等于相应各组的频率的数值,所有小矩形面积和为1.
②从频率分布直方图可以清楚地看出数据分布的总体趋势.
③从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息被抹掉.
3.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标.
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
4.列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
总计
总计
从列表中,依据与的值可直观得出结论:两个变量是否有关系.
5.独立性检验
(1)定义:利用独立性假设、随机变量来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
(2)公式:,其中为样本容量.
6.古典概率:
如果某个事件A包含的结果有m个,那么事件A的概率为P(A).
7.相互独立事件的概率:
将事件A和事件B同时发生的事件即为A•B,若两个相互独立事件A、B同时发生,则事件A•B发生的概率P(A•B)=P(A)•P(B).
8.条件概率的求法:
①利用条件概率公式,分别求出P(A)和P(AB),得P(B|A),其中P(A)>0;
②借助古典概型概率公式,先求出事件A包含的基本事件数n(A),再在事件A发生的条件下求出事件B包含的基本事件数,即n(A∩B),得P(B|A).
9.全概率公式:
一般地,设是一组两两互斥的事件,且,则对任意的事件,有,此公式为全概率公式.
10.离散型随机变量的分布列及性质
(1)一般地,若离散型随机变量X可能取的不同值为x1,x2,…,xi,…,xn,X取每一个值xi(i=1,2,…,n)的概率P(X=xi)=pi,则表
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
称为离散型随机变量X的概率分布列.
(2)离散型随机变量的分布列的性质:①pi≥0(i=1,2,…,n);②p1+p2+…+pn=1.
(3)E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.若Y=aX+b,其中a,b为常数,则Y也是随机变量,则E(aX+b)=aE(X)+b.
为这些偏离程度的加权平均,刻画了随机变量X与其均值E(X)的平均偏离程度,称
(4) D(X)= (xi-E(X))2pi为随机变量X的方差,其算术平方根为随机变量X的标准差.
11. 独立重复试验
一般地,在相同条件下重复地做n次试验,各次试验的结果相互独立,称为n次独立重复试验.
在n次独立重复试验中,设事件A发生的次数为X,在每次试验中事件A发生的概率为p,那么在n次独立重复试验中,事件A恰好发生k次的概率为Pn(k)=pk(1-p)n-k,(k=0,1,2,…,n).
12.二项分布
定义:若将事件A发生的次数设为X,发生的概率为P,不发生的概率q=1-p,那么在n次独立重复试验中,事件A恰好发生k次的概率是P(X=k)=pkqn-k(k=0,1,2,…,n),于是得到X的分布列:
X
0
1
…
k
…
n
P
p0qn
p1qn-1
…
pkqn-k
…
pnq0
由于表中第二行恰好是二项式展开式
(q+p)n=p0qn+p1qn-1+…+pkqn-k+…+pnq0各对应项的值,称这样的离散型随机变量X服从参数为n,p的二项分布,记作.
二项分布的期望、方差:若,则.
13.两点分布
X
0
1
P
1-p
p
这样的分布列叫做两点分布列.如果随机变量X的分布列为两点分布列,就称X服从两点分布,而称p=P(X=1)为成功概率.两点分布的期望与方差:.
14.超几何分布列
一般地,在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则事件{X=k}发生的概率为,k=0,1,2,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*,称分布列为超几何分布列.如果随机变量X的分布列为超几何分布列,则称随机变量X服从超几何分布.
X
0
1
…
k
…
m
P
…
…
超几何分布的均值:若X服从参数为N,M,n的超几何分布,则.
15.正态分布
正态曲线: 我们称f(x)= ,x∈R,其中μ∈R,σ>0为参数,为正态密度函数,称它的图
象为正态密度曲线.
正态曲线的特点
(1)曲线位于x轴上方,与x轴不相交;
(2)曲线是单峰的,它关于直线x=μ对称;
(3)曲线在x=μ处达到峰值;
(4)曲线与x轴之间的面积为1;
(5)当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移;
(6)当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
正态分布的三个常用数据:
(1)P(μ-σ<X≤μ+σ)=0.6826;(2)P(μ-2σ<X≤μ+2σ)=0.9544;(3)P(μ-3σ<X≤μ+3σ)=0.9974.
正态分布的均值与方差:若X~N(μ,σ2),则E(X)=μ,D(X)=σ2.
二、聚焦高考:
新高考在概率和统计方面的主要考点和知识点通常包括以下几个方面:
考点一:抽样方法
· 掌握简单随机抽样、分层抽样和系统抽样这三种基本抽样方法的特点和适用情况。
· 能够根据具体问题选择合适的抽样方法进行抽样。
考点二:用样本估计总体
· 利用样本数据估计总体的均值(平均数)、方差、标准差等数字特征。
· 通过样本频率分布估计总体分布,理解频率分布直方图与总体分布的关系。
· 会进行样本均值与总体均值、样本方差与总体方差的比较和推断。
考点三:统计图表
· 能够从统计图表中获取信息,包括数据的分布情况、集中趋势、离散程度等。
· 会根据给定的数据绘制合适的统计图表,以直观地展示数据特征。
考点四:独立性检验
· 了解独立性检验的基本思想和方法,用于判断两个分类变量之间是否存在关联。
· 能够根据给定的列联表计算卡方统计量,并与临界值进行比较,得出关于两个变量独立性的结论。
考点五:随机事件及其概率
· 理解随机事件的概念,能区分必然事件、不可能事件和随机事件。
· 掌握概率的基本性质,如概率的取值范围在 0 到 1 之间,互斥事件的概率加法公式等。
· 会计算简单随机事件的概率,如古典概型(等可能事件的概率),通过列举基本事件的个数来计算事件发生的概率。
考点六:概率分布与期望、方差
· 熟悉常见的离散型随机变量的概率分布,如二项分布、超几何分布等。
· 掌握计算离散型随机变量的期望和方差的方法,理解期望和方差的意义。
· 能够运用概率分布和期望、方差的知识解决实际问题,如决策问题、风险评估等。
这些考点和知识点通常相互关联,在考试中可能会综合考查学生对概率和统计的理解和应用能力。具体的考查形式和难度会根据试卷的整体要求和命题特点而有所变化。
高考真题:
1.(2023全国II)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( ).
A.种 B.种 C.种 D.种
【答案】D
【详解】根据分层抽样的定义知初中部共抽取人,高中部共抽取,根据组合公式和分步计数原理则不同的抽样结果共有种.故选:D.
2.(2021全国II)(多选)下列统计量中,能度量样本的离散程度的是( )
A.样本的标准差 B.样本的中位数
C.样本的极差 D.样本的平均数
【答案】AC
【详解】由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选:AC.
3.(2021全国I)(多选)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则( )
A.两组样本数据的样本平均数相同 B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同 D.两组样本数据的样本极差相同
【答案】CD
【详解】A:且,故平均数不相同,错误;
B:若第一组中位数为,则第二组的中位数为,显然不相同,错误;
C:,故方差相同,正确;
D:由极差的定义知:若第一组的极差为,则第二组的极差为,故极差相同,正确;
故选:CD
4.(2023全国I)(多选)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数 B.的中位数等于的中位数
C.的标准差不小于的标准差 D.的极差不大于的极差
【答案】BD
【详解】对于选项A:设的平均数为,的平均数为,则,因为没有确定的大小关系,所以无法判断的大小,例如:,可得;例如,可得;例如,可得;故A错误;对于选项B:不妨设,可知的中位数等于的中位数均为,故B正确;对于选项C:因为是最小值,是最大值,则的波动性不大于的波动性,即的标准差不大于的标准差,例如:,则平均数,标准差,例如,则平均数,标准差,显然,即;故C错误;对于选项D:不妨设,则,当且仅当时,等号成立,故D正确;故选:BD.
5.(2023全国II)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表
亩产量
[900,950)
[950,1000)
[1000,1050)
[1050,1100)
[1100,1150)
[1150,1200)
频数
6
12
18
30
24
10
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
【答案】C
【详解】对于 A, 根据频数分布表可知, ,所以亩产量的中位数不小于 , 故 A 错误;对于B,亩产量不低于的频数为,所以低于的稻田占比为,故B错误;对于C,稻田亩产量的极差最大为,最小为,故C正确;
对于D,由频数分布表可得,平均值为,故D错误.故选;C.
6.(2024全国II)在如图的4×4的方格表中选4个方格,要求每行和每列均恰有一个方格被选中,则共有 种选法,在所有符合上述要求的选法中,选中方格中的4个数之和的最大值是 .
【答案】24 112
【详解】由题意知,选4个方格,每行和每列均恰有一个方格被选中,则第一列有4个方格可选,第二列有3个方格可选,第三列有2个方格可选,第四列有1个方格可选,所以共有种选法;每种选法可标记为,分别表示第一、二、三、四列的数字,则所有的可能结果为:
,
,
,
,
所以选中的方格中,的4个数之和最大,为.故答案为:24;112
7.(2022全国I)从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为( )
A. B. C. D.
【答案】D
【详解】从2至8的7个整数中随机取2个不同的数,共有种不同的取法,若两数不互质,不同的取法有:,共7种,故所求概率.故选:D.
8.(2024全国I)甲、乙两人各有四张卡片,每张卡片上标有一个数字,甲的卡片上分别标有数字1,3,5,7,乙的卡片上分别标有数字2,4,6,8,两人进行四轮比赛,在每轮比赛中,两人各自从自己持有的卡片中随机选一张,并比较所选卡片上数字的大小,数字大的人得1分,数字小的人得0分,然后各自弃置此轮所选的卡片(弃置的卡片在此后的轮次中不能使用).则四轮比赛后,甲的总得分不小于2的概率为 .
【答案】
【详解】设甲在四轮游戏中的得分分别为,四轮的总得分为.对于任意一轮,甲乙两人在该轮出示每张牌的概率都均等,其中使得甲获胜的出牌组合有六种,从而甲在该轮获胜的概率
,所以.从而.记.如果甲得0分,则组合方式是唯一的:必定是甲出1,3,5,7分别对应乙出2,4,6,8,所以
;如果甲得3分,则组合方式也是唯一的:必定是甲出1,3,5,7分别对应乙出8,2,4,6,所以.而的所有可能取值是0,1,2,3,故,.所以,,两式相减即得,故.所以甲的总得分不小于2的概率为.故答案为:.
9.(2023全国II)(多选)在信道内传输0,1信号,信号的传输相互独立.发送0时,收到1的概率为,收到0的概率为;发送1时,收到0的概率为,收到1的概率为. 考虑两种传输方案:单次传输和三次传输.单次传输是指每个信号只发送1次,三次传输 是指每个信号重复发送3次.收到的信号需要译码,译码规则如下:单次传输时,收到的信号即为译码;三次传输时,收到的信号中出现次数多的即为译码(例如,若依次收到1,0,1,则译码为1).
A.采用单次传输方案,若依次发送1,0,1,则依次收到l,0,1的概率为
B.采用三次传输方案,若发送1,则依次收到1,0,1的概率为
C.采用三次传输方案,若发送1,则译码为1的概率为
D.当时,若发送0,则采用三次传输方案译码为0的概率大于采用单次传输方案译码为0的概率
【答案】ABD
【详解】对于A,依次发送1,0,1,则依次收到l,0,1的事件是发送1接收1、发送0接收0、发送1接收1的3个事件的积,它们相互独立,所以所求概率为,A正确;对于B,三次传输,发送1,相当于依次发送1,1,1,则依次收到l,0,1的事件,是发送1接收1、发送1接收0、发送1接收1的3个事件的积,它们相互独立,所以所求概率为,B正确;对于C,三次传输,发送1,则译码为1的事件是依次收到1,1,0、1,0,1、0,1,1和1,1,1的事件和,它们互斥,由选项B知,所以所求的概率为,C错误;
对于D,由选项C知,三次传输,发送0,则译码为0的概率,单次传输发送0,则译码为0的概率,而,因此,即,D正确.故选:ABD
10.(2022全国II)已知随机变量X服从正态分布,且,则___
【答案】
【详解】因为,所以,因此.故答案为:.
11.(2021全国I)有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回的随机取两次,每次取1个球,甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则( )
A.甲与丙相互独立 B.甲与丁相互独立 C.乙与丙相互独立 D.丙与丁相互独立
【答案】B
【详解】 故选:B
12.(2021全国II)某物理量的测量结果服从正态分布,下列结论中不正确的是( )
A.越小,该物理量在一次测量中在的概率越大
B.该物理量在一次测量中大于10的概率为0.5
C.该物理量在一次测量中小于9.99与大于10.01的概率相等
D.该物理量在一次测量中落在与落在的概率相等
【答案】D
【详解】对于A,为数据的方差,所以越小,数据在附近越集中,所以测量结果落在内的概率越大,故A正确;
对于B,由正态分布密度曲线的对称性可知该物理量一次测量大于10的概率为,故B正确;
对于C,由正态分布密度曲线的对称性可知该物理量一次测量结果大于的概率与小于的概率相等,故C正确;
对于D,因为该物理量一次测量结果落在的概率与落在的概率不同,所以一次测量结果落在的概率与落在的概率不同,故D错误.
故选:D.
13.(2024全国I)(多选)随着“一带一路”国际合作的深入,某茶叶种植区多措并举推动茶叶出口.为了解推动出口后的亩收入(单位:万元)情况,从该种植区抽取样本,得到推动出口后亩收入的样本均值,样本方差,已知该种植区以往的亩收入服从正态分布,假设推动出口后的亩收入服从正态分布,则( )(若随机变量Z服从正态分布,)
A. B. C. D.
【答案】BC
【详解】依题可知,,所以,故,C正确,D错误;因为,所以,因为,所以,而,B正确,A错误,故选:BC.
三、考点精炼:
考点一:抽样方法
1.北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”很受欢迎,现工厂决定从20只“冰墩墩”,15只“雪容融”和10个北京2022年冬奥会会徽中,采用比例分配分层随机抽样的方法,抽取一个容量为n的样本进行质量检测,若“冰墩墩”抽取了4只,则n为( )
A.3 B.2 C.5 D.9
【答案】D
【详解】,解得:.故选:D
2.某社区有1500名老年居民、2100名中青年居民和1800名儿童居民.为了解该社区居民对社区工作的满意度,现采用分层抽样的方法从这些居民中抽取一个容量为n的样本,若中青年居民比老年居民多抽取20人,则( )
A.120 B.150 C.180 D.210
【答案】C
【详解】由题可知,解得.故选:C
3.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为
A.60 B.80 C.120 D.180
【答案】C
【详解】从11~12岁的学生中回收180份问卷,从中抽取60份,则抽样比为.∵从回收的问卷中按年龄段分层抽取容量为300的样本,∴从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷总数为(份),则15~16岁回收问卷份数为x=900-120-180-240=360(份).∴在15~16岁学生中抽取的问卷份数为360×=120(份),故选C.
4.某小区为了调查本小区业主对物业服务满意度的真实情况,对本小区业主进行了调查,调查中问了两个问题1:你的手机尾号是不是奇数?问题2:你是否满意物业的服务?调查者设计了一个随机化装置,其中装有大小、形状和质量完全相同的白球和红球,每个被调查者随机从装置中摸到红球和白球的可能性相同,其中摸到白球的业主回答第一个问题,摸到红球的业主回答第二个问题,回答“是”的人往一个盒子中放一个小石子,回答“否”的人什么都不要做由于问题的答案只有“是”和“否”,而且回答的是哪个问题别人并不知道,因此被调查者可以毫无顾虑地给出符合实际情况的答案.已知某小区80名业主参加了问卷,且有47名业主回答了“是”,由此估计本小区对物业服务满意的百分比大约为( )
A.85% B.75% C.63.5% D.67.5%
【答案】D
【详解】要调查80名居民,在准备的两个问题中每一个问题被问到的概率相同,第一个问题可能被询问40次,在被询问的40人中有20人手机号是奇数,而有47人回答了“是”,估计有27个人回答是否满意物业的服务时回答了“是”,在40人中有27个人满意服务, 估计本小区对物业服务满意的百分比,故选: D
5.(多选)某地区公共部门为了调查本地区中学生的吸烟情况,对随机抽出的编号为1~1000的1000名学生进行了调查.调查中使用了两个问题,问题1:你的编号是否为奇数?问题2:你是否吸烟?被调查者从设计好的随机装置(内有除颜色外完全相同的白球50个,红球50个)中摸出一个小球(摸完放回):摸到白球则如实回答问题1,摸到红球则如实回答问题2,回答“是”的人在一张白纸上画一个“√”,回答“否”的人什么都不用做,由于问题的答案只有“是”和“否”,而且回答的是哪个问题也是别人不知道的,因此被调查者可以毫无顾忌的给出真实的答案.最后统计得出,这1000人中,共有265人回答“是”,则下列表述正确的是( )
A.估计被调查者中约有15人吸烟 B.估计约有15人对问题2的回答为“是”
C.估计该地区约有3%的中学生吸烟 D.估计该地区约有1.5%的中学生吸烟
【答案】BC
【详解】随机抽出的1000名学生中,回答第一个问题的概率是,其编号是奇数的概率也是,所以回答问题1且回答的“是”的学生人数为,回答问题2且回答的“是”的人数为,从而估计该地区中学生吸烟人数的百分比为,估计被调查者中吸烟的人数为.故选BC.
6.设某总体是由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第3列数字开始从左到右依次选取两个数字,则选出来的第6个个体编号为 .
【答案】19
【详解】由随机数的抽样规则得:依次选取的样本编号为:,故选出来的第6个个体编号为.故答案为:
考点二:用样本估计总体
1.我国智慧港口的建设飞速发展,作为智能化搬运设备的自动化引导车作用越发凸显.自重吨.再加上集装箱的重量,全车最重可达吨,但其停启位置十分精确,停车误差不超过厘米.码头地面埋设了几万个磁钉,车辆的位置由它们记录下来,传给后台,再由软件精确计算行驶路径,防止碰撞和刮擦.经统计,某港口某次运输中,有台的停车误差为厘米,有台的停车误差为厘米,有台没有停车误差,则该港口本次运输中所有的平均停车误差约为( )
A.厘米 B.厘米 C.厘米 D.厘米
【答案】B
【详解】由题意可知,这该港口本次运输中所有的平均停车误差为厘米.
故选:B.
2. 2024年1月九省联考的数学试卷出现新结构,其中多选题计分标准如下:①本题共3小题,每小题6分,满分18分;②每道小题的四个选项中有两个或三个正确选项,全部选对得6分,有选错的得0分;③部分选对得部分分(若某小题正确选项为两个,漏选一个正确选项得3分;若某小题正确选项为三个,漏选一个正确选项得4分,漏选两个正确选项得2分).已知在某次新结构数学试题的考试中,小明同学三个多选题中第一小题确定得满分,第二小题随机地选了两个选项,第三小题随机地选了一个选项,则小明同学多选题所有可能总得分(相同总分只记录一次)的中位数为 .
【答案】11
【详解】由题意得小明同学第一题得6分;第二题选了2个选项,可能得分情况有3种,分别是得0分、4分和6分;第二题选了1个选项,可能得分情况有3种,分别是得0分、2分和3分;由于相同总分只记录一次,因此小明的总分情况有:6分、8分、9分、10分、12分、13分、14分、15分共8种情况,所以中位数为,故答案为:11.
3.(多选)盒子中有编号一次为1,2,3,4,5,6的6个小球(大小相同),从中不放回地抽取4个小球并记下编号,根据以下统计数据,可以判断一定抽出编号为6的小球的是( )
A.极差为5 B.上四分位数为5 C.平均数为3.5 D.方差为4.25
【答案】ABD
【详解】假设抽出四张卡牌从小到大排列为.A.,得,,故A正确;
B.上四分位数为,得,,故B正确;C.,存在,,,使得不抽出卡牌6,故C错误;D.若未抽出卡牌6,则方差最大为,,,时,此时,,故D正确.故选:ABD.
4.(多选)现有一组数据为1,2,4,8,16,32,则( )
A.这组数据的极差为31 B.这组数据的中位数为6
C.这组数据的平均数为6 D.去掉数据中的最大值后,方差较原来变小
【答案】ABD
【详解】极差为,故A正确;中位数为,故B正确;
平均数为,故C错误;
去掉最大数32后数据更集中,稳定性更强,则方差变小,故D正确.
故选:ABD.
5.若某同学连续三次考试的名次(第一名为,第二名为,以此类推,且可以有名次并列的情况)均不超过,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续三次考试的名次数据,推断一定不是尖子生的是( )
A.甲同学:平均数为,中位数为 B.乙同学:平均数为,方差小于
C.丙同学:中位数为,众数为 D.丁同学:众数为,方差大于
【答案】D
【详解】甲同学名次数据的平均数为,说明名次之和为,由中位数为,得出三次考试名次均不超过,断定甲是尖子生;乙同学名次数据的平均数为,设乙同学3次考试的名次分别为、、,由题意可得则方差,所以,,则,所以,、、均不超过,由此可断定乙是尖子生;丙同学名次数据的中位数为,众数为,说明三次考试中至少有两次名次为,故丙可能是尖子生;丁同学名次数据的众数为,说明某两次名次为,设另一次名次为,平均数为,方差为,即,所以,或或均不满足,故,断定丁一定不是尖子生.故选:D.
6.已知数据,,,,的方差为,则数据,,,,的标准差为( )
A. B. C. D.
【答案】C
【详解】由题意新数据的方差为,因此标准差为.故选:C.
7.(多选)下列统计量中,能刻画样本的离散程度的是( )
A.样本的标准差 B.样本的中位数
C.样本的方差 D.样本的极差
【答案】ACD
【详解】显然样本的方差与样本的方差相等,刻画样本的离散程度的量是标准差、方差、极差,ACD是,样本的中位数刻画的是样本数据的集中趋势,B不是.故选ACD
8.已知数据是某市个普通职工的年收入,如果再加上世界首富的年收入,组成个数据,则下列说法正确的是( )
A.年收入的平均数可能不变,中位数可能不变,方差可能不变
B.年收入的平均数大大增加,中位数可能不变,方差变大
C.年收入的平均数大大增加,中位数可能不变,方差变小
D.年收入的平均数大大增加,中位数一定变大,方差可能不变
【答案】B
【详解】因为数据是某市个普通职工的年收入,而是世界首富的年收入,则会远远大于,故这个数据中,年收入的平均数大大增加,中位数可能不变,也可能稍微变大,由于数据的集中程度也受到比较大的影响,而更加离散,则方差变大.故选:B
9.现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为( )
A. B. C. D.
【答案】D
【详解】设甲组数据分别为、、、,乙组数据分别为、、、,甲组数据的平均数为,可得,方差为,可得,乙组数据的平均数为,可得,方差为,可得,混合后,新数据的平均数为,方差为.故选D.
考点三:统计图表
1.某校举行数学竞赛,现将100名参赛学生的成绩(单位:分)整理如下:
成绩
频数
5
25
30
20
10
10
根据表中数据,下列结论正确的是( )
A.100名学生成绩的极差为60分
B.100名学生成绩的中位数大于70分
C.100名学生成绩的平均数大于60分
D.100名学生中成绩大于60分的人数所占比例超过
【答案】C
【详解】对于A,由表格可知,100名学生成绩的极差可能为60,故A错误;
对于B,由表格可知,100名学生成绩的中位数位于之间,故B错误;
对于C,平均数为,故C正确;
对于D,100名学生中成绩大于60分的人数所占比例为,故D错误;
故选:C
2.某市原来都开小车上班的唐先生统计了过去一年每一工作日的上班通行时间,并进行初步处理,得到频率分布表如下(表示通行时间,单位为分钟):
通行时间
频率
0.1
0.3
0.3
0.2
0.1
该市号召市民尽量减少开车出行,以绿色低碳的出行方式支持节能减排.唐先生积极响应政府号召,准备每天从骑自行车和开小车两种出行方式中随机选择一种.如果唐先生选择骑自行车,当天上班的通行时间为30分钟.将频率视为概率,根据样本估计总体的思想,对唐先生上班通行时间的判断,以下正确的是( )
A.开小车出行的通行时间的中位数为27.5分钟
B.开小车出行两天的总通行时间少于40分钟的概率为0.01
C.选择骑自行车比开小车平均通行时间至少会多耗费5分钟
D.若选择骑自行车和开小车的概率相等,则平均通行时间为28.5分钟
【答案】D
【详解】对于A,由频率分布表可知中位数在内,若设中位数为,则有,解得,所以A错误;对于B,由频率分布表可知开小车出行两天的总通行时间少于40分钟的概率为1,所以B错误;对于C,由频率分布表可得开小车平均通行时间为,所以选择骑自行车比开小车平均通行时间至少会多耗费3分钟,所以C错误;对于D,由上面的计算可知平均通行时间为,所以D正确,故选:D
3.(多选)某科研院所共有科研人员200人,统计得到如下数据:
研究学科
性别
数学
物理
化学
生物
合计
女
15
10
24
31
80
男
45
40
18
17
120
合计
60
50
42
48
200
欲了解该所科研人员的创新能力,决定抽取40名科研人员进行调查,那么( )
A.若按照研究学科进行分层抽样(比例分配),则数学学科科研人员一定被抽取12人
B.若按照性别进行分层抽样(比例分配),则男性科研人员可能被抽取20人
C.若按照简单随机抽样,则女性科研人员一定被抽取10人
D.若按照简单随机抽样,则可能抽出的均为数学学科科研人员
【答案】AD
【详解】对于选项A:按学科分层抽样,则数学学科抽样比为,则数学学科抽取人数为人,故A正确;对于选项B:按性别分层抽样,男性抽样比为,则男性科研人员被抽到的人数为人,故选项B错误.对于选项C:若按照简单随机抽样,则每个人被抽到的概率都相等,则女性科研人员不一定被抽取10人,选项C错误;对于选项D: 若按照简单随机抽样,则每个人被抽到的概率都相等,则可能抽出的均为数学学科科研人员,故选项D正确;故选:AD
4. 2021年是中国共产党建党100周年,为全面贯彻党的教育方针,提高学生的审美水平和人文素养,促进学生全面发展.某学校高一年级举办了班级合唱活动.现从全校学生中随机抽取部分学生,并邀请他们为此次活动评分(单位:分,满分100分),对评分进行整理,得到如图所示的频率分布直方图,则下列结论正确的是( )
A.
B.学生评分的中位数的估计值为85
C.学生评分的众数的估计值为85
D.若该学校有3000名学生参与了评分,则估计评分超过80分的学生人数为1200
【答案】C
【详解】对于A,,A不正确;对于B,学生评分在内的频率为0.6,则学生评分的中位数t在内,则有,解得,B不正确;对于C,学生评分在的频率最大,则学生评分的众数的估计值为85,C正确;对于D,因评分超过80分的频率为0.6,则估计评分超过80分的学生人数为,D不正确.故选:C
5.(多选)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这名学生中,成绩位于内的学生成绩方差为,成绩位于内的同学成绩方差为.则( )
参考公式:样本划分为层,各层的容量、平均数和方差分别为:、、;、、.记样本平均数为,样本方差为,.
A.
B.估计该年级学生成绩的中位数约为
C.估计该年级成绩在分及以上的学生成绩的平均数为
D.估计该年级成绩在分及以上的学生成绩的方差为
【答案】BCD
【详解】对于A选项,在频率分布直方图中,所有直方图的面积之和为,则,解得,A错;
对于B选项,前两个矩形的面积之和为,
前三个矩形的面积之和为,
设计该年级学生成绩的中位数为,则,
根据中位数的定义可得,解得,
所以,估计该年级学生成绩的中位数约为,B对;
对于C选项,估计成绩在分以上的同学的成绩的平均数为
分,C对;
对于D选项,估计该年级成绩在分及以上的学生成绩的方差为
,D对.
故选:BCD.
6.为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图,根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
【答案】C
【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为,故B正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为,故D正确;该地农户家庭年收入的平均值的估计值为(万元),超过6.5万元,故C错误.综上,给出结论中不正确的是C.故选:C.
考点四:随机事件及其概率
1.有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回地随机取两次,每次取1个球,甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则下列说法错误的是( )
A.丙与丁是互斥事件 B.甲与丙是互斥事件
C.甲与丁相互独立 D.(乙丙)(乙)+(丙)
【答案】D
【详解】对于A:丙与丁不可能同时发生,所以丙与丁是互斥事件,A正确;对于B:若第一次取出的球的数字是1,则两次取出的球的数字之和不可能是8,所以甲与丙不可能同时发生,是互斥事件,B正确;
对于C:(甲),(丁),(甲丁),则(甲)(丁)(甲丁),所以甲与丁相互独立,C正确;对于D:乙丙包含的基本事件有共10个,乙包含的基本事件有共6个,丙包含的基本事件有共5个,
所以P(乙丙)P(乙)+P(丙),D错误.故选:D.
2.在一次考试中有一道4个选项的双选题,其中B和C是正确选项,A和D是错误选项,甲、乙两名同学都完全不会这道题目,只能在4个选项中随机选取两个选项.设事件“甲、乙两人所选选项恰有一个相同”,事件“甲、乙两人所选选项完全不同”,事件“甲、乙两人所选选项完全相同”,事件“甲、乙两人均未选择B选项”,则( )
A.事件M与事件N相互独立 B.事件X与事件Y相互独立
C.事件M与事件Y相互独立 D.事件N与事件Y相互独立
【答案】C
【详解】依题意甲、乙两人所选选项有如下情形:①有一个选项相同,②两个选项相同,③两个选项不相同,所以,,,,
因为事件与事件互斥,所以,又,所以事件M与事件N不相互独立,故A错误;,故B错误;由,则事件M与事件Y相互独立,故C正确;因为事件N与事件Y互斥,所以,又,
所以事件N与事件Y不相互独立,故D错误.故选:C.
3.某质检员对一批设备的性能进行抽检,第一次检测每台设备合格的概率是0.5,不合格的设备重新调试后进行第二次检测,第二次检测合格的概率是0.8,如果第二次检测仍不合格,则作报废处理.设每台设备是否合格是相互独立的,则每台设备报废的概率为 ;检测3台设备,则至少2台合格的概率为 .
【答案】 0.1 0.972
【详解】由题意可得,每台设备报废的情况是第一次检测不合格,第二次检测仍不合格,则作报废处理,
故每台设备报废的概率为 ;每台设备合格的概率为 ,故检测3台设备,则至少2台合格的概率为 ,故答案为:0.1;0.972
4.在某世界杯足球赛上,a,b,c,d四支球队进入了最后的比赛,在第一轮的两场比赛中,a对b,c对d,然后这两场比赛的胜者将进入冠亚军决赛,这两场比赛的负者比赛,决出第三名和第四名.若a对b、a对d的胜率均为0.6,a对c、c对d的胜率均为0.5,则a获得冠军的概率为 .
【答案】
【详解】a获得冠军,第一轮中必须胜出,概率为,由题意可得,第二轮比赛中可以分两种情况,胜,概率为,然后胜,由独立事件的乘法公式可得a获得冠军的概率为;第二种情况为胜,概率为,然后胜,由独立事件的乘法公式可得a获得冠军的概率为;由分类原理可得a获得冠军的概宰为,故答案为:.
5.甲、乙两人下围棋,若甲执黑子先下,则甲胜的概率为;若乙执黑子先下,则乙胜的概率为.假定每局之间相互独立且无平局,第二局由上一局负者先下,若甲、乙比赛两局,第一局甲、乙执黑子先下是等可能的,则甲胜第一局,乙胜第二局的概率为 .
【答案】
【详解】第一局甲胜,第二局乙胜:第一局甲执黑子先下,则甲胜第一局的概率为,第二局乙执黑子先下,则乙胜的概率为,若第一局乙执黑子先下,则甲胜第一局的概率为,第二局乙执黑子先下,则乙胜的概率为,所以,第一局甲胜,第二局乙胜的概率为;故答案为:.
6.设是一个随机试验中的两个事件,若,则 .
【答案】/0.25
【详解】根据条件概率公式可得.故答案为:.
7.在某电路上有C,D两个独立工作的元件,每次通电后,需要更换C元件的概率为0.3,需要更换D元件的概率为0.2,则在某次通电后C,D有且只有一个需要更换的条件下,C需要更换的概率是( )
A. B. C. D.
【答案】C
【详解】记事件E:在某次通电后C,D有且只有一个需要更换,事件F:C需要更换,则,,由条件概率公式可得.故选:C.
8.(多选)以码的方式在信道内发送位码数据流,前位为信息码,最后一位为奇检验码,使得位码数据流中的个数为奇数,如若信息码为,则检验码为,所发送数据流为.每位码信号的传输相互独立,发送时,收到的概率为,收到的概率为.接收方收到数据后,若数据流中的个数是偶数个,则数据传输错误,要求重新发送该数据,则( )
A.位码数据流传输无误的概率为
B.接收方要求重新发送该数据的概率为
C.若所接收数据流中的个数是奇数个,则信息码传输正确的概率为
D.若所接收数据流中的个数是偶数个,则信息码传输正确的概率为
【答案】ABC
【详解】对于A选项,每位数据码传输正确的概率均为,传输错误的概率为,由独立事件的概率公式可知,位码数据流传输无误的概率为,A对;对于B选项,设接收方要求重新发送该数据的概率为,不用重新发数据的概率为,接收方要求重新发送该数据,意味着数据码在传输时传错的数码的个数为或或,则,,
所以,,①,②,①②得,则,B对;对于C选项,由①②可得,则,记事件所接收数据流中的个数是奇数个,事件信息码传输正确,则,事件意味着,数据流前四位是正确的,最后一位也是正确的,所以,,
由条件概率公式可得,所以,若所接收数据流中的个数是奇数个,则信息码传输正确的概率为,C对;对于D选项,记事件所接收数据流中的个数是偶数个,则,事件意味着数据流前四位是正确的,最后一位是错误的,则,由条件概率公式可得,D错.故选:ABC.
考点五:概率分布与期望、方差
1.已知随机变量X服从,若,则( )
A.0.1 B.0.2 C.0.3 D.0.4
【答案】C
【详解】.故选:C
2.已知随机变量,且,则( )
A.3 B.2 C.1 D.0
【答案】C
【详解】随机变量,所以,所以,故.故选:C.
3.某红绿灯十字路口早上9点后的某分钟内10辆汽车到达路口的时间依次为(单位:秒):1,2,4,7,11,16,21,29,37,46,令表示第i辆车到达路口的时间,记,则的方差为 .
【答案】
【详解】由题意得,,
,,
故的平均数为,故的方差为.故答案为:
4.为了解某大学射击社团的射击水平,分析组用分层抽样的方法抽取了6名老学员和2名新学员的某次射击成绩进行分析,经测算,6名老学员的射击成绩样本均值为8(单位:环),方差为(单位:环2);2名新学员的射击成绩分别为3环和5环,则抽取的这8名学员的射击成绩的方差为 环2.
【答案】
【详解】记6名老学员射击环数分别为,8名学员的射击成绩的平均数和方差分别为.
由题可知,,则,所以.故答案为:
5.某品牌手机的电池使用寿命(单位:年)服从正态分布.且使用寿命不少于1年的概率为0.9,使用寿命不少于9年的概率为,则该品牌手机的电池使用寿命不少于5年且不多于9年的概率为 .
【答案】0.4
【详解】由题意知,,∴∴正态分布曲线的对称轴为直线,因为,∴,故该品牌手机的电池使用寿命不少于5年且不多于9年的概率为0.4,故答案为:0.4
6.每袋食盐的标准质量为500克,现采用自动流水线包装食盐,抽取一袋食盐检测,它的实际质量与标准质量存在一定的误差,误差值为实际质量减去标准质量.随机抽取100袋食盐,检测发现误差X(单位:克)近似服从正态分布,,则X介于~2的食盐袋数大约为( )
A.4 B.48 C.50 D.96
【答案】D
【详解】,,则,,则.
故选:D.
7.32名业余棋手组队与甲、乙2名专业棋手进行车轮挑战赛,每名业余棋手随机选择一名专业棋手进行一盘比赛,每盘比赛结果相互独立,若获胜的业余棋手人数不少于10名,则业余棋手队获胜.已知每名业余棋手与甲比赛获胜的概率均为,每名业余棋手与乙比赛获胜的概率均为,若业余棋手队获胜,则选择与甲进行比赛的业余棋手人数至少为( )
A.24 B.25 C.26 D.27
【答案】A
【详解】设选择与甲进行比赛且获胜的业余棋手人数为X,选择与乙进行比赛且获胜的业余棋手人数为Y;设选择与甲进行比赛的业余棋手人数为n,则选择与乙进行比赛的业余棋手人数为32-n.
X所有可能的取值为0,1,2,,n,则,;
Y所有可能的取值为0,1,2,,32-n,则,,
所以获胜的业余棋手总人数的期望,解得.
故选:A.
8.已知,则,,.今有一批数量庞大的零件.假设这批零件的某项质量指标引单位:毫米)服从正态分布,现从中随机抽取N个,这N个零件中恰有K个的质量指标ξ位于区间.若,试以使得最大的N值作为N的估计值,则N为( )
A.45 B.53 C.54 D.90
【答案】B
【详解】由已知可得,.
又,
所以,,.设,
则,所以,,所以.,
所以,,所以.所以,以使得最大的N值作为N的估计值,则N为.故选:B.
四、强化训练:
题组一:抽样方法
1.某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的分位数为( )
A.93 B.93.5 C.94 D.94.5
【答案】B
【详解】将比赛得分从小到大重新排列:85,87,89,90,91,91,92,93,94,96,因为,所以这组数据的分位数第8个数与第9个数的平均值,即.故选:B.
2.已知三种不同型号的产品数量之比依次为,现用分层抽样的方法抽取容量为的样本,若样本中型号产品有件,则为( )
A.60 B.70 C.80 D.90
【答案】B
【详解】因为三种不同型号的产品数量之比依次为,且用分层抽样的方法抽取一个容量为的样本,所以型号产品被抽的抽样比为:,因为型号产品有件,所以,解得.故选:B.
3.某中学有初中生600名,高中生200名,为保障学生的身心健康,学校举办“校园安全知识”了竞赛.现按比例分配的分层随机抽样的方法,分别抽取初中生名,高中生名,经统计:名学生的平均成饽为74分,其中名初中生的平均成绩为72分,名高中生的平均成绩为分,则( )
A.74 B.76 C.78 D.80
【答案】D
【详解】由题意,得可得,解得.故选:D.
4.(多选)某学校高三年级学生有500人,其中男生320人,女生180人.为了获得该校全体高三学生的身高信息,现采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为174,方差为16,女生样本的均值为164,方差为30.则下列说法正确的是( )
A.如果抽取25人作为样本,则抽取的样本中男生有16人
B.该校全体高三学生的身高均值为171
C.抽取的样本的方差为44.08
D.如果已知男、女的样本量都是25,则总样本的均值和方差可以作为总体均值和方差的估计值
【答案】AC
【详解】根据分层抽样,抽取25人作为样本,则抽取的样本中男生有正确;
样本学生的身高均值,B错误;
抽取的样本的方差为,C正确;
因为抽样中未按比例进行分层抽样,所以总体中每个个体被抽到的可能性不完全相同,因而样本的代表性差,所以作为总体的估计不合适.D错误.
故选:AC
题组二:用样本估计总体
1.(2022·海南·模拟预测)有一组样本数据如下:
56,62,63,63,65,66,68,69,71,74,76,76,77,78,79,79,82,85,87,88,95,98
则其25%分位数、中位数与75%分位数分别为( )
A.65,76,82 B.66,74,82 C.66,76,79 D.66,76,82
【答案】D
【详解】因为,所以样本数据的25%分位数为第六个数据即66;中位数为:,
因为,所以样本数据的75%分位数为第十七个数据即82.故选:D.
2.(多选)某班班主任为了了解该班学生寒假期间做家务劳动的情况,随机抽取该班15名学生,调查得到这15名学生寒假期间做家务劳动的天数分别是8,18,15,20,16,20,19,18,19,10,6,20,20,23,25,则下列结论正确的是( )
A.这组数据的中位数是18
B.这组数据的众数是20
C.若在记录数据时,漏掉了一个数据,则新数据的众数是20
D.若在记录数据时,漏掉了一个数据,则新数据的中位数是19
【答案】BC
【详解】由题意,将这组数据按从小到大的顺序排列:6,8,10,15,16,18,18,19,19,20,20,20,20,23,25,根据中位数和众数的定义,可得数据的中位数和众数分别是19和20,则A错误,B正确;若漏掉了一个数据后,新数据中出现最多的数仍然是20,则C正确;若漏掉的数据大于或等于19,则新数据的中位数是18.5,故D错误.故选:BC.
3.(多选)今年第5号台风“杜苏芮”于7月28日9时55分在福建晋江登陆,为1949年以来登陆福建的第二强台风,登陆后强度迅速减弱并一路北上影响黄淮、华北,给华北、黄淮等地带来较大范围的特大暴雨.华中地区某市受此次台风影响,最高气温同比有所下降,测得七天的最高气温分别是28,26,25,27,29,27,25(单位:℃),则( )
A.该组数据的极差为4 B.该组数据的众数为27
C.该组数据的中位数为27 D.该组数据的第70百分位数为28
【答案】AC
【详解】将这组数据按照从小到大的顺排列得,则该组数据的极差为,故A正确;该组数据的众数为和,故B错误;该组数据的中位数为27,故C正确;因为,
所以该组数据的第70百分位数为第个数据,即,故D错误.故选:AC.
4.(多选)甲,乙两个体育社团小组成员的某次立定跳远成绩(单位:厘米)如下:
甲组:,,,,,,,,,,,
乙组:,,,,,,,,,
则下列说法正确的是( )
A.甲组数据的第60百分位数是252
B.乙组数据的中位数是246
C.从甲、乙两组各随机选取一个成员,两人跳远成绩均在250厘米以上的概率为
D.甲组中存在这样的成员,将他调派到乙组后,甲、乙两组的跳远平均成绩都有提高
【答案】BCD
【详解】对于选项A,因为,所以甲组数据的第60百分位数是第8个数,即253,故A错误;对于选项B,因为,所以乙组数据的中位数是第5个数与第6个数的平均数,即,故B正确;对于选项C,甲组中跳远成绩在250厘米以上的有7人,乙组中跳远成绩在250厘米以上的有2人,所以从甲、乙两组各随机选取一个成员,两人跳远成绩均在250厘米以上的概率为,故C正确;对于选项D,甲组的平均成绩为厘米,乙组的平均成绩为厘米,所以将甲组中跳远成绩为248厘米的成员调派到乙组后,甲、乙两组的跳远平均成绩都有提高,故D正确.故选:BCD.
5.(多选)在一次党建活动中,甲、乙、丙、丁四个兴趣小组举行党史知识竞赛,每个小组各派10名同学参赛,记录每名同学失分(均为整数)情况,若该组每名同学失分都不超过7分,则该组为“优秀小组”,已知甲、乙、丙、丁四个小组成员失分数据信息如下,则一定为“优秀小组”的是( )
A.甲组中位数为2,极差为5 B.乙组平均数为2,众数为2
C.丙组平均数为1,方差大于0 D.丁组平均数为2,方差为3
【答案】AD
【详解】对,因为中位数为2,极差为5,故最大值小于等于7,故正确;对,如失分数据分别为,则满足平均数为2,众数为2,但不满足每名同学失分都不超过7分,故B错误;
对,如失分数据分别为,则满足平均数为1,方差大于0,但不满足每名同学失分都不超过7分,故C错误;对,利用反证法,假设有一同学失分超过7分,则方差大于,与题设矛盾,故每名同学失分都不超过7分.故D正确.故选:AD.
6.已知一组样本数据的方差为10,且,则样本数据的方差为( )
A.9.2 B.10.8 C.9.75 D.10.25
【答案】B
【详解】设样本数据的平均数为,则,且样本数据的平均数也为,故:.故选:B
7.已知样本数据的平均数为6,方差为16;样本数据的平均数为11,方差为21,现将两组样本数据合并,则新的样本数据,的方差为( )
A.18 B.24 C.26 D.28
【答案】B
【详解】由题可得,所以,利用分层抽样的方差公式可得新的样本数据的方差为:.故选:B.
8.现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为( )
A. B. C. D.
【答案】D
【详解】设甲组数据分别为、、、,乙组数据分别为、、、,
甲组数据的平均数为,可得,方差为,可得,
乙组数据的平均数为,可得,方差为,可得,
混合后,新数据的平均数为,
方差为
.
故选:D.
9.一组样本数据的平均数为,标准差为.另一组样本数据,,…,的平均数为,标准差为.两组数据合成一组新数据,,…,,新数据的平均数为,标准差为,则( )
A. B. C. D.与的大小与有关
【答案】A
【详解】对于数据,可得,
所以;
对于数据,,…,,可得,
所以;
对于数据,,…,,可得:平均数,
标准差
,注意到,所以.故选:A.
题组三:统计图表
1.甲、乙两人进行射击比赛,分别对同一目标各射击10次,其成绩(环数)如下:
甲的环数
7
7
10
6
10
8
7
9
7
9
乙的环数
7
8
8
9
8
7
7
9
8
9
下列说法正确的是( )
A.甲的平均数大于乙的平均数 B.甲的中位数等于乙的中位数
C.甲、乙的众数都是7 D.乙的成绩更稳定
【答案】D
【详解】计算得甲、乙的平均数都是8,故A错误;甲从小到大进行排序:6,7,7,7,7,8,9,9,10,10,乙从小到大进行排序,7,7,7,8,8,8,8,9,9,9,所以甲的中位数是7.5,而乙的中位数是8,故B错误;乙的众数是8,故C错误;甲的方差为,乙的方差为,所以乙的方差小,所以乙的成绩更稳定,故D正确.故选:D
2.(多选)某学校准备组织部分同学去研学旅行,为了便于识别,他们准备定做一批容量一致的双肩包,为此,活动负责人征求了参加同学的意向,得到了如下数据:
容量/L
22
25
28
31
34
37
频数
4
1
5
21
2
2
对于上述数据,下列说法正确的是( )
A.众数为31 B.第一四分位数为28 C.平均数大于28 D.标准差小于2
【答案】ABC
【详解】对于A,31出现的次数最多,因此众数为31,A正确;对于B,由,得第一四分位数为从小到在排列的第9个数28,B正确;对于C,平均数,C正确;对于D,由,得样本数据的方差大于4,因此样本数据的标准差大于2,D错误.故选:ABC
3.(多选)某地区为促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物、有害垃圾和其他垃圾四类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,随机抽取了该地区四类垃圾箱中总计生活垃圾.经分拣以后数据统计如下表(单位:).根据样本估计本地区生活垃圾投放情况,下列说法中正确的是( )
项目
“厨余垃圾”箱
“可回收物”箱
“有害垃圾”箱
“其他垃圾”箱
厨余垃圾
300
80
20
100
可回收物
30
200
40
30
有害垃圾
20
20
50
10
其他垃圾
20
10
10
60
A.该地区居民可回收垃圾约占生活垃圾的
B.该地区居民生活垃圾投放错误的概率约为0.39
C.该地区四类垃圾箱中投放正确的概率最低的是“有害垃圾”箱
D.厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“有害垃圾”箱、“其他垃圾”箱的投放量的方差为106800
【答案】AB
【详解】可回收垃圾约占生活垃圾的比例为:,所以A正确;生活垃圾投放错误的概率约为:,所以B正确;因为厨余垃圾、可回收物、有害垃圾和其他垃圾四类垃圾箱中投放正确的概率为:,它们的大小关系为:,所以C错误;,,所以D错误.故选:AB.
4.在年巴黎奥运会上,我国网球选手郑钦文历经场比赛,勇夺巴黎奥运会女子网球单打冠军,书写了中国网球新的历史.某学校有名学生,一机构在该校随机抽取了名学生对郑钦文奥运会期间场单打比赛的收看情况进行了调查,将数据分组整理后,列表如下:
观看场次
观看人数占调查
人数的百分比
从表中数据可以得出的正确结论为( ).
A.表中的数值为
B.观看场次不超过场的学生的比例为
C.估计该校观看场次不超过场的学生约为人
D.估计该校观看场次不低于场的学生约为人
【答案】D
【详解】由表可知,,解得,选项A错误;
观看场次不超过场的学生的比例为,选项B错误;
观看场次不超过场的学生的比例为,则观看场次不超过场的学生约为人,选项C错误;
观看场次不低于场的学生的比例为,则观看场次不低于场的学生约为人,选项D正确.
故选:D
5.某组样本数据的频率分布直方图如图所示,据此估计该组样本数据的众数、平均数、第一四分位数分别为,,,则,,的大小关系是(注:同一组中数据用该组区间中点值近似代替)( )
A. B. C. D.
【答案】A
【详解】由频率分布直方图可知众数为,即,平均数,
显然第一四分位数位于之间,则,解得,所以.故选:A
6.某教育机构为调查中小学生每日完成作业的时间,收集了某位学生100天每天完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了下列结论,其中正确的是( )
A.估计该学生每日完成作业的时间在2小时至2.5小时的有50天
B.估计该学生每日完成作业时间超过3小时的概率为0.3
C.估计该学生每日完成作业时间的平均数为2.75小时
D.估计该学生每日完成作业时间的中位数与平均数相等
【答案】C
【详解】对于A:估计该学生每日完成作业的时间在2小时至2.5小时的有天,A错误;
对于B:估计该学生每日完成作业时间超过3小时的概率为,B错误;
对于C:,C正确;对于D:估计该学生每日完成作业时间的中位数为,则,解得,D错误.
7.作为惠民政策之一,新农合是国家推出的一项新型农村合作医疗保险政策,极大地解决了农村人看病难的问题.为了检测此项政策的落实情况,现对某地乡镇医院随机抽取100份住院记录作出频率分布直方图如图,已知该医院报销政策为:花费400元及以下的不予报销;花费超过400元不超过6000元的,超过400元的部分报销;花费在6000元以上的报销所花费费用的.则下列说法中,正确的是( )
A.
B.若某病人住院花费了4300元,则报销后实际花费为2235元
C.根据频率分布直方图可估计一个病人在该医院报销所花费费用为的概率为
D.这100份花费费用的中位数是4200元
【答案】D
【详解】由频率分布直方图可得,
经计算得,即A错误;某病人住院花费了4300元,则报销的金额为元,所以此人实际花费为元,即B错误;样本中可报销费用为的占比为0.15,即根据频率分布直方图可估计一个病人在该医院报销所花费费用为的概率为,即C错误;样本中花费金额小于4000的概率为,所以中位数应在区间内,所以花费费用的中位数是元,即D正确.故选:D
8.在某区高三年级举行的一次质量检测中,某学科共有3000人参加考试.为了解本次考试学生的成绩情况,从中抽取了部分学生的成绩(成绩均为正整数,满分为100分)作为样本进行统计,样本容量为n.按照,,,,的分组作出频率分布直方图(如图所示).已知成绩落在内的人数为16,则下列结论正确的是( )
A.样本容量
B.图中
C.估计全体学生该学科成绩的平均分为70.6分
D.若将该学科成绩由高到低排序,前15%的学生该学科成绩为A等,则成绩为78分的学生该学科成绩肯定不是A等
【答案】C
【详解】由频率分布直方图可得:,,,,的频率依次为.对于A:∵成绩落在内的人数为16,则,解得,故A错误;
对B:由频率可得,解得,故B错误;对C:由选项B可得:成绩落在的频率为,估计全体学生该学科成绩的平均分分,故C正确;对D:设该学科成绩为A等的最低分数为,∵,,的频率依次为,即,可知,则,解得,虽然,但是估计值,有可能出现没有学生考到分的情况(学生成绩均为正整数),这种情况下成绩为78分的学生该学科成绩可以是A等,D错误;故选:C.
9.(多选)根据《冰雪运动发展规划(2016-2025年)》,到2025年,我国冰雪运动普及度大幅提高,直接参加冰雪运动的人数超过5000万,并“带动3亿人参与冰雪运动”.某滑冰馆统计了2021年11月1日到30日某小区居民在该滑冰馆的锻炼天数,得到如图所示的频率分布直方图(将频率视为概率),则下列说法正确的是( )
A.该小区居民在该滑冰馆的锻炼天数在区间内的最多
B.估计该小区居民在该滑冰馆的锻炼天数的中位数为16
C.估计该小区居民在该滑冰馆的锻炼天数的平均值不超过14
D.估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为0.465
【答案】AD
【详解】频率分布直方图中,最高小矩形所在的区间为,故选项A正确;由频率分布直方图可得,前三个小矩形的面积之和为,所以估计该小区居民在该滑冰馆的锻炼天数的中位数小于15,故选项B不正确;由频率分布直方图可得,,故选项C不正确;由频率分布直方图可得,该小区居民在该滑冰馆的锻炼天数超过15天的概率为,故选项D正确.故选:AD.
10.(多选)衡阳市第八中学为了解学生数学史知识的积累情况,随机抽取150名同学参加数学史知识测试,测试题共5道,每答对一题得20分,答错得0分.得分不少于60分记为及格,不少于80分记为优秀,测试成绩百分比分布图如图所示,则( )
A.该次数学史知识测试及格率超过90%
B.该次数学史知识测试得满分的同学有15名
C.该次测试成绩的中位数大于测试成绩的平均数
D.若八中共有3000名学生,则数学史知识测试成绩能得优秀的同学大约有1800名
【答案】ACD
【详解】由图知,及格率为,A正确;
该测试满分同学的百分比为,则有名,B错误;
由图知,中位数为80分,平均数为分,C正确;
由题意,3000名学生成绩能得优秀的同学有,D正确.
故选:ACD
11.(多选)新中国成立以来,我国共进行了次人口普查,这次人口普查的城乡人口数据如图所示.根据该图数据判断,下列选项中正确的是( )
A.乡村人口数均高于城镇人口数
B.城镇人口比重的极差是
C.城镇人口数达到最高峰是第次
D.和前一次相比,城镇人口比重增量最大的是第次
【答案】BC
【详解】对于A,年,城镇人口数高于乡村人口数,A错误;
对于B,城镇人口比重的极差为,B正确;
对于C,城镇人口数最高峰为年,即第次,C正确;
对于D,和前一次相比,第次普查,城镇人口比重增量为;第次普查,城镇人口比重增量为;则城镇人口比重增量最大的是第次,D错误.
故选:BC.
题组四:随机事件及其概率
1.有四种礼盒,前三种里面分别仅装有中国结、记事本、笔袋,第四个礼盒里面三种礼品都有,现从中任选一个盒子,设事件:所选盒中有中国结,事件:所选盒中有记事本,事件:所选盒中有笔袋,则( )
A.事件与事件互斥 B.事件与事件相互独立
C.事件与事件互斥 D.事件与事件相互独立
【答案】B
【详解】选项A,事件和事件可以同时发生,即第四个礼盒中可以既有中国结,又有记事本,事件与事件不互斥,A错误;选项B,,,,,B正确;选项C,事件与事件可以同时发生,即第四个礼盒中可以既有中国结,又有记事本或笔袋,C错误;选项D,,,,,与不独立,故D错误.故选:B.
2.随机安排甲、乙等4位同学参加校运会跳高、跳远、投铅球比赛,要求每位同学参加一项比赛,每项比赛至少一位同学参加,事件“甲参加跳高比赛”,事件“乙参加跳高比赛”,事件“乙参加跳远比赛”,则( )
A.事件A与B相互独立 B.事件A与C为互斥事件
C. D.
【答案】C
【详解】对于A,每项比赛至少一位同学参加,则有不同的安排方法,事件“甲参加跳高比赛”,若跳高比赛安排2人,则有种方法;若跳高比赛安排1人,则有种方法,所以安排甲参加跳高比赛的不同安排方法共有种,则,同理,若安排甲、乙同时参加跳高比赛,则跳高比赛安排2人为甲和乙,跳远、投铅球比赛各安排1人,有种不同的安排方法,所以,因为,事件A与B不相互独立故A错误;
对于B,在一次试验中,不可能同时发生的两个事件称为互斥事件,事件A与C可以同时发生,故事件A与C不是互斥事件,故B错误;对于C,在安排甲参加跳高比赛的同时安排乙参加跳远比赛的不同安排方法有种,所以,所以,故C正确;对于D,,故D错误.故选:C
3.(多选)某人连续掷两次骰子,表示事件“第一次掷出的点数是2”,表示事件“第二次掷出的点数是3”.表示事件“两次掷出的点数之和为5”,表示事件“两次掷出的点数之和为9”.则( )
A.与相互独立 B.与相互独立 C.与不相互独立 D.与不相互独立
【答案】ACD
【详解】由题,,,.
对A:∵,∴与相互独立,故A正确.
对B:∵,∴与不相互独立,故B错误.
对C:∵,∴与不相互独立,故C正确.
对D:∵,∴与不相互独立,故D正确.
故选:ACD.
4.2022年11月30日,神舟十五号与神舟十四号航天员乘组在太空“胜利会师”,一起在中国人自己的“太空家园”留下了一张足以载入史册的太空合影.为了帮助同学们了解这六名航天员的奋斗历程,某班进行了相关专题讲座,并要求每人写一篇感想,班主任从中选取两篇优秀感想A,B向甲、乙报社投稿,先把A投向甲报社,B投向乙报社,两篇感想被采用的概率均为,若两篇感想至少有一篇被采用,则没被采用的将不再继续投稿;若两篇感想都没有被采用,则把A投向乙报社,B投向甲报社,此时A,B被采用的概率均为.若A,B是否被采用互不影响,则两篇感想至少有一篇被采用的概率为 .
【答案】
【详解】由题意得,第一次投稿两篇感想都没被采用的概率为,所以第一次投稿至少有一篇感想被采用的概率,第一次投稿两篇感想都没被采用,第二次投稿至少有一篇感想被采用的概率,故两篇感想至少有一篇被采用的概率.
故答案为:.
5. 2023年“中华情·中国梦”中秋展演系列活动在厦门举办,包含美术、书法、摄影民间文艺作品展览,书画笔会,中秋文艺晚会等内容.假如在美术、书法、摄影民间文艺作品展览中,某区域有2幅不同的美术作品、3幅不同的书法作品、2幅不同的摄影作品,将这7幅作品排成一排挂在同一面墙上,则美术作品不能挂两端且摄影作品不能相邻的概率为( )
A. B. C. D.
【答案】B
【详解】由题意知这7幅作品所有的不同挂法有种,美术作品不能挂两端且摄影作品相邻时不同的挂法有种,美术作品不能挂两端时不同的挂法有种,则美术作品不能挂两端且摄影作品不能相邻的不同的挂法有种,所以事件美术作品不能挂两端且摄影作品不能相邻的概率为,故选:B
6.某学校为了搞好课后服务工作,教务科组建了一批社团,学生们都能积极选择自己喜欢的社团.目前话剧社团、书法社团、摄影社团、街舞社团分别还可以再接收1名学生,恰好含甲、乙的4名同学前来教务科申请加入,按学校规定每人只能加入一个社团,则甲进街舞社团,乙进书法社团或摄影社团的概率为( )
A. B. C. D.
【答案】C
【详解】4名同学分别进入话剧社团、书法社团、摄影社团、街舞社团共有种,其中甲进街舞社团,乙进书法社团或摄影社团有种,由古典概型的概率计算公式可得,按学校规定每人只能加入一个社团,则甲进街舞社团,乙进书法社团或摄影社团的概率为,故选:C.
7.甲、乙两名游客慕名来到四川旅游,准备分别从九寨沟、峨眉山、海螺沟、都江堰、青城山这5个景点中随机选一个.事件:甲和乙选择的景点不同,事件:甲和乙恰好有一人选择九寨沟.则条件概率( )
A. B. C. D.
【答案】A
【详解】由题知,,,所以,故选:A.
8.甲乙两位游客慕名来到赣州旅游,准备分别从大余丫山、崇义齐云山、全南天龙山、龙南九连山和安远三百山5个景点中随机选择其中一个,记事件A:甲和乙选择的景点不同,事件B:甲和乙恰好一人选择崇义齐云山,则条件概率( )
A. B. C. D.
【答案】B
【详解】由题知,,,所以,故选:B.
9.在信道内传输0,1信号,信号的传输相互独立.发送0时,收到1的概率为,收到0的概率为;发送1时,收到0的概率为,收到1的概率为.考虑两种传输方案:单次传输和三次传输.单次传输是指每个信号只发送1次,三次传输是指每个信号重复发送3次.收到的信号需要译码,译码规则如下:单次传输时,收到的信号即为译码;三次传输时,收到的信号中出现次数多的即为译码(例如,若依次收到1,0,1,则译码为1)下列说法错误的是( )
A.采用单次传输方案,若依次发送1,0,1,则依次收到1,0,1的概率为
B.采用三次传输方案,若发送1,则依次收到1,0,1的概率为
C.采用三次传输方案,若发送1,则译码为1的概率为
D.当时,若发送0,则采用三次传输方案译码为0的概率大于采用单次传输方案译码为0的概率
【答案】C
【详解】对于A,由题意可知:信号的传输相互独立,输入收到的概率为,输入收到的概率为,所以采用单次传输方案,若依次发送1,0,1,则依次收到1,0,1的概率为,故A正确;对于B,由题意可知:信号的传输相互独立,输入收到的概率为,输入收到的概率为,所以采用三次传输方案,若发送1,则依次收到1,0,1的概率为,故B正确;对于C,采用三次传输方案,若发送1,译码为1的情况分别为“”、“”、“”、“”,因为信号的传输相互独立,输入收到的概率为,输入收到的概率为,所以采用三次传输方案,若发送1,则译码为1的概率为,故C错误;对于D,若发送0,采用三次传输方案译码为0的情况有“”、“”、“”、“”,所以其概率为;若发送0,采用单次传输方案译码为0的概率为,由,且,则,故D正确;故选:C.
题组五:概率分布与期望、方差
1.已知有4个数据的平均值为5,方差为4,现加入数据6和10,则这6个数据的新方差为( )
A. B. C.6 D.10
【答案】C
【详解】设原来的4个数依次为,,,,原来4个数据的平均值为5,方差为4,,,,,现加入数据6和10,则这6个数据的平均数为,则这6个数据的方差为:
.故选:C.
2.已知随机变量X服从正态分布N,若,则( )
A. B. C. D.
【答案】D
【详解】由正态分布的对称性知,故.
故选:D.
3.(多选)已知随机变量服从正态分布,即,则( ).
A. B. C. D.
【答案】BD
【详解】由可得,,故A错误;B正确;
对于C,因,则,故C错误;
对于D,因,则,故,即D正确.
故选:BD.
4.小强对重力加速度做n次实验,若以每次实验结果的平均值作为重力加速度的估值.已知估值的误差,为使误差在内的概率不小于0.6827,至少要实验 次.
(参考数据:若,则).
【答案】6
【详解】,∴,∴,至少要实验6次.故答案为:6.
5.某企业生产的一种零件,其质量指标介于的为优质品,该企业生产的这种零件质量指标服从正态分布,技术改造后生产的同种零件质量指标服从正态分布,那么,该企业生产的这种零件的优质品率约提高了 .
(若,则,,).
【答案】
【详解】由题知技术改造前,该零件质量指标的均值为,标准差为,技术改造后该零件质量指标的均值为,标准差;改造前,改造后.所以优质品率提高了约.故答案为:
6.下列说法:①若随机变量X服从正态分布,若,则;②设某校男生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据,用最小二乘法建立的回归方程为,若该校某男生的身高为170cm,则其体重大约为62.5kg;③有甲、乙两个袋子,甲袋子中有3个白球,2个黑球;乙袋子中有4个白球,4个黑球.现从甲袋子中任取2个球放入乙袋子,然后再从乙袋子中任取一个球,则此球为白球的概率为,其中正确的个数为( )
A.0 B.1 C.2 D.3
【答案】C
【详解】对于①,由题意知:,,又,故,错误;
对于②,当时,,正确;
对于③,若从甲中取了2个白球放入乙袋子,从乙袋子中取出白球的概率为,
若从甲中取了2个黑球放入乙袋子,从乙袋子中取出白球的概率为,
若从甲中取了1个白球1个黑球放入乙袋子,从乙袋子中取出白球的概率为,
所以取到白球的概率为,正确.
故选:C.
7.(多选)18世纪30年代,数学家棣莫弗发现,如果随机变量X服从二项分布,那么当n比较大时,可视为X服从正态分布,其密度函数,.任意正态分布,可通过变换转化为标准正态分布(且).当时,对任意实数x,记,则( )
A.
B.当时,
C.随机变量,当减小,增大时,概率保持不变
D.随机变量,当,都增大时,概率单调增大
【答案】AC
【详解】对于A,根据正态曲线的对称性可得:,故A正确;对于B, 当时,,故B错误;对于C,D,根据正态分布的准则,在正态分布中代表标准差,代表均值,即为图象的对称轴,根据原则可知数值分布在中的概率为0.6826,是常数,故由可知,C正确,D错误,故选:AC
8.下列说法错误的是( )
A.若随机变量,则
B.若随机变量服从两点分布,且,则
C.若随机变量的分布列为,则
D.若随机变量,则的分布列中最大的只有
【答案】D
【详解】A选项,,由正态分布的对称性可知,A正确;
B选项,若随机变量服从两点分布,且,即分布列为:
0
1
所以
0
2
故,则,B正确;
C选项,分布列中概率之和为1,即,解得,C正确;
D选项,随机变量,令,即,解得,因为,所以或3,则的分布列中最大的有或,D错误.
故选:D
9.(多选)假设某厂有两条包装食盐的生产线甲、乙,生产线甲正常情况下生产出来的包装食盐质量服从正态分布(单位:g),生产线乙正常情况下生产出来包装食盐质量为xg,随机变量x服从正态密度函数,其中,则( )
附:随机变量,则,,.
A.正常情况下,从生产线甲任意抽取一包食盐,质量小于485g的概率为0.15%
B.生产线乙的食盐质量
C.生产线乙产出的包装食盐一定比生产线甲产出的包装食盐质量重
D.生产线甲上的检测员某天随机抽取两包食盐,称得其质量均大于515g,于是判断出该生产线出现异常是合理的
【答案】AD
【详解】由条件可知,设生产线甲正常情况下生产出来的包装食盐的质量为,其中,其中,,则,故A正确;B. 随机变量x服从正态密度函数,可知,,,所以生产线乙的食盐质量,故B错误;C.不一定,可能小概率事件发生,生产线乙产出的包装食盐比生产线甲产出的包装食盐质量轻,故C错误;D. ,说明生产线甲抽到质量大于515g的可能性很低,所以随机抽取两包质量均大于515g,说明判断出该生产线出现异常是合理的,故D正确.故选:AD
44 / 44
学科网(北京)股份有限公司
$$