第16讲 概率与统计(9类核心考点精讲精练)-备战2025年高考数学一轮复习考点帮(上海专版)
2024-10-23
|
2份
|
114页
|
1468人阅读
|
75人下载
精品
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | - |
| 年级 | 高三 |
| 章节 | - |
| 类型 | 教案-讲义 |
| 知识点 | 计数原理与概率统计 |
| 使用场景 | 高考复习-一轮复习 |
| 学年 | 2025-2026 |
| 地区(省份) | 上海市 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 6.54 MB |
| 发布时间 | 2024-10-23 |
| 更新时间 | 2024-10-23 |
| 作者 | 宋老师数学图文制作室 |
| 品牌系列 | 上好课·一轮讲练测 |
| 审核时间 | 2024-10-23 |
| 下载链接 | https://m.zxxk.com/soft/48146273.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
第16讲 概率与统计(9类核心考点精讲精练)
1. 5年真题考点分布
5年考情
考题示例
考点分析
2024年秋考8、13、19题
2024年春考15、19题
全概率公式;数据相关分析;用样本估计总体、由频率分布表求平均数及独立性检验。
互斥事件的定义;分层抽样的平均数及方差公式的应用
2023秋考9、14、19题
2023春考5、7、10、14题
中位数和平均数的定义;线性相关的概念;离散型随机变量的分布和期望的计算。
对立事件概率计算公式;频率分布直方图;古典概型概率;统计图的识别。
2022秋考9题
古典概型概率及其计算公式
2021年秋考10题
古典概型概率及其计算公式
2020年秋考7题
样本的数据特征:中位数、平均数
2. 备考策略
1.应用互斥事件的概率加法公式时,一定要先确定各事件是否彼此互斥,然后求出各事件分别发生的概率,再求和.
2.正确区别互斥事件与对立事件的关系:对立事件是互斥事件,是互斥中的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的必要不充分条件.
3.易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
4.要注意概率P(A|B)与P(AB)的区别
(1)在P(A|B)中,事件A,B发生有时间上的差异,B先A后;在P(AB)中,事件A,B同时发生.
(2)样本空间不同,在P(A|B)中,事件B成为样本空间;在P(AB)中,样本空间仍为Ω,因而有P(A|B)≥P(AB).
5.(1)易忘判定随机变量是否服从二项分布,盲目使用二项分布的均值和方差公式计算致误.
(2)涉及求分布列时,要注意区分是二项分布还是超几何分布.
一.互斥事件与对立事件
1.互斥事件
(1)定义:一次试验中,事件A和事件B不能同时发生,则这两个不能同时发生的事件叫做互斥事件.
如果A1,A2,…,An中任何两个都不可能同时发生,那么就说事件A1,A2,…An彼此互斥.
(2)互斥事件的概率公式:
在一个随机试验中,如果随机事件A和B是互斥事件,则有:
P(A+B)=P(A)+P(B)
注:上式使用前提是事件A与B互斥.
推广:一般地,如果事件A1,A2,…,An彼此互斥,那么事件发生(即A1,A2,…,An中有一个发生)的概率等于这n个事件分别发生的概率之和,即:
P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)
2.对立事件
(1)定义:一次试验中,两个事件中必有一个发生的互斥事件叫做对立事件,事件A的对立事件记做.
注:①两个对立事件必是互斥事件,但两个互斥事件不一定是对立事件;
②在一次试验中,事件A与只发生其中之一,并且必然发生其中之一.
(2)对立事件的概率公式:
P()=1﹣P(A)
3.互斥事件与对立事件的区别和联系
互斥事件是不可能同时发生的两个事件,而对立事件除要求这两个事件不同时发生外,还要求二者之一必须有一个发生.因此,对立事件是互斥事件的特殊情况,而互斥事件未必是对立事件,即“互斥”是“对立”的必要但不充分条件,而“对立”则是“互斥”的充分但不必要条件.
二.互斥事件的概率加法公式
互斥事件的概率加法公式:
在一个随机试验中,如果随机事件A和B是互斥事件,则有:
P(A+B)=P(A)+P(B)
注:上式使用前提是事件A与B互斥.
推广:一般地,如果事件A1,A2,…,An彼此互斥,那么事件发生(即A1,A2,…,An中有一个发生)的概率等于这n个事件分别发生的概率之和,即:
P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)
三.古典概型及其概率计算公式
1.定义:如果一个试验具有下列特征:
(1)有限性:每次试验可能出现的结果(即基本事件)只有有限个;
(2)等可能性:每次试验中,各基本事件的发生都是等可能的.
则称这种随机试验的概率模型为古典概型.
*古典概型由于满足基本事件的有限性和基本事件发生的等可能性这两个重要特征,所以求事件的概率就可以不通过大量的重复试验,而只要通过对一次试验中可能出现的结果进行分析和计算即可.
2.古典概率的计算公式
如果一次试验中可能出现的结果有n个,而且所有结果出现的可能性都相等,那么每一个基本事件的概率都是;
如果某个事件A包含的结果有m个,那么事件A的概率为P(A)==.
【解题方法点拨】
1.注意要点:解决古典概型的问题的关键是:分清基本事件个数n与事件A中所包含的基本事件数.
因此要注意清楚以下三个方面:
(1)本试验是否具有等可能性;
(2)本试验的基本事件有多少个;
(3)事件A是什么.
2.解题实现步骤:
(1)仔细阅读题目,弄清题目的背景材料,加深理解题意;
(2)判断本试验的结果是否为等可能事件,设出所求事件A;
(3)分别求出基本事件的个数n与所求事件A中所包含的基本事件个数m;
(4)利用公式P(A)=求出事件A的概率.
3.解题方法技巧:
(1)利用对立事件、加法公式求古典概型的概率
(2)利用分析法求解古典概型.
四.列举法计算基本事件数及事件发生的概率
1、等可能条件下概率的意义:一般地,如果在一次试验中,有n种可能的结果,并且它们发生的可能性都相等,事件A包含其中的m种结果,那么事件A发生的概率为P(A)=.
等可能条件下概率的特征:
(1)对于每一次试验中所有可能出现的结果都是有限的;
(2)每一个结果出现的可能性相等.
2、概率的计算方法:
(1)列举法(列表或画树状图),
(2)公式法;
列表法或树状图这两种举例法,都可以帮助我们不重不漏的列出所以可能的结果.
列表法
(1)定义:用列出表格的方法来分析和求解某些事件的概率的方法叫做列表法.
(2)列表法的应用场合
当一次试验要设计两个因素,并且可能出现的结果数目较多时,为不重不漏地列出所有可能的结果,通常采用列表法.
树状图法
(1)定义:通过列树状图列出某事件的所有可能的结果,求出其概率的方法叫做树状图法.
(2)运用树状图法求概率的条件
当一次试验要设计三个或更多的因素时,用列表法就不方便了,为了不重不漏地列出所有可能的结果,通常采用树状图法求概率.
五.几何概型
1.定义:若一个试验具有下列特征:
(1)每次试验的结果有无限多个,且全体结果可用一个有度量的几何区域来表示;
(2)每次试验的各种结果是等可能的.
那么这样的试验称为几何概型.
2.几何概率:设几何概型的基本事件空间可表示成可度量的区域Ω,事件A所对应的区域用A表示(A⊆Ω),则P(A)=称为事件A的几何概率.
六.相互独立事件和相互独立事件的概率乘法公式
1.相互独立事件:事件A(或B)是否发生,对事件B(或A)发生的概率没有影响,这样两个事件叫做相互独立事件.
2.相互独立事件同时发生的概率公式:
将事件A和事件B同时发生的事件即为A•B,若两个相互独立事件A、B同时发生,则事件A•B发生的概率为:
P(A•B)=P(A)•P(B)
推广:一般地,如果事件A1,A2,…,An相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率之积,即:
P(A1•A2…An)=P(A1)•P(A2)…P(An)
3.区分
互斥事件和相互独立事件是两个不同的概念:
(1)互斥事件:两个事件不可能同时发生;
(2)相互独立事件:一个事件的发生与否对另一个事件发生的概率没有影响.
七.条件概率与独立事件
1、条件概率的定义:对于任何两个事件A和B,在已知事件A发生的条件下,事件B发生的概率叫做条件概率,用符号P(B|A)来表示.
(2)条件概率公式:称为事件A与B的交(或积).
(3)条件概率的求法:
①利用条件概率公式,分别求出P(A)和P(AB),得P(B|A)=,其中P(A)>0;
②借助古典概型概率公式,先求出事件A包含的基本事件数n(A),再在事件A发生的条件下求出事件B包含的基本事件数,即n(A∩B),得P(B|A)=
八.离散型随机变量及其分布列
1、相关概念;
(1)随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量随机变量常用希腊字母ξ、η等表示.
(2)离散型随机变量:对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是随机变量,η=aξ+b,其中a、b是常数,则η也是随机变量.
(3)连续型随机变量:对于随机变量可能取的值,可以取某一区间内的一切值,这样的变量就叫做连续型随机变量
(4)离散型随机变量与连续型随机变量的区别与联系:离散型随机变量与连续型随机变量都是用变量表示随机试验的结果;但是离散型随机变量的结果可以按一定次序一一列出,而连续性随机变量的结果不可以一一列出.
2、离散型随机变量
(1)随机变量:在随机试验中,试验可能出现的结果可以用一个变量X来表示,并且X是随着试验结果的不同而变化的,这样的变量X叫做一个随机变量.随机变量常用大写字母X,Y,…表示,也可以用希腊字母ξ,η,…表示.
(2)离散型随机变量:如果随机变量X的所有可能的取值都能一一列举出来,则称X为离散型随机变量.
3、离散型随机变量的分布列.
(1)定义:一般地,设离散型随机变量X的所有可能值为x1,x2,…,xn;X取每一个对应值的概率分别为p1,p2,…,pn,则得下表:
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
该表为随机变量X的概率分布,或称为离散型随机变量X的分布列.
(2)性质:①pi≥0,i=1,2,3,…,n;②p1+p2+…+pn=1.
九.离散型随机变量的期望与方差
1、离散型随机变量的期望
数学期望:一般地,若离散型随机变量ξ的概率分布为
x 1
x 2
…
xn
…
P
p 1
p 2
…
pn
…
则称Eξ=x1p1+x2p2+…+xnpn+…为ξ的数学期望,简称期望.
数学期望的意义:数学期望离散型随机变量的一个特征数,它反映了离散型随机变量取值的平均水平.
平均数与均值:一般地,在有限取值离散型随机变量ξ的概率分布中,令p1=p2=…=pn,则有p1=p2=…=pn=,Eξ=(x1+x2+…+xn)×,所以ξ的数学期望又称为平均数、均值.
期望的一个性质:若η=aξ+b,则E(aξ+b)=aEξ+b.
2、离散型随机变量的方差;
方差:对于离散型随机变量ξ,如果它所有可能取的值是x1,x2,…,xn,…,且取这些值的概率分别是p1,p2,…,pn…,那么,
称为随机变量ξ的均方差,简称为方差,式中的Eξ是随机变量ξ的期望.
标准差:Dξ的算术平方根叫做随机变量ξ的标准差,记作.
方差的性质:.
方差的意义:
(1)随机变量 的方差的定义与一组数据的方差的定义式是相同的;
(2)随机变量 的方差、标准差也是随机变量 的特征数,它们都反映了随机变量取值的稳定与波动、集中与离散的程度;
(3)标准差与随机变量本身有相同的单位,所以在实际问题中应用更广泛.
十.正态分布曲线的特点及曲线所表示的意义
1.正态曲线及性质
(1)正态曲线的定义
函数φμ, σ (x)=,x∈(﹣∞,+∞),其中实数μ和σ(σ>0)为参数,我们称φμ,σ(x)的图象(如图)为正态分布密度曲线,简称正态曲线.
(2)正态曲线的解析式
①指数的自变量是x定义域是R,即x∈(﹣∞,+∞).
②解析式中含有两个常数:π和e,这是两个无理数.
③解析式中含有两个参数:μ和σ,其中μ可取任意实数,σ>0这是正态分布的两个特征数.
④解析式前面有一个系数为,后面是一个以e为底数的指数函数的形式,幂指数为﹣.
2.正态分布
(1)正态分布的定义及表示
如果对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=φμ,σ(x)dx,则称X的分布为正态分布,记作N(μ,σ2).
(2)正态总体在三个特殊区间内取值的概率值
①P(μ﹣σ<X≤μ+σ)=0.6826;
②P(μ﹣2σ<X≤μ+2σ)=0.9544;
③P(μ﹣3σ<X≤μ+3σ)=0.9974.
3.正态曲线的性质
正态曲线φμ, σ (x)=,x∈R有以下性质:
(1)曲线位于x轴上方,与x轴不相交;
(2)曲线是单峰的,它关于直线x=μ对称;
(3)曲线在x=μ处达到峰值;
(4)曲线与x轴围成的图形的面积为1;
(5)当σ一定时,曲线随着μ的变化而沿x轴平移;
(6)当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
4.三个邻域
会用正态总体在三个特殊区间内取值的概率值结合正态曲线求随机变量的概率.落在三个邻域之外是小概率事件,这也是对产品进行质量检测的理论依据.
【解题方法点拨】
正态分布是高中阶段唯一连续型随机变量的分布,这个考点虽然不是高考的重点,但在近几年新课标高考中多次出现,其中数值计算是考查的一个热点,考生往往不注意对这些数值的记忆而导致解题无从下手或计算错误.对正态分布N(μ,σ2)中两个参数对应的数值及其意义应该理解透彻并记住,且注意第二个数值应该为σ2而不是σ,同时,记住正态密度曲线的六条性质.
十一.频率分布直方图
1.频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中的各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直方图.
2.频率分布直方图的特征
①图中各个长方形的面积等于相应各组的频率的数值,所有小矩形面积和为1.
②从频率分布直方图可以清楚地看出数据分布的总体趋势.
③从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息被抹掉.
3.频率分布直方图求数据
①众数:频率分布直方图中最高矩形的底边中点的横坐标.
②平均数:频率分布直方图各个小矩形的面积乘底边中点的横坐标之和.
③中位数:把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标.
【解题方法点拨】
绘制频率分布直方图的步骤:
十二.频率分布折线图、密度曲线
1.频率分布折线图:
如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图,简称频率折线图.
2.总体分布的密度曲线:
如果将样本容量取得足够大,分组的组距取得足够小,则相应的频率分布折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.
十三.茎叶图
1.茎叶图:将样本数据有条理地列出来,从中观察样本分布情况的图称为茎叶图.
例:某篮球运动员在某赛季各场比赛的得分情况:12,15,24,25,31,31,36,36,37,39,44,49,50
得分表示成茎叶图如下:
2.茎叶图的优缺点:
优点:
(1)所有信息都可以从茎叶图上得到
(2)茎叶图便于记录和表示
缺点:
分析粗略,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便.
【解题方法点拨】
茎叶图的制作步骤:
(1)将每个数据分为“茎”(高位)和“叶”(低位)两部分
(2)将最小的茎和最大的茎之间的数按小大次序排成一列
(3)将各个数据的叶按大小次序写在茎右(左)侧
第1步中,
①如果是两位数字,则茎为十位上的数字,叶为个位上的数字,如89,茎:8,叶:9.
②如果是三位数字,则茎为百位上的数字,叶为十位和个位上的数字,如123,茎:1,叶:23.
对于重复出现的数据要重复记录,不能遗漏,同一数据出现几次,就要在图中体现几次.
十四.统计图表获取信息
统计图表反映了被描述对象的重要内容和数据情况,它简单明了,有利于我们把握数据的特点,统计图还能直观、生动地传递信息.
【解题方法点拨】
由统计图表获取信息的步骤:
一、看统计图表特征;
二、读统计图表数据信息并进行分析;
三、寻找出统计图表中数据的变化趋势或规律;
四、对统计图表的数据与信息作分析、推测,为对解决问题作出合理的判断提供依据.
注意:①要避免统计图的误导,首先要仔细观察统计图,其次要关注数据的来源、收集方式及描述形式,这样才能获得准确的信息;
②对数据的收集、整理等一定要重视它的普遍性、代表性、公正性,不能以点带面,以偏概全,夸大局部的作用.
【命题方向】
能正确解读统计图表,从中获取必要、准确的信息,并进站简单的决策;处理生活中常见的不规范统计图带来的错误信息,提高对统计图表的认识能力.
十五.众数、中位数、平均数
1.众数、中位数、平均数
众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.
(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数;
(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;
(3)平均数:一组数据的算术平均数,即.
2.众数、中位数、平均数的优缺点
【解题方法点拨】
众数、中位数、平均数的选取:
(1)平均数能较好地反映一组数据的总体情况;
(2)中位数不受极端值影响,有时用它代表全体数据的中等水平(或一般水平);
(3)众数能反映一组数据的集中情况(即多数水平).
根据频率分布直方图估算众数、中位数、平均数:
(1)众数:在频率分布直方图中,最高矩形的中点的横坐标就是众数.
(2)中位数:在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.
(3)平均数:是频率分布直方图的“重心”,是直方图的平衡点.平均数等于频率分布直方图中每个小矩形的面积(即落在该组中的频率)乘以小矩形底边中点的横坐标(组中值)之和.
十六.极差、方差与标准差
用一组数据中最大数据减去最小数据的差来反映这组数据的变化范围,这个数据就叫极差.一组数据中各数据与平均数差的平方和的平均数叫做方差.方差的算术平方根就为标准差.方差和标准差都是反映这组数据波动的大小,方差越大,数据的波动越大.
十七.百分位数
百分位数的定义:一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点,总体数据中的任意一个数小于或等于它的可能性是p.
四分位数:25%,50%,75%分位数是三个常用的百分位数.把总体数据按照从小到大排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是.因此这三个百分位数也称为总体的四分位数.
【解题方法点拨】
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100﹣p)%的数据大于或等于这个值.计算一组n个数据的第p百分位数步骤如下:
①按从小到大排列原始数据;
②计算i=n×p%;
③若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
【命题方向】
理解连续变量的百分位数的统计含义,考察百分位数的计算,学会用样本估计总体的百分位数.
十八.相关系数
1、概念:
相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度.于是,著名统计学家卡尔•皮尔逊设计了统计指标﹣﹣相关系数.相关系数是用以反映变量之间相关关系密切程度的统计指标.相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数.
2、相关系数用r表示,计算公式为
其中:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.
3、残差:
相关指数R2用来刻画回归的效果,其计算公式是
在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方.显然,R2取值越大,意味着残差平方和越小,也就是模型的拟合效果越好.
【解题方法点拨】
建立回归模型的基本步骤:
(1)确定研究对象,明确哪个变量是解释变量,哪个是预报变量;
(2)画出解释变量和预报变量的散点图,观察它们之间的关系;
(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程:=x+);
(4)按一定规则估计回归方程中的参数(如最小二乘法);
(5)得出结果分析残差图是否有异常,若存在异常,则检查数据是否有误,或模型是否适当.当回归方程不是形如:=x+时,我们称之为非线性回归方程.
十九.线性回归方程
线性回归是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一,运用十分广泛.分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析.如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析.如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析.变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点将散布在某一直线周围.因此,可以认为关于的回归函数的类型为线性函数.
二十.独立性检验
1、分类变量:
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2、原理:假设性检验(类似反证法原理).
一般情况下:假设分类变量X和Y之间没有关系,通过计算K2值,然后查表对照相应的概率P,发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1﹣P),也就是“X和Y有关系”.(表中的k就是K2的观测值,即k=K2).
其中n=a+b+c+d(考试给出)
3、2×2列联表:
4、范围:K2∈(0,+∞);性质:K2越大,说明变量间越有关系.
5、解题步骤:
(1)认真读题,取出相关数据,作出2×2列联表;
(2)根据2×2列联表中的数据,计算K2的观测值k;
(3)通过观测值k与临界值k0比较,得出事件有关的可能性大小.
知识讲解
考点一:样本空间与随机事件
1.(2024•浦东新区校级三模)掷两颗骰子,观察掷得的点数.设事件表示“两个点数都是偶数”,事件表示“两个点数都是奇数”,事件表示“两个点数之和是偶数”,事件表示“两个点数的乘积是偶数”.那么下列结论正确的是
A.与是对立事件 B.与是互斥事件
C.与是相互独立事件 D.与是相互独立事件
2.(2024•普陀区模拟)从放有两个红球、一个白球的袋子中一次任意取出两个球,两个红球分别标记为、,白球标记为,则它的一个样本空间可以是
A., B.,,
C.,,, D.,,,,
3.(2023•徐汇区校级三模)某小组有1名男生和2名女生,从中任选2名学生参加围棋比赛,事件“至少有1名男生”与事件“至少有1名女生”
A.是对立事件 B.都是不可能事件
C.是互斥事件但不是对立事件 D.不是互斥事件
4.(2023•黄浦区二模)从装有两个红球和两个白球的口袋内任取两个球,那么互斥而不对立的事件是
A.恰好有一个白球与都是红球
B.至多有一个白球与都是红球
C.至多有一个白球与都是白球
D.至多有一个白球与至多一个红球
5.(2023•宝山区校级模拟)某家庭有三个孩子,假定生男孩和生女孩是等可能且相互独立的.记事件:该家庭既有男孩又有女孩;事件:该家庭最多有一个男孩;事件:该家庭最多有一个女孩;则下列说法中正确的是
A.事件与事件互斥但不对立 B.事件与事件互斥且对立
C.事件与事件相互独立 D.事件与事件相互独立
6.(2023•闵行区校级三模)分别抛掷3枚质地均匀的硬币,则等可能事件的样本空间中样本点的个数是 .
考点二:随机事件的概率
1.(2024•浦东新区校级模拟)在10件产品中有3件次品,从中选3件.下列各种情况是互斥事件的有
①:“所取3件中至多2件次品”, :“所取3件中至少2件为次品”;
②:“所取3件中有一件为次品”, :“所取3件中有二件为次品”;
③:“所取3件中全是正品”, :“所取3件中至少有一件为次品”;
④:“所取3件中至多有2件次品”, :“所取3件中至少有一件是正品”;
A.①③ B.②③ C.②④ D.③④
2.(2024•浦东新区三模)有一袋子中装有大小、质地相同的白球个,黑球.甲、乙两人约定一种游戏规则如下:第一局中两人轮流摸球,摸后放回,先摸到白球者本局获胜但从第二局起,上一局的负者先摸球.若第一局中甲先摸球,记第局甲获胜的概率为,则关于以下两个命题判断正确的是
①,且;
②若第七局甲获胜的概率不小于0.9,则不小于1992.
A.①②都是真命题 B.①是真命题,②是假命题
C.①是假命题,②是真命题 D.①②都是假命题
3.(2024•浦东新区二模)某校面向高一全体学生共开设3门体育类选修课,每人限选一门.已知这三门体育类选修课的选修人数之比为,考核优秀率分别为、和,现从该年级所有选择体育类选修课的同学中任取一名,其成绩是优秀的概率为 .
4.(2024•普陀区校级模拟)某学校有、两个餐厅,已知同学甲每天中午都会在这两个餐厅中选择一个就餐,如果甲当天选择了某个餐厅,他第二天会有的可能性换另一个餐厅就餐,假如第1天甲选择了餐厅,则第天选择餐厅的概率为 .
5.(2024•青浦区校级模拟)齐王与田忌赛马,田忌的上等马优于齐王的中等马,劣于齐王的上等马,田忌的中等马优于齐王的下等马,劣于齐王的中等马,田忌的下等马劣于齐王的下等马.现从双方的马匹中随机选一匹进行一场比赛,则田忌的马获胜的概率为 .
6.(2024•徐汇区校级模拟)如图为正六棱柱,若从该正六棱柱的6个侧面的12条面对角线中,随机选取两条,则它们共面的概率是 .
考点三:随机事件的独立性与条件概率
1.(2024•奉贤区三模)如果、分别是、的对立事件,下列选项中不能判断件与事件相互独立的是
A.(A)(B) B.(A)(B)
C.(A) D.(B)
2.(2024•虹口区模拟)对于独立事件,,若,,则 .
3.(2024•嘉定区二模)小张、小王两家计划假期来嘉定游玩,他们分别从“古猗园,秋霞圃,州桥老街”这三个景点中随机选择一个游玩,记事件表示“两家至少有一家选择古猗园”,事件表示“两家选择景点不同”,则概率 .
4.(2024•长宁区校级三模)已知工厂库房中的某种零件来自甲公司,正品率为;来自乙公司,正品率为,从库房中任取一个这种零件,它是正品的概率为 .
5.(2024•静安区二模)某工厂生产的产品以100个为一批.在进行抽样检查时,只从每批中抽取10个来检查,如果发现其中有次品,则认为这批产品是不合格的.假定每一批产品中的次品最多不超过2个,并且其中恰有,1,个次品的概率如下:
一批产品中有次品的个数
0
1
2
概率
0.3
0.5
0.2
则各批产品通过检查的概率为 .(精确到
6.(2024•奉贤区三模)在刚刚结束的杭州亚运会上,中国羽毛球队延续了传统优势项目,以4金3银2铜的成绩傲视亚洲.在旧制的羽毛球赛中,只有发球方赢得这一球才可以得分,即如果发球方在此回合的争夺中输球,则双方均不得分.但发球方输掉此回合后,下一回合改为对方发球.
(1)在旧制羽毛球赛中,中国队某运动员每一回合比赛赢球的概率均为,且各回合相互独立.若第一回合该中国队运动员发球,求第二回合比赛有运动员得分的概率;
(2)羽毛球比赛中,先获得第一分的队员往往会更加占据心理上的优势,给出以下假设:
假设1:各回合比赛相互独立;
假设2:比赛双方运动员甲和乙的实力相当,即每回合比赛中甲获胜的概率均为;
求第一回合发球者在整场比赛中先得第一分的概率,并说明旧制是否合理?
考点四:离散型随机变量及其分布列
1.(2024•虹口区二模)给出下列4个命题:
①若事件和事件互斥,则(A)(B);
②数据2,3,6,7,8,10,11,13的第70百分位数为10;
③已知关于的回归方程为,则样本点的离差为;
④随机变量的分布为,则其数学期望.
其中正确命题的序号为
A.①② B.①③ C.②③ D.②④
2.(2024•闵行区三模)已知随机变量,且,则 .
3.(2024•嘉定区校级模拟)设随机变量服从二项分布,则 .
4.(2024•松江区校级模拟)2024年1月5日起,第40届中国哈尔滨国际冰雪节在黑龙江省哈尔滨市举行.让大家对冰雪文化进一步了解,激发了大家对冰雪运动进一步的热爱.为了调查不同年龄层的人对“冰雪运动”的喜爱态度.某研究小组随机调查了哈尔滨市社区年龄在,的市民300人,所得结果统计如下频数分布表所示:
年龄(单位:周岁)
,
,
,
,
,
频数
30
81
99
60
30
持喜爱态度
24
65
75
30
12
(1)求该样本中市民年龄的平均数;(同一组中的数据用该区间的中点值作代表)
(2)从这300名市民中随机抽取1人,在此人喜爱冰雪运动的前提下,求其年龄小于50周岁的概率:
(3)为鼓励市民积极参加这次调查,该研究小组决定给予参加调查的市民一定的奖励,奖励方案有两种:
方案一:按年龄进行分类奖励,当时,奖励10元:当时,奖励30元:当时,奖励40元;
方案二:利用抽奖的方式获得奖金,其中年龄低于样本中位数的可抽1次奖,年龄不低于样本中位数的可抽2次奖.每次抽中奖励30元,未抽中奖励10元,各次抽奖间相互独立,且每次抽奖中奖的概率均为,
将频率视为概率,利用样本估计总体的思想,若该研究小组希望最终发出更多的奖金,则从期望角度出发.该研究小组应采取哪种方案.
5.(2024•闵行区三模)2021年国庆期间,某县书画协会在县宣传部门的领导下组织了庆国庆书画展,参展的200幅书画作品反映了该县人民在党的领导下进行国家建设中的艰苦卓绝,这些书画作品的作者的年龄都在,之间,根据统计结果,作出如图所示的频率分布直方图:
(1)求这200位作者年龄的平均数和方差(同一组数据用该区间的中点值作代表);
(2)县委宣传部从年龄在,和,的作者中,按照分层抽样的方法,抽出6人参加县委组织的表彰大会,现要从6人中选出3人作为代表发言,设这3位发言者的年龄落在区间,的人数是,求变量的分布列和数学期望.
考点五:正态分布
1.(2024•宝山区校级四模)已知随机变量,和,,如图为对应的正态密度函数图像,则下列结论正确的是
A., B.,
C., D.,
2.(2024•宝山区二模)已知随机变量服从正态分布,若,则
A. B. C. D.
3.(2024•黄浦区校级三模)李明上学有时坐公交车,有时骑自行车,他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到,假设坐公交车用时和骑自行车用时都服从正态分布,,,,.和的分布密度曲线如图所示.则下列结果正确的是
A. B.
C. D.
4.(2024•松江区校级模拟)王先生每天8点上班,他通常开私家车加步行或乘坐地铁加步行.私家车路程近一些,但路上经常拥堵,所需时间(单位:分钟)服从正态分布,,从停车场步行到单位要6分钟;王先生从家到地铁站需要步行5分钟,乘坐地铁畅通,但路线较长,所需时间(单位:分钟)服从正态分布,,下地铁后从地铁站步行到单位要5分钟,从统计角度出发,关于两种上班方式,下列说法正确的个数是 个.
①若出门,则王先生开私家车上班不会迟到
②若出门,则王先生开私家车上班不迟到的可能性更大
③若出门,则王先生乘坐地铁上班不迟到的可能性更大
④若出门,则王先生乘坐地铁几乎不可能上班不迟到
参考数据:若,则,,
A.1 B.2 C.3 D.4
5.(2024•闵行区三模)已知随机变量服从正态分布,若,则 .
6.(2024•嘉定区校级模拟)某区学生参加模拟大联考,假如联考的数学成绩服从正态分布,其总体密度函数为:,且,若参加此次联考的学生共有8000人,则数学成绩超过100分的人数大约为 .
考点六:统计图表
1.(2024•浦东新区校级模拟)从某中学甲、乙两班各随机抽取10名同学,测量他们的身高(单位:,所得数据用茎叶图表示如图,由此可估计甲、乙两班同学的身高情况,则下列结论正确的是
A.甲乙两班同学身高的极差相等
B.甲乙两班同学身高的平均值相等
C.甲乙两班同学身高的中位数相等
D.乙班同学身高在以上的人数较多
2.(2024•闵行区校级三模)上海百联集团对旗下若干门店的营业额与三个影响因素分别作了相关性分析,绘制了如下的散点图,则下述大小关系正确的为
A. B. C. D.
3.(2024•浦东新区二模)通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点后,下列说法正确的是
A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关
B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变
C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小
4.(2024•浦东新区校级四模)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则的值为 .
5.(2024•宝山区三模)由于“新冠肺炎”对抵抗力差的人的感染率相对更高,特别是老年人群体,因此某社区在疫情控制后,及时给老年人免费体检,通过体检发现“高血糖,高血脂,高血压”,即“三高”老人较多.为此社区根据医生的建议为每位老人提供了一份详细的健康安排表,还特地建设了一个老年人活动中心,老年人每天可以到该活动中心去活动,以增强体质,通过统计每周到活动中心去运动的老年人的活动时间,得到了以下频率分布直方图.
(1)从到活动中心参加活动的老人中任意选取5人.
①若将频率视为概率,求至少有3人每周活动时间在,(单位:的概率;
②若抽取的5人中每周活动时间在,(单位:的人数为2人,从5人中选出3人进行健康情况调查,记3人中每周活动时间在,(单位:的人数为,求的分布列和期望;
(2)将某人的每周活动时间量与所有老人的每周平均活动时间量比较,当超出所有老人的每周平均活动量不少于时,则称该老人为“活动爱好者”,从参加活动的老人中随机抽取10人,且抽到人为“活动爱好者”的可能性最大,试求的值.(每组数据以区间的中点值为代表)
考点七:用样本估计总体
1.(2024•崇明区二模)某单位共有、两部门,1月份进行服务满意度问卷调查,得到两部门服务满意度得分的频率分布条形图如下.设、两部门的服务满意度得分的第75百分位数分别为,,方差分别为,,则
A. B.
C. D.
2.(2024•奉贤区三模)有一组样本数据,,,,其中是最小值,是最大值,则下列说法正确的是
A.,,,的中位数一定等于,,,的中位数
B.,,,的平均数一定等于,,,的平均数
C.,,,的标准差一定不小于,,,的标准差
D.,,,的30百分位数一定不等于,,,的30百分位数
3.(2024•闵行区校级模拟)某校高三年级10名男生的身高数据(单位:如下:168、171、173、176、176、180、183、184、186、191.该组数据的第80百分位数为 .
4.(2024•杨浦区校级三模)对于没有重复数据的样本、、、,记这个数的第百分位数为.若不在这组数据中,且在区间,中的数据有且只有5个,则的所有可能值组成的集合为 .
考点八:一元线性回归模型
1.(2024•闵行区校级模拟)设一组成对数据的相关系数为,线性回归方程为,则下列说法正确的为
A.越大,则越大 B.越大,则越小
C.若大于零,则一定大于零 D.若大于零,则一定小于零
2.(2024•浦东新区校级模拟)在研究线性回归模型时,样本数据,,2,3,,所对应的点均在直线上,用表示解释变量对于反应变量变化的线性相关度,则
A. B.1 C. D.2
3.(2024•黄浦区校级三模)对成对数据,、,、、,用最小二乘法求回归方程是为了使
A. B.
C.最小 D.最小
4.(2024•嘉定区校级模拟)某产品的广告支出费用(单位:万元)与销售额(单位:万元)的数据如表:
2
4
5
6
8
30
40
50
70
已知关于的线性回归方程为,则表格中实数的值为 .
5.(2024•普陀区模拟)为了提高学生参加体育锻炼的积极性,某校本学期依据学生特点针对性的组建了五个特色运动社团,学校为了了解学生参与运动的情况,对每个特色运动社团的参与人数进行了统计,其中一个特色运动社团开学第1周至第5周参与运动的人数统计数据如表所示.
周次
1
2
3
4
5
参与运动的人数
35
36
40
39
45
若表中数据可用回归方程来预测,则本学期第11周参与该特色运动社团的人数约为 .(精确到整数)
6.(2024•浦东新区校级模拟)环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量(单位:辆)和空气中的的平均浓度(单位:.调研人员采集了50天的数据,制作了关于,,2,3,,的散点图,并用直线与将散点图分成如图所示的四个区域Ⅰ、Ⅱ、Ⅲ、Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的列联表,并判断至少有多大把握认为“平均浓度不小于与“汽车日流量不小于1500辆”有关;
汽车日流量
汽车日流量
合计
的平均浓度
的平均浓度
合计
(2)经计算得回归方程为,且这50天的汽车日流量的标准差,的平均浓度的标准差.
①求相关系数,并判断该回归方程是否有价值;
②若这50天的汽车日流量满足,试推算这50天的日均浓度的平均数.(精确到
参考公式:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
回归方程,其中.
相关系数.若,则认为与有较强的线性相关性.
考点九:列联表与独立性检验
1.(2024•浦东新区校级模拟)为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了50人,得到如下结果(单位:人)
不患肺癌
患肺癌
合计
不吸烟
24
6
30
吸烟
6
14
20
合计
30
20
50
附:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
根据表中数据,以下叙述正确的是
A.可以通过计算,结合统计决断,判断:有的把握认为吸烟与患肺癌有关
B.可以通过计算,结合统计决断,判断:不能否定吸烟与肺癌无关
C.可以通过计算,结合统计决断,判断:有的把握认为吸烟与患肺癌有关
D.可以通过计算,结合统计决断,判断:不能否定吸烟与肺癌无关
2.(2024•长宁区二模)收集数据,利用列联表,分析学习成绩好与上课注意力集中是否有关时,提出的零假设为:学习成绩好与上课注意力集中 .(填有关或无关)
3.(2024•浦东新区校级模拟)一项研究同年龄段的男、女生的注意力差别的脑功能实验,实验数据如表:
注意力稳定
注意力不稳定
男生
29
7
女生
33
5
依据,该实验 该年龄段的学生在注意力的稳定性上对于性别没有显著差异(填拒绝或支持),
参考公式:,.
4.(2024•杨浦区二模)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.完成生产任务的工作时间不超过70分钟的工人为“优秀”,否则为“合格”.根据工人完成生产任务的工作时间(单位:分钟)绘制了如下茎叶图:
(1)求40名工人完成生产任务所需时间的第75百分数;
(2)独立地从两种生产方式中各选出一个人,求选出的两个人均为优秀的概率;
(3)根据工人完成生产任务的工作时间,两种生产方式优秀与合格的人数填入下面的列联表:
第一种生产方式
第二种生产方式
总计
优秀
合格
总计
根据上面的列联表,判断能否有的把握认为两种生产方式的工作效率有显著差异?.其中,.
一.选择题(共4小题)
1.(2024•浦东新区校级四模)某市组织一次高三调研考试,考试后统计的数学成绩服从正态分布,其密度函数为,则下列命题不正确的是
A.该市这次考试的数学平均成绩为80分
B.分数在120分以上的人数与分数在60分以下的人数相同
C.分数在110分以上的人数与分数在50分以下的人数相同
D.该市这次考试的数学标准差为10
2.(2024•闵行区三模)某社区通过公益讲座宣传交通法规.为了解讲座效果,随机抽取10位居民,分别在讲座前、后各回答一份交通法规知识问卷,满分为100分.他们得分的茎叶图如图所示 “叶”是个位数字),则下列选项叙述错误的是
A.讲座后的答卷得分整体上高于讲座前的得分
B.讲座前的答卷得分分布较讲座后分散
C.讲座后答卷得分的第80百分位数为95
D.讲座前答卷得分的极差大于讲座后得分的极差
3.(2024•普陀区校级三模)以下数据为某学校参加数学竞赛10人的成绩:(单位:分)72,86,80,88,83,78,81,90,91,92,则这10个成绩的第75百分位数是
A.90 B.89 C.88 D.88.5
4.(2024•长宁区二模)某运动员8次射击比赛的成绩为:9.6、9.7、9.5、9.9、9.4、9.8、9.3、10.0.已知这组数据的第百分位为,若从这组数据中任取一个数,这个数比大的概率为0.25,则的取值不可能是
A.65 B.70 C.75 D.80
二.填空题(共13小题)
5.(2024•宝山区三模)盲盒是指消费者不能提前得知具体产品款式的商品盒子.已知某盲盒产品共有3种玩偶,小明购买4个盲盒,则他能集齐3种玩偶的概率是 .
6.(2024•浦东新区三模)一袋中装有大小与质地相同的2个白球和3个黑球,从中不放回地摸出2个球,记2球中白球的个数为,则 .
7.(2024•浦东新区校级模拟)随机变量的概率分布密度函数,其图象如图所示,设,则图中阴影部分的面积为 .
8.(2024•杨浦区校级三模)设随机变量服从成功概率为的二项分布,若,,则 .
9.(2024•杨浦区校级三模)某次数学练习中,学生成绩服从正态分布.若,则从参加这次考试的学生中任意选取3名学生,至少有2名学生的成绩高于125的概率是 .
10.(2024•黄浦区校级三模)已知一个随机变量的分布列为,若是,的等差中项,则 .
11.(2024•青浦区二模)设随机变量服从正态分布,若,则实数 .
12.(2024•崇明区二模)某学习小组共有10名学生,其中至少有2名学生在同一月份的出生的概率是 .(默认每月天数相同,结果精确到
13.(2024•浦东新区校级模拟)设随机变量,且,,则 .
14.(2024•浦东新区校级模拟)设随机变量服从正态分布,若,则实数 .
15.(2024•奉贤区三模)为了研究某班学生的脚步(单位厘米)和身高之间有线性相关关系,设其回归直线方程为.该班某学生的脚长为24,据此估计其身高为 .
16.(2024•黄浦区校级三模)已知两个具有线性相关关系的变量,的一组数据,,,,根据上述数据可得关于的回归直线方程,则实数 .
17.(2024•浦东新区校级模拟)某射击运动员在一次训练中10次射击成绩(单位:环)如下:5,5,6,6,7,7,8,9,9,9,这组数据的第60百分位数为 .
三.解答题(共1小题)
18.(2024•长宁区校级三模)火车晚点是人们在旅行过程中最常见的问题之一,针对这个问题,许多人都会打电话进行投诉.某市火车站为了解每年火车的正点率对每年顾客投诉次数(单位:次)的影响,对近8年年年)每年火车正点率和每年顾客投诉次数的数据作了初步处理,得到下面的一些统计量的值.
600
592
43837.2
93.8
(1)求关于的经验回归方程;若预计2024年火车的正点率为,试估算2024年顾客对火车站投诉的次数;
(2)根据顾客对火车站投诉的次数等标准,该火车站这8年中有6年被评为“优秀”,2年为“良好”,若从这8年中随机抽取3年,记其中评价“良好”的年数为,求的分布列和数学期望.
附:经验回归直线的斜率和截距的最小二乘法估计公式分别为:
,
一.选择题(共2小题)
1.(2024•浦东新区校级模拟)全概率公式在敏感性问题调查中有着重要应用.例如某学校调查学生对食堂满意度的真实情况,为防止学生有所顾忌而不如实作答,可以设计如下调查流程:每位学生先从一个装有3个红球,6个白球的盒子中任取3个球,取到至少一个红球的学生回答问题一“你出生的月份是否为3的倍数?”,未取到任何红球的学生回答问题二“你对食堂是否满意?”.由于两个问题的答案均只有“是”和“否”,而且回答的是哪个问题他人并不知道(取球结果不被看到即可),因此理想情况下学生应当能给出符合实际情况的答案.已知某学校800名学生参加了该调查,且有250人回答的结果为“是”,由此估计学生对食堂的实际满意度大约为
A. B. C. D.
2.(2024•青浦区校级模拟)回归直线方程的系数,的最小二乘法估计中,使函数最小,函数指
A. B.
C. D.
二.填空题(共8小题)
3.(2024•浦东新区校级模拟)从2,3,4,5,6,7,8中任取两个不同的数,事件为“取到的两个数的和为偶数”,事件为“取到的两个数均为偶数”,则 .
4.(2024•松江区校级模拟)设随机变量服从二项分布,则 .
5.(2024•天心区校级模拟)记一组样本数据10,18,8,4,16,24,6,8,32的中位数为,平均数为,则 .
6.(2024•松江区校级模拟)已知1、2、、中位数为4,平均数为5,则 .
7.(2024•黄浦区校级三模)现有一组数1,1,2,2,3,5,6,7,9,9,则该组数的第25百分位数为 .
8.(2024•浦东新区校级模拟)甲乙两人射击,每人射击一次.已知甲命中的概率是0.8,乙命中的概率是0.7,两人每次射击是否命中互不影响.已知甲、乙两人至少命中一次,则甲命中的概率为 .
9.(2024•宝山区三模)在某项测量中,其测量结果服从正态分布,,且,则 .
10.(2024•普陀区校级三模)甲、乙等4人参加,,这三项活动,要求每人只参加一项活动,且每项活动至少有1人参加,则甲不单独参加活动,且乙不参加活动的概率是 .
三.解答题(共5小题)
11.(2024•浦东新区校级模拟)新宁崀山景区是世界自然遗产、国家级景区,其中“八角寨”景区和“天下第一巷”景区是新宁崀山景区的两张名片.为了合理配置旅游资源,现对已游览“八角寨”景区且尚未游览“天下第一巷”景区的游客进行随机调查,若不游览“天下第一巷”景区记2分,若继续游览“天下第一巷”景区记4分,假设每位游客选择游览“天下第一巷”景区的概率均为,游客之间选择意愿相互独立.
(1)从游客中随机抽取2人,记总得分为随机变量,求的数学期望;
(2)(ⅰ)记表示“从游客中随机抽取人,总分恰为分”的概率,求的前4项和;
(ⅱ)在对游客进行随机问卷调查中,记表示“已调查过的累计得分恰为分”的概率,探求与的关系,并求数列的通项公式.
12.(2024•嘉定区校级模拟)为培养学生的阅读习惯,某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.活动后,为了解阅读情况,学校统计了甲、乙两组各10名学生的阅读量(单位:本),统计结果用茎叶图记录如下,乙组记录中有一个数据模糊,无法确认,在图中以表示.
(1)若甲组阅读量的平均值大于乙组阅读量的平均值,求图中的所有可能取值;
(2)将甲、乙两组中阅读量超过15本的学生称为“阅读达人”.设,从20名学生中随机抽取一人,已知该生为阅读达人,求该生为甲组学生的概率.
(3)记甲组阅读量的方差为.在甲组中增加一名学生得到新的甲组,若的阅读量为10,则记新甲组阅读量的方差为;若的阅读量为20,则记新甲组阅读量的方差为,试比较,,的大小.(结论不要求证明)
13.(2024•宝山区校级四模)某航天公司研发了一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:
飞行距离
56
63
71
79
90
102
110
117
损坏零件数(个
61
73
90
105
119
136
149
163
(1)建立关于的回归模型,根据所给数据及回归模型,求回归方程及相关系数.精确到0.1,精确到1,精确到
(2)该公司进行了第二次测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,对其中60台进行飞行前保养,测试结束后,有20台报废,其中保养过的推进器占比,请根据统计数据完成列联表,并根据小概率值的独立性检验,能否认为推进器是否报废与保养有关?
保养
未保养
合计
报废
20
未报废
合计
60
100
附:,
0.050
0.010
0.001
3.841
6.635
10.828
14.(2024•浦东新区校级三模)某学校为了解本学期学生参加公益劳动的情况,从学校内随机抽取了500名高中学生进行在线调查,收集了他们参加公益劳动时间(单位:小时)分配情况等数据,并将样本数据分成,,,,,,,,,,,,,,,,,九组,绘制成如图所示的频率分布直方图.
(1)现认为大于10小时的公益劳动时间为长,小于10小时的公益劳动时间为短,填写下列列联表,并判断是否有把握认为公益劳动时间与学生性别有关.
性别
公益劳动时间
合计
长
短
男
110
女
120
合计
(2)为进一步了解这500名学生参加公益劳动时间的分配情况,从参加公益劳动时间在,,,,,三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人.记参加公益劳动时间在,内的学生人数为,求的分布列和期望;
(3)以调查结果的频率估计概率,从该学校所有高中学生中随机抽取20名学生,用“”表示这20名学生中恰有名学生参加公益劳动时间在,(单位:小时)内的概率,其中,1,2,,20.当最大时,写出的值.
0.100
0.050
0.025
0.010
2.706
3.841
5.024
6.635
15.(2024•普陀区校级三模)某学校有甲、乙、丙三家餐厅,分布在生活区的南北两个区域,其中甲、乙餐厅在南区,丙餐厅在北区各餐厅菜品丰富多样,可以满足学生的不同口味和需求.
性别
就餐区域
合计
南区
北区
男
33
10
43
女
38
7
45
合计
71
17
88
(1)现在对学生性别与在南北两个区域就餐的相关性进行分析,得到下表所示的抽样数据,依据的独立性检验,能否认为在不同区域就餐与学生性别有关联?
(2)张同学选择餐厅就餐时,如果前一天在甲餐厅,那么后一天去甲,乙餐厅的概率均为;如果前一天在乙餐厅,那么后一天去甲,丙餐厅的概率分别为,;如果前一天在丙餐厅,那么后一天去甲,乙餐厅的概率均为.张同学第1天就餐时选择甲,乙,丙餐厅的概率分别为,,.
0.100
0.050
0.025
0.010
2.706
3.841
5.024
6.635
(ⅰ)求第2天他去乙餐厅用餐的概率;
(ⅱ)求第天他去甲餐厅用餐的概率.
附:,.
一.选择题(共4小题)
1.(2023•上海)根据所示的散点图,下列说法正确的是
A.身高越大,体重越大 B.身高越大,体重越小
C.身高和体重成正相关 D.身高和体重成负相关
2.(2024•上海)有四种礼盒,前三种里面分别仅装有中国结、记事本、笔袋,第四个礼盒里面三种礼品都有,现从中任选一个盒子,设事件:所选盒中有中国结,事件:所选盒中有记事本,事件:所选盒中有笔袋,则
A.事件与事件互斥 B.事件与事件相互独立
C.事件与事件互斥 D.事件与事件相互独立
3.(2024•上海)已知气候温度和海水表层温度相关,且相关系数为正数,对此描述正确的是
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度呈下降趋势
4.(2023•上海)如图为年上海市货物进出口总额的条形统计图,则下列对于进出口贸易额描述错误的是
A.从2018年开始,2021年的进出口总额增长率最大
B.从2018年开始,进出口总额逐年增大
C.从2018年开始,进口总额逐年增大
D.从2018年开始,2020年的进出口总额增长率最小
二.填空题(共8小题)
5.(2021•上海)已知花博会有四个不同的场馆,,,,甲、乙两人每人选2个去参观,则他们的选择中,恰有一个馆相同的概率为 .
6.(2020•上海)已知有四个数1,2,,,这四个数的中位数是3,平均数是4,则 .
7.(2024•上海)某校举办科学竞技比赛,有、、种题库,题库有5000道题,题库有4000道题,题库有3000道题.小申已完成所有题,他题库的正确率是0.92,题库的正确率是0.86,题库的正确率是0.72.现他从所有的题中随机选一题,正确率是 .
8.(2023•上海)已知事件的对立事件为,若(A),则 .
9.(2022•上海)为了检测学生的身体素质指标,从游泳类1项,球类3项,田径类4项共8项项目中随机抽取4项进行检测,则每一类都被抽到的概率为 .
10.(2023•上海)某校抽取100名学生测身高,其中身高最大值为,最小值为,根据身高数据绘制频率组距分布直方图,组距为5,且第一组下限为153.5,则组数为 .
11.(2023•上海)现有某地一年四个季度的(亿元),第一季度为232(亿元),第四季度为241(亿元),四个季度的逐季度增长,且中位数与平均数相同,则该地一年的为 .
12.(2023•上海)为了学习宣传党的二十大精神,某校学生理论宣讲团赴社区宣讲,已知有4名男生,6名女生,从10人中任选3人,则恰有1名男生2名女生的概率为 .
三.解答题(共3小题)
13.(2024•上海)水果分为一级果和二级果,共136箱,其中一级果102箱,二级果34箱.
(1)随机挑选两箱水果,求恰好一级果和二级果各一箱的概率;
(2)进行分层抽样,共抽8箱水果,求一级果和二级果各几箱;
(3)抽取若干箱水果,其中一级果共120个,单果质量平均数为303.45克,方差为603.46;二级果48个,单果质量平均数为240.41克,方差为648.21;求168个水果的方差和平均数,并预估果园中单果的质量.
14.(2023•上海)2023年6月7日,21世纪汽车博览会在上海举行,已知某汽车模型公司共有25个汽车模型,其外观和内饰的颜色分布如下表所示:
红色外观
蓝色外观
棕色内饰
12
8
米色内饰
2
3
(1)若小明从这些模型中随机拿一个模型,记事件为小明取到红色外观的模型,事件为小明取到棕色内饰的模型,求(B)和,并判断事件和事件是否独立;
(2)该公司举行了一个抽奖活动,规定在一次抽奖中,每人可以一次性从这些模型中拿两个汽车模型,给出以下假设:
假设1:拿到的两个模型会出现三种结果,即外观和内饰均为同色、外观和内饰都异色、以及仅外观或仅内饰同色;
假设2:按结果的可能性大小,概率越小奖项越高;
假设3:该抽奖活动的奖金额为:一等奖600元,二等奖300元、三等奖150元;
请你分析奖项对应的结果,设为奖金额,写出的分布列并求出的数学期望.
15.(2024•上海)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:
时间范围
,
,
,
,
,
学业成绩
优秀
5
44
42
3
1
不优秀
134
147
137
40
27
(1)该地区29000名学生中体育锻炼时长不少于1小时的人数约为多少?
(2)估计该地区初中学生日均体育锻炼的时长(精确到.
(3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?
原创精品资源学科网独家享有版权,侵权必究!6
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$
第16讲 概率与统计(9类核心考点精讲精练)
1. 5年真题考点分布
5年考情
考题示例
考点分析
2024年秋考8、13、19题
2024年春考15、19题
全概率公式;数据相关分析;用样本估计总体、由频率分布表求平均数及独立性检验。
互斥事件的定义;分层抽样的平均数及方差公式的应用
2023秋考9、14、19题
2023春考5、7、10、14题
中位数和平均数的定义;线性相关的概念;离散型随机变量的分布和期望的计算。
对立事件概率计算公式;频率分布直方图;古典概型概率;统计图的识别。
2022秋考9题
古典概型概率及其计算公式
2021年秋考10题
古典概型概率及其计算公式
2020年秋考7题
样本的数据特征:中位数、平均数
2. 备考策略
1.应用互斥事件的概率加法公式时,一定要先确定各事件是否彼此互斥,然后求出各事件分别发生的概率,再求和.
2.正确区别互斥事件与对立事件的关系:对立事件是互斥事件,是互斥中的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的必要不充分条件.
3.易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
4.要注意概率P(A|B)与P(AB)的区别
(1)在P(A|B)中,事件A,B发生有时间上的差异,B先A后;在P(AB)中,事件A,B同时发生.
(2)样本空间不同,在P(A|B)中,事件B成为样本空间;在P(AB)中,样本空间仍为Ω,因而有P(A|B)≥P(AB).
5.(1)易忘判定随机变量是否服从二项分布,盲目使用二项分布的均值和方差公式计算致误.
(2)涉及求分布列时,要注意区分是二项分布还是超几何分布.
一.互斥事件与对立事件
1.互斥事件
(1)定义:一次试验中,事件A和事件B不能同时发生,则这两个不能同时发生的事件叫做互斥事件.
如果A1,A2,…,An中任何两个都不可能同时发生,那么就说事件A1,A2,…An彼此互斥.
(2)互斥事件的概率公式:
在一个随机试验中,如果随机事件A和B是互斥事件,则有:
P(A+B)=P(A)+P(B)
注:上式使用前提是事件A与B互斥.
推广:一般地,如果事件A1,A2,…,An彼此互斥,那么事件发生(即A1,A2,…,An中有一个发生)的概率等于这n个事件分别发生的概率之和,即:
P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)
2.对立事件
(1)定义:一次试验中,两个事件中必有一个发生的互斥事件叫做对立事件,事件A的对立事件记做.
注:①两个对立事件必是互斥事件,但两个互斥事件不一定是对立事件;
②在一次试验中,事件A与只发生其中之一,并且必然发生其中之一.
(2)对立事件的概率公式:
P()=1﹣P(A)
3.互斥事件与对立事件的区别和联系
互斥事件是不可能同时发生的两个事件,而对立事件除要求这两个事件不同时发生外,还要求二者之一必须有一个发生.因此,对立事件是互斥事件的特殊情况,而互斥事件未必是对立事件,即“互斥”是“对立”的必要但不充分条件,而“对立”则是“互斥”的充分但不必要条件.
二.互斥事件的概率加法公式
互斥事件的概率加法公式:
在一个随机试验中,如果随机事件A和B是互斥事件,则有:
P(A+B)=P(A)+P(B)
注:上式使用前提是事件A与B互斥.
推广:一般地,如果事件A1,A2,…,An彼此互斥,那么事件发生(即A1,A2,…,An中有一个发生)的概率等于这n个事件分别发生的概率之和,即:
P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)
三.古典概型及其概率计算公式
1.定义:如果一个试验具有下列特征:
(1)有限性:每次试验可能出现的结果(即基本事件)只有有限个;
(2)等可能性:每次试验中,各基本事件的发生都是等可能的.
则称这种随机试验的概率模型为古典概型.
*古典概型由于满足基本事件的有限性和基本事件发生的等可能性这两个重要特征,所以求事件的概率就可以不通过大量的重复试验,而只要通过对一次试验中可能出现的结果进行分析和计算即可.
2.古典概率的计算公式
如果一次试验中可能出现的结果有n个,而且所有结果出现的可能性都相等,那么每一个基本事件的概率都是;
如果某个事件A包含的结果有m个,那么事件A的概率为P(A)==.
【解题方法点拨】
1.注意要点:解决古典概型的问题的关键是:分清基本事件个数n与事件A中所包含的基本事件数.
因此要注意清楚以下三个方面:
(1)本试验是否具有等可能性;
(2)本试验的基本事件有多少个;
(3)事件A是什么.
2.解题实现步骤:
(1)仔细阅读题目,弄清题目的背景材料,加深理解题意;
(2)判断本试验的结果是否为等可能事件,设出所求事件A;
(3)分别求出基本事件的个数n与所求事件A中所包含的基本事件个数m;
(4)利用公式P(A)=求出事件A的概率.
3.解题方法技巧:
(1)利用对立事件、加法公式求古典概型的概率
(2)利用分析法求解古典概型.
四.列举法计算基本事件数及事件发生的概率
1、等可能条件下概率的意义:一般地,如果在一次试验中,有n种可能的结果,并且它们发生的可能性都相等,事件A包含其中的m种结果,那么事件A发生的概率为P(A)=.
等可能条件下概率的特征:
(1)对于每一次试验中所有可能出现的结果都是有限的;
(2)每一个结果出现的可能性相等.
2、概率的计算方法:
(1)列举法(列表或画树状图),
(2)公式法;
列表法或树状图这两种举例法,都可以帮助我们不重不漏的列出所以可能的结果.
列表法
(1)定义:用列出表格的方法来分析和求解某些事件的概率的方法叫做列表法.
(2)列表法的应用场合
当一次试验要设计两个因素,并且可能出现的结果数目较多时,为不重不漏地列出所有可能的结果,通常采用列表法.
树状图法
(1)定义:通过列树状图列出某事件的所有可能的结果,求出其概率的方法叫做树状图法.
(2)运用树状图法求概率的条件
当一次试验要设计三个或更多的因素时,用列表法就不方便了,为了不重不漏地列出所有可能的结果,通常采用树状图法求概率.
五.几何概型
1.定义:若一个试验具有下列特征:
(1)每次试验的结果有无限多个,且全体结果可用一个有度量的几何区域来表示;
(2)每次试验的各种结果是等可能的.
那么这样的试验称为几何概型.
2.几何概率:设几何概型的基本事件空间可表示成可度量的区域Ω,事件A所对应的区域用A表示(A⊆Ω),则P(A)=称为事件A的几何概率.
六.相互独立事件和相互独立事件的概率乘法公式
1.相互独立事件:事件A(或B)是否发生,对事件B(或A)发生的概率没有影响,这样两个事件叫做相互独立事件.
2.相互独立事件同时发生的概率公式:
将事件A和事件B同时发生的事件即为A•B,若两个相互独立事件A、B同时发生,则事件A•B发生的概率为:
P(A•B)=P(A)•P(B)
推广:一般地,如果事件A1,A2,…,An相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率之积,即:
P(A1•A2…An)=P(A1)•P(A2)…P(An)
3.区分
互斥事件和相互独立事件是两个不同的概念:
(1)互斥事件:两个事件不可能同时发生;
(2)相互独立事件:一个事件的发生与否对另一个事件发生的概率没有影响.
七.条件概率与独立事件
1、条件概率的定义:对于任何两个事件A和B,在已知事件A发生的条件下,事件B发生的概率叫做条件概率,用符号P(B|A)来表示.
(2)条件概率公式:称为事件A与B的交(或积).
(3)条件概率的求法:
①利用条件概率公式,分别求出P(A)和P(AB),得P(B|A)=,其中P(A)>0;
②借助古典概型概率公式,先求出事件A包含的基本事件数n(A),再在事件A发生的条件下求出事件B包含的基本事件数,即n(A∩B),得P(B|A)=
八.离散型随机变量及其分布列
1、相关概念;
(1)随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量随机变量常用希腊字母ξ、η等表示.
(2)离散型随机变量:对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是随机变量,η=aξ+b,其中a、b是常数,则η也是随机变量.
(3)连续型随机变量:对于随机变量可能取的值,可以取某一区间内的一切值,这样的变量就叫做连续型随机变量
(4)离散型随机变量与连续型随机变量的区别与联系:离散型随机变量与连续型随机变量都是用变量表示随机试验的结果;但是离散型随机变量的结果可以按一定次序一一列出,而连续性随机变量的结果不可以一一列出.
2、离散型随机变量
(1)随机变量:在随机试验中,试验可能出现的结果可以用一个变量X来表示,并且X是随着试验结果的不同而变化的,这样的变量X叫做一个随机变量.随机变量常用大写字母X,Y,…表示,也可以用希腊字母ξ,η,…表示.
(2)离散型随机变量:如果随机变量X的所有可能的取值都能一一列举出来,则称X为离散型随机变量.
3、离散型随机变量的分布列.
(1)定义:一般地,设离散型随机变量X的所有可能值为x1,x2,…,xn;X取每一个对应值的概率分别为p1,p2,…,pn,则得下表:
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
该表为随机变量X的概率分布,或称为离散型随机变量X的分布列.
(2)性质:①pi≥0,i=1,2,3,…,n;②p1+p2+…+pn=1.
九.离散型随机变量的期望与方差
1、离散型随机变量的期望
数学期望:一般地,若离散型随机变量ξ的概率分布为
x 1
x 2
…
xn
…
P
p 1
p 2
…
pn
…
则称Eξ=x1p1+x2p2+…+xnpn+…为ξ的数学期望,简称期望.
数学期望的意义:数学期望离散型随机变量的一个特征数,它反映了离散型随机变量取值的平均水平.
平均数与均值:一般地,在有限取值离散型随机变量ξ的概率分布中,令p1=p2=…=pn,则有p1=p2=…=pn=,Eξ=(x1+x2+…+xn)×,所以ξ的数学期望又称为平均数、均值.
期望的一个性质:若η=aξ+b,则E(aξ+b)=aEξ+b.
2、离散型随机变量的方差;
方差:对于离散型随机变量ξ,如果它所有可能取的值是x1,x2,…,xn,…,且取这些值的概率分别是p1,p2,…,pn…,那么,
称为随机变量ξ的均方差,简称为方差,式中的Eξ是随机变量ξ的期望.
标准差:Dξ的算术平方根叫做随机变量ξ的标准差,记作.
方差的性质:.
方差的意义:
(1)随机变量 的方差的定义与一组数据的方差的定义式是相同的;
(2)随机变量 的方差、标准差也是随机变量 的特征数,它们都反映了随机变量取值的稳定与波动、集中与离散的程度;
(3)标准差与随机变量本身有相同的单位,所以在实际问题中应用更广泛.
十.正态分布曲线的特点及曲线所表示的意义
1.正态曲线及性质
(1)正态曲线的定义
函数φμ, σ (x)=,x∈(﹣∞,+∞),其中实数μ和σ(σ>0)为参数,我们称φμ,σ(x)的图象(如图)为正态分布密度曲线,简称正态曲线.
(2)正态曲线的解析式
①指数的自变量是x定义域是R,即x∈(﹣∞,+∞).
②解析式中含有两个常数:π和e,这是两个无理数.
③解析式中含有两个参数:μ和σ,其中μ可取任意实数,σ>0这是正态分布的两个特征数.
④解析式前面有一个系数为,后面是一个以e为底数的指数函数的形式,幂指数为﹣.
2.正态分布
(1)正态分布的定义及表示
如果对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=φμ,σ(x)dx,则称X的分布为正态分布,记作N(μ,σ2).
(2)正态总体在三个特殊区间内取值的概率值
①P(μ﹣σ<X≤μ+σ)=0.6826;
②P(μ﹣2σ<X≤μ+2σ)=0.9544;
③P(μ﹣3σ<X≤μ+3σ)=0.9974.
3.正态曲线的性质
正态曲线φμ, σ (x)=,x∈R有以下性质:
(1)曲线位于x轴上方,与x轴不相交;
(2)曲线是单峰的,它关于直线x=μ对称;
(3)曲线在x=μ处达到峰值;
(4)曲线与x轴围成的图形的面积为1;
(5)当σ一定时,曲线随着μ的变化而沿x轴平移;
(6)当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
4.三个邻域
会用正态总体在三个特殊区间内取值的概率值结合正态曲线求随机变量的概率.落在三个邻域之外是小概率事件,这也是对产品进行质量检测的理论依据.
【解题方法点拨】
正态分布是高中阶段唯一连续型随机变量的分布,这个考点虽然不是高考的重点,但在近几年新课标高考中多次出现,其中数值计算是考查的一个热点,考生往往不注意对这些数值的记忆而导致解题无从下手或计算错误.对正态分布N(μ,σ2)中两个参数对应的数值及其意义应该理解透彻并记住,且注意第二个数值应该为σ2而不是σ,同时,记住正态密度曲线的六条性质.
十一.频率分布直方图
1.频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中的各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直方图.
2.频率分布直方图的特征
①图中各个长方形的面积等于相应各组的频率的数值,所有小矩形面积和为1.
②从频率分布直方图可以清楚地看出数据分布的总体趋势.
③从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息被抹掉.
3.频率分布直方图求数据
①众数:频率分布直方图中最高矩形的底边中点的横坐标.
②平均数:频率分布直方图各个小矩形的面积乘底边中点的横坐标之和.
③中位数:把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标.
【解题方法点拨】
绘制频率分布直方图的步骤:
十二.频率分布折线图、密度曲线
1.频率分布折线图:
如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图,简称频率折线图.
2.总体分布的密度曲线:
如果将样本容量取得足够大,分组的组距取得足够小,则相应的频率分布折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.
十三.茎叶图
1.茎叶图:将样本数据有条理地列出来,从中观察样本分布情况的图称为茎叶图.
例:某篮球运动员在某赛季各场比赛的得分情况:12,15,24,25,31,31,36,36,37,39,44,49,50
得分表示成茎叶图如下:
2.茎叶图的优缺点:
优点:
(1)所有信息都可以从茎叶图上得到
(2)茎叶图便于记录和表示
缺点:
分析粗略,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便.
【解题方法点拨】
茎叶图的制作步骤:
(1)将每个数据分为“茎”(高位)和“叶”(低位)两部分
(2)将最小的茎和最大的茎之间的数按小大次序排成一列
(3)将各个数据的叶按大小次序写在茎右(左)侧
第1步中,
①如果是两位数字,则茎为十位上的数字,叶为个位上的数字,如89,茎:8,叶:9.
②如果是三位数字,则茎为百位上的数字,叶为十位和个位上的数字,如123,茎:1,叶:23.
对于重复出现的数据要重复记录,不能遗漏,同一数据出现几次,就要在图中体现几次.
十四.统计图表获取信息
统计图表反映了被描述对象的重要内容和数据情况,它简单明了,有利于我们把握数据的特点,统计图还能直观、生动地传递信息.
【解题方法点拨】
由统计图表获取信息的步骤:
一、看统计图表特征;
二、读统计图表数据信息并进行分析;
三、寻找出统计图表中数据的变化趋势或规律;
四、对统计图表的数据与信息作分析、推测,为对解决问题作出合理的判断提供依据.
注意:①要避免统计图的误导,首先要仔细观察统计图,其次要关注数据的来源、收集方式及描述形式,这样才能获得准确的信息;
②对数据的收集、整理等一定要重视它的普遍性、代表性、公正性,不能以点带面,以偏概全,夸大局部的作用.
【命题方向】
能正确解读统计图表,从中获取必要、准确的信息,并进站简单的决策;处理生活中常见的不规范统计图带来的错误信息,提高对统计图表的认识能力.
十五.众数、中位数、平均数
1.众数、中位数、平均数
众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛.
(1)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数;
(2)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数;
(3)平均数:一组数据的算术平均数,即.
2.众数、中位数、平均数的优缺点
【解题方法点拨】
众数、中位数、平均数的选取:
(1)平均数能较好地反映一组数据的总体情况;
(2)中位数不受极端值影响,有时用它代表全体数据的中等水平(或一般水平);
(3)众数能反映一组数据的集中情况(即多数水平).
根据频率分布直方图估算众数、中位数、平均数:
(1)众数:在频率分布直方图中,最高矩形的中点的横坐标就是众数.
(2)中位数:在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.
(3)平均数:是频率分布直方图的“重心”,是直方图的平衡点.平均数等于频率分布直方图中每个小矩形的面积(即落在该组中的频率)乘以小矩形底边中点的横坐标(组中值)之和.
十六.极差、方差与标准差
用一组数据中最大数据减去最小数据的差来反映这组数据的变化范围,这个数据就叫极差.一组数据中各数据与平均数差的平方和的平均数叫做方差.方差的算术平方根就为标准差.方差和标准差都是反映这组数据波动的大小,方差越大,数据的波动越大.
十七.百分位数
百分位数的定义:一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点,总体数据中的任意一个数小于或等于它的可能性是p.
四分位数:25%,50%,75%分位数是三个常用的百分位数.把总体数据按照从小到大排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是.因此这三个百分位数也称为总体的四分位数.
【解题方法点拨】
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100﹣p)%的数据大于或等于这个值.计算一组n个数据的第p百分位数步骤如下:
①按从小到大排列原始数据;
②计算i=n×p%;
③若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
【命题方向】
理解连续变量的百分位数的统计含义,考察百分位数的计算,学会用样本估计总体的百分位数.
十八.相关系数
1、概念:
相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度.于是,著名统计学家卡尔•皮尔逊设计了统计指标﹣﹣相关系数.相关系数是用以反映变量之间相关关系密切程度的统计指标.相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数.
2、相关系数用r表示,计算公式为
其中:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;|r|≤1,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小.
3、残差:
相关指数R2用来刻画回归的效果,其计算公式是
在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方.显然,R2取值越大,意味着残差平方和越小,也就是模型的拟合效果越好.
【解题方法点拨】
建立回归模型的基本步骤:
(1)确定研究对象,明确哪个变量是解释变量,哪个是预报变量;
(2)画出解释变量和预报变量的散点图,观察它们之间的关系;
(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程:=x+);
(4)按一定规则估计回归方程中的参数(如最小二乘法);
(5)得出结果分析残差图是否有异常,若存在异常,则检查数据是否有误,或模型是否适当.当回归方程不是形如:=x+时,我们称之为非线性回归方程.
十九.线性回归方程
线性回归是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一,运用十分广泛.分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析.如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析.如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析.变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点将散布在某一直线周围.因此,可以认为关于的回归函数的类型为线性函数.
二十.独立性检验
1、分类变量:
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
2、原理:假设性检验(类似反证法原理).
一般情况下:假设分类变量X和Y之间没有关系,通过计算K2值,然后查表对照相应的概率P,发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1﹣P),也就是“X和Y有关系”.(表中的k就是K2的观测值,即k=K2).
其中n=a+b+c+d(考试给出)
3、2×2列联表:
4、范围:K2∈(0,+∞);性质:K2越大,说明变量间越有关系.
5、解题步骤:
(1)认真读题,取出相关数据,作出2×2列联表;
(2)根据2×2列联表中的数据,计算K2的观测值k;
(3)通过观测值k与临界值k0比较,得出事件有关的可能性大小.
知识讲解
考点一:样本空间与随机事件
1.(2024•浦东新区校级三模)掷两颗骰子,观察掷得的点数.设事件表示“两个点数都是偶数”,事件表示“两个点数都是奇数”,事件表示“两个点数之和是偶数”,事件表示“两个点数的乘积是偶数”.那么下列结论正确的是
A.与是对立事件 B.与是互斥事件
C.与是相互独立事件 D.与是相互独立事件
【分析】根据题意,由对立事件的定义分析,由互斥事件的定义分析,由相互独立事件的定义分析、,综合可得答案.
【解答】解:根据题意,依次分析选项:
对于,由对立事件的定义,和不是对立事件,错误;
对于,表示“两个点数都是偶数”,则有,错误;
对于,(B),(D),,事件、不是相互独立事件,错误;
对于,为必然事件,则必有(B)(B),与是相互独立事件,正确.
故选:.
【点评】本题考查随机事件的定义,涉及相互独立事件、互斥事件的定义,属于基础题.
2.(2024•普陀区模拟)从放有两个红球、一个白球的袋子中一次任意取出两个球,两个红球分别标记为、,白球标记为,则它的一个样本空间可以是
A., B.,,
C.,,, D.,,,,
【分析】根据已知条件,结合样本空间的定义,即可求解.
【解答】解:两个红球分别标记为、,白球标记为,
则抽取两个球的情况为,,,即它的一个样本空间可以是,,.
故选:.
【点评】本题主要考查样本空间的定义,属于基础题.
3.(2023•徐汇区校级三模)某小组有1名男生和2名女生,从中任选2名学生参加围棋比赛,事件“至少有1名男生”与事件“至少有1名女生”
A.是对立事件 B.都是不可能事件
C.是互斥事件但不是对立事件 D.不是互斥事件
【分析】根据已知条件,结合对立事件、互斥事件的定义,即可求解.
【解答】解:事件“至少有1名男生”与事件“至少有1名女生”能同时发生,即两名学生正好一名男生,一名女生,故两事件既不是对立事件也不是互斥事件.
故选:.
【点评】本题主要考查对立事件、互斥事件的定义,属于基础题.
4.(2023•黄浦区二模)从装有两个红球和两个白球的口袋内任取两个球,那么互斥而不对立的事件是
A.恰好有一个白球与都是红球
B.至多有一个白球与都是红球
C.至多有一个白球与都是白球
D.至多有一个白球与至多一个红球
【分析】由题意可得总事件分别为(红,白),(红,红),(白,白)三种情况,根据互斥事件以及对立事件的定义再对应各个选项逐个分析即可求解.
【解答】解:从装有两个红球和两个白球的口袋内任取两个球,
表示的事件分别为(红,白),(红,红),(白,白)三种情况,
故选项互斥不对立,正确,
选项:至多有一个白球表示的是(红,白),(红,红),与都是红球不互斥,故错误,
选项:由选项的分析可知互斥且对立,故错误,
选项:至多有一个红球表示的是(红,白),(白,白),所以两个事件不互斥,故错误,
故选:.
【点评】本题考查了互斥事件应急对立事件的定义,考查了学生的逻辑推理能力,属于基础题.
5.(2023•宝山区校级模拟)某家庭有三个孩子,假定生男孩和生女孩是等可能且相互独立的.记事件:该家庭既有男孩又有女孩;事件:该家庭最多有一个男孩;事件:该家庭最多有一个女孩;则下列说法中正确的是
A.事件与事件互斥但不对立 B.事件与事件互斥且对立
C.事件与事件相互独立 D.事件与事件相互独立
【分析】先列出生3个小孩包含的基本事件数及事件,事件,事件,包含的基本事件数,再利用互斥,对立和独立事件所满足的关系,对四个选项一一作出判断.
【解答】解:生3个小孩的总事件包含(男,男,男),(男,男,女),(男,女,男),(女,男,男),(男,女,女),(女,男,女),(女,女,男),(女,女,女),共8个基本事件,
事件包含(男,男,女),(男,女,男),(女,男,男),(男,女,女),(女,男,女),(女,女,男),共6个基本事件,
事件包含(男,女,女),(女,男,女),(女,女,男),(女,女,女),共4个基本事件,
事件包含(男,男,男),(男,男,女),(男,女,男),(女,男,男),共4个基本事件,
选项,因为,,所以事件与事件互斥且对立,错误;
选项,因为,所以事件与事件不互斥,不对立,错误;
选项,因为,所以,又,故(B)(C),故事件与事件不独立,错误;
选项,因为有3个基本事件,所以,又,
所以(A)(B),正确.
故选:.
【点评】本题主要考查了古典概率公式的应用,属于基础题.
6.(2023•闵行区校级三模)分别抛掷3枚质地均匀的硬币,则等可能事件的样本空间中样本点的个数是 8 .
【分析】根据每枚硬币的情况数,即可求出分别抛掷3枚硬币的所有情况数.
【解答】解:每枚硬币都有2种情况,即正面和反面,
则分别抛掷3枚硬币,(正,正,正),(正,正,反),(正,反,正),(正,反,反),(反,正,正),(反,正,反),(反,反,正),(反,反,反),
所以等可能事件的样本空间中样本点的个数是8.
故答案为:8.
【点评】本题考查了随机事件的概念,属于基础题
考点二:随机事件的概率
1.(2024•浦东新区校级模拟)在10件产品中有3件次品,从中选3件.下列各种情况是互斥事件的有
①:“所取3件中至多2件次品”, :“所取3件中至少2件为次品”;
②:“所取3件中有一件为次品”, :“所取3件中有二件为次品”;
③:“所取3件中全是正品”, :“所取3件中至少有一件为次品”;
④:“所取3件中至多有2件次品”, :“所取3件中至少有一件是正品”;
A.①③ B.②③ C.②④ D.③④
【分析】所取3件中至多2件次品与所取3件中至少2件为次品,两个事件中都包含2件次品,所取3件中有一件为次品与所取3件中有二件为次品是互斥事件,所取3件中全是正品与所取3件中至少有一件为次品是不能同时发生的.
【解答】解:在10件产品中有3件次品,从中选3件,
所取3件中至多2件次品与所取3件中至少2件为次品,
两个事件中都包含2件次品,
①中的两个事件不是互斥事件.
所取3件中有一件为次品与所取3件中有二件为次品是互斥事件,
②中的两个事件是互斥事件.
所取3件中全是正品与所取3件中至少有一件为次品是不能同时发生的,
③中的两个事件是互斥事件
故选:.
【点评】本题考查互斥事件的意义,判断两个事件是否是互斥事件,是解题的关键,可以把事件中所包含的所有事件列出来进行比较.
2.(2024•浦东新区三模)有一袋子中装有大小、质地相同的白球个,黑球.甲、乙两人约定一种游戏规则如下:第一局中两人轮流摸球,摸后放回,先摸到白球者本局获胜但从第二局起,上一局的负者先摸球.若第一局中甲先摸球,记第局甲获胜的概率为,则关于以下两个命题判断正确的是
①,且;
②若第七局甲获胜的概率不小于0.9,则不小于1992.
A.①②都是真命题 B.①是真命题,②是假命题
C.①是假命题,②是真命题 D.①②都是假命题
【分析】写出一局中不同情况下甲赢的概率寻找规律,写出通项公式,解答本题.
【解答】解:对于第一局,甲获胜的概率为:
摸1次:(甲,
摸3次:(甲乙甲,前两次甲乙均摸到黑球,第3次甲摸到白球,下同理),
摸5次:(甲乙甲乙甲),
摸7次:(甲乙甲乙甲乙甲),
根据上述,寻找规律,发现甲获胜的概率是以,公比的等比数列.
对等比数列的前项和取极限运算,有:
.
设第局甲赢的概率为,根据马尔科夫链有:
整理得:;
构造数列求出通项公式:,
整理得到:,
不难发现:,
则:,
进一步有:,
根据题意有:,
即:,
即:,
即:,
即,
解得,
故,
故①②都正确.
故选:.
【点评】本题考查概率的综合运用,属于难题.
3.(2024•浦东新区二模)某校面向高一全体学生共开设3门体育类选修课,每人限选一门.已知这三门体育类选修课的选修人数之比为,考核优秀率分别为、和,现从该年级所有选择体育类选修课的同学中任取一名,其成绩是优秀的概率为 0.18 .
【分析】设这三门体育类选修课的选修人数分别为,,,分别求出三门体育类选修课考核优秀的人数,再利用古典概型的概率公式求解,
【解答】解:设这三门体育类选修课的选修人数分别为,,,
则所求概率为.
故答案为:0.18.
【点评】本题主要考查了古典概型的概率公式,属于基础题.
4.(2024•普陀区校级模拟)某学校有、两个餐厅,已知同学甲每天中午都会在这两个餐厅中选择一个就餐,如果甲当天选择了某个餐厅,他第二天会有的可能性换另一个餐厅就餐,假如第1天甲选择了餐厅,则第天选择餐厅的概率为 .
【分析】根据全概率公式可得出,可得出,由此可得出数列为等比数列,确定该数列的首项和公比,即可求得数列的通项公式.
【解答】解:当且时,若甲在第天选择了餐厅,
那么在第天有的可能性选择餐厅,
若甲在第天选择了餐厅,那么在第天有的可能性选择餐厅,
所以第天选择餐厅的概率,
即,所以.
又由题意得,,所以是以为首项,为公比的等比数列,
所以,所以.
故答案为:.
【点评】本题考查古典概率模型,属于基础题.
5.(2024•青浦区校级模拟)齐王与田忌赛马,田忌的上等马优于齐王的中等马,劣于齐王的上等马,田忌的中等马优于齐王的下等马,劣于齐王的中等马,田忌的下等马劣于齐王的下等马.现从双方的马匹中随机选一匹进行一场比赛,则田忌的马获胜的概率为 .
【分析】基本事件总数,田忌的马获胜包含的基本事件有:种,由此能求出田忌的马获胜的概率.
【解答】解:现从双方的马匹中随机选一匹进行一场比赛,
基本事件总数,
田忌的马获胜包含的基本事件有:种,
田忌的马获胜的概率.
故答案为:.
【点评】本题考查概率的求法,考查等可能事件概率计算公式等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.
6.(2024•徐汇区校级模拟)如图为正六棱柱,若从该正六棱柱的6个侧面的12条面对角线中,随机选取两条,则它们共面的概率是 .
【分析】共面分为平行和相交,平行时,只需要考虑对面平行中的直线即可,相交时分为:在侧面内相交,两个相邻面相交于一个点,相隔一个面中相交于对角线延长线上,分别分析几种情况下对角线共面的个数,再利用古典概型的概率计算公式,计算结果即可.
【解答】解:由题意知,若两个对角线在同一个侧面,因为有6个侧面,所以共有6组,
若相交且交点在正六棱柱的顶点上,因为有12个顶点,所以共有12组,
若相交且交点在对角线延长线上时,如图所示,连接,,,,,
先考虑下底面,根据正六边形性质可知,所以,
且,故共面,且共面,
故,相交,且,相交,故共面有2组,
则正六边形对角线所对应的有2组共面的面对角线,
同理可知正六边形对角线,所对的分别有两组,共6组,
故对于上底面对角线,,同样各对两组,共6组,
若对面平行,一组对面中有2组对角线平行,三组对面共有6组,
所以共面的概率是.
故答案为:.
【点评】本题主要考查了古典概型的概率公式,考查了棱柱的结构特征,属于中档题.
考点三:随机事件的独立性与条件概率
1.(2024•奉贤区三模)如果、分别是、的对立事件,下列选项中不能判断件与事件相互独立的是
A.(A)(B) B.(A)(B)
C.(A) D.(B)
【分析】根据题意,依次分析选项,验证(A)(B)是否成立,即可得答案.
【解答】解:根据题意,依次分析选项:
对于,(A)(B),则事件、相互独立,符合题意;
对于,(A),(A)(B)(A)(A)(B),
若(A)(B),即(A)(A)(A)(B),
则(A)(B),必有事件、相互独立,符合题意;
对于,,若(A),即(A),
则有(A),事件不一定相互独立,不符合题意.
对于,,若(B),即(B),
变形可得(A)(B),必有事件、相互独立,符合题意.
故选:.
【点评】本题考查相互独立事件的判断,涉及条件概率的计算,属于基础题.
2.(2024•虹口区模拟)对于独立事件,,若,,则 .
【分析】根据相互独立事件的概率乘法公式可解.
【解答】解:因为,为相互独立事件,且,,
则(A)(B).
故答案为:.
【点评】本题考查相互独立事件的概率乘法公式,属于基础题.
3.(2024•嘉定区二模)小张、小王两家计划假期来嘉定游玩,他们分别从“古猗园,秋霞圃,州桥老街”这三个景点中随机选择一个游玩,记事件表示“两家至少有一家选择古猗园”,事件表示“两家选择景点不同”,则概率 .
【分析】根据题意,由古典概型公式求出(A)、,进而计算可得答案.
【解答】解:根据题意,两家分别从“古猗园,秋霞圃,州桥老街”这三个景点中随机选择一个游玩,有种情况,
若两家至少有一家选择古猗园,有种情况,则(A),
若两家选择景点不同且至少有一家选择古猗园,有种情况,则,
则.
故答案为:.
【点评】本题考查条件概率的计算,涉及古典概型的计算,属于基础题.
4.(2024•长宁区校级三模)已知工厂库房中的某种零件来自甲公司,正品率为;来自乙公司,正品率为,从库房中任取一个这种零件,它是正品的概率为 0.92 .
【分析】根据已知条件,结合全概率公式,即可求解.
【解答】解:工厂库房中的某种零件来自甲公司,正品率为;来自乙公司,正品率为,
故从库房中任取一个这种零件,它是正品的概率为:.
故答案为:0.92.
【点评】本题主要考查全概率公式,属于基础题.
5.(2024•静安区二模)某工厂生产的产品以100个为一批.在进行抽样检查时,只从每批中抽取10个来检查,如果发现其中有次品,则认为这批产品是不合格的.假定每一批产品中的次品最多不超过2个,并且其中恰有,1,个次品的概率如下:
一批产品中有次品的个数
0
1
2
概率
0.3
0.5
0.2
则各批产品通过检查的概率为 0.91 .(精确到
【分析】利用全概率公式求解.
【解答】解:设事件表示一批产品中有个次品,1,,
则,,,
设事件表示这批产品通过检查,即抽样检查的10个产品都是合格品,
则,,,
所以(A).
故答案为:0.91.
【点评】本题主要考查了全概率公式,属于基础题.
6.(2024•奉贤区三模)在刚刚结束的杭州亚运会上,中国羽毛球队延续了传统优势项目,以4金3银2铜的成绩傲视亚洲.在旧制的羽毛球赛中,只有发球方赢得这一球才可以得分,即如果发球方在此回合的争夺中输球,则双方均不得分.但发球方输掉此回合后,下一回合改为对方发球.
(1)在旧制羽毛球赛中,中国队某运动员每一回合比赛赢球的概率均为,且各回合相互独立.若第一回合该中国队运动员发球,求第二回合比赛有运动员得分的概率;
(2)羽毛球比赛中,先获得第一分的队员往往会更加占据心理上的优势,给出以下假设:
假设1:各回合比赛相互独立;
假设2:比赛双方运动员甲和乙的实力相当,即每回合比赛中甲获胜的概率均为;
求第一回合发球者在整场比赛中先得第一分的概率,并说明旧制是否合理?
【分析】(1)结合全概率公式,即可求解;
(2)根据已知条件,求出运动员甲先获得第一分的概率,再与比较,即可求解.
【解答】解:(1)设事件表示第一回合该中国队运动员发球,设事件表示第二回合该中国队运动员发球,事件表示第二回回合比赛有运动员得分.则;
(2)若运动员甲先发球,记事件表示第回合运动员甲复球,
记事件表示运动员甲先获得第一分.则,
则,即先得第一分概率大于,即运动员水平相当的情形下,先发球者更大概率占据心理优势,赛制不合理.
【点评】本题主要考查概率的应用,属于中档题.
考点四:离散型随机变量及其分布列
1.(2024•虹口区二模)给出下列4个命题:
①若事件和事件互斥,则(A)(B);
②数据2,3,6,7,8,10,11,13的第70百分位数为10;
③已知关于的回归方程为,则样本点的离差为;
④随机变量的分布为,则其数学期望.
其中正确命题的序号为
A.①② B.①③ C.②③ D.②④
【分析】由互斥事件的定义分析①,由百分位数的计算公式分析②,由残差的计算公式分析③,根据离散型随机变量的期望公式分析④,综合可得答案.
【解答】解:对于①,若事件和事件互斥,,①错误;
对于②,共有8个数据,,根据百分位数的定义直接取第六位即可,②正确;
对于③,若关于的回归方程为,则样本点的残差为,③正确;
对于④,,④错误.
故选:.
【点评】本题考查命题真假的判断,涉及互斥事件、百分位数、残差的计算,期望的计算,属于基础题.
2.(2024•闵行区三模)已知随机变量,且,则 12 .
【分析】由二项分布的期望公式计算可求出,再由方差公式求解即可.
【解答】解:因为随机变量,且,
所以,所以,
所以,
所以.
故答案为:12.
【点评】本题主要考查二项分布的期望和方差,考查运算求解能力,属于基础题.
3.(2024•嘉定区校级模拟)设随机变量服从二项分布,则 8 .
【分析】根据二项分布方差的公式及性质即可求解.
【解答】解:因为随机变量,
所以,
所以.
故答案为:8.
【点评】本题考查了二项分布的方差及性质,属于基础题.
4.(2024•松江区校级模拟)2024年1月5日起,第40届中国哈尔滨国际冰雪节在黑龙江省哈尔滨市举行.让大家对冰雪文化进一步了解,激发了大家对冰雪运动进一步的热爱.为了调查不同年龄层的人对“冰雪运动”的喜爱态度.某研究小组随机调查了哈尔滨市社区年龄在,的市民300人,所得结果统计如下频数分布表所示:
年龄(单位:周岁)
,
,
,
,
,
频数
30
81
99
60
30
持喜爱态度
24
65
75
30
12
(1)求该样本中市民年龄的平均数;(同一组中的数据用该区间的中点值作代表)
(2)从这300名市民中随机抽取1人,在此人喜爱冰雪运动的前提下,求其年龄小于50周岁的概率:
(3)为鼓励市民积极参加这次调查,该研究小组决定给予参加调查的市民一定的奖励,奖励方案有两种:
方案一:按年龄进行分类奖励,当时,奖励10元:当时,奖励30元:当时,奖励40元;
方案二:利用抽奖的方式获得奖金,其中年龄低于样本中位数的可抽1次奖,年龄不低于样本中位数的可抽2次奖.每次抽中奖励30元,未抽中奖励10元,各次抽奖间相互独立,且每次抽奖中奖的概率均为,
将频率视为概率,利用样本估计总体的思想,若该研究小组希望最终发出更多的奖金,则从期望角度出发.该研究小组应采取哪种方案.
【分析】(1)根据频率分布表,利用平均数公式求解;
(2)设事件表示抽中的此人喜爱冰雪运动,事件表示抽中的此人年龄在50周岁以下,根据频数分布表,利用古典概型的概率求得(A),,再利用条件概率求解;
(3)对于方案一,设每名参与调查的市民可获得的奖金为元,则的所有可能取值为10,30,40,求得其对应的概率,再求期望;对于方案二,设每名参与调查市民可获得的奖金为元,则的所有可能值为10,20,30,40,60,求得其相应概率,再求期望,对比下结论.
【解答】解:(1)样本中市民年龄的平均数为.
(2)设事件表示抽中的此人喜爱冰雪运动,事件表示抽中的此人年龄在50周岁以下.
则由频数分布表可知,
所以在此人喜爱冰雪运动的前提下,其年龄小于50周岁的概率为.
(3)对于方案一,设每名参与调查的市民可获得的奖金为元,则的所有可能取值为10,30,40,
其对应的概率分别为,
故.
对于方案二,设每名参与调查的市民可获得的奖金为元,则的所有可能取值为10,20,30,40,60.
可得,
,
,
所以,
因为,所以从数学期望的角度分析,该研究小组应采取方案二.
【点评】本题主要考查离散型随机变量的期望,属于中档题.
5.(2024•闵行区三模)2021年国庆期间,某县书画协会在县宣传部门的领导下组织了庆国庆书画展,参展的200幅书画作品反映了该县人民在党的领导下进行国家建设中的艰苦卓绝,这些书画作品的作者的年龄都在,之间,根据统计结果,作出如图所示的频率分布直方图:
(1)求这200位作者年龄的平均数和方差(同一组数据用该区间的中点值作代表);
(2)县委宣传部从年龄在,和,的作者中,按照分层抽样的方法,抽出6人参加县委组织的表彰大会,现要从6人中选出3人作为代表发言,设这3位发言者的年龄落在区间,的人数是,求变量的分布列和数学期望.
【分析】(1)根据频率分布直方图,利用平均数和方差的公式代入计算即可;
(2)根据分层抽样的原理,可知这6人中年龄在,内有2人,在,内有4人,利用古典概型的概率公式代入计算,列出分布列求出数学期望即可.
【解答】解:(1)这200位作者年龄的样本平均数和样本方差分别为,
.
(2)根据分层抽样的原理,可知这6人中年龄在,内有2人,在,内有4人,
故可能的取值为0,1,2,
,,,
所以的分布列为:
0
1
2
所以的数学期望为.
【点评】本题主要考查频率分布直方图,离散型随机变量分布列及数学期望,考查运算求解能力,属于中档题.
考点五:正态分布
1.(2024•宝山区校级四模)已知随机变量,和,,如图为对应的正态密度函数图像,则下列结论正确的是
A., B.,
C., D.,
【分析】根据已知条件,结合正态分布的图象,即可求解.
【解答】解:由图可知,,
随机变量,对应的图象“瘦高“,,对应的图象“矮胖“,
故.
故选:.
【点评】本题主要考查正态分布的图象,是基础题.
2.(2024•宝山区二模)已知随机变量服从正态分布,若,则
A. B. C. D.
【分析】根据题意,利用正态分布曲线的对称性,结合,即可求解.
【解答】解:由随机变量服从正态分布,
因为,可得,
所以.
故选:.
【点评】本题考查正态分布曲线的特点及曲线所表示的意义,考查正态分布中两个量和的应用,考查曲线的对称性,属于基础题.
3.(2024•黄浦区校级三模)李明上学有时坐公交车,有时骑自行车,他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到,假设坐公交车用时和骑自行车用时都服从正态分布,,,,.和的分布密度曲线如图所示.则下列结果正确的是
A. B.
C. D.
【分析】根据正态分布曲线的定义及对称性逐一求解即可.
【解答】解:由,,得,错误;
由正态密度曲线图像可知,,,,错误;
由正态密度曲线图像可知,,所以,正确;
由正态密度曲线图像可知,,,所以,错误.
故选:.
【点评】本题考查正态分布曲线的特点及曲线所表示的意义,考查正态分布中两个量和的应用,考查曲线的对称性,属于基础题.
4.(2024•松江区校级模拟)王先生每天8点上班,他通常开私家车加步行或乘坐地铁加步行.私家车路程近一些,但路上经常拥堵,所需时间(单位:分钟)服从正态分布,,从停车场步行到单位要6分钟;王先生从家到地铁站需要步行5分钟,乘坐地铁畅通,但路线较长,所需时间(单位:分钟)服从正态分布,,下地铁后从地铁站步行到单位要5分钟,从统计角度出发,关于两种上班方式,下列说法正确的个数是 个.
①若出门,则王先生开私家车上班不会迟到
②若出门,则王先生开私家车上班不迟到的可能性更大
③若出门,则王先生乘坐地铁上班不迟到的可能性更大
④若出门,则王先生乘坐地铁几乎不可能上班不迟到
参考数据:若,则,,
A.1 B.2 C.3 D.4
【分析】对于①,由即可判断;对于②和③,分别计算开私家车及乘坐地铁不迟到的概率即可判断;对于④,计算即可判断,综合可得答案.
【解答】解:根据题意,依次判断4个说法:
对于①,由题意得,当满足时,江先生仍旧有可能迟到,只不过发生的概率较小,①错误;
对于②,若出门,分2种情况讨论:
若江先生开私家车,当满足时,江先生开私家车不会迟到;
若江先生乘坐地铁,当满足时,此时江先生乘坐地铁不会迟到,
此时两种方式,江先生不迟到的概率相当,所以②错误;
对于③,若出门,分2种情况讨论:
若江先生开私家车,当满足,此时江先生开私家车不会迟到;
若江先生乘坐地铁,由题意得,当满足时,此时江先生乘坐地铁不会迟到,
此时两种方式,显然江先生开私家车不迟到的可能性更大,所以③正确;
对于④,若出门,江先生乘坐地铁上班,
当满足时,江先生乘坐地铁不会迟到,此时不迟到的可能性极小,
故江先生乘坐地铁几乎不可能上班不迟到,所以④正确.
故选:.
【点评】本题考查正态分布,考查考生的数据处理能力,分析问题解决问题的能力以及运算求解能力,属于中档题.
5.(2024•闵行区三模)已知随机变量服从正态分布,若,则 0.94 .
【分析】根据正态分布的对称性即可求出指定区间的概率.
【解答】解:由正态分布的对称性得.
故答案为:0.94.
【点评】本题考查正态分布的应用,属于基础题.
6.(2024•嘉定区校级模拟)某区学生参加模拟大联考,假如联考的数学成绩服从正态分布,其总体密度函数为:,且,若参加此次联考的学生共有8000人,则数学成绩超过100分的人数大约为 1200 .
【分析】根据总体密度函数可知,结合对称性求解即可.
【解答】解:因为总体密度函数为:,则,
由得,
所以超过100分人数大约为:人.
故答案为:1200.
【点评】本题主要考查正态分布曲线的对称性,属于基础题.
考点六:统计图表
1.(2024•浦东新区校级模拟)从某中学甲、乙两班各随机抽取10名同学,测量他们的身高(单位:,所得数据用茎叶图表示如图,由此可估计甲、乙两班同学的身高情况,则下列结论正确的是
A.甲乙两班同学身高的极差相等
B.甲乙两班同学身高的平均值相等
C.甲乙两班同学身高的中位数相等
D.乙班同学身高在以上的人数较多
【分析】根据茎叶图和极差、平均数、中位数等概念逐一计算,即可判断选项是否正确.
【解答】解:由茎叶图可知,甲班同学身高的极差为,乙班同学身高的极差为,两班身高极差不相等,故错误;
甲班同学身高的平均值为,
乙班同学身高的平均值为,
显然,甲乙两班同学身高的平均值不相等,即错误;
根据茎叶图可知,甲班同学身高的中位数为,乙班同学身高的中位数为:,
所以甲乙两班同学身高的中位数不相等,即错误;
由茎叶图可知,甲班同学身高在以上的人数为3人,乙班同学身高在以上的人数为4人,故正确.
故选:.
【点评】本题主要考查了茎叶图的应用,考查了极差、平均数、中位数的计算,属于基础题.
2.(2024•闵行区校级三模)上海百联集团对旗下若干门店的营业额与三个影响因素分别作了相关性分析,绘制了如下的散点图,则下述大小关系正确的为
A. B. C. D.
【分析】根据相关系数的性质判断.
【解答】解:由散点图可以看出,图①是正相关,相关系数,
图②和图③是负相关,相关系数,相关系数,
图①和图②的点相对更加集中,所以线性相关程度要强,所以接近于1,接近于,
所以.
故选:.
【点评】本题主要考查了散点图的应用,考查了相关系数的性质,属于基础题.
3.(2024•浦东新区二模)通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点后,下列说法正确的是
A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关
B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变
C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大
D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小
【分析】根据相关系数的概念逐一判断.
【解答】解:对于:去掉图中右下方的点后,根据图象,两个变量还是负相关,故错误;
对于:去掉图中右下方的点后,相对来说数据会集中,相关程度会更高,但因为是负相关,相关系数会更接近,线性相关系数会变小,
故正确,错误.
故选:.
【点评】本题主要考查了散点图的应用,考查了相关系数的性质,属于基础题.
4.(2024•浦东新区校级四模)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则的值为 8 .
【分析】由已知有中这两组数据的中位数相等,且平均值也相等,可得,的值.
【解答】解:由已知中甲组数据:56,62,65,74,;的中位数为65,
故乙组数据:59,61,,67,78;的中位数也为65,即,
将,代入乙组可得乙组数据的平均数为:66,这两组数据的平均值也相等,故,
所以:;
故答案为:8
【点评】本题考查了茎叶图的应用问题,也考查了中位数与平均数的应用问题,是基础性题目.
5.(2024•宝山区三模)由于“新冠肺炎”对抵抗力差的人的感染率相对更高,特别是老年人群体,因此某社区在疫情控制后,及时给老年人免费体检,通过体检发现“高血糖,高血脂,高血压”,即“三高”老人较多.为此社区根据医生的建议为每位老人提供了一份详细的健康安排表,还特地建设了一个老年人活动中心,老年人每天可以到该活动中心去活动,以增强体质,通过统计每周到活动中心去运动的老年人的活动时间,得到了以下频率分布直方图.
(1)从到活动中心参加活动的老人中任意选取5人.
①若将频率视为概率,求至少有3人每周活动时间在,(单位:的概率;
②若抽取的5人中每周活动时间在,(单位:的人数为2人,从5人中选出3人进行健康情况调查,记3人中每周活动时间在,(单位:的人数为,求的分布列和期望;
(2)将某人的每周活动时间量与所有老人的每周平均活动时间量比较,当超出所有老人的每周平均活动量不少于时,则称该老人为“活动爱好者”,从参加活动的老人中随机抽取10人,且抽到人为“活动爱好者”的可能性最大,试求的值.(每组数据以区间的中点值为代表)
【分析】(1)①记“至少有3人每周活动时间在,(单位:”为事件,求出(A)的值即可;
②分别计算,,的值,求出的值即可;
(2)求出,若人的可能性最大,则,,1,2,3,,得到,得到关于的不等式,求出的范围即可判断.
【解答】解:(1)由图表的直方图可知,
事件“到活动中心参加活动的老人中任意选取1人,每周活动时间在,内”的概率为,
①记“至少有3人每周活动时间在,(单位:”为事件,
则(A);
②随机变量所以可能的取值为0,1,2,
则,,,
的分布列如下:
0
1
2
故;
(2)老人的周活动时间的平均值为:
,
则老人中“活动爱好者”的活动时间为,,
参加活动的老人中为“活动爱好者”的概率为,
若从参加活动的老人中随机抽取10人,且抽到人为“活动爱好者”,
则,
若人的可能性最大,则,,1,2,3,,
由,
即
且,
解得:,由于,故.
【点评】本题考查了随机变量的分布列和期望,考查概率求值以及不等式问题,是中档题.
考点七:用样本估计总体
1.(2024•崇明区二模)某单位共有、两部门,1月份进行服务满意度问卷调查,得到两部门服务满意度得分的频率分布条形图如下.设、两部门的服务满意度得分的第75百分位数分别为,,方差分别为,,则
A. B.
C. D.
【分析】根据百分位数和方差的定义求解.
【解答】解:对于部门,因为,
所以,
对于部门,因为,
所以,
所以,
由频率分布条形图可知,部门满意度更集中,
所以.
故选:.
【点评】本题主要考查了百分位数和方差的定义,属于基础题.
2.(2024•奉贤区三模)有一组样本数据,,,,其中是最小值,是最大值,则下列说法正确的是
A.,,,的中位数一定等于,,,的中位数
B.,,,的平均数一定等于,,,的平均数
C.,,,的标准差一定不小于,,,的标准差
D.,,,的30百分位数一定不等于,,,的30百分位数
【分析】根据中位数、百分位数、平均数及标准差的定义判断即可.
【解答】解:对于:因为,,,的中位数为从小到大排列的第1013个数,
设为又,,,的中位数从小到大排列的第1012个数恰为,
所以,,,的中位数一定等于,,,的中位数,故正确;
对于:因为 不一 定相等,
故,,,的平均数与,,,的 平均数不一定相等,故错误;
对于:因为,,,的极差不大于,,,的极差,
所以,,,的标准差不大于,,,的标准差,故错误;
对于:因为,,则,,,的30百分位数为从小到大排列的第608个数,
设为;,,,的30百分位数为从小到大排列的第607个数恰为,
故,,,的30百分位数一定等于,,,的30百分位数,故错误.
故选:.
【点评】本题考查了中位数、百分位数、平均数及标准差的定义相关知识,属于基础题.
3.(2024•闵行区校级模拟)某校高三年级10名男生的身高数据(单位:如下:168、171、173、176、176、180、183、184、186、191.该组数据的第80百分位数为 185 .
【分析】根据已知条件,结合百分位数的定义,即可求解.
【解答】解:将数据从小到大排序依次为:168、171、173、176、176、180、183、184、186、191,共10个,
,
故该组数据的第80百分位数为.
故答案为:185.
【点评】本题主要考查百分数的定义,属于基础题.
4.(2024•杨浦区校级三模)对于没有重复数据的样本、、、,记这个数的第百分位数为.若不在这组数据中,且在区间,中的数据有且只有5个,则的所有可能值组成的集合为 , .
【分析】根据是否为正整数分类讨论,若为正整数,则5个数分别为,,,若不为整数,则5个数分别为,,,根据,的范围分类计算.
【解答】解:设,
则不在这组数据,
为正整数,
,,
在区间,中的数据有且只有5个,
故这个5个数分别为,,,即,
当,6,7,
当时,,,,即为,,,,共5个,符合;
当时,,,,即为,,,,,,共6个,不符合;
当时,,,,,,,,共7个,不符合,
若为整数,可得,即有;
若不为整数,故,其中为正奇数,
设,其中为正整数,
则,且,故,
,,
在区间,中的数据有且只有5个,
这5个数分别为,,,,即,
但当,,此时,,至少有6个,
,6,7,
当时,,,即为,,,,,共5个,符合,此时;
当时,,,即为,,,,,,共6个,不符合;
当时,,,即为,,,,,,,共7个,不符合.
综上,符合条件的为50,55.
故答案为:,.
【点评】本题考查百分位数的定义和集合的表示,考查运算求解能力,是基础题.
考点八:一元线性回归模型
1.(2024•闵行区校级模拟)设一组成对数据的相关系数为,线性回归方程为,则下列说法正确的为
A.越大,则越大 B.越大,则越小
C.若大于零,则一定大于零 D.若大于零,则一定小于零
【分析】利用,说明两个变量之间呈正相关,故即可判断.
【解答】解:影响的是直线的斜率,影响的是两个变量之间的相关性,与之间没有关系,故,选项错误;若,则说明两个变量之间呈正相关,故,因此选项正确.
故选:.
【点评】本题考查的是两个变量之间的相关性,属于基础题.
2.(2024•浦东新区校级模拟)在研究线性回归模型时,样本数据,,2,3,,所对应的点均在直线上,用表示解释变量对于反应变量变化的线性相关度,则
A. B.1 C. D.2
【分析】利用相关系数的性质求解.
【解答】解:因为样本数据所对应的点都在直线上,
所以.
故选:.
【点评】本题主要考查了相关系数的性质,属于基础题.
3.(2024•黄浦区校级三模)对成对数据,、,、、,用最小二乘法求回归方程是为了使
A. B.
C.最小 D.最小
【分析】利用最小二乘法求回归方程的定义,判断选项的正误即可.
【解答】解:最小二乘法(又称最小平方法)是一种数学优化技术.它通过最小化误差的平方和寻找数据的最佳函数匹配.利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小.
故选:.
【点评】本题考查线性回归直线方程的性质,最小二乘法的定义的应用,是基础题.
4.(2024•嘉定区校级模拟)某产品的广告支出费用(单位:万元)与销售额(单位:万元)的数据如表:
2
4
5
6
8
30
40
50
70
已知关于的线性回归方程为,则表格中实数的值为 48 .
【分析】计算样本中心点,代入回归方程,求解即可.
【解答】解:根据表格可知,,,
关于的线性回归方程为,
即,解得.
故答案为:48.
【点评】本题考查线性回归方程的应用,属于基础题.
5.(2024•普陀区模拟)为了提高学生参加体育锻炼的积极性,某校本学期依据学生特点针对性的组建了五个特色运动社团,学校为了了解学生参与运动的情况,对每个特色运动社团的参与人数进行了统计,其中一个特色运动社团开学第1周至第5周参与运动的人数统计数据如表所示.
周次
1
2
3
4
5
参与运动的人数
35
36
40
39
45
若表中数据可用回归方程来预测,则本学期第11周参与该特色运动社团的人数约为 57 .(精确到整数)
【分析】由已知求出样本点的中心的坐标,代入线性回归方程,再取求解.
【解答】解:,,
把代入,得.
可得线性回归方程为.
把代入,可得.
故答案为:57.
【点评】本题考查线性回归方程及其应用,考查运算求解能力,是基础题.
6.(2024•浦东新区校级模拟)环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量(单位:辆)和空气中的的平均浓度(单位:.调研人员采集了50天的数据,制作了关于,,2,3,,的散点图,并用直线与将散点图分成如图所示的四个区域Ⅰ、Ⅱ、Ⅲ、Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的列联表,并判断至少有多大把握认为“平均浓度不小于与“汽车日流量不小于1500辆”有关;
汽车日流量
汽车日流量
合计
的平均浓度
的平均浓度
合计
(2)经计算得回归方程为,且这50天的汽车日流量的标准差,的平均浓度的标准差.
①求相关系数,并判断该回归方程是否有价值;
②若这50天的汽车日流量满足,试推算这50天的日均浓度的平均数.(精确到
参考公式:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
回归方程,其中.
相关系数.若,则认为与有较强的线性相关性.
【分析】(1)根据题意,完成列联表,再计算,结合表格即可求得结果.
(2)代入公式计算可判断与的相关性强弱,由可得,结合回归直线必过样本中心可求得的值.
【解答】解:(1)列联表如下:
汽车日流量
汽车日流量
合计
的平均浓度
16
8
24
的平均浓度
6
20
26
合计
22
28
50
零假设:“平均浓度不小于”与“汽车日流量不小于1500辆”无关,
因为,
所以至少有的把握(但还不能有的把握)认为“平均浓度不小于”与“汽车日流量不小于1500辆有关”.
(2)①因为回归方程为,
所以,
又因为,,
所以.
,与有较强的相关性,
该回归方程有价值.
②,解得
而样本中心点位于回归直线上,
因此可推算.
【点评】本题主要考查线性回归方程的应用,以及独立性检验公式,属于中档题.
考点九:列联表与独立性检验
1.(2024•浦东新区校级模拟)为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了50人,得到如下结果(单位:人)
不患肺癌
患肺癌
合计
不吸烟
24
6
30
吸烟
6
14
20
合计
30
20
50
附:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
根据表中数据,以下叙述正确的是
A.可以通过计算,结合统计决断,判断:有的把握认为吸烟与患肺癌有关
B.可以通过计算,结合统计决断,判断:不能否定吸烟与肺癌无关
C.可以通过计算,结合统计决断,判断:有的把握认为吸烟与患肺癌有关
D.可以通过计算,结合统计决断,判断:不能否定吸烟与肺癌无关
【分析】根据题意求出的值,再与临界值比较即可得出结论.
【解答】解:由题意可知,,
所以有的把握认为“吸烟与患肺癌有关有关”.
故选:.
【点评】本题主要考查了独立性检验的应用,属于基础题.
2.(2024•长宁区二模)收集数据,利用列联表,分析学习成绩好与上课注意力集中是否有关时,提出的零假设为:学习成绩好与上课注意力集中 无关 .(填有关或无关)
【分析】根据零假设的含义,即可得解.
【解答】解:零假设等价于两个变量相互独立,
所以此题中的零假设为:学习成绩好与上课注意力集中无关.
故答案为:无关.
【点评】本题考查独立性检验,理解零假设的含义是解题的关键,考查逻辑推理能力,属于基础题.
3.(2024•浦东新区校级模拟)一项研究同年龄段的男、女生的注意力差别的脑功能实验,实验数据如表:
注意力稳定
注意力不稳定
男生
29
7
女生
33
5
依据,该实验 支持 该年龄段的学生在注意力的稳定性上对于性别没有显著差异(填拒绝或支持),
参考公式:,.
【分析】根据卡方公式计算即可作出判断.
【解答】解:由表中数据:,
所以没有足够把握认为学生在注意力的稳定性上与性别有关,
即该实验支持该年龄段的学生在注意力的稳定性上对于性别没有显著差异.
故答案为:支持.
【点评】本题考查独立性检验相关知识,属于基础题.
4.(2024•杨浦区二模)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.完成生产任务的工作时间不超过70分钟的工人为“优秀”,否则为“合格”.根据工人完成生产任务的工作时间(单位:分钟)绘制了如下茎叶图:
(1)求40名工人完成生产任务所需时间的第75百分数;
(2)独立地从两种生产方式中各选出一个人,求选出的两个人均为优秀的概率;
(3)根据工人完成生产任务的工作时间,两种生产方式优秀与合格的人数填入下面的列联表:
第一种生产方式
第二种生产方式
总计
优秀
合格
总计
根据上面的列联表,判断能否有的把握认为两种生产方式的工作效率有显著差异?.其中,.
【分析】(1)利用百分位数的定义求解;
(2)分别求出第一种生产方式中优秀的概率和第二种生产方式中优秀的概率,再利用独立事件的概率乘法公式求解;
(3)根据茎叶图中数据补全列联表,计算的值,再与临界值比较即可.
【解答】解:(1)40名工人完成生产任务所需时间按从小到大排列为:61,61,62,63,63,65,65,67,68,69,70,70,71,72,72,72,72,74,75,77,78,81,82,82,83,84,84,84,87,87,90,90,91,91,91,92,92,93,94,94,
因为,
所以第75百分数为;
(2)由题意可知,第一种生产方式中优秀的概率为,第二种生产方式中优秀的概率为,
所以选出的两个人均为优秀的概率为;
(3)根据茎叶图,补全列联表如下:
第一种生产方式
第二种生产方式
总计
优秀
2
10
12
合格
18
10
28
总计
20
20
40
所以,
所以有的把握认为两种生产方式的工作效率有显著差异.
【点评】本题主要考查了茎叶图的应用,考查了百分位的定义,以及独立性检验的应用,属于基础题.
一.选择题(共4小题)
1.(2024•浦东新区校级四模)某市组织一次高三调研考试,考试后统计的数学成绩服从正态分布,其密度函数为,则下列命题不正确的是
A.该市这次考试的数学平均成绩为80分
B.分数在120分以上的人数与分数在60分以下的人数相同
C.分数在110分以上的人数与分数在50分以下的人数相同
D.该市这次考试的数学标准差为10
【分析】根据密度函数的特点可得:平均成绩及标准差,再结合正态曲线的对称性可得分数在110分以上的人数与分数在50分以下的人数相同.从而即可选出答案.
【解答】解:其密度函数为,
该市这次考试的数学平均成绩为80分,
该市这次考试的数学标准差为10,
从图形上看,它关于直线对称,
且50与110也关于直线对称,
故分数在110分以上的人数与分数在50分以下的人数相同.
故选:.
【点评】本题主要考查了正态分布曲线的特点及曲线所表示的意义,以及利用几何图形的对称性求解,属于基础题.
2.(2024•闵行区三模)某社区通过公益讲座宣传交通法规.为了解讲座效果,随机抽取10位居民,分别在讲座前、后各回答一份交通法规知识问卷,满分为100分.他们得分的茎叶图如图所示 “叶”是个位数字),则下列选项叙述错误的是
A.讲座后的答卷得分整体上高于讲座前的得分
B.讲座前的答卷得分分布较讲座后分散
C.讲座后答卷得分的第80百分位数为95
D.讲座前答卷得分的极差大于讲座后得分的极差
【分析】根据茎叶图知讲座前的答卷分数集中在,讲座后的答卷得分集中在,由此判断选项中的命题是否正确.
【解答】解:根据茎叶图知,讲座前的答卷分数集中在,讲座后的答卷得分集中在,
所以讲座后的答卷得分整体上高于讲座前的得分,选项正确;
讲座前的答卷得分分布较讲座后的得分分散,所以选项正确;
讲座后答卷得分的第80百分位数是,选项错误;
讲座前答卷得分的极差是,讲座后得分的极差是,所以选项正确.
故选:.
【点评】本题考查了茎叶图中的数据分析应用问题,是基础题.
3.(2024•普陀区校级三模)以下数据为某学校参加数学竞赛10人的成绩:(单位:分)72,86,80,88,83,78,81,90,91,92,则这10个成绩的第75百分位数是
A.90 B.89 C.88 D.88.5
【分析】根据题意,由百分位数的计算公式,代入计算,即可得到结果.
【解答】解:从小到大排序这10个数据为72,78,80,81,83,86,88,90,91,92,
因为,所以这10个成绩的第75百分位数是第8个数90.
故选:.
【点评】本题主要考查百分位数的定义,属于基础题.
4.(2024•长宁区二模)某运动员8次射击比赛的成绩为:9.6、9.7、9.5、9.9、9.4、9.8、9.3、10.0.已知这组数据的第百分位为,若从这组数据中任取一个数,这个数比大的概率为0.25,则的取值不可能是
A.65 B.70 C.75 D.80
【分析】结合百分数的定义,即可求解.
【解答】解:8次射击比赛成绩从小到大排序:9.3,9.4,9.5,9.6,9.7,9.8,9.9,10,
若取65,
则,此时第65百分数为9.8,满足从这组数据中任取一个数,这个数比大的概率为0.25,故错误;
若取70,
则,此时第70百分数为9.8,满足从这组数据中任取一个数,这个数比大的概率为0.25,故错误;
若取75,
则,此时第75百分数为9.85,满足从这组数据中任取一个数,这个数比大的概率为0.25,故错误;
若取80,
则,此时第80百分数为9.9,不满足从这组数据中任取一个数,这个数比大的概率为0.25,故正确.
故选:.
【点评】本题主要考查百分数的定义,属于基础题.
二.填空题(共13小题)
5.(2024•宝山区三模)盲盒是指消费者不能提前得知具体产品款式的商品盒子.已知某盲盒产品共有3种玩偶,小明购买4个盲盒,则他能集齐3种玩偶的概率是 .
【分析】根据给定条件,求出买4个盲盒的基本事件数,再求出集齐3种玩偶的基本事件数即可计算作答.
【解答】解:小明购买4个盲盒的试验有个基本事件,它们等可能,
能集齐3种玩偶的事件含有的基本事件数为:,
所以能集齐3种玩偶的概率是.
故答案为:.
【点评】本题主要考查古典概型概率公式,考查运算求解能力,属于基础题.
6.(2024•浦东新区三模)一袋中装有大小与质地相同的2个白球和3个黑球,从中不放回地摸出2个球,记2球中白球的个数为,则 .
【分析】根据已知条件,所有可能取值为0,1,2,依次求出对应的概率,再结合期望与方差公式,即可求解.
【解答】解:由题意可知,所有可能取值为0,1,2,
,
,
,
故,
.
故答案为:.
【点评】本题主要考查期望与方差公式,属于基础题.
7.(2024•浦东新区校级模拟)随机变量的概率分布密度函数,其图象如图所示,设,则图中阴影部分的面积为 0.35 .
【分析】根据已知条件,结合概率分布密度函数,结合正态分布曲线的对称性,即可求解.
【解答】解:随机变量的概率分布密度函数,
则,
故,
故图中阴影部分的面积为0.35.
故答案为:0.35.
【点评】本题主要考查正态分布曲线的对称性,属于基础题.
8.(2024•杨浦区校级三模)设随机变量服从成功概率为的二项分布,若,,则 .
【分析】根据二项分布的数学期望和方差的公式,直接计算.
【解答】解:因为服从成功概率为的二项分布,且,,
所以,
解得:.
故答案为:.
【点评】本题考查了二项分布的期望和方差的应用,属于基础题.
9.(2024•杨浦区校级三模)某次数学练习中,学生成绩服从正态分布.若,则从参加这次考试的学生中任意选取3名学生,至少有2名学生的成绩高于125的概率是 .
【分析】根据已知条件,结合正态分布的对称性,求出,再结合二项分布的概率公式,即可求解.
【解答】解:学生成绩服从正态分布.,
则,
故,
从参加这次考试的学生中任意选取3名学生,
设选中的学生的成绩高于125的人数为,
由题意可知,,
故至少有2名学生的成绩高于125的概率是:.
故答案为:.
【点评】本题主要考查正态分布的对称性,以及二项分布的概率公式,属于基础题.
10.(2024•黄浦区校级三模)已知一个随机变量的分布列为,若是,的等差中项,则 .
【分析】根据题意,分析可得,结合等差数列的性质可得,变形可得答案.
【解答】解:根据题意,随机变量的分布列为,
则有,
又由是,的等差中项,则,则.
故答案为:.
【点评】本题考查随机变量的分布列,涉及分布列的性质,属于基础题.
11.(2024•青浦区二模)设随机变量服从正态分布,若,则实数 .
【分析】根据正态分布的对称性即可得出答案.
【解答】解:随机变量服从正态分布,且,
由正态分布的对称性可知,,
解得.
故答案为:.
【点评】本题考查了正态分布的性质,属于基础题.
12.(2024•崇明区二模)某学习小组共有10名学生,其中至少有2名学生在同一月份的出生的概率是 0.996 .(默认每月天数相同,结果精确到
【分析】根据古典概型及对立事件概率公式计算即可.
【解答】解:由于每名学生的出生月份可能是1月到12月中的任何一个,因此10名学生的出生月份共有种可能的排列,
每个排列对应一个基本事件,从而基本事件就有个,且每个基本事件发生的概率都相等.
设表示事件“10名学生中没有任何2名学生在同一月份出生”,那么10名学生的出生月份共有种可能的排列,
即事件包含 个基本事件,所以事件的概率是(A).
这样,“至少有2名学生在同一月份出生”的概率是(A).
故答案为:0.996.
【点评】本题考查古典概率模型,属于基础题.
13.(2024•浦东新区校级模拟)设随机变量,且,,则 .
【分析】根据已知条件,结合二项分布的期望与方差公式,即可求解.
【解答】解:随机变量,且,,
,解得.
故答案为:.
【点评】本题主要考查二项分布的期望与方差公式,属于基础题.
14.(2024•浦东新区校级模拟)设随机变量服从正态分布,若,则实数 2 .
【分析】根据给定条件,利用正态分布的对称性列式计算即得.
【解答】解:由正态分布的对称性,得,所以.
故答案为:2.
【点评】本题考查正态分布的性质,属于基础题.
15.(2024•奉贤区三模)为了研究某班学生的脚步(单位厘米)和身高之间有线性相关关系,设其回归直线方程为.该班某学生的脚长为24,据此估计其身高为 166厘米 .
【分析】直接把代入线性回归方程求解.
【解答】解:在回归直线方程为中,
取,解得(厘米).
故答案为:166厘米.
【点评】本题考查线性回归方程及其应用,是基础题.
16.(2024•黄浦区校级三模)已知两个具有线性相关关系的变量,的一组数据,,,,根据上述数据可得关于的回归直线方程,则实数 20 .
【分析】由回归直线经过点即可计算.
【解答】解:由题中数据可知,
因为回归直线一定经过点,
所以.
故答案为:20.
【点评】本题主要考查线性回归方程的性质,属于基础题.
17.(2024•浦东新区校级模拟)某射击运动员在一次训练中10次射击成绩(单位:环)如下:5,5,6,6,7,7,8,9,9,9,这组数据的第60百分位数为 7.5 .
【分析】根据已知条件,结合百分位数的定义,即可求解.
【解答】解:射击成绩如下:5,5,6,6,7,7,8,9,9,9,共10个,
,
故这组数据的第60百分位数为.
故答案为:7.5.
【点评】本题主要考查百分位数的定义,属于基础题.
三.解答题(共1小题)
18.(2024•长宁区校级三模)火车晚点是人们在旅行过程中最常见的问题之一,针对这个问题,许多人都会打电话进行投诉.某市火车站为了解每年火车的正点率对每年顾客投诉次数(单位:次)的影响,对近8年年年)每年火车正点率和每年顾客投诉次数的数据作了初步处理,得到下面的一些统计量的值.
600
592
43837.2
93.8
(1)求关于的经验回归方程;若预计2024年火车的正点率为,试估算2024年顾客对火车站投诉的次数;
(2)根据顾客对火车站投诉的次数等标准,该火车站这8年中有6年被评为“优秀”,2年为“良好”,若从这8年中随机抽取3年,记其中评价“良好”的年数为,求的分布列和数学期望.
附:经验回归直线的斜率和截距的最小二乘法估计公式分别为:
,
【分析】(1)应用最小二乘法求回归直线,再代入估算2024年顾客对火车站投诉的次数;
(2)根据题意写出的可能取值,应用超几何概率公式求对应概率,即得分布列,进而求期望.
【解答】解:(1)由题设,,则,
所以,所以;
当时,代入,得到,
所以2024年顾客对该市火车站投诉的次数约为20次.
(2)由题意,服从超几何分布,可取0,1,2,
,,,
0
1
2
所以.
【点评】本题主要考查线性回归方程的求解,以及超几何分布的知识,属于基础题.
一.选择题(共2小题)
1.(2024•浦东新区校级模拟)全概率公式在敏感性问题调查中有着重要应用.例如某学校调查学生对食堂满意度的真实情况,为防止学生有所顾忌而不如实作答,可以设计如下调查流程:每位学生先从一个装有3个红球,6个白球的盒子中任取3个球,取到至少一个红球的学生回答问题一“你出生的月份是否为3的倍数?”,未取到任何红球的学生回答问题二“你对食堂是否满意?”.由于两个问题的答案均只有“是”和“否”,而且回答的是哪个问题他人并不知道(取球结果不被看到即可),因此理想情况下学生应当能给出符合实际情况的答案.已知某学校800名学生参加了该调查,且有250人回答的结果为“是”,由此估计学生对食堂的实际满意度大约为
A. B. C. D.
【分析】利用全概率公式可求答案.
【解答】解:设学生对食堂的实际满意度为,事件 “回答问题一”,事件 “回答的结果为是”,
由题意可知,则,
又因为,
由全概率公式可得,
即,
解得.
故选:.
【点评】本题主要考查了全概率公式,属于基础题.
2.(2024•青浦区校级模拟)回归直线方程的系数,的最小二乘法估计中,使函数最小,函数指
A. B.
C. D.
【分析】是指所求的回归直线方程在,各点的值与真实值,的误差的平方和,可得结论.
【解答】解:是指所求的回归直线方程在,各点的值与真实值,的误差的平方和,
即,,
故选:.
【点评】本题考查回归直线方程,考查基本概念,比较基础.
二.填空题(共8小题)
3.(2024•浦东新区校级模拟)从2,3,4,5,6,7,8中任取两个不同的数,事件为“取到的两个数的和为偶数”,事件为“取到的两个数均为偶数”,则 .
【分析】利用条件概率的计算公式可求.
【解答】解:表示“取到的两个数为偶数且和为偶数”, ,
而,故.
故答案为:.
【点评】本题考查了条件概率的计算,属于基础题.
4.(2024•松江区校级模拟)设随机变量服从二项分布,则 2 .
【分析】直接利用二项分布的方差公式求解.
【解答】解:,
.
故答案为:2.
【点评】本题主要考查了二项分布的方差公式,属于基础题.
5.(2024•天心区校级模拟)记一组样本数据10,18,8,4,16,24,6,8,32的中位数为,平均数为,则 .
【分析】利用中位数和平均数的定义求解.
【解答】解:数据从小到大排列为:4,6,8,8,10,16,18,24,32,
所以中位数,平均数,
所以.
故答案为:.
【点评】本题主要考查了中位数和平均数的定义,属于基础题.
6.(2024•松江区校级模拟)已知1、2、、中位数为4,平均数为5,则 66 .
【分析】根据平均数和中位数的定义求解.
【解答】解:当时,则,
解得,
此时;
当时,,
解得,
此时,
综上所述,.
故答案为:66.
【点评】本题主要考查了平均数和中位数的定义,属于基础题.
7.(2024•黄浦区校级三模)现有一组数1,1,2,2,3,5,6,7,9,9,则该组数的第25百分位数为 2 .
【分析】根据已知数据集,应用百分数的求法求第25百分位数即可.
【解答】解:由题设,数据集(从小到大排列)中共有10个数据,则,
所以该组数的第25百分位数为第三个数2.
故答案为:2.
【点评】本题考查百分位数,属于基础题.
8.(2024•浦东新区校级模拟)甲乙两人射击,每人射击一次.已知甲命中的概率是0.8,乙命中的概率是0.7,两人每次射击是否命中互不影响.已知甲、乙两人至少命中一次,则甲命中的概率为 .
【分析】根据条件概率公式计算即可.
【解答】解:设事件为“两人至少命中一次”,事件为“甲命中”,
,,
所以.
故答案为:.
【点评】本题考查条件概率,属于中档题.
9.(2024•宝山区三模)在某项测量中,其测量结果服从正态分布,,且,则 .
【分析】利用正态分布的对称性求概率即可.
【解答】解:由题设,,而,
又,故,
所以.
故答案为:.
【点评】本题考查正态分布曲线的性质,属于中档题.
10.(2024•普陀区校级三模)甲、乙等4人参加,,这三项活动,要求每人只参加一项活动,且每项活动至少有1人参加,则甲不单独参加活动,且乙不参加活动的概率是 .
【分析】先求出4人参加三项活动,要求每人只参加一项活动,且每项活动至少有1人参加的方法总数,再求出甲不单独参加活动,且乙不参加活动的方法总数,然后由古典概型求出结果.
【解答】解:4人参加三项活动,要求每人只参加一项活动,且每项活动至少有1人参加,
由分步计数原理,将4人分成3组,再全排列,共有种排法,
甲不单独参加活动,且乙不参加活动,
乙从,两项活动中选一项参加有种,
除甲、乙外两人在乙参加外的两项活动中全排列,有种,
然后甲从,,这三项活动中任选一项参加有种,
由分步计数原理,共有种方法,
由古典概型得甲、乙等4人参加,,这三项活动,
要求每人只参加一项活动,且每项活动至少有1人参加,
则甲不单独参加活动,且乙不参加活动的概率是.
故答案为:.
【点评】本题考查古典概型、排列组合等基础知识,考查运算求解能力,是基础题.
三.解答题(共5小题)
11.(2024•浦东新区校级模拟)新宁崀山景区是世界自然遗产、国家级景区,其中“八角寨”景区和“天下第一巷”景区是新宁崀山景区的两张名片.为了合理配置旅游资源,现对已游览“八角寨”景区且尚未游览“天下第一巷”景区的游客进行随机调查,若不游览“天下第一巷”景区记2分,若继续游览“天下第一巷”景区记4分,假设每位游客选择游览“天下第一巷”景区的概率均为,游客之间选择意愿相互独立.
(1)从游客中随机抽取2人,记总得分为随机变量,求的数学期望;
(2)(ⅰ)记表示“从游客中随机抽取人,总分恰为分”的概率,求的前4项和;
(ⅱ)在对游客进行随机问卷调查中,记表示“已调查过的累计得分恰为分”的概率,探求与的关系,并求数列的通项公式.
【分析】(1)先得到的所有取值,求出相对应的概率,代入期望公式中即可求解;
(2)根据题意可得“总分恰为分”的概率为,再根据等比数列前项和公式求解即可;
因为“已调查过的累计得分恰为分”的概率为,得不到分的情况只有先得分,再得4分,概率为,则,再利用构造法求解即可.
【解答】解:(1)易知的所有取值为4,6,8,
因为每位游客选择游览“天下第一巷”景区的概率均为,游客之间选择意愿相互独立,
此时,,,
所以;
(2)易知“总分恰为分”的概率为,
所以数列是以首项为,公比为的等比数列,
记该数列的前项和为,
则;
若“已调查过的累计得分恰为分”的概率为,
此时得不到分的情况只有先得分,再得4分,概率为,
所以,
即,
此时,
则数列是以为首项,为公比的等比数列,
所以,
故.
【点评】本题考查离散型随机变量分布列的数学期望以及等比数列的性质,考查了逻辑推理和运算能力.
12.(2024•嘉定区校级模拟)为培养学生的阅读习惯,某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.活动后,为了解阅读情况,学校统计了甲、乙两组各10名学生的阅读量(单位:本),统计结果用茎叶图记录如下,乙组记录中有一个数据模糊,无法确认,在图中以表示.
(1)若甲组阅读量的平均值大于乙组阅读量的平均值,求图中的所有可能取值;
(2)将甲、乙两组中阅读量超过15本的学生称为“阅读达人”.设,从20名学生中随机抽取一人,已知该生为阅读达人,求该生为甲组学生的概率.
(3)记甲组阅读量的方差为.在甲组中增加一名学生得到新的甲组,若的阅读量为10,则记新甲组阅读量的方差为;若的阅读量为20,则记新甲组阅读量的方差为,试比较,,的大小.(结论不要求证明)
【分析】(1)根据平均数公式列不等式解得,即可求解;
(2)利用缩小样本空间法求解条件概率即可;
(3)根据方差表示数据稳定性,即可作出大小判断.
【解答】解:(1)甲组10名学生阅读量的平均值为,
乙组10名学生阅读量的平均值为,
由题意,得,又,所以.故图中的取值为1或2.
(2)记事件“从20名学生中随机抽取一人,已知该生为阅读达人,该生为甲组学生”为.
由图可知,甲组“阅读达人”有2人,在此分别记为,,乙组“阅读达人”有3人,在此分别记为,,,
从所有的“阅读达人”里任取1人,所有可能结果有5种,即,,,,,
事件的结果有2种,它们是,,
所以,即该生为甲组学生的概率;
(3)通过茎叶图观察,当增加一名阅读量为10学生后,甲的茎叶图峰变瘦变尖,说明数据更集中,即更稳定,
所以,
当增加一名阅读量为20学生后,甲的茎叶图峰变胖变矮,说明数据更分散,所以,
所以.
【点评】本题考查了概率与统计的定义等基础知识,考查运算求解能力,属于中档题.
13.(2024•宝山区校级四模)某航天公司研发了一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:
飞行距离
56
63
71
79
90
102
110
117
损坏零件数(个
61
73
90
105
119
136
149
163
(1)建立关于的回归模型,根据所给数据及回归模型,求回归方程及相关系数.精确到0.1,精确到1,精确到
(2)该公司进行了第二次测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,对其中60台进行飞行前保养,测试结束后,有20台报废,其中保养过的推进器占比,请根据统计数据完成列联表,并根据小概率值的独立性检验,能否认为推进器是否报废与保养有关?
保养
未保养
合计
报废
20
未报废
合计
60
100
附:,
0.050
0.010
0.001
3.841
6.635
10.828
【分析】(1)利用最小二乘法求出,,即可得出回归方程,再根据公式求出相关系数即可;
(2)根据题意可将列联表补充完整,根公式求得,再对照临界值表即可得出结论.
【解答】解:(1)由题意可得,
,
又由,,
所以,
,
所以变量关于的线性回归方程为;
,,
;
(2)设零假设为:是否报废与是否保养无关,
由题意,报废推进器中保养过的共台,未保养的推进器共台,
补充列联表如下:
保养
未保养
合计
报废
6
14
20
未报废
54
26
80
合计
60
40
100
则,
根据小概率值的独立性检验,我们推断不成立,
即认为是否报废与保养有关,此推断的错误概率不大于0.01.
【点评】本题主要考查线性回归方程,独立性检验,考查运算求解能力,属于中档题.
14.(2024•浦东新区校级三模)某学校为了解本学期学生参加公益劳动的情况,从学校内随机抽取了500名高中学生进行在线调查,收集了他们参加公益劳动时间(单位:小时)分配情况等数据,并将样本数据分成,,,,,,,,,,,,,,,,,九组,绘制成如图所示的频率分布直方图.
(1)现认为大于10小时的公益劳动时间为长,小于10小时的公益劳动时间为短,填写下列列联表,并判断是否有把握认为公益劳动时间与学生性别有关.
性别
公益劳动时间
合计
长
短
男
110
女
120
合计
(2)为进一步了解这500名学生参加公益劳动时间的分配情况,从参加公益劳动时间在,,,,,三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人.记参加公益劳动时间在,内的学生人数为,求的分布列和期望;
(3)以调查结果的频率估计概率,从该学校所有高中学生中随机抽取20名学生,用“”表示这20名学生中恰有名学生参加公益劳动时间在,(单位:小时)内的概率,其中,1,2,,20.当最大时,写出的值.
0.100
0.050
0.025
0.010
2.706
3.841
5.024
6.635
【分析】(1)先由频率分布直方图求出值,然后可完成列联表,再利用独立性检验的相关知识即可求解;
(2)利用统计知识可得抽取的10人中有4人参加公益劳动时间在,内,则的可能取值为0,1,2,3,然后利用超几何分布的知识求出对应的概率即可得解;
(3)由题可得,要使最大,则应满足,然后解此不等式组即可得解.
【解答】解:(1)由频率分布直方图得:,
解得,
所以公益劳动时间长的人数为人,则时间短的人数为300人,
故列联表如下:
性别
公益劳动时间
合计
长
短
男
110
180
290
女
90
120
210
合计
200
300
500
零假设:认为公益劳动时间与学生性别无关,
由列联表可得,
根据小概率值的独立性检验,无法否定原假设,
所以没有的把握认为公益劳动时间与学生性别有关;
(2)由频率分布直方图得:这500名学生中参加公益劳动时间在,,,,,三组内的学生人数分别为:人,人,人,
若采用分层抽样的方法抽取了10人,
则从参加公益劳动时间在,内的学生中抽取:,
现从这10人中随机抽取3人,则的可能取值为0,1,2,3,
所以,,
,,
所以的分布列为:
0
1
2
3
则;
(3)由(1)可知参加公益劳动时间在,的概率,
所以,
要使最大,则应满足,
即,
即,解得,
因为为非负整数,所以,
即当最大时,.
【点评】本题考查了独立性检验及离散型随机变量的分布列和期望,属于难题.
15.(2024•普陀区校级三模)某学校有甲、乙、丙三家餐厅,分布在生活区的南北两个区域,其中甲、乙餐厅在南区,丙餐厅在北区各餐厅菜品丰富多样,可以满足学生的不同口味和需求.
性别
就餐区域
合计
南区
北区
男
33
10
43
女
38
7
45
合计
71
17
88
(1)现在对学生性别与在南北两个区域就餐的相关性进行分析,得到下表所示的抽样数据,依据的独立性检验,能否认为在不同区域就餐与学生性别有关联?
(2)张同学选择餐厅就餐时,如果前一天在甲餐厅,那么后一天去甲,乙餐厅的概率均为;如果前一天在乙餐厅,那么后一天去甲,丙餐厅的概率分别为,;如果前一天在丙餐厅,那么后一天去甲,乙餐厅的概率均为.张同学第1天就餐时选择甲,乙,丙餐厅的概率分别为,,.
0.100
0.050
0.025
0.010
2.706
3.841
5.024
6.635
(ⅰ)求第2天他去乙餐厅用餐的概率;
(ⅱ)求第天他去甲餐厅用餐的概率.
附:,.
【分析】(1)根据卡方计算公式计算,与临界值比较即可求解;
(2)根据相互独立事件的概率,结合全概率公式即可求解;
根据递推关系,结合等比数列的定义即可求解.
【解答】解:(1)零假设为:在不同区域就餐与学生性别没有关联,
依据表中数据,,
依据的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即认为在不同区域就餐与学生性别没有关联;
(2)设 “第天去甲餐厅用餐”, “第天去乙餐厅用餐”, “第天去丙餐厅用餐”,
则、、两两独立,,2,,,
根据题意得,
;
由,结合全概率公式,
得,
因此,张同学第2天去乙餐厅用餐的概率为.
记第天他去甲,乙,丙餐厅用餐的概率分别为,,,则,
由全概率公式,得
,
故①,
同理②,
③,
④,
由①②,,
由④,,
代入②,得:,即,
故是首项为,公比为的等比数列,
即,所以,
于是,当时,
,
综上所述:.
【点评】本题考查了独立性检验、全概率公式和等比数列的应用,属于难题.
一.选择题(共4小题)
1.(2023•上海)根据所示的散点图,下列说法正确的是
A.身高越大,体重越大 B.身高越大,体重越小
C.身高和体重成正相关 D.身高和体重成负相关
【分析】根据散点图的分布情况,即可得解.
【解答】解:根据散点图的分布可得:身高和体重成正相关.
故选:.
【点评】本题考查线性相关的概念,属基础题.
2.(2024•上海)有四种礼盒,前三种里面分别仅装有中国结、记事本、笔袋,第四个礼盒里面三种礼品都有,现从中任选一个盒子,设事件:所选盒中有中国结,事件:所选盒中有记事本,事件:所选盒中有笔袋,则
A.事件与事件互斥 B.事件与事件相互独立
C.事件与事件互斥 D.事件与事件相互独立
【分析】根据互斥事件和对立事件的定义,逐一判断选项即可.
【解答】解:选项,事件和事件可以同时发生,即第四个礼盒中可以既有中国结,又有记事本,事件与事件不互斥,错误;
选项,(A),(B),,(A)(B),正确;
选项,事件与事件可以同时发生,即第四个礼盒中可以既有中国结,又有记事本或笔袋,错误;
选项,(A),,,(A),与不独立,故错误.
故选:.
【点评】本题考查相互独立事件的概率公式,考查互斥事件的定义,属于基础题.
3.(2024•上海)已知气候温度和海水表层温度相关,且相关系数为正数,对此描述正确的是
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度呈下降趋势
【分析】利用变量的性关系,判断选项即可.
【解答】解:成对数据相关分析中,如果相关系数为正,当的值由小变大,的值具有由小变大的变化趋势,
所以、、选项错误.
故选:.
【点评】本题考查数据相关分析,是基础题.
4.(2023•上海)如图为年上海市货物进出口总额的条形统计图,则下列对于进出口贸易额描述错误的是
A.从2018年开始,2021年的进出口总额增长率最大
B.从2018年开始,进出口总额逐年增大
C.从2018年开始,进口总额逐年增大
D.从2018年开始,2020年的进出口总额增长率最小
【分析】结合统计图中条形图的高度、增量的变化,以及增长率的计算方法,逐项判断即可.
【解答】解:显然2021年相对于2020年进出口额增量增加特别明显,故最后一年的增长率最大,对;
统计图中的每一年条形图的高度逐年增加,故对;
2020年相对于2019的进口总额是减少的,故错;
显然进出口总额2021年的增长率最大,而2020年相对于2019年的增量比2019年相对于2018年的增量小,
且计算增长率时前者的分母还大,故2020年的增长率一定最小,正确.
故选:.
【点评】本题考查统计图的识图问题,以及增长率的计算,属于中档题.
二.填空题(共8小题)
5.(2021•上海)已知花博会有四个不同的场馆,,,,甲、乙两人每人选2个去参观,则他们的选择中,恰有一个馆相同的概率为 .
【分析】根据古典概型的概率公式进行计算即可.
【解答】解:甲选2个去参观,有种,乙选2个去参观,有种,共有种,
若甲乙恰有一个馆相同,则选确定相同的馆有种,
然后从剩余3个馆中选2个进行排列,有种,共有种,
则对应概率,
故答案为:.
【点评】本题主要考查概率的计算,利用古典概型的概率公式是解决本题的关键,是基础题.
6.(2020•上海)已知有四个数1,2,,,这四个数的中位数是3,平均数是4,则 36 .
【分析】分别由题意结合中位数,平均数计算方法得,,解得,,再算出答案即可.
【解答】解:因为四个数的平均数为4,所以,
因为中位数是3,所以,解得,代入上式得,
所以,
故答案为:36.
【点评】本题考查样本的数字特征,中位数,平均数,属于基础题.
7.(2024•上海)某校举办科学竞技比赛,有、、种题库,题库有5000道题,题库有4000道题,题库有3000道题.小申已完成所有题,他题库的正确率是0.92,题库的正确率是0.86,题库的正确率是0.72.现他从所有的题中随机选一题,正确率是 .
【分析】根据已知条件,结合全概率公式,即可求解.
【解答】解:由题可知,题库占比为,题库占比为,题库占比为,
故.
故答案为:.
【点评】本题主要考查全概率公式的应用,属于基础题.
8.(2023•上海)已知事件的对立事件为,若(A),则 0.5 .
【分析】利用对立事件概率计算公式直接求解.
【解答】解:事件的对立事件为,
若(A),则.
故答案为:0.5.
【点评】本题考查概率的求法,考查对立事件概率计算公式等基础知识,考查运算求解能力,是基础题.
9.(2022•上海)为了检测学生的身体素质指标,从游泳类1项,球类3项,田径类4项共8项项目中随机抽取4项进行检测,则每一类都被抽到的概率为 .
【分析】由题意,利用古典概率的计算公式,计算求得结果.
【解答】解:从游泳类1项,球类3项,田径类4项共8项项目中随机抽取4项进行检测,
则每一类都被抽到的方法共有种,
而所有的抽取方法共有种,
故每一类都被抽到的概率为,
故答案为:.
【点评】本题主要考查古典概率及其计算公式的应用,属于基础题.
10.(2023•上海)某校抽取100名学生测身高,其中身高最大值为,最小值为,根据身高数据绘制频率组距分布直方图,组距为5,且第一组下限为153.5,则组数为 7 .
【分析】计算极差,根据组距求解组数即可.
【解答】解:极差为,组距为5,且第一组下限为153.5,
,故组数为7组,
故答案为:7.
【点评】本题考查频率分布直方图,属于基础题.
11.(2023•上海)现有某地一年四个季度的(亿元),第一季度为232(亿元),第四季度为241(亿元),四个季度的逐季度增长,且中位数与平均数相同,则该地一年的为 946(亿元) .
【分析】设第二季度为亿元,第三季度为亿元,则,由题意可得,可求出的值,从而求出该地一年的.
【解答】解:设第二季度为亿元,第三季度为亿元,则,
中位数与平均数相同,
,
,
该地一年的为(亿元).
故答案为:946(亿元).
【点评】本题主要考查了中位数和平均数的定义,属于基础题.
12.(2023•上海)为了学习宣传党的二十大精神,某校学生理论宣讲团赴社区宣讲,已知有4名男生,6名女生,从10人中任选3人,则恰有1名男生2名女生的概率为 0.5 .
【分析】根据古典概型求解即可.
【解答】解:从10人中任选3人的事件个数为,
恰有1名男生2名女生的事件个数为,
则恰有1名男生2名女生的概率为.
故答案为:0.5.
【点评】略
三.解答题(共3小题)
13.(2024•上海)水果分为一级果和二级果,共136箱,其中一级果102箱,二级果34箱.
(1)随机挑选两箱水果,求恰好一级果和二级果各一箱的概率;
(2)进行分层抽样,共抽8箱水果,求一级果和二级果各几箱;
(3)抽取若干箱水果,其中一级果共120个,单果质量平均数为303.45克,方差为603.46;二级果48个,单果质量平均数为240.41克,方差为648.21;求168个水果的方差和平均数,并预估果园中单果的质量.
【分析】(1)由排列组合公式可得样本空间的样本点的个数及所求的事件的样本点的个数,由古典概型的概率公式可得所求的概率;
(2)由两个级别的箱数之比,可得样本中两个级别的箱数;
(3)由分层抽样的平均数及方差的计算公式,可得168个水果的方差和平均数,进而估计136箱单果的质量.
【解答】解:(1)古典概型:设事件为恰好选到一级果和二级果各一箱,样本空间的样本点的个数,
事件的样本点的公式,
所以(A);
(2)因为一级果箱数:二级果箱数,
所以8箱水果中有一级果抽取6箱,二级果抽取2箱;
(3)设一级果平均质量为,方差为,二级果质量为,方差为,总体样本平均质量为平均值,方差为,
因为,,,,
所以克,
克.
预估:平均质量为克.
【点评】本题考查分层抽样的平均数公式及方差公式的应用,属于基础题.
14.(2023•上海)2023年6月7日,21世纪汽车博览会在上海举行,已知某汽车模型公司共有25个汽车模型,其外观和内饰的颜色分布如下表所示:
红色外观
蓝色外观
棕色内饰
12
8
米色内饰
2
3
(1)若小明从这些模型中随机拿一个模型,记事件为小明取到红色外观的模型,事件为小明取到棕色内饰的模型,求(B)和,并判断事件和事件是否独立;
(2)该公司举行了一个抽奖活动,规定在一次抽奖中,每人可以一次性从这些模型中拿两个汽车模型,给出以下假设:
假设1:拿到的两个模型会出现三种结果,即外观和内饰均为同色、外观和内饰都异色、以及仅外观或仅内饰同色;
假设2:按结果的可能性大小,概率越小奖项越高;
假设3:该抽奖活动的奖金额为:一等奖600元,二等奖300元、三等奖150元;
请你分析奖项对应的结果,设为奖金额,写出的分布列并求出的数学期望.
【分析】(1)根据概率公式分别进行计算即可.
(2)分别求出三种结果对应的概率,比较大小,确定对应的概率,求出分布列,利用期望公式进行计算即可.
【解答】解:(1)若红色外观的模型,则分棕色内饰12个,米色内饰2个,则对应的概率(A),
若小明取到棕色内饰,分红色外观12,蓝色外观8,则对应的概率(B).
取到红色外观的模型同时是棕色内饰的有12个,即,
则.
(A)(B),(A)(B),
即事件和事件不独立.
(2)由题意知,300,150,
则外观和内饰均为同色的概率,
外观和内饰都异色的概率,
仅外观或仅内饰同色的概率,
,
,,,
则的分布列为:
150
300
600
则(元.
【点评】本题主要考查离散型随机变量的分布列和期望的计算,根据概率公式求出对应的概率是解决本题的关键,是中档题.
15.(2024•上海)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:
时间范围
,
,
,
,
,
学业成绩
优秀
5
44
42
3
1
不优秀
134
147
137
40
27
(1)该地区29000名学生中体育锻炼时长不少于1小时的人数约为多少?
(2)估计该地区初中学生日均体育锻炼的时长(精确到.
(3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关?
【分析】(1)由已知结合频率与概率关系即可求解;
(2)先求出样本平均数,然后用样本平均数估计总体平均数即可;
(3)结合独立性检验即可判断.
【解答】解:(1)580人中体育锻炼时长大于1小时人数占比,
该地区29000名初中学生中体育锻炼时长大于1小时的人数约为;
(2)该地区初中学生锻炼平均时长约为
;
(3)由题意可得列联表,
,
其他
总数
优秀
45
50
95
不优秀
177
308
485
①提出零假设:成绩优秀与日均体育锻炼时长不小于1小时且小于2小时无关,
②确定显著性水平,,
③,
④否定零假设,即学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关.
【点评】本题主要考查了用样本估计总体,由频率分布表求平均数及独立性检验的应用,属于中档题.
原创精品资源学科网独家享有版权,侵权必究!6
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。