内容正文:
专题04 随机变量及统计案例
目录
解题知识必备 1
压轴题型讲练 3
类型一、随机变量 3
类型二、随机变量分布列 5
类型三、二项分布和超几何分布 10
类型四、正态分布 14
类型五、统计案例 17
压轴能力测评(10题) 24
一、.离散型随机变量的分布列的表示
一般地,若离散型随机变量可能取的不同值为,取每一个值的概率,以表格的形式表示如下:
我们将上表称为离散型随机变量的概率分布列,简称为的分布列.有时为了简单起见,也用等式,表示的分布列.
二、离散型随机变量的均值与方差
1、均值
若离散型随机变量的分布列为
称为随机变量的均值或数学期望,它反映了离散型随机变量取值的平均水平.
2、均值的性质
(1)(为常数).
(2)若,其中为常数,则也是随机变量,且.
(3).
(4)如果相互独立,则.
3、方差
若离散型随机变量的分布列为
则称为随机变量的方差,并称其算术平方根为随机变量的标准差.
4、方差的性质
(1)若,其中为常数,则也是随机变量,且.
(2)方差公式的变形:.
三、二项分布
1、定义
一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,不发生的概率,那么事件恰好发生次的概率是(,,,…,)
于是得到的分布列
…
…
…
…
由于表中第二行恰好是二项式展开式
各对应项的值,称这样的离散型随机变量服从参数为,的二项分布,记作,并称为成功概率.
2、二项分布的适用范围及本质
(1)适用范围:
①各次试验中的事件是相互独立的;
②每次试验只有两种结果:事件要么发生,要么不发生;
③随机变量是这次独立重复试验中事件发生的次数.
(2)本质:二项分布是放回抽样问题,在每次试验中某一事件发生的概率是相同的.
3、二项分布的期望、方差
若,则,.
四、超几何分布
1、定义
在含有件次品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,,1,2,…,,其中,且,,,,,称分布列为超几何分布列.如果随机变量的分布列为超几何分布列,则称随机变量服从超几何分布.
0
1
…
…
2、超几何分布的适用范围件及本质
(1)适用范围:
①考察对象分两类;
②已知各类对象的个数;
③从中抽取若干个个体,考察某类个体个数的概率分布.
(2)本质:超几何分布是不放回抽样问题,在每次试验中某一事件发生的概率是不相同的.
五、正态分布
一般地,如果对于任何实数,,随机变量满足,则称随机变量服从正态分布.正态分布完全由参数,确定,因此正态分布常记作.如果随机变量服从正态分布,则记为.
其中,参数是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.
类型一、随机变量
【变式训练1】同时掷两颗质地均匀的骰子,观察朝上一面出现的点数.设两颗骰子出现的点数分别为,,记,则( )
A. B. C. D.
【答案】B
【详解】依题意,随机变量满足的事件是、、的3个互斥事件的和,
而,,,
所以.
故选:B
【变式训练2】甲、乙两人下象棋,赢了得3分,平局得1分,输了得0分,共下三局.用ξ表示甲的得分,则{ξ=3}表示( )
A.甲赢三局
B.甲赢一局
C.甲、乙平局三次
D.甲赢一局输两局或甲、乙平局三次
【答案】D
【详解】由题意知,甲、乙两人下象棋,赢了得3分,平局得1分,输了得0分,
其中甲得3分,有两种情况:
甲赢一局输两局,甲得分为3分;
甲、乙平局三次,甲得分为3分.
所以{ξ=3}表示甲赢一局输两局或甲、乙平局三次.
故选:D.
【变式训练3】甲、乙两人下象棋,胜者得1分,平局得0分,负者得分,共下5局.用表示甲的得分,则表示( )
A.甲胜3局负2局 B.甲胜4局负1局
C.甲胜3局平2局或甲胜3局负2局 D.甲胜4局负1局或甲胜3局平2局
【答案】D
【详解】由已知可得,当时,应该为3胜2平或4胜1负.
故选:D.
【变式训练4】(多选)口袋中有大小形状都相同的4个红球,n个白球,每次从中摸一个球,摸后再放回口袋中,摸到红球记2分,摸到白球记1分,共摸球3次.设所得分数为随机变量,若则随机变量的取值可能为( )
A.2 B.3 C.4 D.5
【答案】BCD
【详解】口袋中有大小形状都相同的4个红球,n个白球,每次从中摸一个球,摸后再放回口袋中,
∴摸到红球的概率是,白球的概率是,而即得3分:表示这3次摸的都是白球且,
∴,解得,
∴的可能取值为3,4,5,6.
故选:BCD.
【变式训练5】一用户在打电话时忘记了号码的最后三个数字,只记得最后三个数字两两不同,且都大于5,于是他随机拨最后三个数字(都大于5且两两不同),设他拨到所要号码的次数为,则随机变量的可能取值共有 种.
【答案】24
【详解】因为后四位数字两两不同,且都大于5,
所以只能是6,7,8,9四个数字,
因为随机拨最后三位数字两两不同,
所以有种,
故答案为:.
【变式训练6】小王参加一次比赛,比赛共设三关,第一、二关各有两个必答题,如果每关两个问题都答对,可进入下一关,第三关有三个问题,只要答对其中两个问题,则闯关成功.每过一关可获得价值分别为1000元,2000元,3000元的奖品(奖品重复设立),小王对三关中每个问题回答正确的概率依次是,且每个问题回答正确与否相互之间没有影响,用X表示小王所获奖品的价值,写出X的所有可能取值及每个值所表示的随机试验的结果.
【答案】答案见解析
【详解】X的可能取值为0,1000,3000,6000,
,表示第一关就没有通过;
,表示第一关通过,而第二关没有通过;
,表示第一、二关通过,而第三关没有通过;
,表示三关都通过.
类型二、随机变量分布列
【变式训练1】某公司计划派员工到甲、乙、丙、丁、戊这5个领头企业中的两个企业进行考察学习,记该公司员工所学习的企业中含甲、乙、丙的个数为,记的所有取值的平均数为,方差为,则( )
A. B. C. D.
【答案】D
【详解】由题知的所有可能取值为,则,.
且,,,
所以,故A错误;
由于,故C错误;
,故B错误;
,则,故D正确.
故选:D
【变式训练2】密室逃脱是当下非常流行的解压放松游戏,现有含甲在内的7名成员参加密室逃脱游戏,其中3名资深玩家,4名新手玩家,甲为新手玩家.
(1)在某个游戏环节中,需随机选择两名玩家进行对抗,若是同级的玩家对抗,双方获胜的概率均为;若是资深玩家与新手玩家对抗,新手玩家获胜的概率为,求在该游戏环节中,获胜者为甲的概率;
(2)甲作为上一轮的获胜者参加新一轮游戏:如图,有两间相连的密室,设两间密室的编号分别为①和②.密室①有2个门,密室②有3个门(每个门都可以双向开),甲在每个密室随机选择1个门出去,若走出密室则挑战成功.若甲的初始位置为密室①,设其挑战成功所出的密室号为,求的分布列.
【答案】(1)
(2)分布列见解析
【详解】(1)7人中随机选择2人,共有种情况,其中含甲的情况有种,
6种情况中,甲和资深玩家对抗的情况有3种,和同级的玩家对抗情况有3种,
则甲和资深玩家对抗并获胜的概率为,
和同级的玩家对抗并获胜的概率为,
故在该游戏环节中,获胜者为甲的概率为;
(2)设为甲在密室①,且最终从密室①走出密室,挑战成功的概率,
为甲在密室②,且最终从密室①走出密室,挑战成功的概率,
考虑,需考虑甲直接从号门走出密室或者进入密室②且最终从密室①走出密室,
故①,
考虑,则甲从号门进行密室①,且从密室①走出密室,
故②,
联立①②,可得,
所以,故,
故分布列如下:
1
2
【变式训练3】学校教学楼的每两层楼之间的上下楼梯有个台阶,从下至上记台阶所在位置为,同学甲在上楼的过程中,每一步等可能地跨或个台阶(位置或).
(1)记甲迈步后所在的位置为,写出的分布列和期望值.
(2)求甲步内到过位置的概率;
(3)求步之内同时到过位置和的有多少种走法,及发生的概率.
【答案】(1)分布列见解析, (2) (3)种,
【详解】(1)由题意可知甲每步跨或个台阶的概率都为,
可能的取值为,,,.取值分别对应步中分别有,,,次跨两个台阶,
故,
的分布列如下,
X
3
4
5
6
P
.
(2)步内到过位置记为事件可分为:步到达位置(记为)、
步到达位置(记为)和步到达位置(记为)三种情况.
即步中每步都;即步中有两步,步;
即步中有两步,步.
则.
(3)记步内到过位置为事件,走法为,则由题意,故由,,
递推,依次为,其中步和步到达位置的走法分别为和种,
步到达位置情况下再到达位置只有种走法,
步到达位置不可能再到达位置,其他到达位置的情况再到达位置都有种走法.
故步之内同时到过位置和的走法为:种,
记为,由题意,
数列是以为首项,为公比的等比数列,,,
记步和步到达位置为分别为事件,,,,
记步内到过位置为事件,
则,,,
其余情况下,
,
故步之内同时到过位置和的概率为.
【变式训练4】随着全球环境问题的加剧,环境安全已逐渐成为国家和地区安全的重要组成部分,其中环境空气质量尤为重要.我国空气质量分为六级,在大气中空气动力学当量直径小于或等于2.5微米的颗粒物称为可入肺颗粒物(记为PM2.5),对人体健康和环境质量的影响很大,其中PM2.5与空气质量的关系如下:
PM2.5日均值为及以下时,空气质量等级为“一级:优”;
PM2.5日均值为时,空气质量等级为“二级:良好”;
PM2.5日均值为时,空气质量等级为“三级:轻度污染”.
某市环保局从冬季每天的PM2.5监测数据中随机抽取10天数据作为样本,其数据分别为:38,32,45,49,53,77,66,86,76,91.空气质量低于二级视为PM2.5数据超标.
(1)从这10天的PM2.5监测数据中,随机抽出三天数据,求至少有一天空气质量为二级的概率;
(2)从这10天的PM2.5监测数据中,随机抽出三天,求这三天PM2.5监测数据超标的天数的分布列.
【答案】(1)
(2)答案见解析
【详解】(1)由题可得,空气质量为一级的有1天,为二级的有5天,为三级的有4天,
则所求概率.
(2)设“这三天PM2.5监测数据超标的天数”为,则的可能取值为0,1,2,3.
所以;
.
即的分布列如下:
0
1
2
3
【变式训练5】巴黎奥运会于2024年7月26日至8月11日举行.某体育局为普及奥运知识,组织了答题活动.设置一个抽题箱,箱中有若干装有题目的小球,小球大小、颜色、质量都一样.每个小球内只有一道题目,每道题目只有一个分值,题目分值分别为2分、10分.抽取规则:每次从抽题箱抽取一个小球,对小球中题目作答后将该题目放回原球内,并把小球放回抽题箱,摇匀后,再抽取.已知2分题目小球被抽到的概率为,10分题目小球被抽到的概率为.
(1)若甲抽取3次,记表示甲3次抽取题目分值之和,求的分布列和数学期望.
(2)若甲、乙各抽取4次,已知甲前两次抽出题目分值之和为20,记事件“乙抽出题目分值之和大于甲抽出题目分值之和”,求.
【答案】(1)分布列见解析,12
(2)
【详解】(1)的所有可能取值为.
,,
,,
所以的分布列为
6
14
22
30
所以.
(2)记“甲抽出题目分值之和为”,,
则,.
当甲抽出题目分值之和为24时,乙抽出题目分值之和需为32或40,
所以;
当甲抽出题目分值之和为32时,乙抽出题目分值之和需为40,
所以.
故
.
类型三、二项分布和超几何分布
【变式训练1】设随机变量服从二项分布,若,则( )
A.0.16 B.0.32 C.0.64 D.0.84
【答案】C
【详解】,解得,
所以,则.
故选:C.
【变式训练2】一袋中有5个白球,3个红球,现从袋中往外取球,每次任取一个记下颜色后放回,直到红球出现10次停止,设停止时共取了次球,则( )
A. B. C. D.
【答案】D
【详解】由题意知第12次取到红球,前11次中恰有9次取到红球,2次取到白球,由于每次取到红球的概率为.
由二项分布知识可知,
故选:D.
【变式训练3】一个不透明的袋子有10个除颜色不同外,大小、质地完全相同的球,其中有6个黑球,4个白球.现进行如下两个试验,试验一:逐个不放回地随机摸出3个球,记取到白球的个数为,期望方差分别为;试验二:逐个有放回地随机摸出3个球,记取到白球的个数为,期望和方差分别为,则下列判断正确的是( )
A. B.
C. D.
【答案】A
【详解】试验一:从中随机地无放回摸出3个球,记白球的个数为,
则的可能取值是0,1,2,3,
则,
,,
故随机变量的概率分布列为:
0
1
2
3
则数学期望为:,
方差为:;
试验二:从中随机地有放回摸出3个球,则每次摸到白球的概率为,
则,
故,,
故,.
故选:A.
【变式训练4】某校在一次“二项分布的性质”为主题的探究活动中,该校数学第一小组的学生同学表现优异,探究数学的奥秘.设随机变量,记,在探究的最大值时,小组同学发现:当为正整数,则,,此时这两项概率均为最大值;当为非整数,取的整数部分,是唯一的最大值.以此为理论依据,有同学重复投掷一枚大小均匀的骰子实时记录点数6出现的次数.当投掷第20次时,记录到此时点数6出现5次,再进行80次投掷实验,当投掷到100次时,点数6总共出现的次数为 的概率最大.
【答案】18
【详解】继续再进行80次投掷试验,出现点数为6次数服从二项分布,
由,结合题中结论可知,时概率最大,
即后面80次中出现13次点数6的概率最大,
加上前面20次中的5次,所以出现18次的概率最大.
故答案为:18.
【变式训练5】如图是一块高尔顿板的示意图,在一块木板上钉着若干排相互平行但相互错开的圆柱形小木钉,小木钉之间留有适当的空隙作为通道,前面挡有一块玻璃.将小球从顶端放入,小球下落的过程中,每次碰到小木钉后都等可能地向左或向右落下,后落入底部的格子中.记格子从左到右的编号分别为,用表示小球最后落入格子的号码,若,则 .
【答案】5
【详解】小球在下落的过程中,共10次等可能的向左或向右落下,则小球落入底部的格子号码服从二项分布,
且落入格子的号码即向右次数,即~,
所以,
由二项式系数的对称性可知当时,最大,即最大,所以.
故答案为:5.
【变式训练6】如图,在研究某种粒子的实验装置中,粒子从腔室出发,到达腔室,粒子从室经过号门进入室后,等可能的变为上旋或下旋状态,粒子从室经过号门进入室后,粒子的旋转状态发生改变的概率为.粒子间的旋转状态相互独立.现有两个粒子从室出发.
(1)求两粒子进入室都为上旋状态的概率;
(2)若实验装置出现故障,两个粒子进入室后,共裂变为个粒子,裂变后的每个粒子再经过号门返回室的概率为,各粒子返回室相互独立.
①时,写出返回室的粒子个数的分布列、期望、方差;
②时,记有个粒子返回室的概率为,则为何值时,取最大值.
【答案】(1)
(2)①分布列见详解,期望,方差;
②
【详解】(1)设“两个粒子通过号门后处于上旋状态粒子个数为个”,,
“两个粒子通过号门后进入室都为上旋状态”,
则,,
则.
(2)①返回室的粒子个数的可能性为,,,,
服从二项分布:
,,
,,
,
所以期望,方差;
②的可能取值为,此时,
个粒子返回室的概率为,
则,
所以,
当时,取最大值.
类型四、正态分布
【变式训练1】已知随机变量分别服从正态分布和二项分布,且,,则( )
A. B. C. D.
【答案】D
【详解】由题可得,,,,
所以.
故选:D.
【变式训练2】.生态环境部2024年7月21日发布了《全国碳市场发展报告(2024)》,系统总结了全国碳排放权交易市场和全国温室气体自愿减排交易市场的最新建设进展,全方位展示了市场建设运行工作成效.为了解某地碳市场建设情况,相关部门对当地1000家企业的碳排放情况进行了综合评估,得到各企业的综合得分近似服从正态分布,则得分在区间内的企业大约有(参考数据:若,则,)( )
A.108家 B.116家 C.124家 D.136家
【答案】D
【详解】由题得,,则
,
故得分在区间内的企业大约有家.
故选:D
【变式训练3】已知三个随机变量的正态密度函数的图象如图所示,则( )
A. B.
C. D.
【答案】D
【详解】因为正态密度函数和的图象关于同一条直线对称,所以.
又的图象的对称轴在的图象的对称轴的右边,所以.
因为越大,曲线越“矮胖”.越小,曲线越“瘦高”,
由图可知,正态密度函数和的图象一样“瘦高”,的图象明显“矮胖”,
所以.
故选:D.
【变式训练4】(多选)已知随机变量服从正态分布,,,则以下选项正确的是( )
A. B.若,则
C.若,则 D.
【答案】ABD
【详解】由题知,故A正确;
,故B正确;
,故C错误;
由正态分布密度曲线关于对称,
利用对称性知,,
所以,故D正确.
故选:ABD.
【变式训练5】(多选)若随机变量,从的取值中随机抽取个数据,记这个数据的平均值为,则随机变量.随机变量服从正态分布,则.某珠宝店出售的珍珠的直径均服从期望为15毫米,标准差为2毫米的正态分布.程女士在该珠宝店随机地挑选了16颗圆润华美的珍珠,将它串成一条璀璨夺目的项链.设这16颗珍珠的直径平均值为,则( )
A.随机变量的标准差为 B.随机变量
C. D.
【答案】BC
【详解】由题设可知:,则随机变量,
所以随机变量的标准差为,故A错误, B正确;
因为
,故C正确;
因为,故D错误.
故选:BC.
【变式训练6】为加大自然生态系统和环境保护力度,加强企业对尊重自然、顺应自然、保护自然的生态文明理念,某市对化工企业的排污情况进行调查,并出台相应的整治措施.相关部门对1000家化工企业所排污水的质量及周围空气质量进行了综合检测,得分情况如频率分布直方图所示.
(1)计算该市化工企业的平均得分(同一组中的数据以这组数据的中间值为代表);
(2)已知化工企业的得分情况近似服从正态分布,其中,则得分在内的企业大约有多少家;
(3)按照(2)中概率分布随机抽取100家化工企业,分数不低于19分的企业有多少家时概率最大.
参考数据:若随机变量服从正态分布,则,,.
【答案】(1)51
(2)136家
(3)98家
【详解】(1)该市被调查的化工企业的污染情况得分的平均值为.
(2)由(1)知化工企业的得分情况.因为,
所以
.
可得所求企业大约有家.
(3)由(2)得,
所以每家企业得分不低于19分的概率为0.9772,
则得分不低于19分的企业数.
其中恰有家企业得分不低于19分的概率为,
令,,
可得,解得,
故在走访的100家化工企业中,分数不低于19分的企业有98家时概率最大.
类型五、统计案例
【变式训练1】某统计部门对四组数据进行统计分析后, 获得如图所示的散点图.
下面关于样本相关系数的比较, 正确的是 ( )
A. B.
C. D.
【答案】C
【详解】由题图可知,所对应的图中的散点呈现正相关,
而且对应的散点图更接近直线,相关性比对应的相关性要强,故,
,所对应的图中的散点呈现负相关,
而且对应的散点图更接近直线,相关性比对应的相关性要强,故,
因此.
故选:C.
【变式训练2】(多选)国家统计局7月15日发布数据显示,2024年上半年我国经济运行总体平稳,其中新能源产业依靠持续的技术创新实现较快增长.某企业根据市场调研得到研发投入(亿元)与产品收益(亿元)的数据统计如下,则下列叙述正确的是( )
1
2
3
4
5
6
7
2
3
5
7
8
8
9
A.
B.由散点图知变量和正相关
C.用最小二乘法求得关于的经验回归直线方程为
D.收益的方差为6
【答案】AB
【详解】A.,,故A正确;
B.散点图的分布从左下到右上,所以是正相关,故B正确;
C. 经验回归直线必过样本点中心,当时,,故C错误;
D.收益的方差为,故D错误.
故选:A
【变式训练3】(多选)某直播带货公司统计了今年1月份至5月份的某种产品的月销量(单位:千件)如下表所示:
月份
1
2
3
4
5
月销量
2.4
3.1
4
5
5.5
已知变量与之间具有线性相关关系,通过最小二乘法求得的经验回归直线方程为,则下列说法正确的是( )
参考公式:相关系数,决定系数.
A. B.
C.每增加1,一定增加0.81 D.
【答案】ABD
【详解】由题意及表得,
在中,,
,
A项,∵,
∴,故A正确;
B项,
,即,∴,故B正确;
C项,经验回归直线方程为,
并不意味着每增加1,一定增加0.81,会有一定的浮动,故C错误;
D项,
∴,∴,故D正确;
故选:ABD.
【变式训练4】(多选)如图是根据一组观测数据得到海拔千米的大气压强散点图,根据一元线性回归模型得到经验回归方程为,决定系数为;根据非线性回归模型得到经验回归方程为,决定系数为,则下列说法正确的是( )
A.由散点图可知,大气压强与海拔高度负相关
B.由方程可知,海拔每升高1千米,大气压强必定降低kPa
C.由方程可知,样本点的残差为
D.对比两个回归模型,结合实际情况,方程的预报效果更好
【答案】ACD
【详解】对于A,由图象知,海拔高度越高,大气压强越低,所以大气压强与海拔高度负相关,故A正确;
对于B,经验回归方程得到的数据为估计值,而非精确值,故B错误;
对于C,当时, ,所以样本点的残差为,故C正确;
对于D,随着海拔高度的增加,大气压强越来越小,但不可能为负数,因此方程的预报效果更好,故D正确.
故选:ACD.
【变式训练5】近年来,我国铁路事业取得历史性成就、发生历史性变革,路网规模质量大幅提升,建成世界最大的高速铁路网.截至2023年底,我国铁路营业里程达15.9万公里,其中高铁营业里程4.5万公里,继续稳居世界第一.如图,是我国2015-2023年高铁营业里程的发展情况(单位:万公里).
(1)由散点图看出,可用线性回归模型拟合高铁营业里程与年份代码的关系,请用相关系数加以说明(结果精确到0.001;当时,认为线性相关性较强;时,认为线性相关性一般;,认为线性相关性较弱);
(2)求关于的线性回归方程,并预测到哪一年我国高铁的营业里程将达到7万公里(结果精确到0.01).
附:参考公式:相关系数;
回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,,,.
【答案】(1)答案见解析
(2),预测到2030年我国高铁的营业里程将会达到7万公里
【详解】(1)由散点图数据得
,
,
又,,,
所以,
故与的线性相关性较强,所以可以用线性回归模型拟合与的关系.
(2)由(1)得,
则,
所以关于的线性回归方程为,
令,即,解得,
即时,高铁的营业里程将会达到7万公里,
所以预测到2030年我国高铁的营业里程将会达到7万公里.
【变式训练6】某社区对随机抽取的120名居民进行“安全卫生服务满意度”问卷调查,其中对社区“安全卫生服务”满意的男性居民占抽取调查人数的.
满意
不满意
合计
男性居民
60
女性居民
20
60
合计
120
(1)请根据调查结果将上面的列联表补充完整,依据小概率值的独立性检验分析居民对“安全卫生服务”的满意程度是否有差异;
(2)用分层随机抽样方法,从对社区“安全卫生服务”满意的居民中随机抽取9人,再从9人中随机抽取4人到其他社区交流学习,记这4人中女性居民的人数为,求的分布列与期望.
附:,其中.
0.100
0.050
0.025
2.706
3.841
5.024
【答案】(1)列联表见解析,有差异
(2)分布列见解析,
【详解】(1)因为对社区“安全卫生服务”满意的男性居民占抽取调查人数的,
所以对社区“安全卫生服务”满意的男性居民有(人),
所以列联表如下:
满意
不满意
合计
男性居民
50
10
60
女性居民
40
20
60
合计
90
30
120
零假设为:居民对“安全卫生服务”满意程度无差异.
根据题表中的数据可得,
根据小概率值的独立性检验,没有充分证据推断成立,
因此可以认为不成立,
即认为居民对“安全卫生服务”的满意程度有差异,此推断犯错误的概率不大于0.05.
(2)由(1)知对社区“安全卫生服务”满意的男性居民有50人,女性居民有40人,
用分层随机抽样的方法随机抽取9人,
则男性居民应抽取5人,女性居民应抽取4人,
再从9人中随机抽取4人到其他社区交流学习,记这4人中女性居民的人数为,
所以的所有可能取值为,
所以,,
,,
,
所以随机变量的分布列为
0
1
2
3
4
所以.
1.已知甲参加青年志愿者的选拔,选拔以现场答题的方式进行.已知在备选的10道试题中,甲能答对其中的6道题,规定每次考试都从备选题中随机抽出3道题进行测试,设甲答对的试题数为X,则的概率为( )
A. B. C. D.
【答案】D
【详解】由题意可知:表示答对2题,即随机抽出3道题有2题答对,1题打错,
所以.
故选:D.
2.一个班级共有30名学生,其中有10名女生,现从中任选三人代表班级参加学校开展的某项活动,假设选出的3名代表中的女生人数为变量,男生的人数为变量,则等于( )
A. B.
C. D.
【答案】C
【详解】因为,
所以.
故选:C.
3.变量之间有如下对应数据
2
3
4
5
6
13
12
10
8
7
已知变量与呈线性相关关系,且回归方程为,则的值为( )
A.16 B.14 C.12 D.10
【答案】A
【详解】由已知,,
所以,所以,
故选:A.
4.(多选)一射手对同一目标独立地射击四次,已知至少命中一次的概率为,若该射手射击四次命中次数为,每次命中的概率为,则( )
A. B.
C.或 D.
【答案】ABD
【详解】设此射手射击四次命中次数为,每次命中的概率为,,
则的可能取值有,且,
依题意可知,,
所以,
所以,所以或(舍去).
故选:ABD.
5.(多选)一个袋中有6个同样大小的黑球,编号为1,2,3,4,5,6,还有4个同样大小的白球,编号为7,8,9,10,现从中任取4个球,则下列说法中正确的是( )
A.取出一个黑球记2分,取出一个白球记1分,表示取出的4个球的总得分,则服从超几何分布
B.若表示取出的黑球的个数,则服从超几何分布
C.若表示取出白球的个数,则
D.若表示取出黑球的个数,则
【答案】BD
【详解】A,B均根据超几何分布的定义可得,故A错,B正确;
C中,,故C错误;
D中,,故D正确.
故选:ABD.
6.(多选)若随机变量,下列说法中正确的有( )
A. B.期望
C.期望 D.方差
【答案】AB
【详解】若随机变量,,则,故A正确;
期望,故B正确;
,故C错误;
,故D错误.
故选:AB
7.(多选)若随机变量服从正态分布,设,则( )
A. B. C. D.
【答案】BCD
【详解】根据正态分布图象的对称性可知:;
;.
对A:因为,所以A错误;
对B:因为,故B正确;
对C:因为,故C正确;
对D:因为
.
所以成立,故D正确.
故选:BCD
8.(多选)已知某批产品的质量指标服从正态分布,且,现从该批产品中随机取3件,用表示这3件产品的质量指标值位于区间的产品件数,则( )
A. B.
C. D.
【答案】AC
【详解】由正态分布的概念可知,故A正确;
由正态分布的性质得,故B错误;
则1件产品的质量指标值位于区间的概率为
所以,故C正确;
,故D错误.
故选:AC.
9.(多选)已知三个密度函数的图象如图所示,则( )
A.
B.
C.若,,则
D.若,,则存在实数,使得
【答案】BCD
【详解】根据正态曲线关于对称,且μ越大曲线越靠近右边,则,故A错误;
又σ越小数据越集中,曲线越瘦高,则,故B正确.
,,则,
所以,C正确;
若,,,则存在实数,使,D正确.
故选:BCD.
10.商家项目投资的利润产生是一个复杂的系统结果.它与项目落地国的商业环境,政府执政能力,法律生态等都有重大的关联.如表所示是某项目在中国和南亚某国投资额和相应利润的统计表.
项目落地国
中国
南亚某国
投资额x(亿元)
10
11
12
13
14
10
11
12
13
14
利润y(亿元)
11
12
14
16
19
12
13
13
14
15
请选择平均利润较高的落地国,用最小二乘法求出回归直线方程为 .参考数据和公式:,中国,南亚某国,,.
【答案】
【详解】两国的平均利润分别为和,故中国的平均利润较高.
根据题设数据,有,.
故答案为:.
11.小张参加某项专业能力考试.该考试有,,三类问题,考生可以自行决定三类问题的答题次序,回答问题时按答题次序从某一类问题中随机抽取一个问题回答,若回答正确则考试通过,若回答错误则继续从下一类问题中再随机抽取一个问题回答,依此规则,直到三类问题全部答完,仍没有答对,则考试不通过.已知小张能正确回答,,三类问题的概率分别为,,,且每个问题的回答结果相互独立.
(1)若小张按照在先,次之,最后的顺序回答问题,记为小张的累计答题数目,求的分布列;
(2)小张考试通过的概率会不会受答题次序的影响,请作出判断并说明理由;
(3)设,为使累计答题数目的均值最小,小张应如何安排答题次序?并说明理由.
【答案】(1)答案见解析
(2)不会,理由见解析
(3)应按的顺序答题,理由见解析
【详解】(1)按的顺序答题,的可能取值为,
则,,,
所以的分布列为:
(2)小张考试通过的概率不受答题次序的影响,理由如下:
由题意,小张没有通过考试的情况只有三题全部答错,
所以小张考试通过的概率均为
(3)应按的顺序答题,理由如下:
设,,
.
若按的顺序答题,设为此时小张的累计答题数目,
由(1)得
.
若按的顺序答题,设为此时小张的累计答题数目,
则,
所以
,
则
,
则.
若按的顺序答题,设为此时小张的累计答题数目,
同理可得.
若按的顺序答题,设为此时小张的累计答题数目,
同理可得.
,
若按的顺序答题,设为此时小张的累计答题数目,
同理可得.
若按的顺序答题,设为此时小张的累计答题数目,
同理可得.
.
所以累计答题数目的均值最小的,是、、中最小的一个,
,
,
所以,
,
,
所以,
所以最小的是,
所以应按的顺序答题.
12.2024年第七届中国国际进口博览会(简称进博会)于11月5日至10日在上海国家会展中心举行.为了解进博会参会者的年龄结构,某机构随机抽取了年龄在15-75岁之间的200名参会者进行调查,并按年龄绘制了频率分布直方图,分组区间为.把年龄落在区间内的人称为“青年人”,把年龄落在区间内的人称为“中年人”,把年龄落在内的人称为“老年人”.
(1)求所抽取的“青年人”的人数;
(2)以分层抽样的方式从“青年人”“中年人”“老年人”中抽取10名参会者做进一步访谈,发现其中女性共4人,这4人中有3人是“中年人”.再用抽签法从所抽取的10名参会者中任选2人.
①简述如何采用抽签法任选2人;
②设事件A:2人均为“中年人”,事件B:2人中至少有1人为男性,判断事件A与事件B是否独立,并说明理由.
【答案】(1)80
(2)①答案见解析;②事件A与事件B不独立,理由见解析
【详解】(1)由频率分布直方图可得,解得:,
又“青年人”占比为,
所以所抽取的“青年人”人数为人;
(2)①先将10名参会者进行编号:1、2、、10,并将10个号码写在完全相同的纸片上,
放入某容器中充分混合均匀,再取出2张,2张纸片上所对应的参会者就是要选取的人,
②“青年人”“中年人”“老年人”的人数之比为,
所以10人中“中年人”共有5人,
2人均为“中年人”的概率,
2人中至少有1人为男性的概率,
2人均为“中年人”且至少有1人为男性的概率,
因为,所以事件A与事件B不独立.
13.在第九个全民国家安全教育日即将来临之际,拉萨市人民检察院于12日会同拉萨市委宣传部、拉萨市普法办、拉萨市教育局等部门,共同举办了以“检爱同行,共护花开”为主题的首届拉萨市青少年国家安全知识竞赛.每人可参加多轮答题活动,每轮答题情况互不影响.每轮比赛共有两组题,每组都有两道题,只有第一组的两道题均答对,方可进行第二组答题,否则本轮答题结束.已知吴科同学第一组每道题答对的概率均为,第二组每道题答对的概率均为,两组题至少答对3题才可获得一枚纪念章.经过激烈的角逐,拉萨江苏实验中学代表队获得一等奖,拉萨市第三高级中学、拉萨市北京中学代表队获得二等奖,拉萨市第二高级中学、拉萨市第二中等职业技术学校、拉萨市第四高级中学代表队获得三等奖.
(1)记吴科同学在一轮比赛答对的题目数为,请写出的分布列,并求;
(2)若吴科同学进行了10轮答题,试问获得多少枚纪念章的概率最大.
【答案】(1)分布列见解析, (2)2枚
【详解】(1)由题意得,可取0,1,2,3,4.
,
,
,
,…
,
则的分布列为:
0
1
2
3
4
(2)每一轮获得纪念章的概率为,
每一轮相互独立,则每一轮比赛可视为二项分布,
设10轮答题获得纪念章的数量为,则,
,.
由,
得,
解得,又,得,则获得2枚纪念章的概率最大.
14.历史悠久的杨柳青年画,全称“杨柳青木版年画”,属木版印绘制品,是我国著名民间传统木版年画.它起源于明代崇祯年间,距今已有近400年的历史,是首批国家级非物质文化遗产.杨柳青年画制作特别之处是它采用“印画结合”的独特工艺,制作程序大致是:创稿、分版、刻版、套印、彩绘、装裱,前期工序与其他木彼年画大致相同,而杨柳青年画的后期制作艺术风格迥然不同.一个优秀的作品除了需要有很好的素材外,更要有制作上的技术要求,已知某年工艺画师在后期套印、彩绘、装裱每个环节制作成功的概率分别为,只有当每个环节制作都成功才认为是一次优秀制作.
(1)设事件“制作一件优秀作品”,求事件A的概率;
(2)若该工艺画师进行3次制作,事件”恰有一件优秀作品”,求事件B的概率;
(3)若该工艺画师制作3次,其中优秀作品数为X,求X的分布列和数学期望.
【答案】(1)
(2)
(3)分布列见解析;期望为
【详解】(1)由题意得;
(2)该工艺画师进行3次制作,恰有一件优秀作品为事件B
;
(3)随机变量X的取值为
由题意可知:
随机变量X的分布列为
X
0
1
2
3
P
或者.
15.某项团体比赛分为两轮,第一轮由团队队员轮流与AI人工智能进行比赛,若挑战成功,则参加第二轮攻擂赛,与上任擂主争夺此次团体赛的擂主.现有甲队参加比赛,队中共有3名事先排好顺序的队员.
(1)第一轮与AI对战,比赛的规则如下:若某队员第一关闯关成功,则该队员继续闯第二关,否则该队员结束闯关并由下一位队员接力去闯第一关,若某队员第二关闯关成功,则该团队接力闯关活动结束,否则该成员结束闯关并由下一位队员接力去闯第二关;当第二关闯关成功或所有队员全部上场参加了闯关,该队挑战活动结束.已知甲队每位成员闯过第一关和第二关的概率分别为,,且每位成员闯关是否成功互不影响,每关结果也互不影响.用表示甲队闯关活动结束时上场闯关的成员人数,求的分布列和期望.
(2)甲队已经顺利进入第二轮,现和擂主乙队1-3号队员进行比赛,规则为:双方先由1号队员比赛,负者被淘汰,胜者再与负方2号队员比赛……直到有一方队员全被淘汰,另一方获得胜利.已知甲队三名队员每场比赛的胜率分别为,,,若要求甲队获得擂主的概率大于,问是否满足?请说明理由.
【答案】(1)分布列见解析,
(2)满足,理由见解析
【详解】(1)由题意知,的所有可能取值为1,2,3,
则,
,
,
所以的分布列为
1
2
3
所以.
(2)满足题意,理由如下:
分三种情况:
①一人参赛全胜获得擂主,该事件发生的概率设为,则,
②两人参赛获得擂主,该事件发生的概率设为,
则,
③三人参赛获得擂主,该事件发生的概率设为,
若在第一局被淘汰,淘汰掉乙队三人,概率为,
若在第二局被淘汰,淘汰掉乙队两人,
概率为,
若在第三局被淘汰,淘汰掉乙队一人,
概率为
,
故,
因为,
所以要使甲队获胜的概率大于,即,则,
即,化简得,
当时,代入可得,满足题意.
16.统计显示,我国在线直播生活购物用户规模近几年保持高速增长态势,下表为年—年我国在线直播生活购物用户规模(单位:亿人),其中年—年对应的代码依次为—.
年份代码
市场规模
,,,其中
参考公式:对于一组数据、、、,其经验回归直线的斜率和截距的最小二乘估计公式分别为,.
(1)由上表数据可知,若用函数模型拟合与的关系,请估计年我国在线直播生活购物用户的规模(结果精确到);
(2)已知我国在线直播生活购物用户选择在品牌官方直播间购物的概率,现从我国在线直播购物用户中随机抽取人,记这人中选择在品牌官方直播间购物的人数为,若,求的数学期望和方差.
【答案】(1)亿人
(2),
【详解】(1)设,则,
因为,,,
所以,,
所以,与的拟合函数关系式为
当时,,
则估计年我国在线直播生活购物用户的规模为亿人.
(2)由题意知,所以,,
,
由,可得,
因为,解得,
所以,,.
原创精品资源学科网独家享有版权,侵权必究!1
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$
专题04 随机变量及统计案例
目录
解题知识必备 1
压轴题型讲练 3
类型一、随机变量 3
类型二、随机变量分布列 5
类型三、二项分布和超几何分布 7
类型四、正态分布 8
类型五、统计案例 10
压轴能力测评(10题) 14
一、.离散型随机变量的分布列的表示
一般地,若离散型随机变量可能取的不同值为,取每一个值的概率,以表格的形式表示如下:
我们将上表称为离散型随机变量的概率分布列,简称为的分布列.有时为了简单起见,也用等式,表示的分布列.
二、离散型随机变量的均值与方差
1、均值
若离散型随机变量的分布列为
称为随机变量的均值或数学期望,它反映了离散型随机变量取值的平均水平.
2、均值的性质
(1)(为常数).
(2)若,其中为常数,则也是随机变量,且.
(3).
(4)如果相互独立,则.
3、方差
若离散型随机变量的分布列为
则称为随机变量的方差,并称其算术平方根为随机变量的标准差.
4、方差的性质
(1)若,其中为常数,则也是随机变量,且.
(2)方差公式的变形:.
三、二项分布
1、定义
一般地,在次独立重复试验中,用表示事件发生的次数,设每次试验中事件发生的概率为,不发生的概率,那么事件恰好发生次的概率是(,,,…,)
于是得到的分布列
…
…
…
…
由于表中第二行恰好是二项式展开式
各对应项的值,称这样的离散型随机变量服从参数为,的二项分布,记作,并称为成功概率.
2、二项分布的适用范围及本质
(1)适用范围:
①各次试验中的事件是相互独立的;
②每次试验只有两种结果:事件要么发生,要么不发生;
③随机变量是这次独立重复试验中事件发生的次数.
(2)本质:二项分布是放回抽样问题,在每次试验中某一事件发生的概率是相同的.
3、二项分布的期望、方差
若,则,.
四、超几何分布
1、定义
在含有件次品的件产品中,任取件,其中恰有件次品,则事件发生的概率为,,1,2,…,,其中,且,,,,,称分布列为超几何分布列.如果随机变量的分布列为超几何分布列,则称随机变量服从超几何分布.
0
1
…
…
2、超几何分布的适用范围件及本质
(1)适用范围:
①考察对象分两类;
②已知各类对象的个数;
③从中抽取若干个个体,考察某类个体个数的概率分布.
(2)本质:超几何分布是不放回抽样问题,在每次试验中某一事件发生的概率是不相同的.
五、正态分布
一般地,如果对于任何实数,,随机变量满足,则称随机变量服从正态分布.正态分布完全由参数,确定,因此正态分布常记作.如果随机变量服从正态分布,则记为.
其中,参数是反映随机变量取值的平均水平的特征数,可以用样本的均值去估计;是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计.
类型一、随机变量
【变式训练1】同时掷两颗质地均匀的骰子,观察朝上一面出现的点数.设两颗骰子出现的点数分别为,,记,则( )
A. B. C. D.
【变式训练2】甲、乙两人下象棋,赢了得3分,平局得1分,输了得0分,共下三局.用ξ表示甲的得分,则{ξ=3}表示( )
A.甲赢三局
B.甲赢一局
C.甲、乙平局三次
D.甲赢一局输两局或甲、乙平局三次
【变式训练3】甲、乙两人下象棋,胜者得1分,平局得0分,负者得分,共下5局.用表示甲的得分,则表示( )
A.甲胜3局负2局 B.甲胜4局负1局
C.甲胜3局平2局或甲胜3局负2局 D.甲胜4局负1局或甲胜3局平2局
【变式训练4】(多选)口袋中有大小形状都相同的4个红球,n个白球,每次从中摸一个球,摸后再放回口袋中,摸到红球记2分,摸到白球记1分,共摸球3次.设所得分数为随机变量,若则随机变量的取值可能为( )
A.2 B.3 C.4 D.5
【变式训练5】一用户在打电话时忘记了号码的最后三个数字,只记得最后三个数字两两不同,且都大于5,于是他随机拨最后三个数字(都大于5且两两不同),设他拨到所要号码的次数为,则随机变量的可能取值共有 种.
【变式训练6】小王参加一次比赛,比赛共设三关,第一、二关各有两个必答题,如果每关两个问题都答对,可进入下一关,第三关有三个问题,只要答对其中两个问题,则闯关成功.每过一关可获得价值分别为1000元,2000元,3000元的奖品(奖品重复设立),小王对三关中每个问题回答正确的概率依次是,且每个问题回答正确与否相互之间没有影响,用X表示小王所获奖品的价值,写出X的所有可能取值及每个值所表示的随机试验的结果.
类型二、随机变量分布列
【变式训练1】某公司计划派员工到甲、乙、丙、丁、戊这5个领头企业中的两个企业进行考察学习,记该公司员工所学习的企业中含甲、乙、丙的个数为,记的所有取值的平均数为,方差为,则( )
A. B. C. D.
【变式训练2】密室逃脱是当下非常流行的解压放松游戏,现有含甲在内的7名成员参加密室逃脱游戏,其中3名资深玩家,4名新手玩家,甲为新手玩家.
(1)在某个游戏环节中,需随机选择两名玩家进行对抗,若是同级的玩家对抗,双方获胜的概率均为;若是资深玩家与新手玩家对抗,新手玩家获胜的概率为,求在该游戏环节中,获胜者为甲的概率;
(2)甲作为上一轮的获胜者参加新一轮游戏:如图,有两间相连的密室,设两间密室的编号分别为①和②.密室①有2个门,密室②有3个门(每个门都可以双向开),甲在每个密室随机选择1个门出去,若走出密室则挑战成功.若甲的初始位置为密室①,设其挑战成功所出的密室号为,求的分布列.
【变式训练3】学校教学楼的每两层楼之间的上下楼梯有个台阶,从下至上记台阶所在位置为,同学甲在上楼的过程中,每一步等可能地跨或个台阶(位置或).
(1)记甲迈步后所在的位置为,写出的分布列和期望值.
(2)求甲步内到过位置的概率;
(3)求步之内同时到过位置和的有多少种走法,及发生的概率.
【变式训练4】随着全球环境问题的加剧,环境安全已逐渐成为国家和地区安全的重要组成部分,其中环境空气质量尤为重要.我国空气质量分为六级,在大气中空气动力学当量直径小于或等于2.5微米的颗粒物称为可入肺颗粒物(记为PM2.5),对人体健康和环境质量的影响很大,其中PM2.5与空气质量的关系如下:
PM2.5日均值为及以下时,空气质量等级为“一级:优”;
PM2.5日均值为时,空气质量等级为“二级:良好”;
PM2.5日均值为时,空气质量等级为“三级:轻度污染”.
某市环保局从冬季每天的PM2.5监测数据中随机抽取10天数据作为样本,其数据分别为:38,32,45,49,53,77,66,86,76,91.空气质量低于二级视为PM2.5数据超标.
(1)从这10天的PM2.5监测数据中,随机抽出三天数据,求至少有一天空气质量为二级的概率;
(2)从这10天的PM2.5监测数据中,随机抽出三天,求这三天PM2.5监测数据超标的天数的分布列.
【变式训练5】巴黎奥运会于2024年7月26日至8月11日举行.某体育局为普及奥运知识,组织了答题活动.设置一个抽题箱,箱中有若干装有题目的小球,小球大小、颜色、质量都一样.每个小球内只有一道题目,每道题目只有一个分值,题目分值分别为2分、10分.抽取规则:每次从抽题箱抽取一个小球,对小球中题目作答后将该题目放回原球内,并把小球放回抽题箱,摇匀后,再抽取.已知2分题目小球被抽到的概率为,10分题目小球被抽到的概率为.
(1)若甲抽取3次,记表示甲3次抽取题目分值之和,求的分布列和数学期望.
(2)若甲、乙各抽取4次,已知甲前两次抽出题目分值之和为20,记事件“乙抽出题目分值之和大于甲抽出题目分值之和”,求.
类型三、二项分布和超几何分布
【变式训练1】设随机变量服从二项分布,若,则( )
A.0.16 B.0.32 C.0.64 D.0.84
【变式训练2】一袋中有5个白球,3个红球,现从袋中往外取球,每次任取一个记下颜色后放回,直到红球出现10次停止,设停止时共取了次球,则( )
A. B. C. D.
【变式训练3】一个不透明的袋子有10个除颜色不同外,大小、质地完全相同的球,其中有6个黑球,4个白球.现进行如下两个试验,试验一:逐个不放回地随机摸出3个球,记取到白球的个数为,期望方差分别为;试验二:逐个有放回地随机摸出3个球,记取到白球的个数为,期望和方差分别为,则下列判断正确的是( )
A. B.
C. D.
【变式训练4】某校在一次“二项分布的性质”为主题的探究活动中,该校数学第一小组的学生同学表现优异,探究数学的奥秘.设随机变量,记,在探究的最大值时,小组同学发现:当为正整数,则,,此时这两项概率均为最大值;当为非整数,取的整数部分,是唯一的最大值.以此为理论依据,有同学重复投掷一枚大小均匀的骰子实时记录点数6出现的次数.当投掷第20次时,记录到此时点数6出现5次,再进行80次投掷实验,当投掷到100次时,点数6总共出现的次数为 的概率最大.
【变式训练5】如图是一块高尔顿板的示意图,在一块木板上钉着若干排相互平行但相互错开的圆柱形小木钉,小木钉之间留有适当的空隙作为通道,前面挡有一块玻璃.将小球从顶端放入,小球下落的过程中,每次碰到小木钉后都等可能地向左或向右落下,后落入底部的格子中.记格子从左到右的编号分别为,用表示小球最后落入格子的号码,若,则 .
【变式训练6】如图,在研究某种粒子的实验装置中,粒子从腔室出发,到达腔室,粒子从室经过号门进入室后,等可能的变为上旋或下旋状态,粒子从室经过号门进入室后,粒子的旋转状态发生改变的概率为.粒子间的旋转状态相互独立.现有两个粒子从室出发.
(1)求两粒子进入室都为上旋状态的概率;
(2)若实验装置出现故障,两个粒子进入室后,共裂变为个粒子,裂变后的每个粒子再经过号门返回室的概率为,各粒子返回室相互独立.
①时,写出返回室的粒子个数的分布列、期望、方差;
②时,记有个粒子返回室的概率为,则为何值时,取最大值.
类型四、正态分布
【变式训练1】已知随机变量分别服从正态分布和二项分布,且,,则( )
A. B. C. D.
【变式训练2】.生态环境部2024年7月21日发布了《全国碳市场发展报告(2024)》,系统总结了全国碳排放权交易市场和全国温室气体自愿减排交易市场的最新建设进展,全方位展示了市场建设运行工作成效.为了解某地碳市场建设情况,相关部门对当地1000家企业的碳排放情况进行了综合评估,得到各企业的综合得分近似服从正态分布,则得分在区间内的企业大约有(参考数据:若,则,)( )
A.108家 B.116家 C.124家 D.136家
【变式训练3】已知三个随机变量的正态密度函数的图象如图所示,则( )
A. B.
C. D.
【变式训练4】(多选)已知随机变量服从正态分布,,,则以下选项正确的是( )
A. B.若,则
C.若,则 D.
【变式训练5】(多选)若随机变量,从的取值中随机抽取个数据,记这个数据的平均值为,则随机变量.随机变量服从正态分布,则.某珠宝店出售的珍珠的直径均服从期望为15毫米,标准差为2毫米的正态分布.程女士在该珠宝店随机地挑选了16颗圆润华美的珍珠,将它串成一条璀璨夺目的项链.设这16颗珍珠的直径平均值为,则( )
A.随机变量的标准差为 B.随机变量
C. D.
【变式训练6】为加大自然生态系统和环境保护力度,加强企业对尊重自然、顺应自然、保护自然的生态文明理念,某市对化工企业的排污情况进行调查,并出台相应的整治措施.相关部门对1000家化工企业所排污水的质量及周围空气质量进行了综合检测,得分情况如频率分布直方图所示.
(1)计算该市化工企业的平均得分(同一组中的数据以这组数据的中间值为代表);
(2)已知化工企业的得分情况近似服从正态分布,其中,则得分在内的企业大约有多少家;
(3)按照(2)中概率分布随机抽取100家化工企业,分数不低于19分的企业有多少家时概率最大.
参考数据:若随机变量服从正态分布,则,,.
类型五、统计案例
【变式训练1】某统计部门对四组数据进行统计分析后, 获得如图所示的散点图.
下面关于样本相关系数的比较, 正确的是 ( )
A. B.
C. D.
【变式训练2】(多选)国家统计局7月15日发布数据显示,2024年上半年我国经济运行总体平稳,其中新能源产业依靠持续的技术创新实现较快增长.某企业根据市场调研得到研发投入(亿元)与产品收益(亿元)的数据统计如下,则下列叙述正确的是( )
1
2
3
4
5
6
7
2
3
5
7
8
8
9
A.
B.由散点图知变量和正相关
C.用最小二乘法求得关于的经验回归直线方程为
D.收益的方差为6
【变式训练3】(多选)某直播带货公司统计了今年1月份至5月份的某种产品的月销量(单位:千件)如下表所示:
月份
1
2
3
4
5
月销量
2.4
3.1
4
5
5.5
已知变量与之间具有线性相关关系,通过最小二乘法求得的经验回归直线方程为,则下列说法正确的是( )
参考公式:相关系数,决定系数.
A. B.
C.每增加1,一定增加0.81 D.
【变式训练4】(多选)如图是根据一组观测数据得到海拔千米的大气压强散点图,根据一元线性回归模型得到经验回归方程为,决定系数为;根据非线性回归模型得到经验回归方程为,决定系数为,则下列说法正确的是( )
A.由散点图可知,大气压强与海拔高度负相关
B.由方程可知,海拔每升高1千米,大气压强必定降低kPa
C.由方程可知,样本点的残差为
D.对比两个回归模型,结合实际情况,方程的预报效果更好
【变式训练5】近年来,我国铁路事业取得历史性成就、发生历史性变革,路网规模质量大幅提升,建成世界最大的高速铁路网.截至2023年底,我国铁路营业里程达15.9万公里,其中高铁营业里程4.5万公里,继续稳居世界第一.如图,是我国2015-2023年高铁营业里程的发展情况(单位:万公里).
(1)由散点图看出,可用线性回归模型拟合高铁营业里程与年份代码的关系,请用相关系数加以说明(结果精确到0.001;当时,认为线性相关性较强;时,认为线性相关性一般;,认为线性相关性较弱);
(2)求关于的线性回归方程,并预测到哪一年我国高铁的营业里程将达到7万公里(结果精确到0.01).
附:参考公式:相关系数;
回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,,,.
【变式训练6】某社区对随机抽取的120名居民进行“安全卫生服务满意度”问卷调查,其中对社区“安全卫生服务”满意的男性居民占抽取调查人数的.
满意
不满意
合计
男性居民
60
女性居民
20
60
合计
120
(1)请根据调查结果将上面的列联表补充完整,依据小概率值的独立性检验分析居民对“安全卫生服务”的满意程度是否有差异;
(2)用分层随机抽样方法,从对社区“安全卫生服务”满意的居民中随机抽取9人,再从9人中随机抽取4人到其他社区交流学习,记这4人中女性居民的人数为,求的分布列与期望.
附:,其中.
0.100
0.050
0.025
2.706
3.841
5.024
1.已知甲参加青年志愿者的选拔,选拔以现场答题的方式进行.已知在备选的10道试题中,甲能答对其中的6道题,规定每次考试都从备选题中随机抽出3道题进行测试,设甲答对的试题数为X,则的概率为( )
A. B. C. D.
2.一个班级共有30名学生,其中有10名女生,现从中任选三人代表班级参加学校开展的某项活动,假设选出的3名代表中的女生人数为变量,男生的人数为变量,则等于( )
A. B.
C. D.
3.变量之间有如下对应数据
2
3
4
5
6
13
12
10
8
7
已知变量与呈线性相关关系,且回归方程为,则的值为( )
A.16 B.14 C.12 D.10
4.(多选)一射手对同一目标独立地射击四次,已知至少命中一次的概率为,若该射手射击四次命中次数为,每次命中的概率为,则( )
A. B.
C.或 D.
5.(多选)一个袋中有6个同样大小的黑球,编号为1,2,3,4,5,6,还有4个同样大小的白球,编号为7,8,9,10,现从中任取4个球,则下列说法中正确的是( )
A.取出一个黑球记2分,取出一个白球记1分,表示取出的4个球的总得分,则服从超几何分布
B.若表示取出的黑球的个数,则服从超几何分布
C.若表示取出白球的个数,则
D.若表示取出黑球的个数,则
6.(多选)若随机变量,下列说法中正确的有( )
A. B.期望
C.期望 D.方差
7.(多选)若随机变量服从正态分布,设,则( )
A. B. C. D.
8.(多选)已知某批产品的质量指标服从正态分布,且,现从该批产品中随机取3件,用表示这3件产品的质量指标值位于区间的产品件数,则( )
A. B.
C. D.
9.(多选)已知三个密度函数的图象如图所示,则( )
A.
B.
C.若,,则
D.若,,则存在实数,使得
10.商家项目投资的利润产生是一个复杂的系统结果.它与项目落地国的商业环境,政府执政能力,法律生态等都有重大的关联.如表所示是某项目在中国和南亚某国投资额和相应利润的统计表.
项目落地国
中国
南亚某国
投资额x(亿元)
10
11
12
13
14
10
11
12
13
14
利润y(亿元)
11
12
14
16
19
12
13
13
14
15
请选择平均利润较高的落地国,用最小二乘法求出回归直线方程为 .参考数据和公式:,中国,南亚某国,,.
11.小张参加某项专业能力考试.该考试有,,三类问题,考生可以自行决定三类问题的答题次序,回答问题时按答题次序从某一类问题中随机抽取一个问题回答,若回答正确则考试通过,若回答错误则继续从下一类问题中再随机抽取一个问题回答,依此规则,直到三类问题全部答完,仍没有答对,则考试不通过.已知小张能正确回答,,三类问题的概率分别为,,,且每个问题的回答结果相互独立.
(1)若小张按照在先,次之,最后的顺序回答问题,记为小张的累计答题数目,求的分布列;
(2)小张考试通过的概率会不会受答题次序的影响,请作出判断并说明理由;
(3)设,为使累计答题数目的均值最小,小张应如何安排答题次序?并说明理由.
12.2024年第七届中国国际进口博览会(简称进博会)于11月5日至10日在上海国家会展中心举行.为了解进博会参会者的年龄结构,某机构随机抽取了年龄在15-75岁之间的200名参会者进行调查,并按年龄绘制了频率分布直方图,分组区间为.把年龄落在区间内的人称为“青年人”,把年龄落在区间内的人称为“中年人”,把年龄落在内的人称为“老年人”.
(1)求所抽取的“青年人”的人数;
(2)以分层抽样的方式从“青年人”“中年人”“老年人”中抽取10名参会者做进一步访谈,发现其中女性共4人,这4人中有3人是“中年人”.再用抽签法从所抽取的10名参会者中任选2人.
①简述如何采用抽签法任选2人;
②设事件A:2人均为“中年人”,事件B:2人中至少有1人为男性,判断事件A与事件B是否独立,并说明理由.
13.在第九个全民国家安全教育日即将来临之际,拉萨市人民检察院于12日会同拉萨市委宣传部、拉萨市普法办、拉萨市教育局等部门,共同举办了以“检爱同行,共护花开”为主题的首届拉萨市青少年国家安全知识竞赛.每人可参加多轮答题活动,每轮答题情况互不影响.每轮比赛共有两组题,每组都有两道题,只有第一组的两道题均答对,方可进行第二组答题,否则本轮答题结束.已知吴科同学第一组每道题答对的概率均为,第二组每道题答对的概率均为,两组题至少答对3题才可获得一枚纪念章.经过激烈的角逐,拉萨江苏实验中学代表队获得一等奖,拉萨市第三高级中学、拉萨市北京中学代表队获得二等奖,拉萨市第二高级中学、拉萨市第二中等职业技术学校、拉萨市第四高级中学代表队获得三等奖.
(1)记吴科同学在一轮比赛答对的题目数为,请写出的分布列,并求;
(2)若吴科同学进行了10轮答题,试问获得多少枚纪念章的概率最大.
14.历史悠久的杨柳青年画,全称“杨柳青木版年画”,属木版印绘制品,是我国著名民间传统木版年画.它起源于明代崇祯年间,距今已有近400年的历史,是首批国家级非物质文化遗产.杨柳青年画制作特别之处是它采用“印画结合”的独特工艺,制作程序大致是:创稿、分版、刻版、套印、彩绘、装裱,前期工序与其他木彼年画大致相同,而杨柳青年画的后期制作艺术风格迥然不同.一个优秀的作品除了需要有很好的素材外,更要有制作上的技术要求,已知某年工艺画师在后期套印、彩绘、装裱每个环节制作成功的概率分别为,只有当每个环节制作都成功才认为是一次优秀制作.
(1)设事件“制作一件优秀作品”,求事件A的概率;
(2)若该工艺画师进行3次制作,事件”恰有一件优秀作品”,求事件B的概率;
(3)若该工艺画师制作3次,其中优秀作品数为X,求X的分布列和数学期望.
15.某项团体比赛分为两轮,第一轮由团队队员轮流与AI人工智能进行比赛,若挑战成功,则参加第二轮攻擂赛,与上任擂主争夺此次团体赛的擂主.现有甲队参加比赛,队中共有3名事先排好顺序的队员.
(1)第一轮与AI对战,比赛的规则如下:若某队员第一关闯关成功,则该队员继续闯第二关,否则该队员结束闯关并由下一位队员接力去闯第一关,若某队员第二关闯关成功,则该团队接力闯关活动结束,否则该成员结束闯关并由下一位队员接力去闯第二关;当第二关闯关成功或所有队员全部上场参加了闯关,该队挑战活动结束.已知甲队每位成员闯过第一关和第二关的概率分别为,,且每位成员闯关是否成功互不影响,每关结果也互不影响.用表示甲队闯关活动结束时上场闯关的成员人数,求的分布列和期望.
(2)甲队已经顺利进入第二轮,现和擂主乙队1-3号队员进行比赛,规则为:双方先由1号队员比赛,负者被淘汰,胜者再与负方2号队员比赛……直到有一方队员全被淘汰,另一方获得胜利.已知甲队三名队员每场比赛的胜率分别为,,,若要求甲队获得擂主的概率大于,问是否满足?请说明理由.
16.统计显示,我国在线直播生活购物用户规模近几年保持高速增长态势,下表为年—年我国在线直播生活购物用户规模(单位:亿人),其中年—年对应的代码依次为—.
年份代码
市场规模
,,,其中
参考公式:对于一组数据、、、,其经验回归直线的斜率和截距的最小二乘估计公式分别为,.
(1)由上表数据可知,若用函数模型拟合与的关系,请估计年我国在线直播生活购物用户的规模(结果精确到);
(2)已知我国在线直播生活购物用户选择在品牌官方直播间购物的概率,现从我国在线直播购物用户中随机抽取人,记这人中选择在品牌官方直播间购物的人数为,若,求的数学期望和方差.
原创精品资源学科网独家享有版权,侵权必究!1
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$